進化を続けるAI開発において、その学習に不可欠なものに「アノテーション」があります。
テキスト・画像・音声などさまざまな形式のデータに対して、コンピュータが理解できるようにタグを付けることですが、膨大な手間と時間がかかる作業です。
自社でアノテーションを行っているものの、時間がかかりすぎるので、外部に委託したいという企業も少なくありません。
そこで今回は、AI開発におけるアノテーションを外部に依頼したい方向けに、アノテーションサービスの種類と、おすすめの会社を紹介します。
特に注目度の高い15社については、表形式で料金や機能の違いが比較できる一覧表をご用意していますので、以下よりぜひダウンロードしてご活用ください。
おすすめサービスのピックアップ方法としては、既存のまとめサイト8個分の情報から、紹介されているアノテーション会社をスコアリングしました。各サイトで紹介頻度の高いものを登場回数順にまとめなおしているので、この記事を読めば効率良くアノテーション会社の情報を入手できるはずです。ぜひ参考にしてください。
※スコアリングや掲載している企業情報などは2024年5月時点のものです。
目次
- アノテーションとはデータのタグ付け作業のこと
- アノテーションサービスの対象となるデータの種類
- アノテーションサービスの外注先の選び方
- <比較表>アノテーションおすすめ15社比較表
- 1.TASUKIアノテーションツール/ソフトバンク株式会社
- 2.Nextremerアノテーションサービス/株式会社Nextremer
- 3.FastLabel/FastLabel株式会社
- 4.株式会社ヒューマンサイエンス
- 5.ANNOTEQ/株式会社ユニメディア
- 6.矢崎の画像アノテーションサービス/矢崎総業株式会社
- 7.harBest for Data/株式会社APTO
- 8.株式会社キャリア・マム
- 9.三栄ハイテックス株式会社
- 10.アディッシュ株式会社
- 11.AOSデータ株式会社
- 12.JOB HUB/JOB HUB Inc.
- 13.株式会社クレスコ
- 14.AI Annotation Platform/株式会社コネクティル
- 15.TTピーエム株式会社
- その他おすすめのアノテーションサービス
- アノテーションサービスに関するよくあるご質問
- まとめ
アノテーションとはデータのタグ付け作業のこと
アノテーションは直訳すると「注釈」という意味で、AI分野においては、テキスト・音声・画像など、さまざまな形態のデータにタグを付ける作業を指します。
このタグを付ける理由は、AIにデータの内容を認識させるためです。学習を行っていないAIは、データを取り込んでも、それが何なのかは認識できません。
たとえば、街を写した写真を人間が見れば、道路・ビル・街路樹・通行人などを個別のものと判別できます。一方、学習前のAIは、そもそも道路がどのようなものを指すのかすら、分からない状態です。
そこで、例題として道路を写した大量の写真データを用意し、それぞれに答えとして「道路」を示すタグをつけます。これを学習させると、AIは道路の特徴を認識し、写真内の道路部分を判別できるようになります。
アノテーションサービスの対象となるデータの種類
アノテーションサービスの対象となるデータは、複数存在します。ここでは、代表的なものを紹介します。
画像アノテーション
画像アノテーションは、画像内の特定の部分を手作業で囲い、囲った領域にタグを付ける作業です。
たとえば、泳いでいる魚の写真があるとします。
人間が見れば魚と水の境界は一目瞭然ですが、未学習のAIでは、どこまでが魚で、どこからが水なのかがわかりません。そこで、手作業で魚の領域を指定し、その領域に「魚」とタグ付けしたデータを学習させます。
同様にタグ付けしたデータを大量に学習したAIは、魚の特徴を統計的に分析できるようになり、魚とそれ以外の判別が可能になります。
映像アノテーション
映像アノテーションは、画像アノテーションの応用のようなものです。人間の目から見れば一連の映像に見えますが、データ的には画像の連番再生であるため、データ形式の違いともいえます。
画像アノテーションとの違いは、シーンなどに応じて連番画像を区切った、「映像セグメント」に対してタグ付けするという点です。
なお、映像アノテーションにも、低度なものと高度なものがあります。色・形などは低度、いつ・どこで・誰が・どのように・なぜ、という5W1Hの指定は高度です。
音声アノテーション
音声アノテーションは、大きく分けて、「音そのものに対する評価」と、「音声が示す意味」に対するタグ付けの2種類があります。
音そのものに対する評価は、音量やクラクションなどの音の種類です。音のデータを時間的に区切り、タグを付けます。
一方、音声が示す意味については、音声を文章に書き起こしてタグ付けを行います。会議や演説などの内容に対するアノテーションです。これは、書き起こしの精度から問う必要があります。
また、音声から読み取れる感情を人間が判断し、タグを付けることも可能です。
音声アノテーションは、映像に付随する音声にも個別に行う必要があります。
意味的(セマンティック)アノテーション
意味的アノテーションを簡単に言い換えると、文脈から判断できる情報の付加です。情報の確実性や、文脈から類推できる感情などを判別する際に必要となります。
人間が文脈を理解し、タイプを分類します。一文が示す意味・表現を分類したり、文章のパーツとして「ようだ」「らしい」「とすれば」といった表現のタイプを分類するといった方法です。
こうした教師データを学習させることで、チャットボットなどで円滑なコミュニケーションを行うAIを開発できるようになります。
テキスト・コンテンツ分類
テキスト・コンテンツ分類は、ジャンルなどを分類して、タグを付ける作業です。予め、どのような分類を行うかを定義し、主題別などで分類していきます。
具体的な例としては、ニュースのカテゴリ分けが挙げられます。「ニュース」という入力に対して、「芸能ニュース」「国際ニュース」「国内ニュース」などに分類するものです。
これも、大量の教師データを学習させることで、統計的にピックアップすべき単語などを認識し、AIがジャンルを自動判別するようになります。
エンティティアノテーション
「エンティティ」という英単語は、直訳すると「実体」です。IT用語としては、E-R図(関係図)を書くときの情報ユニット(箱)のことを指します。
たとえば会社の組織を示す際、会社のエンティティは「ID・会社名・電話番号」などを1つにまとめた箱、社員のエンティティは「社内ID・社員番号・社員名」などを1つにまとめた箱を指します。
エンティティアノテーションも同様に、文章等のデータから情報ユニットに分解し、構造化する作業です。
エンティティリンキング
エンティティリンキングは、エンティティアノテーションを行ったものを、知識ベース上のエントリに結び付ける作業です。Web上のテキストであれば、知識ベースにWikipediaなどを選択します。
「りんご」「林檎」「Apple」を例にしましょう。「りんご」「林檎」は、Wikipedeiaで「果物」として解説されているエントリに結び付けます。一方、「Apple」は企業名としてのエントリが適当です。
こうしてリンクを行っていくと、エンティティ同士の類似性を、高い精度で計算できるようになります。これは、手作業によるタグ付けより、知識ベースへのリンクの方が、関連付けられる情報が多いからです。
りんごに対して手作業でタグ付けするとすれば、「果物」「赤い」など項目が限られます。一方、知識ベースへのリンクなら、科目・花の色・学名・栽培方法・歴史など、圧倒的に多い情報量の付加が可能です。
アノテーションサービスの外注先の選び方
アノテーション自体はある程度知識があれば対応できる作業なので、自社内でも対応可能ですが、膨大な数のデータにタグ付けしなければなりません。自社ですべてを対応するのはコスパがかなり悪いので、外部に委託するのが得策です。
多種多様な企業がサービスを提供しているため、自社の目的に合致するサービスを選ぶためのポイントを解説します。
専用ツールを使用している会社へ外注する
アノテーションを効率的に行うための、専用ツールや自社開発ツールを使用している会社を選択しましょう。
効率化を実現するツールとして、画像アノテーションにおける、セグメンテーションツールが挙げられます。ピクセル単位の色分けを手作業で行うと時間がかかりますが、自動判別するツールがあれば作業は迅速です。
導入されているツールによって、作業効率や精度に差が出るため、最終的な成果物の量や費用だけで選択しないことをおすすめします。
ただし、アノテーションサービスを行う会社が、全種類のアノテーションを行えるというわけではありません。画像アノテーションが主力の会社でも、ランドマークや3Dキューブには非対応ということもあります。
実施目的やジャンルに特化した会社もある
実施目的や、サービス対象となるデータのジャンルを、限定している会社があります。これは、一部に特化することで専門性を高めるためです。
具体的には、建築・土木・設計に関するデータへのアノテーションに特化した会社や、音声認識用のAI開発に適したアノテーションに特化している会社などが挙げられます。
また、タグ付けに専門知識が必要な場合に備えて、専門家を含めたチームを編成している会社も存在します。
自社で取り扱うデータが専門性の高いものなら、特定のジャンルに特化した会社を選びましょう。
<比較表>アノテーションおすすめ15社比較表
本記事で紹介している15社の違いがひと目でわかる一覧表をご用意しました。短時間でサービスの比較をしていただけます。
1.TASUKIアノテーションツール/ソフトバンク株式会社
TASUKI Annotation|高品質なアノテーションサービス|法人向け|ソフトバンク
- 教師データ作成のプロによる丁寧なヒアリングで条件に合ったプランを提示
- 最後の1枚までプロのアノテーターが仕上がりを丁寧にチェック
- 画像・動画から音声など幅広い種類のデータに対応
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■アノテーション代行サービス |
導入企業 | 株式会社十六フィナンシャルグループ、アイエスジー株式会社、朝日信用金庫、香川県三豊市、株式会社URリンケージなど |
導入社数 | 要問い合わせ |
2.Nextremerアノテーションサービス/株式会社Nextremer
- プロジェクトの途中でも追加要件に対応
- 要件定義からアノテーションまで総合的なサポートを提供
- 高品質な教師データ作成などに必要なデータ収集にも対応可能
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■アノテーション ■合成データ作成 ■ランダム生成 ■AIアルゴリズム生成 ■シミュレーション生成 |
導入企業 | 本田技研工業株式会社、富士通株式会社、東急電鉄株式会社、株式会社コシダカホールディングス、THK株式会社など |
導入社数 | 要問い合わせ |
3.FastLabel/FastLabel株式会社
FastLabel – AIインフラを創造し日本を再び「世界レベル」へ
- 専門スタッフがアノテーションマニュアルの作成をサポート
- ビジネス・金融などのジャンル別でのデータセットの作成にも対応
- 端末へのインストール不要で、ウェブ上からすぐに開始できる
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■アノテーション ■モデル開発 ■データ収集・販売 ■LLMデータセット作成 |
導入企業 | 株式会社ヘッドウォータース、名古屋大学、アニコム損害保険、株式会社サイバーエージェント、鹿島建設株式会社など |
導入社数 | 100社以上 |
4.株式会社ヒューマンサイエンス
- 自然言語処理に特化したアノテーションサービス
- スマートフォンなどのAIアシスタントへのリクエスト音声を認識・抽出できる
- 動画のアノテーションでは対象の追跡が可能
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■自然言語処理 ■文章生成 ■音声認識・抽出 ■画像アノテーション ■ドキュメント分析 |
導入企業 | 横河電機株式会社、富士通株式会社、株式会社牧野フライス製作所、キヤノン株式会社、日本電気株式会社など |
導入社数 | 4,800,000社以上 |
5.ANNOTEQ/株式会社ユニメディア
- マイクロタスク型クラウドソーシング連動のアノテーションサービスを提供
- クラウドワーカーを活用することで1週間で10万件以上の作業対応が可能
- 写真やWEBに掲載されている画像データから手書きの文字収集まで幅広く対応
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■画像・動画データ収集 ■手書き文字データ収集 ■画像・動画分類 ■音声適正判定 ■動画音声文字起こし |
導入企業 | 京都大学、角川アスキー総合研究所、株式会社STAIRS LABなど |
導入社数 | 要問い合わせ |
6.矢崎の画像アノテーションサービス/矢崎総業株式会社
【公式】矢崎の画像アノテーションサービスTOP|矢崎総業株式会社
- クラウドワーカー等は活用せず、会社が雇用する社員がアノテーションを行うため高い品質と対応力を実現
- 全量検品やトリプルチェック体制の構築が可能
- 共同作業スペースでのアノテーションにより、作業のバラツキを抑制
初期費用 | 0円 |
---|---|
料金プラン | ■画像分類:5円~ ■短形(バウンディングボックス):10円~ ■ポリゴン(セグメンテーション):お見積り ■キーポイント:7円~ |
主な機能 | ■アノテーション ■画像分類 ■キーポイント |
導入企業 | 株式会社スカイマティクスなど |
導入社数 | 要問い合わせ |
7.harBest for Data/株式会社APTO
harBest(ハーベスト) | harBestでアノテーション・AI(人工知能)開発を簡単に
- 一定のスキルを持つProユーザーが在籍
- アノテーションプラットフォームをまるごと利用可能
- 課題設定からプロジェクトの全体設計まで対応
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■会話データ収集 ■画像データアノテーション ■品質チェック ■動画収集 ■LLM用のテキストデータ作成 |
導入企業 | 株式会社リコー、株式会社LightBlue、マイクロコントロールシステムズ株式会社、RevComm株式会社、株式会社オルツなど |
導入社数 | 100社以上 |
8.株式会社キャリア・マム
大量案件にも強さを発揮。高品質なアノテーション業務をお求めなら「キャリア・マム」
- 案件にあった適性・スキルを持つ専門チームが対応
- 自社システムによりファイルの共有、進捗管理、コミュニケーションがクラウド上で行える
- 主婦層が主な会員のため、子どもからシニアまでのデータ収集が可能
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■画像収集 ■音声収集 ■物体検出 ■領域抽出 ■対話データ作成 |
導入企業 | 要問い合わせ |
導入社数 | 要問い合わせ |
9.三栄ハイテックス株式会社
アノテーション | 人工知能(AI)開発 | 事業内容 | 三栄ハイテックス株式会社
- データはオンプレミスの専用サーバーで管理
- 作業者のPCは外部のネットワークから遮断されるため安心
- 要望に合わせて、一括納品・週一納品等に対応
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■アノテーション ■画像間のオブジェクト継承 ■セグメンテーション |
導入企業 | 要問い合わせ |
導入社数 | 要問い合わせ |
10.アディッシュ株式会社
アノテーション代行サービス – インターネットモニタリングやSNS・コメント監視に対応
- AIを活用・提供する企業を対象にしたアノテーション代行サービス
- 国内に対応センターを複数保有しているため、データが必要なタイミングに合わせて作業可能
- コミュニティサイト内の投稿に上がってくる不適切な画像を自動で検知できる
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■アノテーション代行 ■コミュニティサイト監視 ■広告審査 ■本人確認代行 |
導入企業 | 株式会社DouYu Japan、ANYCOLOR株式会社、株式会社インターエデュ・ドットコム、株式会社ワークポート、株式会社 QVC ジャパンなど |
導入社数 | 要問い合わせ |
11.AOSデータ株式会社
- LLMに代わるコンパクトな自然言語処理モデルsLLM(小さいLLM)を提供
- ファイル名や保存場所のわからないメンバーもキーワードから瞬時に該当ファイルを探し出せる
- 各企業のロゴを搭載し、自社ブランドシステムとしてプラットフォームを提供
初期費用 | 要問い合わせ |
---|---|
料金プラン | ■スタンダードプラン:月額5,000円 ■コラボレーションプラン:要問い合わせ |
主な機能 | ■AIデータALM ■データ暗号化 ■メタデータ検索 ■自動バックアップ ■透かし機能 |
導入企業 | 要問い合わせ |
導入社数 | 要問い合わせ |
12.JOB HUB/JOB HUB Inc.
- Web上で業務委託の仕事を依頼から決済まで行えるダイレクトマッチングサービス
- 自分のライフスタイルにあわせスキルやパフォーマンスにあった仕事を探せる
- システム利用料は仕事が成約した場合にのみ発生
初期費用 | 0円 |
---|---|
料金プラン | ■仕事が成約した際にシステム利用料発生 |
主な機能 | ■募集 ■契約管理 ■ワークプレイス提供 ■支払管理 ■実績管理 |
導入企業 | 要問い合わせ |
導入社数 | 要問い合わせ |
13.株式会社クレスコ
- ベトナムにある専属チームによって高品質なアノテーションサービスを迅速に提供
- QAの対応や品質管理もAIの専門知識をもつクレスコの社員が実施
- 指定領域の塗り方が適当な場合も、画像処理で見やすい形に整えられる
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■セマンテック・セグメンテーション ■バウンディングボックス ■ポーズ・エスティメーション ■バウンダリー・ディテクション |
導入企業 | 株式会社パーソルダイバース、株式会社パソナ、株式会社フォーラムエンジニアリング、イオンコンパス株式会社、株式会社ザイマックスなど |
導入社数 | 要問い合わせ |
14.AI Annotation Platform/株式会社コネクティル
AI アノテーション プラットフォーム-国産クラウド型Webアノテーションツール
- 安心で便利な国産クラウド型のWebアノテーションツール
- バウンディングボックスやポリゴンなどの様々な画像アノテーションを豊富な機能により効率的に実行
- プロジェクトごとにデータやメンバーを分離して管理できる
初期費用 | 0円 |
---|---|
料金プラン | 0円 ※大規模作業や大容量データの場合は要問い合わせ |
主な機能 | ■画像アノテーション ■プロジェクト管理機能 ■ファイル・データ管理機能 |
導入企業 | 要問い合わせ |
導入社数 | 要問い合わせ |
15.TTピーエム株式会社
アノテーション・AI学習用データ作成 | TTピーエム株式会社
- クラウドワーカーと専任ワーカーのハイブリッド体制による高品質なアノテーションサービスを提供
- 定期的にルール策定コンサルテーションを実施
- 学習データの準備から機械学習までの周辺作業を一括でサポート
初期費用 | 要問い合わせ |
---|---|
料金プラン | 要問い合わせ |
主な機能 | ■アノテーション ■コンサルテーション |
導入企業 | 株式会社AGENCIA、Ultimatrust株式会社、株式会社ACES、東京大学医科学研究所、富士ソフト株式会社など |
導入社数 | 要問い合わせ |
その他おすすめのアノテーションサービス
ピクスタ株式会社
株式会社World Standard
audioコーパス株式会社
アッペンジャパン株式会社
Datatang株式会社
株式会社バオバブ
ライオンブリッジジャパン株式会社
Global Walkers株式会社
株式会社ブライセン
アノテーションサービスに関するよくあるご質問
アノテーションサービスの導入を検討中の方に役立つQ&Aをまとめています。
Q.画像アノテーションとは何ですか?
A.画像アノテーションは、画像内の特定の部分を手作業で囲い、その領域にタグを付ける作業です。これにより、AIが画像内のオブジェクトを認識できるようになります。
Q.音声アノテーションとは何ですか?
A.音声アノテーションは、音声データに対してタグを付ける作業です。音量や音の種類、音声内容の書き起こし、感情の判別などを行います。
Q.エンティティアノテーションとは何ですか?
A.エンティティアノテーションは、文章などのデータから情報ユニットを抽出し、構造化する作業です。これにより、AIがデータ間の関係を理解しやすくなります。
Q.アノテーションサービスの料金相場はどのくらいですか?
A.アノテーションサービスの料金相場は、作業内容やデータ量によって異なりますが、画像アノテーションの場合、1データあたり数円から数十円が一般的です。
詳細は提供元にお問い合わせください。
まとめ
アノテーション作業を自社で行うのは、相当な時間と人数を要します。また、使用するデータの収集や、タグの定義付けにも手間がかかるため、外注するのがおすすめです。
外注先を選定する際は「自社の業務に活かせるサービス」であることが、最も重要な視点といえます。言い換えれば、アノテーションを活用する目的を明確にしない限り、最適なサービスはみつかりません。
アノテーションの活用目的を明確化した上で、提供されるサービスの種類・精度・速さなどを総合的に判断しましょう。
参考にしたサイト
アノテーションのサービス比較と企業一覧|AIsmiley
アノテーションサービス比較17選!おすすめ・基本機能・選び方も紹介 – 起業LOG SaaS
アノテーションサービス比較!利用するメリットとサービスの選び方 | BOXIL Magazine
アノテーションサービスおすすめ21選を比較!外注費用相場や口コミ評判を紹介 | 集客・広告戦略メディア「キャククル」
AIアノテーションツールの比較11選。何ができるようになる? | アスピック|SaaS比較・活用サイト
アノテーションサービス会社プロ厳選16社!【2024年最新版】 – AI Market
【2024年】アノテーションサービスのおすすめ10製品(全12製品)を徹底比較!満足度や機能での絞り込みも
アノテーション 製品をまとめて比較!|ITトレンド
コメント