アノテーション

教師データ作成について

AIは画像処理を高速に行う事が出来ます。人の目では速度に限界があります。更にリアルタイムで大量の情報が更新され、追加されるネット環境では人海戦術よりもAIを導入して、効率よく画像分析を施した方が精度もスピードも上です。 AIの能力は教師データによって大きく左右されます。アノテーションを正しく作成する事が肝心であり、この基本的なインプットの質が悪いと導き出される結果も自ずと精度が下がるのです。AIのポテンシャルはまだまだ低いという批判的な意見がありますが、アノテーションの品質が悪い場合、どういったツールを活用しても得られる結果はインプットと同等になり、良質な教師データを作成者が大量に用意し、正解となる情報を予め正しく教えておく事がAIのポテンシャルを引き出すコツです。 教師データの作成には色々な方法がありますが、大勢のワーカー数を準備する事が大切です。人海戦術は非効率的な方法だと批判される事も多いですが、それはあくまでビジネスの現場においての事項です。 教師データ作成という基本的なアノテーションの準備段階においては、豊富なワーカー数を用意して多種多彩な情報を様々な角度から集める事が重要です。画像を集めるだけでも膨大な時間がかかり、そこからメタデータを引き出し分類して処理するためには、それぞれに専門家が必要です。 顔認証の基礎となる画像データ、ファッションアイテムのトレンドを探るための元の教師データなどは、多種多彩なものが必要であり、場合によっては日本国内に留まらず欧米やアジア諸国の物を収集しなければなりません。ワーカー数が足りないと集められるサンプル数にも偏りが生まれます。いわゆる秀才型の人材だけで教師データを集めると、良いも悪いも予め答えが予測できる綺麗なデータだけが集まりやすいのが難点です。ワーカー数を潤沢に確保し、ある意味でアマチュア目線を持つ人々が人海戦術で教師データの収集をすれば、リアルな社会の目に近いサンプルが集まり結果的に、よりファジーな結果にも対応が出来るAIが完成するのです。

パートナー企業一覧