アノテーション

アノテーションとタグ

アノテーションとはannotation、「注釈」という意味を持つ英語です。 プログラムの世界ではあるデータ入力の際に必要性に応じて、タグをつけることを意味します。 アノテーションを行うことのメリットの1つは検索の際に必要なデータを効率的に見つけやすくなるということです。 またAIに効率的な学習を行わせる際にも役に立ちます。 たとえばインターネット上に存在する膨大な画像データの中から人間の食事に関係したものに「人間の食事」というタグを、ライオンの捕食や動物園の餌付けなどの画像により広範な「食事」というタグをつけてAIに機械学習をさせてみると言った方法です。 これを行うことで人工知能は大量のデータの中から食事とそうでないものの違いは何か、あるいは同じ食事でも人間の食事とそうでないものは何が違うのかについて学ぶことができます。 アノテーションを行う際に重要となるのは何よりも学習データの量です。 機械の最大のメリットは疲れることもなく膨大な情報を処理できることだからです。 上記で例に出した任意の画像が食事に関係しているかという実験も、十分な学習データを用意し、十分な時間機械学習させれば人間の限界を遥かに超える速度で高速に判定処理が可能ですが、数十や数百程度ではサンプルが足りず様々な間違いを犯してしまいます。 とはいえアノテーションは極めて面倒な作業です。 機械が一瞬で処理するようなデータであっても、人間が一つずつタグをつけるのは大変です。 そのため現在は必要最小限のアノテーションでAIに効率的で正確な学習をさせる方法がないかという研究が進められています。 たとえば丁寧にタグづけされたデータ500とタグのつけられていないデータ10000を組み合わせた半教師あり学習といった方法です。 上手くいけば機械学習の効率化を図れますが、現在のところやはり膨大なデータに丁寧にタグづけする地道な方法に学習効率で大きく差をつけられているのが実情です。

パートナー企業一覧