アノテーション

アノテーションについて考えてみる

文書作成などで、説明書きを注釈として書き加えることがありますが、この注釈をアノテーションといいます。コンピュータの世界でも、プログラミングでこのアノテーションという言葉が使われており、注釈以上の意味を持つこともあります。 さて、コンピュータの世界でもAI(人工知能)や機械学習といった分野で使われるアノテーションはちょっと違います。これは、AIに学習させる教師データを作成することです。教師データとは何かというと、AIに学習させる問題とその解答のことを指します。 なぜそういった教師データが必要なのかというと、実のところAIはたくさん学ばなければ正答率を上げることが出来ないためです。例えば、花の画像を読み込んで名前を答えるといったアプリがあった場合、わずかな枚数の花の画像だけで学習すると、間違いが多くなります。ですからたくさんの花の画像とその名前を学習し特長をつかまなければならないのです。 このようにAIの精度を上げていくには、大量の教師データが必要なのですが、それは人の手で作られます。先ほどのように花の名前を当てるだけでなく、例えば、咲き始めなのか、すでに枯れようとしているのかなど、画像から分る色々な属性データを人の手で加えていけば、様々なことを判別するようにもなります。分類しやすいようにタグ付けされることもあります。 ところで、AIを使ったアプリを開発する場合、どういった内容にするかだけではなく、どういった人に向けたものなのかといったこともあるでしょう。日本人向けなのか、海外の人も含めたものなのかといったことです。そういう時、教師データを揃えようとすると、気を付けなければならないことがあるかもしれません。 「所変われば品変わる」ではないですが、やはり人の感覚は国や地域によって変わってくることがあります。ですので、海外の人向けなのに、日本人の感覚で作った教師データを使ってAIに学習させると、海外の人にとって使い勝手の悪いアプリに仕上がる可能性は否定出来ないでしょう。その逆もあるはずです。ですので、どこでどういう人たちがアノテーションしたものかなどにも気をつけなければなりません。

パートナー企業一覧