アノテーション

教師データの日進月歩な進化

AIと呼ばれている人工知能は日本だけでなく世界各国で脚光を浴びていて、日々開発が進み、その市場規模もさらに拡大しています。家電製品の制御や自動運転の自動車や翻訳など幅広い分野で、私たちの生活をより豊かにしてくれると期待されています。質の高いAIを開発するのためには質の高い学習データーが欠かせません。学習し判断するといったアルゴリズムやツールの開発はもちろん大切ですが、利用目的と合致した質の高いデーターがなくては、せっかくのシステムが無駄になってしまいます。 たとえば、AIを用いた翻訳サービスを行っている企業には、翻訳に関する適切な運営手法と良質で膨大な学習データーの両方が必要です。データーの作成のためには数多くのクラウドワーカーと呼ばれている翻訳者の存在が不可欠で、2000名以上のワーカーがいても足りないということはありません。もちろんただ単にデーターの数が多いからよいということではなく、翻訳されたテキストをスペシャリストを呼ばれている熟練の担当者がチェックするとともに、提出されたテキストをスコアをつけて評価を行うといった質の向上を実現しています。翻訳言語はひとつとは限りませんので、多くの言語を取り扱うことで幅広い翻訳が実現でき、良質なサービスの提供とクライアントの満足度向上に繋がります。 自動運転を開発している企業では実際に公道で走行試験を行う前に、PC上で仮想走行するシミュレーションを行います。道路上で起こるさまざまな事象をどれだけ多くプログラムに盛り込めるかが重要になります。信号や歩行者や気象状態などの発生要素と、それによってもたらさせるであろう状況を入力する必要があります。そのために多くのクラウドワーカーによって要素と状況を作成してもらい、活用していきます。これは翻訳と同様に熟練の担当者によってチェックされるので、量だけでなく質の向上が期待できます。 このように、これまではビッグデーターと呼ばれる膨大なデーターの蓄積がAIには不可欠とされてきましたが、これからは質も問われていくステージに突入していくことになります。

パートナー企業一覧