アノテーション

教師データ作成についてのあれこれ

機械学習の教師あり学習では、人工知能のニューラルネットワークに例題と答えに関する膨大なデータが与えられています。ニューラルネットワークとはコンピュータによる情報処理による情報処理技術の1つです。ニューロンに相当する基本阻止を結ぶ配列網を指します。人間の脳神経系の働きを解明して技術力で実現しようという試みで、各素子の重みをベクトル変化させます。この仕組によって人工知能が人間と同じように学習することができます。学習機能以外にも分散処理や並列処理、自己組織化などが可能となります。機械学習とは人工知能における研究課題の1つです。人間の学習能力と同じ機能をコンピュータで実現しようとします。教師あり学習は機械学習の手法の1つで、予め与えられたデータを例題と見なします。例題は教師からの助言の役割を果たしており、人工知能が学習する際のガイドになります。具体的にはデータから何らかのフィッティングが行なわれます。例題と答えに関するデータのことを一般的に教師データと呼びます。 人工知能が教師データをガイドとして学習を行うためには教師となる人間が必要です。教師データを作成する作業は一般的にアノテーションと呼ばれます。人工知能が学習するには一般知識と文化知識の他に専門知識が必要とされます。一般知識はパンなど日常生活で使用される情報を指します。文化知識とは言葉の意図などを解釈するために必要な情報です。専門知識は病気画像などを診断する際に必要とされる特殊を意味します。これの情報の中でも特に一般知識のアノテーションを行うには多くのワーカー数を揃えて人海戦術で作業を行う必要があります。文化知識についてはアノテーション代行サービスを利用するのが一般的です。専門知識はそれぞれの情報に関する分野の専門家との共同研究が必要になります。人工知能が十分に性能を発揮するためには、優秀な人間を集めて正確にアノテーションを行うことが重要です。

パートナー企業一覧