アノテーション

教師データの重要性

AIは人間の知能を学んで学習することが必要な人工知能で、AIが学習するためには教師データが必要とされています。こうした教師データを作成するのがアノテーションといわれる加工や処理で、こうした加工処理を経てAIが人間の行動や機械の動作など、企業活動によって毎日蓄積されるデータを活用価値のあるものに変えることができるようになるといわれています。 このしたアノテーションは深層学習などを含む機械学習モデルに学習をさせるための教師データ作成になるということなのですが、こうした教師データは正解データやラベリングなどが必要になります。アノテーションには主には3つの手法があるといわれており、画像に写っているものに対し、人や電車といったタグ付けを行う物体検出という方法と画像に色を塗って、色塗り部分の意味をタグ付けする領域抽出という方法、そして、画像に対して属性をタグ付けする画像分類という方法があるのです。画像分類は画像に対して、この画像は猫なのか犬なのか、どんな色かなのかやどんな模様なのかといった点からタグをつけるということなのです。 あのテ―ションの際の手法は、用途によって変わってくるといわれていますが、機械学習の場合には高精度のAIモデルを作成したいというお場合には10万件くらいの膨大なデータが必要とされるといわれています。こうしたシステムをビジネスで用いたいというケースでも、機械学習における教師データ作成は多くの人手やコスト、時間などが必要とされ手いるのです。その理由としてこうしたタグ付けには人の手がどうしても必要になり、日本人であれば日本語でのタグ付けを行うというケースが多くなっており、海外のものをそのまま利用すればいいというわけにはいかないということなどが挙げられているのです。 このようなコストや工数などの課題を解決するために、このようなデータ作成の代行サービスがスタートしたということなのです。

パートナー企業一覧