アノテーション

教師データによる人工知能の開発

教師データは人工知能の基礎とも言えるデータで、最初の難題とも言えます。 現在文字認識や画像認識などセキュリティに欠かせない教師データですが、どのようなジャンルであっても高品質な人工知能を開発するためには多種多様な情報が必要です。情報が多ければ多いほどより精度の高い正解を導き、たとえ情報が不十分でも正確な情報があれば少なくとも正解率は向上します。 そんな大切な基礎である教師データの世界に日本は海外よりも遅れているのが現状です。 もちろん日本でも教師データの重要性は理解しているものの、日本人による教師データは作成までが良いところで、その運用は難しいと言えます。実際にデータの業界では教師データの作成にほとんどが費やされているようです。また企業においてもデータの活用を重視しているところは海外よりも2割低いとされています。日本における情報産業は世界規模ですが、海外よりも遅れている理由は未だそのデータの管理や収集など活用法が確立されていないからです。反対に海外では保有しているデータを活用する基礎が出来上がっています。 日本人の科学離れは度々ニュースになっているのが実際のところです。 それを反映するようにデータの作成を行うサイエンティストの人材不足を主に開発期限の負担や数多くの課題を解消できない事によるモチベーションの低下など様々な理由が教師データの運用を遅らせていると推察されています。他にも 膨大な情報収集に人間が追い付けず、挫いてしまうケースがあるようです。 現時点では人材育成が将来のためですが、海外で実用されている教師データを作成するための手段を取り込むなどの手段が挙げられます。また企業独自で教師データ作成のフレームを開発する手段もありです。付け加えるなら日本の教師データ作成の遅れに注目し、機械学習とクラウドソーシングを融合させて人工知能の向上を目指す「DefinedCrowd」を開発した会社が支社を日本に設立しています。

パートナー企業一覧