アノテーション

教師データを人材不足の解消に

様々な業界の声に押され、AI(人工知能)の開発は急がれています。それでも、ちまたではまだ実験段階というイメージが付きまといます。なぜ実用にかなったAIの開発が進んでいないのでしょうか。その背景にあるのが、AIの学習に必要な教師データと呼ばれる入出力データの作成の壁です。実は実用にかなうAIの開発には、質の高いこの教師データが大量に必要で、AIは教師データを元に規則性などを学習します。教師データの作成には、必要なデータの整理や関連情報など大切で、このことに多くの時間や人材が当てられています。この教師データの作成に欠かせないのが、データサイエンティストの存在です。データサイエンティストは、データモデルの設計やデータの分析を行い、効率よく学習できるように導く存在です。ですが、日本ではデータ解析などの統計学を専門に学んだ大学卒業者は、アメリカに比べてかなり少ない数となっています。そのようにデータサイエンティストを含むIT技術者が足りないため、本来行う業務の前の教師データの作成に大半の時間を費やしてしまっているのが現状です。これらの状況を改善させるためには、今よりも2000名以上のワーカーが必要とされるとも言われています。さらに日本では、かねがねビッグデータの重要性が問われ、企業は膨大なデータを保有しています。それにも関わらず、AIの普及が進んでいないのは、データの収集や管理方法などが確立していないため、データの活用が行えていないことに原因があると言わざるを得ません。そのため、それらのビッグデータの活用に積極的な企業の割合は、アメリカやドイツなどと比較すると、20パーセントほど低い数値となっているようです。また、日本では、日本語と言う独特の言語の壁も存在します。英語にある文章中の単語の分かれ目や大文字を使用しての人名や地名の判断など、日本語の自然言語としての処理技術の向上が課題とされています。

パートナー企業一覧