アノテーション

教師データという意味合い

教師データと聞いてどんなものを指しているのわかる人はそう多くないのかもしれません。 人工知能を開発する際に用いられる手法の一つで、事前に与えられたデータを元に入力されたものから結果を導き出す計算方法のことで、大量のデータを教師となる人間が用意し人工知能に与え、一度入出力のデータを学習してしまえば他のデータにも適用して結果の予想が可能になります。 将来的にはデータを自動的に取り込んであらゆることを学び、どんな問題も解決してくれるという想像をして言う人がいらっしゃるかもしれませんが、人工知能を使うためには目的や課題を明確にする必要があるので質の高い教師データを作らなければいけません。 今まではデータ分析をするには、人間がやらねばならず非常に大きな負荷が一部の人間にのしかかっていたので、それを人工知能に任せれば人間に対する負荷が少なくなり他の生産的な仕事にエネルギーを注ぐことが出来るようになり、分析漏れがほとんど無くなり非常に安定した業務を行うことが出来ます。 例えば、医療では患者のデータを入力すると論文や臨床データを参照し癌のような遺伝子の変異をピックアップし、現時点で最も適した治療法や薬を提示したり、院内や家庭での転倒・転落のリスクを看護師側に伝え事故を未然に防ぎ患者の安全と看護師の業務の低減に役立っています。 しかし、実際にビジネスの現場で使えるような質の高い教師データを作る為に大量のデータを扱わなくてはいけないのですが、相対的に大量の優秀なデータサイエンティストやITの知識を持つ人間が必要になってきます。 日本はICTという通信技術を利用したサービスや業務が世の中に浸透していて単純な情報量だけで言ったら世界トップクラスなのですが、2000名以上のワーカー教師データの作成に取り組んでいるものの、まだまだデータが足りないのが現状で欧米と比べると約1/10程度しかいなく、20万人程不足しているという試算も出ています。

パートナー企業一覧