アノテーション

教師データの経験値

教師データとはコンピュータの人工知能が解決する必要がある課題に、より一層正しい回答を得ることが出来るように、前もって与えられている例題と回答のことを指します。画像系の人工知能が機械学習をするときには、正解の教師データをラベリングするのが非常に手間がかかる作業です。このとき教師データの問題の内容によっては、CGデータを利用してラベリングし終えた正解の教師データを作成する必要がある場合があります。ですので、いかにして効率的に教師データを作成するのかが重要です。 どのような教師データを作成する必要があるのかを理解出来るようになるためには、機械学習に関する経験を積む必要があります。何故かと言うと、どんな内容の教師データだと誤った学習を行ってしまうのかを経験を通して学ぶ必要があるからです。人物を検出する学習を行ったつもりが、教師データの画像を撮影した環境のことを学習してしまったということもあり得ます。 効率的な教師データを取得するプランを立てたいと感じるかも知れませんが、その前にデータを作成してコンピュータに学習させて、その学習結果を検証して、どうやって改善していくべきなのか何度も繰り返し考える作業が必要です。そのプロセスの中で獲得したノウハウをベースにしてデータを作成する作業を改善していく必要があります。 ネガティブなデータをどのようにして収集するのかや、ネガティブなデータの品質をどのようにして確保するのかということも大切な課題です。例えば、歩行する人を検出できるように学習させるためには街路樹は歩行する人ではないことを学習する必要があります。 同じように郵便ポストや立て看板、ガードレールなども歩行する人ではないことを学習することが必要です。他にも横断歩道や住宅の壁など歩行する人ではない物体を全て歩行する人として検出してしまうことがないに学習することが大切になります。このようにネガティブなデータを漏れなく収集することや全てを学習することが商品として提供できる品質の検出器を作成するために必要です。

パートナー企業一覧