アノテーション

教師データとEラーニング

機械学習(Eラーニング)には大別すると教師あり学習と、教師なし学習があります。教師あり学習では学習データに正解をラベリングして学習する方法になります。例えば何らかの花の画像を正しく認識させるために、その花の固有名の「バラ」などをラベル付けした「教師データ」を与えて、次々に情報を与えながら機会に応答関係を学習させていきます。この場面では何種類の花の映像を覚えることができたかが、その機械学習で得られるノードと言うことになる訳です。例えば1000種類の花の情報を覚えることが出来れば、1000ノードの出力をもつモデルと言うことになります。 これに対して教師なし学習では、学習データにラベリングを付与しないで学習させる方法です。WEB上に大量に出回っている画像や動画をラベル付けなしに学習するうちに、機械学習を行うAI(人工知能)が認識できるようになります。これは人間の幼児が明確な定義を提供されることなく、日々観察しているうちに正しく対象物を認識できるようになるモデルに似ています。 ところで教師あり学習においてよく用いられる統計手法は、「回帰」と言うものがあります。これは多種多彩な情報をプロットしたときに、一見すると関係性もないパラメータの集合の中に関係性を見出し関数を発見するというものです。例えばコンビニにおける弁当の売上を、天候や時間・販売宣伝広告・何らかのイベントの開催の有無などの要素とあわせてプロットすることで品切れなどの機会損失を回避しながら、売れ残って廃棄することになるロスを出来る限り減少させることが可能になるので効率的なマーケティングを可能にします。しかし関数を導き出すたたき台になるデータの選択には注意を払う必要があります。単に雑多な情報を集めてアルゴリズムやプログラムを向上させることだけでは、結果につながる予測の品質を担保することは困難です。教師データの取捨選択は依然、人間の選択と判断に左右される部分が多くあるのは留意しておくべきです。

パートナー企業一覧