Machine Learning:機械学習

Source of Technologies

機械学習はAIの技術のひとつです。ここでは、機械学習、そのアルゴリズムであるニューラルネットワーク、それを活用した機械学習であるディープランニングについて紹介させていただきます。

機械学習

機械学習とは、膨大なデータを学習し、コンピュータが予測や分類などのタスクを遂行するアルゴリズムやモデルを自動的に構築する技術です。データによるトレーニングで、規則性や関係性を構築し、タスクを高い精度で処理することができるようになります。

機械学習では、人間が学習の為の特徴量を選択する必要があります。特徴量とは、コンピュータが物事を認識する際に基準とする特徴のことを指します。例えば「りんご」の画像認識においては「色」「形」などが特徴量として挙げられます。画像に写っている「もの」が赤色であれば「りんご」の特徴に合いますが、虹色ならば「りんご」ではなく、色によって「もの」を「りんご」と判断することになります。

AIに「色に着目して区別しなさい」と指示を与えておくと、まだ解析していない「もの」の画像が出てきたときでも、AIは「もの」の色に着目する。そして学習により、それが「りんご」なのか、さらに「どの様なりんご」なのかを分別するように自ら学習することになります。

機械学習を機能させるアルゴリズムとしては、線形回帰、決定木、サポートベクターマシン(SVM)、ナイーブベイズ(単純ベイズ分類器)、クラスタリング(k平均法)、ニューラルネットワークなど、さまざまな手法が存在します。

機械学習では、アルゴリズム以外に目的に応じて学習方法を選択する必要があります。
「教師あり学習」は、答えを教える学習方法です。事前に、「りんご」の「色」「形」などの特徴量と「りんご」であるというデータを一緒に学習させる方法です。
「教師なし学習」は、「りんご」の「色」「形」「甘さ」「産地」などという特徴量だけを与え、答えを教えません。与えられたデータの特徴や法則を自動的に抽出し、どの「産地」のどの「りんご」が「赤くて甘い」のか?といったクラスタリング分類を得意として使われます。
「強化学習」は、「試行錯誤」と「遅延報酬」を行なって、その中で、どのような行動が最適なのかをシナリオを試行し、予測し、取るべきアクションを構築するときに使われます。

ニューラルネットワーク

ニューラルネットワークは人間の脳の神経回路を数式で表模したものです。人間の神経回路では、刺激があるとニューロンから電気信号が発生し、それが一定以上になるとシナプスを経由して連結している次のニューロンへと信号が伝達していきます。

機械学習で、最初にニューラルネットワークとして考案されたものが、「パーセプトロン」です。「パーセプトロン」は、式1で表されます。xが入力値、wは重み、θは閾値(バイアス) 、∑が関数、yが出力値です。

例えば、「りんご」で、前に述べた特徴量である「色」「形」を例に考えてみましょう。
「色」は赤色といっても様々な濃淡があり、「形」も丸いといっても様々な形があります。
式1では、x1が「色」、x2が「形」など・・特徴量になります。
w1やw2などは、xにかける重みで、機械学習では、正しい出力値を出力するために、重みの値を学習して変えていきます。特徴量が、判断にどの程度影響があるかを学習により知ることで、学習により「青」の「りんご」もあるということを知ると、「色」の重みが変わることいなります。

こうやって、xが入力され、式1の()内の値が、閾値(バイアス)θを超えると、1が出力されます。ここで、出力が不正解の場合は、wの値が変わっていきます。

式1 パーセプトロンの式

 このアルゴリズムでは、出力が1か0の二つにしか分けることが出来ない(線形分離可能な問題以外を解くことが出来ない)という課題がありました。

figure 1 Perceptron Models

この問題には、入力層と出力層の間に隠れ層を取り入れ、多層にした「マルチレイヤーパーセプトロン」が新しく考案されました。この技術により、「パーセプトロン」では処理ができなかった非線形分離も可能になり、複雑な機械学習による処理ができるようになりました。

ディープラーニング

この次に生まれたのが、ディープラーニングです。従って、ディープラーニングは「隠れ層が多数存在する多層構造のニューラルネットワーク」の機械学習がベースとなっています。

ディープラーニングでは、どの特徴量を参考に学習すればいいのかもコンピューター自身が判断します。上記のりんごの例では、「色」「形」や「それ以外」になにを参考にするのかをコンピューターが判断し、正確な分類を学習していきます。人間の作業量が少なく、人間では分別が難しい特徴量を持つ場合に有効に働きます。例えば、先程の「りんご」の例で言えば、「りんごであるかそうでないか」の判断のレベルではなく、農家が経験によって振り分けるしかない「りんごの仕上がり」の予測までも適応させる試みが行われています。

しかし、コンピューターが自ら学習し判断することから、出力結果の経緯を説明できない「ブラックボックス化」が課題としてあります。人命に関わるような判断をした場合、「何故そのような判断をしたのか」といった説明が重要ですが、これに対してどの様に取り組むのかが、今後の課題となります。

機械学習による事例としてアルミニウム合金の開発が試みられています。詳しくは以下を見てください。

コメント

  1. […] […]

  2. […] […]

Translate »
タイトルとURLをコピーしました