機械学習とディープラーニング

旧来の機械学習と新しいディープラーニングのそれぞれの特徴や違いを見て行きたいと思います。例えば、犬と猫が混在した写真があるとします。よく見ると、左側に犬が集まり、右側に猫が集まっていたとします。これを見た人は、ほぼ瞬間的にどれが「犬」、どれが「猫」と判断がつくのではないでしょうか。では、なぜ、その判断がつくのでしょうか。理由を説明しろと言われても、なかなか難しいですよね。犬と猫の違いを探すのは、わかっているようでいて、それを言葉に表現しようとすると、案外むずかしいものです。さらに、コンピュータに「犬・猫の違い」を伝えようとすると、尚更難しいでしょう。AI分野で少し前まで盛んに使われていた方法で、「犬」と「猫」をどのように認知し、どのように分類していくかについて考えてみましょう。旧来の機械学習のプロセスを考えてみると、まず①犬・猫などの特徴(耳の形、シッポなど)を人間が教える(特徴量の抽出方法)、そして②画像を入れたあと、「これは犬」「これは猫」と人間が教える(タグ付け=アノテーション)というものです。犬・猫の区別をコンビュータにやらせようとすると、何らかの「計算式」を使って判断させることになります。ところが、計算式を使うには、「耳が違う」「鼻が違う」など、一つひとつ犬・猫の特徴を捉え、どう違うのかを教えなければいけません。これらの「特徴」を数値化したものを「特徴量」と通常呼んでいます。また、特徴量を割り出すことを、AIの研究者は、「特徴量を抽出」すると表現します。