第17回:シリーズ『AI画像認識 再入門』(2/2)

「5歳児 vs. AI」で知るAI画像認識のキソ

例えば、画面の右手から左手へと、ビー玉がさまざまな動きをしながらゆっくり通り過ぎていき、それを見ながら「いくつ通り過ぎたかを数える」という場面を想像してください。この場合、5歳児の花子ちゃんでも、「ひとつ通った」「ふたつ通った」と簡単に数を数えることができるでしょう。

ところが、AIにこの認識をさせるとなると大変です。というのも、動画はいくつもの画像(フレーム)で構成されていて、それぞれのフレームが、ひとつのビー玉の連続した動きを示すものなのか、それとも、別のビー玉の新しい動きを示すものかが、AIにはなかなか認識できないからです。途中でスピードや方向が変わる場合だけでなく、ビー玉が一定の速度で一定の方向に動く場合にも、AIによる画像認識に加えて、ビー玉を追跡する処理が必要なため、認識の難度は高くなります。

同様に、AIにとって難度が高いのは、「対決6」の「食べこぼしのシミを認識する」という作業です。例えば、衣服やテーブルクロスに、図4のような、食べこぼしのシミがあったとします。

図4:衣服の食べこぼしのシミ
図4:衣服の食べこぼしのシミ

このような食べこぼしのシミは、ヒトであれば、それが「シミ」であるとすぐに認識できます。それは、5歳児の花子ちゃんでも同様でしょう。

ただし、実のところ、シミの色合いや形状は一定ではなく、一つとして同じものはありません。また、シミの輪郭は鮮明でない場合が多く、どこが端なのかはっきりしません。そのため、シミの画像を大量に学習させても、AIがそこから適切な「シミの特徴」を抽出する難度は高く、抽出した特徴との照合によって、精度よく「シミと模様」を区別したり、「これはシミである」と判定したりすることは困難なのです。逆に5歳児でも、シミをシミと簡単に認識できてしまうのは、ヒトだからできることで、そこにヒトの情報処理能力の凄さがあると言えます。

AIの凄さの本質

以上のように、AIとヒトには、画像認識においてそれぞれ得意とするところが異なります。ですから、AIによって、これまでヒトが目検で行ってきた画像認識系の全ての作業がすぐに自動化できるとは言えませんし、前出のシミのように、ヒトなら、5歳児でも簡単に行える画像認識がAIではなかなかできない場合があります。

しかし、だからといって、ヒトよりもAIのほうが劣っているわけではありません。静止画におけるビー玉カウントの例のように、ヒトでは到底できないような作業を簡単にやってのけるのもAIであり、そこにAIの凄さの本質があると言えます。

ですから、AIの得意分野とヒトの得意分野を理解したうえで、AI画像認識でどのようなシステムを実現し、ビジネスに生かしていくかを考えることが大切です。

今日のAI技術の主流であるディープラーニングは、多くの学習データ(過去の実績)を元に、ヒトに似た「頭脳」を生成して、新たに発生する事象の意味を「推論」する技術です(図5)。

図5:ディープラーニングの仕組み
図5:ディープラーニングの仕組み

この技術によって業務の効率化を図ろうとする際には、AI画像認識で何を実現すべきかを明確に定めたうえで、数多くの適切な画像を集め、学習させ、特定の画像認識に特化した頭脳を作り上げなければなりません。

その作業には相応の手間と時間を要する場合がありますが、いったん頭脳が出来上がると、ヒトの判断を支援したり、ヒトの苦手な作業を肩代わりしてくれたりする頼もしい存在として活躍する可能性があります。

また、製造ラインにおける「検品」のプロセスにおいては、パターンマッチングの技術を使った「良品/不良品」の判定がすでに行われている場合がありますが、この技術を使った認識には限界があります。AIを利用することで、従来のパターンマッチング技術ではカバーできない領域の画像認識を行い、大量の製品に対する良品/不良品の判定精度を高めることができる可能性があるのです。

次回は、そうしたヒトや従来技術とは異なる凄さを持ったAIを、ビジネスでどう生かすかについて考察します。

―― 監修 ――

中尾 雅俊

 

中尾 雅俊
パナソニック ソリューションテクノロジー株式会社
AI・アナリティクス部 ソリューション推進課 主事

バックナンバー

商品に関するお問い合わせ

パナソニック ソリューションテクノロジー株式会社 お問い合わせ受付窓口
電話番号: 0570-087870
    受付時間: 9時00分~17時30分 (土・日・祝・当社指定休業日を除く)

お問い合わせイメージ お問い合わせイメージ

※ 記載されている会社名、商品名は各社の商標または登録商標です。なお、本文中では™、®マークは基本的に明記していません。