~第4回~ シリーズ『AI画像認識』(2/3)

誰も言わないので、あえて言う『AI画像認識』、3つの真実【後編】

真実その2:ディープラーニングの頭脳を育てるには相当の労力がいる

ディープラーニングによる画像認識の精度を上げる、つまりは「頭脳を育てる」ためには、適切な数と品質を持った画像サンプルを準備して、ラベル付け(画像内のどこに何があるかを人が指定する作業)を行う必要があります。1つの対象物を認識するために、ときには1,000枚以上の画像が必要になることがあります。

図1は、教師データ(画像)を生成するための一連の作業イメージを示したものです。

教師データ(画像)生成のための作業イメージ図

図1:教師データ(画像)生成のための作業イメージ

この図に示すとおり、まずは認識対象物をさまざまな条件のもとで撮影します。そして、それぞれの画像の中で、「これが対象物です」というラベル付けを行い、最終的に該当部分のイメージを切り出した対象物だけが映った画像ファイルを作ります。これが教師データの元になります。

こうした一連の作業は、専用の画像編集ソフトを使うことで効率的に行うことが可能です。ただし、教師データとなる「適切な画像サンプル」を収集すること、そして、その画像に「認識率が高くなるようにラベル付けする」のは容易なことではなく、それには相応の労力がかかることを認識しておく必要があります。

ところで、「適切な画像サンプル」の「適切さ」の条件とは、一体何なのでしょうか──。
それを一口に言えば、「ディープラーニングの仕組みに認識される画像として、将来インプットされる可能性のある画像すべて」ということになります。より具体的には、例えば、以下のような条件が相当します。

  • 撮影の方向、大きさ
  • 撮影時の輝度、光の当たり具合(影の条件)
  • 画像のぼやけ具合
  • 過学習とならないための対象物以外の条件のバラつき
  • 予測時の画像条件(他との重なりなど)

これらの各項目について、マトリックス的に条件を考えていくと、その数は無限大に膨れ上がってしまい、画像サンプルを準備することは不可能です。そのため、現実的には、優先度の高い条件の画像から準備し、運用する中で徐々に不足する条件の画像を増やして、頭脳を賢くするのですが、とはいえ、最初の段階でどのような条件の画像サンプルを用意するかは重要なポイントとなります。

例えば、認識したい対象物が犬であるとしましょう。この場合、一つの教師データは、「シェパード犬」が「座って」「水を飲んでいる」ところを、「左上から光が当たっている状態」で、「右方向から」撮影した画像といったかたちになります。

また、これらの条件が、さまざまな組み合わせのもとで発生する可能があるので、理想的には、条件による画像サンプル数の“偏り”を抑えながら、1対象物あたり数百~数千枚のサンプル画像を準備することになります。
その逆に、AI画像認識を使ったシステムの運用時に、AIが認識(推論)すべき画像として発生する可能性のないものについては、教師データとして与えないほうが賢明です。

こうした教師データを準備するうえで求められるスキルの一つは、無限に考えられる条件の中から、AIの“頭脳”を育成するために必要な画像を絞り込み、画像点数を可能な限り減らすことです。

また、ここで詳しくは述べませんが、「どのようにラベル付けするか」によっても、認識率は大きく変わります。 対象物が複数重なって存在した場合、一部分しか見えていない場合、ぼけた画像などに対して、どのようにラベル付けするかも、ディープラーニングを上手に使いこなすための技術なのです。

このスキルを獲得することで、効果的な画像認識を他社に先駆けて実現し、自らの力で維持することが可能になるのです。

このように、AI画像認識を使ったシステムの運用時に、どのような条件の認識が必要になるかは、現場のことを熟知している担当者が最も的確に想定できるはずです。言い換えれば、AIの頭脳を育てるのに最もふさわしい人材は、現場の担当者というわけです。

もちろん、現場の担当者の方は、AIに関する知識を持っていないのが通常です。そうした方に、いきなり『AIの“育て親”』の役割を演じさせるのは現実的ではないと思われるかもしれません。ただし、この問題の解決方法はすでに存在するのです(その方法については、次回以降で紹介します)。

現在、サービス業界などにおいては、「顧客の情報を大量に収集して、適切に分析した者が市場を制する」と言われています。製造業界におけるAI画像認識についても、これと同様のことが言えます。すなわち、人が目視で行っていた作業を、少しでもAIに任せられる「頭脳」の作り方をいち早く習得した企業が、競争優位を確立できるというわけです。

そのために何よりも必要とされるのは、現場で認識すべき画像の特性を理解し、どうすれば教師データの収集・撮影が効率的に行えるかを考えられる担当者が現場にいることです。そうした担当者の力を、AI画像認識の発育に上手く活用できれば、現場の競争力は確実に向上します。また、画像認識について現場でのアイディアを即座に試したり、環境の変化や認識不良といった事象に対してすぐに対処したりすることも可能になるはずです。

商品に関するお問い合わせ

パナソニック ソリューションテクノロジー株式会社 お問い合わせ受付窓口
電話番号: 0570-087870
    受付時間: 9時00分~17時30分 (土・日・祝・当社指定休業日を除く)

お問い合わせイメージ お問い合わせイメージ

※ 記載されている会社名、商品名は各社の商標または登録商標です。なお、本文中では™、®マークは基本的に明記していません。