AI画像による基礎研究

今では、私たちの生活の中にも活用されている画像認識技術。画像認識技術は研究や商品開発にも役立てることができます。そこで、ここでは画像認識技術とは何かに加え、おすすめのソリューションもご紹介します。

画像認識とは? 種類や事例、AI活用における動向は?

AI技術の一つである画像認識技術。私たちの生活の中にもAI画像を用いた技術はたくさん使われています。しかし、そもそも画像認識とはどんな技術なのでしょうか。まずは、画像認識や画像認識に欠かせないディープラーニングとは何かを解説していきます。

画像認識とは?

 画像認識は画像や動画から色や形などの特徴を検出し、その特徴から画像・動画に何が写っているのかを識別する技術のことを言います。例えば、いちごなら赤く緑色のヘタがついている、つぶつぶが付いているなどの情報からいちごであると判断します。ただ、コンピュータは人間とは違い、丸いなどの情報を識別することができません。そこで、コンピュータは画像や動画を構成するピクセルデータに対して何かしらの演算を行い、特徴量を算出して識別作業を行います。

 画像認識技術は、私たちの生活の中でも様々な場面で活用されています。数ある画像認識技術を活用したものの中でも、最も古いものがバーコードと言われています。バーコードはバーコードスキャナという専用の機器を用い、太い線、細い線とバーコードの太さで番号を識別し、商品をレジに登録します。人工知能開発の発展に伴い、画像認識技術は年々進歩しており、精密度も高くなっています。

ディープラーニングとは?

 画像認識技術自体はさほど新しい技術ではなく、実は1960年代から存在しています。ただ、画像認識技術が一般に広く知られるようになったのは2000年代に入ってからのことです。2000年代はインターネットが普及し、デジタルカメラやノートパソコンなど電子機器の小型化なども進み、急激にIT技術が進歩しました。この時代にデータの規則性をコンピュータに学習させる機械学習が登場し、AI技術も大幅な発展を遂げました。そして、ディープラーニングが登場したことで世界中でAIブームが起こり、画像認識技術もディープラーニングを活用したものが一般的となります。

 ディープラーニングとは深層学習とも呼ばれ、機械学習をさらに発展させたものに当たります。機械学習は事前にパターンを教える必要がありましたが、ディープラーニングではコンピューターにパターンを見つけるための方法を教えるのが特徴です。そのため、ディープラーニング技術を用いた画像認識システムでは、コンピューターがアルゴリズムを自動的に作成し、自分で画像から特徴を探し出して画像を処理することができます。

画像認識技術の種類

画像認識技術にも様々なものがあります。ここでは、画像認識技術の種類にはどんなものがあるのかを具体的にご紹介していきます。

物体検知

 物体検知とは物体検出とも呼ばれ、画像に写っているものの特徴や位置、個数を識別する技術のことを言います。例えば、画像の中に複数のものが写っているとして、これは人である、猫が2匹いるなどと識別するのが物体検知です。物体検知が使われている技術としては、デジタルカメラやスマホカメラのピント調整機能が挙げられます。これらのカメラでは、レンズに写っている人の顔にピントを自動的に合わせてくれます。「ここに顔がある」というように識別できるのが物体検知です。これ以外にも、物体検知の仕組みは監視カメラや建築現場における外観診断、自動運転などに活用されています。

 物体検知に使われている技術にはR-CNN、YOLO、SSD、DETRが挙げられます。R-CNNはディープラーニングを使わないやり方で、画像の中から2,000個近い特徴を抽出し、特徴量を検出して画像を分類します。YOLOはニューラルネットワークを使った物体検知の方法です。R-CNNと比べてスピーディーに物体検知ができるのが強みであり、AIを用いた物体検知が広まるきっかけとなりました。そして、YOLOを改良して精度を向上させたのがSSD、入力と出力を単一モデルで行うシンプルなものがDETRです。

顔認識

 顔認識技術は、目や口、鼻などパーツの形や配置などそれぞれで異なる特徴から人間を識別する技術のことを言います。顔認証技術が活用されたものとしては、顔認識を使った生体認証ロックが有名です。非接触で感染症対策になる、鍵が必要ないためセキュリティ性が高いなどのメリットから顔認識システムを導入する企業は増えています。

 顔認識の方式は、主に2D認証(ビジュアル方式)と3D認証(IR方式)に分けることができます。2D認証は、主に正面から見た際の顔のパーツの形や配置などで識別する手段を言います。手軽に使える手段ではありますが、その分光の角度などによって精度が左右されてしまうのが難点です。それに対して、3D認証は2D認証に赤外線センサーを加えることで、立体的な識別ができるようになっています。センサーの導入コストがかかりますが、髪型やメイクが変わっても顔のパーツの特徴で人を識別できるのが3D認証の強みです。

文字認識

 文字認識は、画像や動画に写っている文字をコンピューターで扱えるデータ形式に変換する技術のことを言います。文字認識を使った技術としては、手書きでもパソコンで作成されたものでも紙の書類をWordなどで取り扱えるテキスト形式に変換するものが有名です。また、文字認識技術を応用したものとして、英文にカメラをかざすだけで翻訳が出てくるものなどもあります。文字認識の仕組みは、まず画像をブロックに分け、そのブロックの中にある文章を探し出してさらに行に分けます。次に行の中にある文字を識別し、辞書と照らし合わせてテキストファイル化します。サービスによっては、AI辞書との連携を行うことで文章内の誤字を自動で訂正できるものもあります。

 現代では、業務効率化の一貫として書類のペーパーレス化が進んでいます。また、個人でも手書きの勉強ノートをテキストファイル化して、パソコンやスマホに入れて持ち運ぶ人が増えています。文字認識技術を活用したアプリケーションを使うことで、かさばりやすい紙の書類を持ち運ぶ必要がなくなったり、書類を紛失するリスクを減らせます。

画像認識技術の活用事例

画像認識技術は具体的にどんなものに活用されているのでしょうか。ここでは、画像認識技術が使われているサービスの例や仕組みについて解説していきます。

事例:無人コンビニ

 コンビニは人手不足が深刻なことから、店員がいないもしくは少ない無人コンビニ形態を導入する企業が登場しています。無人コンビニの種類はセルフレジタイプ、もしくはウォークスルータイプの2種類があります。セルフレジタイプは本来店員が行ってきたレジ打ち作業を客が自分で行い、電子マネーやクレジットカードを用いて決済を行います。このタイプではカゴの中にある商品とレジ登録後の商品の重さを比較してレジに通っていない商品があったら警告を出す、店員を数名配置するなどして万引き防止策を実施しています。

 ウォークスルータイプでは、事前にスマホに専用のアプリをインストールし、入店時にアプリを起動するなどして入店が確認できたらお買い物を開始します。そして、欲しい商品を手に取ったら退店時にキャッシュレス形式で決済を行います。店舗によっては、何もしなくても退店時に事前にアプリに登録しているクレジットカードから料金が引き落としされるところもあります。こちらの仕組みは、監視カメラに写っている客の動作や陳列棚に付いている重量センサーなどを活用して購入した商品を識別できるようになっています。

事例:監視カメラ

 画像認識技術が向上したことで監視カメラもより精度が高く、セキュリティ性に優れたものになっています。監視カメラに応用されている防犯関連の画像認識技術は様々です。例えば、小売店では万引き防止として怪しい動きをしている人を見つけたらアラームを鳴らす監視カメラが導入されています。具体的には監視カメラを何回も見ている、商品を何回も棚に戻しているなどで、このような動作を識別するのも画像認識技術です。また、駅では飛び込み事故を防ぐために、怪しい動きをしている人物を見つけたらアラームが鳴る監視カメラが導入されています。それ以外にも、酔っ払いや進入禁止エリアの進入などに対してアラームを鳴らしてくれますので、駅員がトラブルに対して早期対応することが可能になっています。

加えて、企業では登録している社員の顔データをもとに監視カメラに映る人を識別する監視カメラも登場しています。これにより、部外者の侵入リスクの低減や社員間トラブルへの早期対応が可能です。

AIを活用した画像認識ソリューション紹介

現代では、様々な企業がAIを活用した画像認識ソリューションを開発しています。ここでは、中でも代表的なものをご紹介していきます。

コベルコ株式会社「画像認識AIソリューション」

 コベルコ株式会社は、製造業に特化したソリューションを提案する企業です。そんなコベルコ株式会社では、製造業の現場の業務量を減らせる画像認識AIソリューションの開発を行っています。こちらの画像認識AIソリューションを用いることで、製造ラインの良品・不良品チェックや稼働状況のチェックなどができますので、生産性の向上に繋がります。また、物品検出機能もあり、高所など危険な場所の保守点検やスタッフの安全ヘルメット・ベストの確認にも活用できます。

コベルコ株式会社の画像認識AIソリューションでは、ディープラーニングを採用しています。製造業の仕事は伝承が難しいものも少なくありません。そこで、特徴量を検出して規則性を見つけるディープラーニングを採用することで、伝承が難しい技術を機械化し、業務効率化を実現します。

パナソニック株式会社「AI画像認識ソリューション」

製造業や食品加工業、物流業など様々な分野において活用されているのがパナソニックのAI画像認識ソリューションです。こちらのAI画像認識ソリューションでできることは、不良品や設備の欠損の検知だけでなく、物品の持ち出しチェックや荷物の個数カウント、ラベルの読み取りなど多岐にわたります。食品など製造ラインで必要な機能が一通り備わっていますので、製造〜管理を一通り1つのアプリケーションで管理できるのが便利です。また、パナソニックのAI画像認識ソリューションは操作のシンプルさも魅力です。機械に強くない人でも手軽にAIシステムの構築から評価までできます。万が一それでも仕組みがわからない人向けに、オプションとして導入やモデル構築のサポートサービスも用意されていますので、初めてAIを導入する際の心配も必要ありません。

NECソリューションイノベータ株式会社「NEC AI」

 画像認識技術で国内トップクラスの技術力を誇るNECが開発している、製造業向けの画像認識ソリューションがNEC AIです。NEC AIでは簡易的な設備・操作で不良品のチェックができるのが強みです。画像認識技術を用いた設備を導入するには専用のカメラなどを新たに導入する必要があり、導入コストが高く付いてしまいがちです。NEC AIなら一般的なネットワークカメラとパソコンさえあれば導入できますので、導入コストを安く抑えられ、小規模な事業所に向いています。また、NEC AIは良品のみを学習することで、検出する不良品の精度を向上させているのも特徴です。良品のみを学習しますので、良品・不良品両方を学習させた場合と比べて、発生頻度の低い不良品も検出可能となってます。しかも、処理スピードもほぼリアルタイムと高速です。このように、NEC AIなら手軽に高品質な画像認識ソリューションを導入できます。

画像認識の研究に使えるサービス「INAI MODEL」

イメージナビ株式会社が開発するINAI MODELでは、AI技術を用いて男女問わず架空の人物を作ることができます。モデルを用意する必要が無く、スチール撮影などの予算も削減できます。ここでは、そんなINAI MODELのサービス内容を詳しくご紹介します。

GANで作られた「INAI MODEL」複数の人物画像をAIで作り出し、研究用の膨大なデータに活用可能

 INAI MODELは、発注内容に合わせてAIで架空の人物画像を作ることができます。こちらは主にスチールモデルに使われることが多いですが、それ以外の用途に使うことも可能です。実際に人に対するイメージの研究などにも応用されています。例えば、体が華奢など外見が理由でクレームの対象になりやすい人がいます。そこで、クレームを受けやすい人とそうでない人の研究を実施するだけでなく、INAI MODELで作成したクレームを受けにくい外見のバーチャルモデルが応対を行えば、クレームを削減することも可能といった研究も行われています。

INAI MODLE

まとめ

イメージナビ株式会社が開発するINAI MODELでは、AIを用いてイメージモデルからバーチャルモデルまで様々な架空の人物を作成することが可能です。インターネット社会と言われる現代で顔を出すリスクは大きいです。そこで、INAI MODELを活用することでクレームのリスクを減らしたり、社員の個人情報を守ることができます。バーチャルモデルの導入を検討しているなら、INAI MODELを検討してみてください。

INAI MODEL公式サイトはコチラ