TDK
Tech-Mag TDK Techno Magazine 〜テクマグ〜
サイト内検索
メールマガジン登録個人情報保護基本方針
home
電気と磁気の?館
じしゃく忍法帳
フェライト・ワールド
column
テクの雑学
アースサイエンス&TDKテクノロジー
パワーエレクトロニクス・ワールド
コンデンサ・ワールド
なるほどノイズ(EMC)入門2
なるほどノイズ(EMC)入門1
過去の読み物

TDKホームページ
 トップページテクの雑学 > 第132回 もはやピント合わせは不要? 最適な表情までもナビするデジタルカメラ
テクの雑学

第132回 もはやピント合わせは不要? 最適な表情までもナビするデジタルカメラ

 年末年始は、クリスマスやお正月の会合、さらには、忘年会や新年会などのイベントが集中し、写真を撮る機会が増える時期ですね。最近のデジタルカメラは非常に多機能化していますが、中でも「顔認識」関連技術の進化の速さには、驚かされることが多いものです。今回は、その「顔認識」についてとりあげてみたいと思います。

 ただし、最初にお断りしておきたいのですが、カメラメーカーにとって顔認識関連の技術は重要な機密事項に属するもので、そのしくみについて公式に語られたものは、あまり多くありません。新製品発表会などの機会に技術者に話を聞いても、ほとんどの場合、ごく基本的な一般論しか語ってもらえません。よって、今回は筆者が過去に取材した事柄をベースに、さまざまな資料を元にした推測も混じえて書かせていただきます。

今後の成長株、パターン認識のしくみと流れ
 「顔認識機能」とは、デジタルカメラの撮像素子に入ってくる光学的情報の中に、人間の顔と判断できる要素が含まれているか否かを判断し、含まれていた場合、その部分にピントや露出を合わせる機能です。たとえば風景をバックにスナップ写真を撮る場合、やはりピントは人間、それも顔に合っていることが望ましいですよね。しかし、一昔前のコンパクトデジタルカメラでは、オートフォーカス(AF)機能でピントを合わせる位置を任意に調整するのにコツが必要なものや、ピントがきちんと合っているかを確認しづらいものが少なくありませんでした。そのような事情によるピンボケを解消するために考案されたのが、顔認識機能です。

 ここ数年の間に登場したデジタルカメラでは、顔認識機能をさらに進化させて、顔部分の色調を調整する(「美肌モード」などと呼ばれます)、人が笑ったと判断したら、その瞬間にシャッターを切る(「スマイルシャッター」などと呼ばれます)、大人の顔と子どもの顔が同時にフレーム内に収まっていた場合は、子どもの顔にピントを合わせたり、あらかじめ登録した人物の顔に優先的にピントを合わせる……といったように、機能がどんどん拡張されています。


 このような顔認識技術の基本にあるのは、情報処理の「パターン認識」に関連する技術です。パターン認識とは、「入力(観測)」に対してなんらかの処理を施すことで、「出力(推定量)」の精度を高めたり、分類を容易にするための技術分野の総称です。非常に奥が深く、かつ広い範囲に応用できる技術分野で、たとえば、ここから派生した「データマイニング」技術は、ネットオークション上のユーザーの行動をパターン化することで詐欺行為などを未然に防止したり、果ては金融市場の動向予測などにも応用されているのですが、話を簡単にするため、とりあえず信号処理の基本である「Signal/Noise」に当てはめて考えてみましょう。

 会議の記録を残すため、ICレコーダーを使って録音するとします。このとき、高感度なマイクを使い、録音ファイルのビットレートを高くするほど、取り込んで保存できる音の情報量(=Signal)が増え、「いい音」で録音できます。ただし、情報量が増えると、室内のエアコン作動音などの雑音(=Noise)も一緒に録音されてしまうといった問題も生じます。それを避けるため、最近のICレコーダーには、マイクの感度や指向性を調整したり、「ローパスフィルタ」を使って特定の周波数のノイズをカットしながら録音する機能が搭載されています。いずれも、種々雑多な情報の中からSignalだけを残し、Noiseは分離・排除するためのものと考えることができます。音声認識の技術もハイペースで進歩していますから、そう遠くない将来には、より高度なSignal/Noise処理が期待できます。たとえば、大勢の人がいっせいにしゃべっていても、あらかじめ登録した人の声だけを録音する、といったことも可能になると考えられます。

 このように、種々雑多な情報の中から、目的の情報だけを取り出す、もしくは、情報を種類ごとに分類するため、特定の事柄に共通する要素を捉え、パターン化することが、「パターン認識」の基本です。そして顔認識技術で用いられている「画像認識」は、録音における「音声」を、「光学情報」に置き換えたようなものと考えていいでしょう。
前のページへ | 1/2 | 次のページへ

ページtop
HOME 電気と磁気の?(はてな)館 アースサイエンス&TDKテクノロジー テクの雑学 コンデンサ・ワールド
Copyright(c) 1996-2014 TDK Corporation. All rights reserved.
※記事の内容は、記事掲載時点での情報に基づいたものです。一部、現在TDKで扱っていない製品情報等も含まれております。
TDKホームページは、Internet Explorer5.5以降、Netscape Navigator7.0以降でご覧いただくことを推奨しています。