画像・映像に関する技術開発支援コンサル
主席研究員 大塚宏子
2008年9月8日(月曜日)
次世代の検索を考える上で、映像検索は非常に重要な要素と言えます。映像検索といったとき、現在は、映像に手動あるいは自動でつけられているキーワード等(メタデータ)を使って、キーワード検索を行う方法が一般的です。しかし、世の中には、メタデータのついていない映像が数多く存在しており、人手でメタデータを付与しようという取り組みも行われていますが、手間のかかる大変な作業であり、なかなか進んでいないのも実情です。それでは、メタデータのついていない映像を二次利用、三次利用するため、あるいは、個人で楽しむために、欲しい映像を探すにはどうしたらよいでしょうか。
例えば、写真等の画像でしたら、欲しい一枚を特定することは、現在の技術を用いるとある程度容易にできます。しかし、映像の場合は、“どの映像か"ではなく、映像の“どの部分"か、というところまでも特定しなければなりません。今は、映像を探すには、人間が一本の映像を最初から最後まで早送りして見ながら、欲しい部分を特定することでしか対応できません。映像の内容を自動的に把握することができれば、最初から最後まで映像を見なくても、自動的にメタデータを付与することもできますし、メタデータを使わずに映像で映像を検索する、言わば真の映像検索もできるようになります。そのためには、コンピュータが自分で、映像の意味を理解し、同じものや似たものを判断できなければなりません。
映像を意味理解するためには、まず、映像を似たかたまりで区切ります(ショット分割)。次に、区切られた映像(ショット)の中から代表的な画像(フレーム)を取り出します(代表フレーム抽出)。さらに、取り出された画像について、色ヒストグラム特徴、代表色特徴、色レイアウト特徴等により色の特徴を抽出したり、一様性パターン(模様のパターン)、エッジ分析(画像内に生じる明るい部分と暗い部分の境界の分析)等によりテクスチャー(模様)の特徴を抽出したり、さらには、領域形状、輪郭形状等により形状の特徴を把握します。また、軌跡特徴から動きの特徴も把握していきます(低次画像特徴抽出)。音声についても同様に、パワー特徴やスペクトル包絡特徴等により特徴を把握します(低次音声特徴抽出)。これらによって、例えば、海が映っている映像と似たようなものを探したいとき、青い部分が多いとか、波の音がする等と認識して、たくさんの映像の中から、それと似たようなものが映っている部分を見つけてくることができるのです。映像の意味理解には、こうした映像解析技術が必要になります。
今回のコンサルティングでは、こうした低次の特徴抽出だけではなく、これら基盤となる技術を活用し、分割したショットを定められたカテゴリーに分類する技術、また、映像からイベントを抽出する技術の開発についてもご支援しました。さらに、これらの技術が将来どのようなところで生かせるのか、技術開発として取り組むべきものは何か等についても検討を行い、映像解析技術に関するロードマップ作成のご支援もしています。今後は、これらの技術を活用し、いかに、より利用者に使いやすい機能やインターフェースを開発し、サービスへとつなげていくかが一層重要になると考えます。
富士通総研ではMOT(技術経営)をサービスメニューに掲げ、技術とサービス(ビジネス)の連携を目指した、コンサルティングを実施しています。技術という資産を、いかに収益に変えていくか、技術経営実現に向けたご支援をさせて頂きます。
関連サービス
お客様の有する各種の技術関連資産に基づいた技術戦略や戦略シナリオの策定、製品化などの展開策の立案、技術提携・連携など他企業とのコラボレーションの企画のほか、戦略策定の前提となる人材育成や、技術動向の分析・評価など、技術関連資産を経営に活かすための各種支援もご提供致します。
情報・通信分野における経営戦略や既存・新規の事業戦略について、マーケティングからブランドマネジメント、ファンドによる戦略投資まで、多角的な視点でのサービスを提供します。
