このページの本文へ移動

富士通研究所

Japan

  1. ホーム >
  2. 技術情報 >
  3. やさしい技術講座 >
  4. 講座一覧 >
  5. 文字認識技術 新聞や雑誌、カラー画像の文字認識

新聞や雑誌、カラー画像の文字認識

新聞や雑誌の文字認識

・タイトルを抽出し、文字の背景を除去
新聞の管理情報を自動登録でき、入力の簡易化を実現しました。

A3 200dpi新聞紙紙面
(Pentium166Mhz)
タイトル領域抽出 94% 5.8秒
背景模様の除去 96% 0.5秒
トータル 90% 6.3秒

カラー画像の文字認識

・認識方法
カラー画像は、低解像度画像のため色ずれがあるので、色情報を使うより、濃淡情報を使います。

(1)原画像を読み込みます。

(2)文字を粗く抽出し、背景を除去します。

(3)低解像のため元々無い画素を、隣同士の画素から予測した新しい画素を加えて高解像にします。1文字単位で「白・黒」に判別する値(しきい値)を決めて、モノクロにします。

・従来方法
モノクロにした時、字がつぶれてしまいます。

・文字正読率

文書画像の解像度 開発技術 従来法
150dpi 97.5% 94.3%
100dpi 91.3% 80.2%

処理時間:1秒/A4サイズ(150dpi文書画像、500MHzのパソコンを使用した場合)