新聞や雑誌、カラー画像の文字認識
新聞や雑誌の文字認識
・タイトルを抽出し、文字の背景を除去
新聞の管理情報を自動登録でき、入力の簡易化を実現しました。

| A3 200dpi新聞紙紙面 (Pentium166Mhz) |
||
| タイトル領域抽出 | 94% | 5.8秒 |
| 背景模様の除去 | 96% | 0.5秒 |
| トータル | 90% | 6.3秒 |
カラー画像の文字認識
・認識方法
カラー画像は、低解像度画像のため色ずれがあるので、色情報を使うより、濃淡情報を使います。
(1)原画像を読み込みます。
(2)文字を粗く抽出し、背景を除去します。
(3)低解像のため元々無い画素を、隣同士の画素から予測した新しい画素を加えて高解像にします。1文字単位で「白・黒」に判別する値(しきい値)を決めて、モノクロにします。

・従来方法
モノクロにした時、字がつぶれてしまいます。

・文字正読率
| 文書画像の解像度 | 開発技術 | 従来法 |
|---|---|---|
| 150dpi | 97.5% | 94.3% |
| 100dpi | 91.3% | 80.2% |
処理時間:1秒/A4サイズ(150dpi文書画像、500MHzのパソコンを使用した場合)
