■ 2002年10月23日(水)

 OCR(光学文字認識)


 スキャナーのバンドルソフトで使用し始めたOCR「読んでココ VER3.0」(A.Iソフト)ですが、使用して認識率と操作性に感激。
 OCR固有技術はここまできているのか。

 

 
 10月にカラーレーザープリンタ(EPSON LP-7800C)と2400dpiのスキャナー(EPSON GT-9300)を導入した。やや、高い買い物であったが、プレゼンテーションを行うには必需品であるからやむをえない。この導入効果は言うまでもない
が、

 今回、お話したいのは、スキャナーにバンドルされていたOCRソフトの認識率、操作性のよさである。

 もう、何年になるだろうか。多分10年弱になると思われる。学会誌などでその原理などを読みふけっていたり、当時の紙ベースのマーケティング情報をなんとかデジタル化して共有化し、組織効率を高めることに寄与できないかと考えていたことがあった。また、当時、池袋のベンチャー企業にも行って認識テストをやった時の記憶がある。原稿の条件の悪さもあったが、遅いことはなんとか我慢できたが、認識率が70%程度あり、これでは拾い読みでチェックするどころかその大半を人手でチェックをしなければならず・・・KB入力した方が速いという結果であった。

 そのような経験からOCRは特に原稿の条件が悪い場合は実用にはならないという潜入観念で固まっていた。

 ある日、日経に医療分野で業績管理制度を取入れる機関が急激に増えている旨の記事が目に付いた。切り抜きのスクラップにしておくのが今まであったが、それでもと思いスキャナーと「読んでココ VER3.0」(A.Iソフト)を起動させ取込後認識の実行をさせてみた。文字サイズ不定の記事見出しなどを除いて、記事本文はほぼ100%認識できているではないか。段落順序などを再定義して完全にデジタル化に成功した。

 いろんな分野特に民生分野で一般化しているPCそのアプリケーションとしてこれだけ完成度をあげているのには敬服した。OCR自身の固有技術開発の方、民生用で使う前提で原稿属性に合わせてフィルター機能を作った方、1万円を切る価格でもソフト企画をされた方、全ての開発関係者に敬意を表したい。

 弊社としても、お奨めできるソフトです。是非、評価してみて頂きたいものである。

  

 

-P.-

目次へ