OCRソフトで情報処理

機能

OCRソフトの機能の流れは次のようになり、これらそれぞれに詳しく述べていく。
1「画像を取り込む」、2「画像のレイアウトを解析する」、3「文字の羅列から文章を切り出す」、4「文字を抽出する」、5「文字を認識する」、6「他のファイルに出力する」。

OCRソフトの機能とは

  • 1:書籍・文献・新聞・雑誌など用紙媒体のものをスキャナ装置で画像として取り込むOCRソフトの機能である。
  • 2:書籍・文献などや、特に新聞・雑誌になると表や図と一緒に書かれているため段落や枠組みが組まれている。
    「画像のレイアウトを解析する」はそれら段落や枠組みの配置を認識し解析することで、認識するための順番を決める。
  • 3:抽出したレイアウトの文章のかたまりから、一つ一つの文に分ける。
  • 4:一文の中から、認識しやすいようにさらに一文字ごとに分けるOCRソフトの機能である。
  • 5:抽出したものを、元々搭載してある文字のデータベースと照らし合わせて文字の認識をするOCRソフトの機能である。
  • 6:認識したものを、PDFファイルのようなパソコンで加工できるファイルで出力するOCRソフトの機能である。
  • 

    その他関連ワード