OCRソフト e.Typistエントリーの使い方

OCR(オーシーアール)ソフトとは、スキャナーにより取り込んだ原稿の活字(画像データ)を、テキストデータに変換するソフトウェアです。

コンピュータ実習室の各パソコンに備え付けのスキャナーCanonScanLiDE40に付属しているOCRソフト e.Typistエントリーを使って、スキャン・テキストデータへの変換の方法を説明します。


1)スキャナの用意

←原稿の向きに注意!

原稿は、左図のように、スキャナの左下端、矢印の書いてあるところに、原稿の端を持ってきます。上下に注意!


2) e.Typistエントリーの起動

    スタート(クリック)→すべてのプログラム(P)(マウスを移動)→ユーティリティ(マウスを移動)→CanoScan(マウスを移動)→e.Typistエントリー(クリック)


3)スキャナの起動

i)下図の赤線で囲った「スキャナ」アイコンをクリック。

「スキャン前に、[その他]ー[スキャナ設定]でご使用のスキャナを選択して下さい。」というメッセージのウインドウが出たら、そのまま「OK」をクリックし、下図「スキャナドライバの選択」ウインドウで
、CanoScan LiDE 40を選択して、「OK」をクリック。(「スキャナメーカーのTwainインターフェースを使用しない」が選ばれているが、そのままにしておくこと。)

 

ii)しばらくすると、下図のような「スキャナ取り込み」ウインドウが現れるので、

1)右上「プレスキャン」ボタンを押し、2)青い線で示された取り込み範囲をドラッグで変更し、3)「スキャン」ボタンをクリックします。


4)認識範囲の指定

  スキャナで取り込んだ文章等は、すべて画像情報として取り込まれています。これらを文字に変えるのがOCRソフトと呼ばれているので、今使っているe.TypistエントリーもスキャナCanonScan LiDE 40についているOCRソフトです。(エントリーはスキャナーに付属のソフトの意)。画像情報を文字情報に変えるには、まずどの部分を変更するのか、認識範囲の指定が必要です。

i)傾き補正

  認識範囲の指定の前に、必ず傾きがないか確認します。傾きがある場合、もう一度読み直すか、下図のように、ボタンを押して、「自動補正」をえらぶか、


または「ウインドウ(U)」→「画像回転(R)」→「手動補正(M)」で基準となる直線を描いて補正をします。

ii)範囲指定


上図のように、まず1)虫めがねアイコンで、作業しやすい倍率にあわせます。2)赤い範囲指定のアイコンをクリックし、3)ドラッグで範囲を指定します。

図の場合、4カ所を範囲指定しています。


5)「認識」アイコンをクリック


6)修正

 左にTEXT、右に画像のウインドウが現れる。認識ミスが無い場合はほとんど無いので、右の画像、あるいは元のテキストを見ながら必ず自分の手で修正すること。なお、「TEXT」のウインドウをクリックし、認証後のテキストは作業用フォルダーに保存しておくこと。なお、EXcel等に認識結果を入力する場合、編集→コピー(e.Typistで)、編集→貼り付け(Excelで)を使うと便利。