10_OCRについて その1

こんにちは!ボンズ企画の編集部員です!

前回まではスキャナーについて5回に分けてご紹介しましたが、今回はボンズ企画の電子化事業における、OCRについてお話します。

このOCRも2回に分けてお話していきたいと思います。

1回目はOCRについて簡単な説明と、活用方法。

そして2回目では、弊社で使用しているOCRソフトについてご説明します。

 

みなさんはOCRとは何かご存じでしょうか?

(私はこの電子化という仕事をするまでは、全く知りませんでした…)

 

OCRとは「Optical Character Recognition」の頭文字をとった略称で「オー・シー・アール」と読み、日本語で言うと「光学文字認識」のことです。

 

どのようなものかといいますと、印刷された文字や手書きの文字などをスキャナーやカメラで読み取り、コンピューターが利用できる文字データに変換する技術のことです。

(※弊社では、まだ手書き文字のOCRは対応しておりません)

読み取った文字データは、テキストとしてコピー&ペーストすることも可能ですし、OCR処理されたファイルはキーワードでの検索が可能になります。

 

ここからは画像でOCRを付けたPDFの活用方法について説明します。

 

テキストのコピー&ペースト

OCRがかかっているPDF

②テキストを選択

③選択テキストをコピー

④テキストを貼り付けたい場所に貼付け

OCRで読み取ったテキストの貼付け完了



キーワード検索

OCRがかかっているODF

②検索マークをクリック

③検索したいワードを打ち込む

④検索ワードに色が付いて引っかかる

キーワード検索ができれば、データの中から「自分の知りたい・探している」情報がどこのデータにあるのか、すぐに分かるようになります!

いくらDXやペーパーレスといって紙資料をPDF化しても、大量のデータから必要なデータを探すのに時間がかかっては、効率化という面では紙資料とあまり変わらないのではないでしょうか。

このように、ただのPDFデータではなく、OCRを付けることで活用しやすいデータになり、効率アップにつながります!

 

OCRについて分かりましたでしょうか?

今回はここまでとなります。

 

次回、複数あるOCRソフトの中でも、弊社で実際に使用しているOCRソフトについてご紹介していきます!

 

電子化センターのURL

https://www.scan.ne.jp/