OneNote(Windows標準)のOCRで文字起こしを省力化する。


 電子データで完結できればそういう問題は発生しないのですが、媒体の古さや保管方法、情報取り扱いの制約などで、既存の紙面やイメージなどから文字おこしが必要になることはデジタル主流になってきた最近でもまだまだあると思います。
 数行程度なら諦めて、見ながら直打ちするわけですが、長文になってくるとまさに仕事のための仕事になって正直テンションさがりますよね。
 そんな時に最近のWindowsにそなえつけ(Window7くらい?)のOneNote for Windowsの簡易OCR機能を知っているかどうかで仕事の手間暇とモチベーションは大きく変わってくる、かもしれません。

 今回は「【日本酒】兵庫5蔵 第2弾 夏のスペシャルセットを入手した!」のチラシを例に説明を。

 やり方は以下の通り。

1.OneNoteを開いて、読み取りたい文面を貼り付ける。

 OCRしたい文章の部分を切り取ってOneNoteに貼り付ける。単純なレイアウトの場合はイメージ全体一発読み取りしてくれることもあるが、枠組みしているとうまくいかないことが多いので、各範囲ごとにおこなうのがオススメ。
 キャプチャの仕方は→「Windows10スクリーンショットの効率的な撮り方

 ここでは、元のチラシと位置関係をあわせながら貼り付けています。時間を空けたり、仕事などで複数人で分担したりする可能性がある場合はそうしておいたほうが無難です。

2.読み取る

 あとは簡単。読み取りたい範囲で右クリックすると[画像からテキストをコピー]が出るので選択。するとクリップボードにコピーされるので、使いたい先でペーストすればOKです。
※貼り付けてすぐは解析してるからか すぐに↑のメニューが出ないので、貼り付けた後はしばらく他の事をやっとくとよいかも(OneNoteは開いたままにしておく)

ちなみに

だと

兵 庫 5 蔵 の プ ロ ジ ェ ク ト 第 2 弾 ! の ス ペ シ ャ ル セ ッ ト
コ ロ ナ 禍 を み ん な で 乗 り 切 ろ う と 起 ち 上 が っ た 兵 庫 の 若 手 5 蔵 の 新 プ ロ ジ ェ ク ト 「 HYO 5 KU RA 」 。 ま だ ま だ 混 沌 と す る 状 況 の
中 で 第 一 弾 を 購 入 で き な か っ た 方 、 も う 一 度 楽 し み た – い 方 – に 向 – け て 一 – 「 五 蔵 一 心 ・ 夏 を 一 ご 用 意 し ま し た 。 300 の セ ッ ト ー は お そ
ら く こ れ で 最 後 。 小 規 模 な 蔵 だ か ら 成 せ る 個 性 あ る 酒 造 り で 醸 す 夏 の オ リ ジ ナ ル 酒 を ス ペ シ ャ ル な セ ッ ト で お 楽 し み く だ さ い !

といった感じで結果を得られるので、普段使用しているエディタで半角スペースを取り除いたり(置換で消せる)、誤字脱字を整えればおしまいです。
※縦書き文書の場合は行の順番が入れ替わることがあるので入れ替える(1行ごとの文字読み取りはだいたい正確です。
※ルビ(よみがな)があるとうまくいかないことがほとんどなので、あらかじめ画像側で消しておくか、諦めて市販のものを導入するかしたほうがよいでしょう。

画像の解像度やフォントや文字種の混合具合にもよるけど無料のOCRとしてはかなりよい精度だと思うのでお試しあれ。


他にもGoogleフォト|Googleレンズを利用するなどの方法がありますが、それは需要があれば またいずれ。

量が多いやら、段組みをもう少し精度良く一度に読み込みたいという場合は、数千円ほどの出費が問題ないのであれば↓を検討するのもアリ。

コメントを残す