スキャンで歪んだ表の補正方法

歪んだ表と言っても俺の場合、業務上での話で車検証OCRに取り込む際の車検証スキャンが歪んでしまった場合の補正方法だが、他の表でも使える話。

まず、画像の様になんか歪んでしまった画像(車検証)だが、この画像はFAXで送られてきた画像なんだが、使用しているFAXの紙送りの時点でバランス悪く途中から用紙がすべったりしてずれてしまいそのまま取り込んで締まったのだろう。

人間の目なら自動的にゆがみを補正して文字を読み取ることが出来るのだが、これをコンピュータに認識させるのは容易ではない。

まず、面と線を認識させて、その線が直線なのか曲線なのか等の判別を経て直線的に読み取る事になるのだが、歪んだままだと活字もどんどんずれていき、認識する文字は訳のわからない文字になって出力を見てがっかりする。

ある程度の歪さは想定していて多少の傾き等は補正出来る物の、曲線的になっている活字を読み取るのは超難しい。

普通の開発費では賄えない位の工数がかかって現実的では無いので俺たちのようなフリーランサーが手に負える様な補正では無いし、そんな事やっても飯が食えないのでたんまりと予算のある研究機関にゆがみ補正は委ねたい。

そこで、手動で簡単に補正する方法としてPaint Shop Proが使い易かったのでそれを使って簡単に修正する方法を紹介する。

PaintShopProには遠隔補正と言う機能があってこれを使うと歪みの調整が楽に出来てしまう。

ツールバーに遠隔補正のアイコンがあるのでそれを選択すると画像の上に矩形が表示される。

そのコーナーを歪んだ枠の4隅にポイントしてOKするだけだ。

たったそれだけで、歪んだ枠が矩形に補正されてOCRにかけられる様になる。

この状態で概ね感覚だが10%だった認識が85%位まで引き上げられる

補正しないと活字が半分半分になったり読み取る幅を調整できないうえに、行の認識が出来ないので上半分下半分で1行と認識してしまい正しい文字と言うかもはやなにごなのか不明な結果になる。

それを矩形に補正するだけで、ある程度正しく行を認識出来るので、文字として文字データベースと照合してある程度精度高く認識した活字を当てはめる事ができる。

ただ、俺は画像編集になれているのでこんな処置は工数に当てはまらない位素早く処理出来てOCRにかけた方が楽だと思えるのだが、一般的にこの編集をするくらいなら手入力した方がマシだという事で結局、画像編集のスキルを上げずに逃げてしまう。

これが、そもそもITリテラシーを上げることが出来ない学習能力なしの実態なのだ。

誰にだって初めてはあるわけで、その初めてをとにかくしつこく繰り返してきたからこそ、独学でプログラミングや全てのデータベースの取扱、言語の取り扱い等もはやへも同然で扱え、不明な点は本屋やちょっとネット検索すれば直ぐに対応出来るスキルを積み上げることが出来ている。

それもちょっとした事の積み上げなんだが、誰しもこの面倒な事をやろうとしないのが俺には不思議でしょうが無いのだが、そのぶん上乗せして料金をつり上げられると言う事からざっと方法は説明して義務を果たすものの、どうせここまでやらないのは明白なので説明はしっかりわかり易く、とにかく馬鹿にするほどわかり易く説明する。

その方が、自分で出来たつもりになる様でいざ説明無しでやると出来ない事がわかる。

その原因は単に基礎の問題で、流石に基礎まで説明する事は無いので目の前の現象に付いての対症療法的な説明の義務を果たし、出来ないからやってと言う台詞を堂々と勝ち取るわけだ。

はっきり言って、俺のスキルなどあって無い様なもので、ネットで検索した情報を元に実施するのがほとんどだ。

なので、ネットで検索すると言う事は誰にでも同じ情報が表示されているにもかかわらず、出来ない、解らないと言う。

だから俺は、出来る出来ないじゃない、出来る、やらないだと言う。

出来ない人はやろうとしないだけの学習怠け者でしか無い。

学習怠け者は歳とるとボケ老人になる。

生涯学習していると、ボケにならないしいつまでも若々しく健康でコロナにもかからずに過ごせると信じている。

皆、5年先、10年先の予定たてているのだろうか?

コメント