車検証OCR機能完了したぞ

シマウマソフトオリジナルで現役バリバリVB6のままWindows10で稼動しているシステムだが、ようやく車検証のOCR取込機能が完了した。

そもそも、Panasonicの帳票OCR8を使おうとしていたのだが、これがとにかく精度が悪すぎて、ホームページに車検証取込OKなんて書いてあるけど、全く使いものにならない詐欺アプリだった。

勿論、車検証の取込に関しては全く無理な話で、それ以外の伝票とか透かしの無い帳票の取込に関してはとても扱い易いのだが、「車検証取込」と言う文言に関しては全く受け入れる事は出来ない。

この帳票OCR8のおかげで毎日毎日憂鬱な状態になって鬱を発症したかと思うくらい、研究しまくった。

その結果、このソフトの開発者は全く車検証に関しての知識は皆無で、車検証が3種類あると言う事すら知らないのでは無いかと思う。

とにかく、枠を設定するのだが、この枠が自分で設定した位置やサイズが勝手に変わってしまい、車検証毎に設定すれば取り込めるのだが、毎日毎日、車検証を取り扱う業者には使いもにならない。

1枚だけ取り込むのはまぁまぁなんとかなるかなぁと言う代物。

それに、こいつに食わせるために、車検証のスキャンデータを真っ白にする方法まで導入したが、これは色々な画像ソフトを試して、inPixioのフィルターを使うとほぼ背景が抜けて文字だけを浮かび上がらせる事が出来るので、ほぼ安物のOCRでも普通に読み込める画像データに出来るにもかかわらず、取り込む位置がずれるので合わせようがないのだ。

罫線をキーにするか絶対位置にするかの選択しかないが、当然背景を抜くと同時に罫線も薄くなる。

となると罫線対応のテンプレートが全く機能しない。

絶対位置に変更した場合、設定している枠がとんでもない位置にずれるのでどうしようも無く、ずれる事を想定してテンプレートを作ったりしたが結局、ちゃんと読める車検証もずれを想定したため、適用されなくなりなどとにかく悩みに悩んで帳票OCR8を使う事は断念せざるを得ない。

損害額40万円

仕方が無いので伝票を取り込むOCRとして活用方法を見いだすしか無くなったわけで、このOCRは企業向けとはいえ、全く使い物にならないOCRだった。

こんなの使って車検証取り込んでいる所有るのか不思議でしょうがない。

で、どうしたかと言うと、実は100%に近い確率で車検証を取り込めるAPIを提供している企業があって、そこと提携する事にしたのだ。

車検証OCR機能の追加導入に関してOCRを提供している所、OCRソフトを探した際、車検証の備考部分まで対応出来る可能性があったのがPanasonicの帳票OCR8だけで、当時は100%近く認識するAPIも備考はノータッチだったので採用を見送った。

そこから少し前に、備考まで対応したと言う連絡がきたので、その時は帳票OCRと戦っていたので、取りあえず情報提供ありがとうで話は終わったのだが、俺もこの機能について散々やり尽くしてやり尽くしても精度を上げる事が出来ず、ついにAPIの導入に踏み切ったのだが、これが1日で完成してしまった。

まぁ元々ベースの開発は完了していたのでCSVの取込かAPIからのレスポンスデータの取り込みかを作り替えるだけだったのでそんなに切替の時間はかからなかったのだが、感心したのは、原本の車検証ならほぼ100%取込に成功するので、FAX等のカラーでは無い車検証のコピーなどで試したくなり、やって見たのだが。勿論、100%からは外れ、8割から9割程度には精度は落ちるものの、妥協出来る安定性に感動すら覚えた。

散々帳票OCR8に苦しめられていたのでその呪縛から解放されたわけだ。

対応している会社の場合、車検証は原本を扱っているので、その場合、ほぼ手直し無しでそのまま取り込める。

国土交通省的には車検証もカードにすると言うか、もうカードになっているのかも知れないが、まだまだ紙の車検証全盛なのでこの機能は必須だろう。

勿論、車両の販売業者だと備考までは必要無いのだろうが、大型車や整備をしている業者だと備考の内容も重要なので、全項目が正確に管理出来ないと正しい整備が出来ない事に繋がってしまう。

しかし、これを手入力でDBに登録するのは結構面倒でパソコンに精通している人ならまだしも、整備会社のエンジニアがパソコンの入力をバリバリすると言う人は非常に少なく、事務員は自動車に関してあまり興味が無いなど色々とITスキルに関しては気を遣う。

その面倒な車検証をスキャナーで取り込めるのは非常に大きいだろう。

また、帳票OCR8は仕入伝票の取込に回して活用しないと元が取れないので、次の対応は、一般伝票の取込だな。

Panasonicの帳票OCR8がどんだけクソなのかのエビデンス!!

まず、車検証をベースにこれはAタイプの車検証なんだが、必死にこの青い枠を項目毎に設定して、青い枠部分を取込範囲にするフォーマット編集

ここまではなんとか作成出来るのだが、これも作るのに一苦労で、ちゃんと枠を作成出来ているが、これ、画像のベース部分にまずは白塗りで枠を全部潰してからじゃないと綺麗に四角の枠が作成出来ないのだ。

その癖は把握出来たのでなんとかここまでのフォーマットを作る事が出来た。

ところが、ところがだが全くもって意味がわからない挙動をする。

実際に取り込む車検証を読み込ませて見ると、右側に設定している青枠のはずが、なんで左上に飛んでるの?

これ一番意味がわからなくて、絶対位置設定で取り込んでるのに、あさっての所を読込に行くって、いったいこのソフトどうなってるのやら。はぁ...

これなんかも、設定している枠より大きくなってるから正しく取り込めない。

こんな所囲んでないのに、勝手に右にずれてしまっている。

とまぁ取込位置を設定しているのに、ずれまくりでフォマット編集の意味が無い。

こんな状況なので、何回作り直したか気が遠くなってくるのだ。

しかも、機能としては帳票の任意の場所を認識していくつかのフォーマットを自動的に切り替えると言う機能があって、車検証の場合は左上にAとかBとか書いてあってそこを帳票の振分に出来れば一括で取りこむさい、AとBが混ざっていても自動的にフォーマットを振り分ける事が出来るはずなんだが、全く機能しない。

機能しないだけならまだしも、取込も実施しないのだ。

こんな挙動で、良く車検証の取込もOKなんて書いてあるわと思うのだ。

取込精度を上げるために、この車検証はほぼ背景を消していて、文字だけの状態で、真っ黒の文字じゃ無くて、灰色っぽくなるのはしょうがないわけだが、これが取り込めない。

他のパーソナルユースのOCRとかオマケのOCRなんかだとちゃんと読み取れるレベルなんだが、高級OCRの帳票OCR8は読み込め無いのだ。

Panasonicを看板にしているソフト屋がなんともこっぱずかしいソフトを販売しているんだから終わってる。

まるで、WinActor見たいなもので、WinActorもRPAとしては終わってるわけで、こんなクソアプリが大企業の販売力で国内に蔓延してしまっている丸で新型コロナみたいなアプリは山ほどあるのだ。

こんなクソアプリを堂々と販売する連中に対応するワクチンが無くて、弱小エンジニアはこんなクソを使って面倒な処理をさせられて鬱になってしまうわけだ。

なんでここまで言うかというと、このクソOCRをなんとか使える方法を模索して暇さえ有ればフォーマットを再編集していったい何回作った事やら。

かれこれ1年以上かけてやってきたから非常に良く解ったのだ。

そして、ようやく元々選択しようとしていたAPIが備考に対応してくれて、バージョン2になってくれたおかげで、帳票OCR8を車検証の取込で使わないでも良くなったと言うわけで、一段落付けることが出来たと言うわけだ。

流石に、OCRエンジンをオリジナルで開発しよと思うと、完全に専念する事になって、フリーランサーのエンジニアには金にならない期間をやり過ごす体力がないので、市販のソフトに頼らざるを得ない

それなので、情報収集は欠かせないわけで、良い情報があれば確認して裏付けをとると言うわけだが、とにかくPanasonicの帳票OCR8で車検証を取り込むのは不可能で、1枚集中して設定して取り込む事は出来るが、それなら手で入力したほうが断然早いのでOCRの意味が無いと言うわけだ。

帳票OCR8のホーム北にはこんな事が書いてある。

こんな事書いてあるけど、これ全く騙しでした。

目の付け所は理解出来るのだが、背景の色が抜けない...

しかし、inPixioのPhotoEditarを使うと見事に一発で背景を消す事ができる。

まずは、カラースキャンした車検証をinPixioに読み込ませる。

そして、お気に入りに設定しているフィルターをクリックすると

こんな風に一発で文字だけの車検証に加工出来て非常に便利なのだ。

多少のノイズはあるものの、ここまで白化するとたいてのOCRで問題なく活字化は可能なんだが、これが帳票OCR8にかけてもまともに読めず、この車検証をベースにフォーマットを作成するときっちり取り込める。

なので、毎回毎回、車検証毎にフォーマット編集する必要があって、業務で使う意味が無い上に、一々作成するぐらいなら手入力したほうが断然早いわけだ。

ここまで白化した車検証を汎用的に作ったフォーマットで取り込めないのを確認して、帳票OCR8で車検証取込は諦めたのだ。

で新たに提携する車検証OCRのAPIを提供しているのはE&Dと言う所

この車検証がほぼ完璧に取り込めてしまう驚愕の精度!

元々車検証の数値部分はしっかり取り込めているのは解っていたが、V2で備考欄の取込にも対応したので完全制覇したわけだ。

ここのAPIだと、原本のスキャンならほぼ100%、わざとFAXを通した白黒コピーの車検証も試したがこれもそこそこ取り込めた。

そして、写メで取った車検証も中々の精度で、歪みのある画像はそれなりに精度は落ちるが、手入力しても比較的楽に修正出来る程度は取り込める。

まぁ一度試して見たらびっくりするくらいニーズにマッチしている。

ただ、テスト用のIDやAPIキーをもらったのだが、API接続にはまだバグがある様で、ちょっと調査してもらっている。

そう言うやりとりのレスポンスが良くて、非常に有り難い話だ。

勿論、帳票OCR8でもなんとか取り込もうとした実績は非常に役にたって、その状態の車検証だと100%完全に取り込めているので文句の付け所が無い。

これで、APIのバグが治れば言う事無しと言うわけで、開発完了させる事が出来たと言うわけなのだ。