最近この本を買ってOCRソリューションを開発しようと思っている。
OCRソリューションは俺の取引先は自動車関係の会社が多く、まだまだ「紙」文化が払拭出来ずにいる業界で、色々と手を尽くしてIT化に貢献はしているのだが、どうしても紙は必要だ。
車検証がカードになるならない、もうなった?かどうかにかかわらず、車検証と言うと基本は紙ベースでそれを持って色々と整備を実施しているが、その内容をデータベースに今までは全部手入力していたわけだが、これはスキャナーで取り込む事でほぼ手直し無しで出来る様になった。
このソリューションで何が起きるかと言うと、全くの新人でも車検証の内容を間違えずにデータベースに登録出来てしまうと言う事で、しかも数分で完了する。
間違えやすい車体番号なんかも完璧に入力出来ると言うメリットがあるのだが、実は車検証に印刷されているQRコードにある程度情報は入っているが、今度は国土交通省が車検証をカード化する云々の前に、このQRコード自体になんの情報もいれてなくて、これに全部書いてあればOCRも必要無いのだがなぁとつくづく国は馬鹿しかいないなぁと思っている。
ただ、これはOCR得意な企業と連携出来たので完璧に取込が出来る様になったわけだが、今度は独自にOCRを開発しようと思ったわけだ。
昔はこのOCRエンジンのライセンスが400万とだったのが、今は1000ユニットまで無料とかかなりお安くなって精度も良くなた。
ならば自分で開発すると小遣稼ぎが出来ると言う物で、未だに紙のタイムカードを使っている所向けに、タイムカードのOCRを開発する。
実は、既に売り先があるので作れば金になるのだが、一社で使うのでは無く、もっと不特定多数がサブスク出来る様なビジネスモデルで展開したいと思ったわけだ。
ただ、そのOCRを使う上で、Pythonが出てきたので、今回、Pythonを使った開発をやろうと思う。
手始めにOCRとPythonと言う事でテーマが出来たので学習コストと開発コストを一緒くたに扱って、直ぐに回収出来ると言う良い感じの流れになっていてなんかわくわくしている。
Pythonってちょっと調べたらGAFAは結構Python多く使って居るみたいだし、OCRのサンプルコードもPythonだと結構多くてPHPはもう古いのか?
本のサンプルとか見ながらPythonにアナコンダって蛇に絡んだツール名で統一しているみたいなんだが、ブラウザに表示されている内容をjsとかで書こうと思ったら結構大変で、htmlやらCSSやらも含めて書く必要がある。
ところが、Streamlitと言うフレームワークを使うとなんとPythonだけで全てが完結してしまう。
これは便利
GoogleのVisionを使ってタイムカードの読取システムを開発するのに今はイメージを構想していて、どういうUIにするかを漠然と頭に作ったのだが、それをするのに今までだと、まずはhtmlである程度構成してタグ書いてID振ってjsで色々とdomを操作して出力するとかライブラリを探してとかになるんだが、PythonとStreamlitがあれば、そのまま直接Pythonで書けるのはちょっとビックリ。
コードも少ないしコードが少ないのは後々のメンテナンスが非常に楽になるのでこれは良い。
しかも、PythonはDropboxとかYoutubeなんかのベースに使われているみたいで、かなり大がかりなWebシステムも構築出来るのでPython侮るなかれだな。
コメント