計測機器に表示された7セグの数字を自動でデータ化したい。お客様のそんな一言から、弊社のOCR開発は始まりました。
様々な壁にぶつかるたびに技術を積み上げ、気づけばAI-OCRのすべてを自社開発するように。
約12年の紆余曲折を経て生まれた、弊社初のAI-OCR商品「DigCReader」の開発秘話をお伝えします。
すべては工場の7セグ文字からはじまった! DigCReader開発秘話
すべての始まりは、工場の計測機器だった

もう12年ほど前のことになります。自動車のサスペンションを製造している工場を持つお客様からご相談を受けました。
「計測機器に表示される7セグの数字を、自動でデータ化できないかな」というものでした。
当時の私たちは、OCR開発の経験がないシステム屋。今であれば「OCRで対応できます」と即答できますが、そのころはOCRエンジンを自社開発するような技術力も資金力もありませんでした。
まずは既存のOCRに触れてみる
そんな私たちがまず頼ったのが、Microsoft Officeに付属する無償OCRライブラリと、GoogleのTesseract OCRです。
ノートPCに市販のWebカメラを接続し、とにかく撮って読ませる。そんなトライアンドエラーを何度も何度も繰り返しました。
その結果はとても不安定で、読めることもあれば読めないこともあるというなんとも言えないものでした。肉眼では同じように見える画像でもなぜか結果が変わる、といったことが多々あり、私たちは途方にくれました。
しかし、行き詰って様々な文献や海外の情報を漁るうち、一つの事実にたどり着きます。
「OCRの精度に前処理が大きく影響する」ということです。
画像をきれいに、鮮明に整えるだけで、認識結果に劇的な変化が生まれました。
ここから私たちは、「前処理こそがOCRの精度の9割である」という気づきを得て、画像加工技術の研究開発を開始します。
OpenCVを導入、そしてOCRエンジン自作の道へ
画像処理の入り口として、私たちがはじめに選んだのはOpenCVでした。フリーで手軽に使え、情報も豊富です。
当時できた処理は二値化と台形補正程度でしたが、それでも着実に精度は上がっていきました。
しかし、OCRエンジン自体が他社製ライブラリで、内部をいじれないブラックボックスであることに変わりはありません。前処理をどれだけ工夫しても、エンジン側の限界という壁に何度もぶつかりました。
そんな私たちに転機が訪れます。
きっかけは、ある大学の先生との共同研究でした。
クラスタリング技術を用いたOCR作成に向けての取り組みと、助成金を利用した研究開発。
OCRの知見が大きく広まり、新しい技術ストックをたくさん手に入れました。
そして、私たちはOCRライブラリを自作する道を選択します。
照明まで自作することになったシステム屋

OCRと画像処理を突き詰めていくうち、私たちは「撮影条件」の問題にぶつかります。
きれいに撮影するにはどんな色の照明が最適なのか。
照射角度は何度がベストなのか。
その答えを出すため、照明まで自作して、現場で検証を重ねました。
作った照明は最終的に採用こそされませんでしたが、その時に身につけた光や影・反射に関する知識は、確実に現在の画像加工技術に活かされています。
OpenCVも卒業し、すべてを自作することに
そうして試行錯誤を続けた結果、弊社はOpenCVからも離れ、画像加工ロジックまでフルスクラッチで実装することになりました。
精度を追求するうちに、気づけばOCRエンジン、AIのコア部分、すべてを自社開発してしまったのです。
そこまでしてこだわった最大の理由は、AIの判断プロセスを完全に把握できる点にあります。
どこで認識を間違えたかをピンポイントで把握し修正することは、他社ライブラリでは絶対にできません。
すべてを自作した結果、最小のコスト・最短距離で、読み取り精度を飛躍的に向上させることができたのです。
DigCReaderの誕生

これらの技術の積み重ねから生まれたのが、弊社初のAI-OCR商品である「DigCReader」です。反射や映り込みもなんのその、7セグ文字を超高精度で読み取り、データ化するシステムが完成したのでした。
さらに、この技術はOEM提供され、現在は別会社の製品としても市場に出ています。
ありがたいことに、非常に多くのお客様にご利用いただいています。
7セグ表示を何とかデータ化できないかと頭を抱えていたあの時、難しいからとあきらめていたら、今の弊社は存在していなかったでしょう。
12年前の古い仕様書は技術的には稚拙なものですが、我々の出発点でした。
これからも「やってみよう」の精神を大切に、技術をさらに積み上げていきたいものです。
あらゆる7セグ文字を超高精度で読み取る「DigCReader」

計測機器や液晶画面の7セグ文字は、その独特な形状や表示のゆらぎによって、OCRが難しいものの1つです。
センクリードの「DigCReader」は7セグ文字に特化したAI-OCR。99.99999%の精度で読み取り、さらにデータ化まで自動で行います。
評価版もご用意しておりますので、お気軽にお問い合わせください。