株式会社センクリード

AI-OCRの処理待ち時間に革命を。重要なのは精度と速度だけじゃない!

AI-OCRを使う中で必ず発生する「処理待ち時間」。
高精度だが遅い、速いが精度が悪い……どちらかを選ばなくてはいけないシーンが必ず発生してしまうものです。

私たちセンクリードが提供するAI-OCR「Growdea-OCR」は超高精度を謳っており、処理速度の問題が常について回っています。

本記事では、精度と速度の兼ね合いの中、私たちがお客様のために導入した手法について解説します。

AI-OCRは魔法じゃない

AI-OCRのイメージ画像

AI-OCRの導入を検討する際、多くの方が「一瞬で読み取れる」「精度はほぼ100%」「現場でサクサク快適に動く」といった期待を抱かれます。

しかし、正直なところ、現場で使われるAI-OCRはそんなに都合のいい存在ではありません。
AI-OCRは魔法ではなく、万能でもないのです。

弊社が提供する「Growdea-OCR」は、活字文字の読み取りに特化したAI-OCRとして、主に製造業の現場で使われています。
ハンディターミナルやスマートフォンなどのモバイル端末で動かして、システムが止まれば作業自体が止まってしまう——そんな環境で試用されているシステムです。

そうした現場で、毎回必ず直面するテーマがあります。

 

読み取り精度をとるか、処理速度をとるか

読み取り精度と処理待ち時間の関係

AI‑OCRは、精度を上げようとすればするほどモデルデータが大きくなり、モデルデータが大きくなるほど処理が重くなります。
これは、どんなに工夫を重ねても避けられない問題です。

現場のプロジェクトでは、「高精度だが遅い」「速いが精度が悪い」どちらかの選択を迫られる場面が何度もあります。

ハードウェアの性能にも限界があるため、ソフトウェア側の工夫だけで解決できる話ではありません。
非常にもどかしいですが、これが実情です。

 

お客様の考えは、プロジェクト進行中に変化するもの

プロジェクトの立ち上げ時にお客様からよく聞くのは、

「最初は7~8割読めれば十分」
「最終的に人がチェックする前提です」

といった声です。
私たちはその前提で設計・調整し、テストを進めていきます。

ところが納品が近づくにつれ、ほぼ決まってこう言われます。

「やっぱり読み取り精度は9割以上は欲しいです」
「ここが読めないのは困ります」

お客様のお気持ちはよくわかります。せっかく作るならよりよいシステムにしたいという一心でしょう。

しかし、ここから話が一気に難しくなるのです。

 

精度を上げると「待ち時間」が生まれる

読み取り精度を優先すると、どうしても処理時間がのびてしまい、OCR処理中の待ち時間が発生してしまいます。
この状態でお客様にお見せすると必ず、

「ちょっと遅くないですか?」
「これ、止まっていませんか?」

といった声が上がります。

実際の処理時間は数秒にすぎませんが、体感としては驚くほど長く感じられるのです。

当初私たちも、この問題を解決するには、とにかく処理速度を速くしなければいけないと考えていました。
しかし、現場の方とのやり取りを重ねていく中で、次第にわかっていったことがあります。

 

本当の問題は処理速度ではなかった

実は、最大の問題は処理速度ではありませんでした。

本当の問題は「終わりが見えないこと」だったのです。

当時のインターフェースは、処理中に画面上でカーソルが回るだけのものでした。
この状態ではいつ終わるのか、本当に動いているのか判断できず、結果的に5秒の処理時間が30秒にも1分にも感じられていたのです。

そこで私たちは、進捗表示を取り入れることにしました。

 

実は簡単ではなかった「待てるI/F」

進捗表示自体は、一般的な業務アプリにおいて珍しいものではありません。
しかしAI-OCRでは話が違います。

AIの処理というのは、人間が頭の中で考え込んでいる状態に近いものです。

例えば、あなたが質問に対して回答を考えているとき、「今どれくらい考え終わったのか」「あと何秒で答えが出るのか」というのはわかりませんよね。

それはAIも同じで、AI自身が「今40%考え終わりました!」などと教えてくれるわけではないのです。

 

正確じゃなくてもいい。進捗が見えることに意味がある

正確な進捗でなくとも、目安の進捗がわかるだけで納得感と安心感が生まれる

改修を進めていく中で、私たちは「進捗表示は必ずしも正確である必要はない」ということにたどり着きました。

実は、お客様にとって重要なのは、

  • 動いているとわかること
  • 少しずつ処理が進んでいるのを実感できること
  • 終了がなんとなく想像できること

このような「納得感」と「安心感」だったのです。

この納得感と安心感を提供するために、私たちは、処理を疑似的にステップ分けし、推定で進捗を算出して表示する手法を導入しました。

処理時間そのものが変わったわけではありません。それでも、お客様の反応は変わりました。

「少し待てばいいんですね」
「これくらいなら大丈夫」

同じ5秒が、「異様に長く感じる5秒」から、待てる5秒に変わったのです。

 

AI-OCRは、技術と人のかかわりの中で完成する

私たちがGrowdea-OCRの開発の中で感じること。それは、

「AI-OCRは読み取り精度や処理速度だけで評価されるものではない」
「人がどう感じるか、不安なく使えるか、そこまで考えてはじめて使えるAI-OCRになる」

ということです。

魔法のように万能なAI-OCRは存在しません。
ですが、人の心理に寄り添う設計を積み重ねていくことで、お客様にとって魔法のような、ずっと使いたくなるAI-OCRを作り上げていくことはできるのです。

このコラムが、AI‑OCRの導入を検討している方や、現場でお客様と日々向き合っている方にとって、「技術ってそういうものか」と感じられるきっかけになれば幸いです。

 

お客様と一緒に育てる「Growdea-OCR」搭載商品のご案内

スクラッチ開発でこだわりぬいて作られたGrowdea-OCR搭載商品群、G-Correctionのご案内

お客様と育てる(Grow)、オンリーワンのAI-OCR「Growdea-OCR」を搭載した、業務効率化のためのソフトウェアを展開しています。
オンプレミスで動作可能、買い切りタイプ、サブスクリプションタイプなど、現場からのご要望を多く反映したパッケージ群です。

帳票ソフトウェアのほか、検品、ポカヨケ、マスキングなど多種多様な商品をご用意しています。

Growdea搭載シリーズG-Correctionについて詳しくはこちら