AI-OCRを使う中で必ず発生する「処理待ち時間」。
高精度だが遅い、速いが精度が悪い……どちらかを選ばなくてはいけないシーンが必ず発生してしまうものです。
私たちセンクリードが提供するAI-OCR「Growdea-OCR」は超高精度を謳っており、処理速度の問題が常について回っています。
本記事では、精度と速度の兼ね合いの中、私たちがお客様のために導入した手法について解説します。
AI-OCRを使う中で必ず発生する「処理待ち時間」。
高精度だが遅い、速いが精度が悪い……どちらかを選ばなくてはいけないシーンが必ず発生してしまうものです。
私たちセンクリードが提供するAI-OCR「Growdea-OCR」は超高精度を謳っており、処理速度の問題が常について回っています。
本記事では、精度と速度の兼ね合いの中、私たちがお客様のために導入した手法について解説します。

AI-OCRの導入を検討する際、多くの方が「一瞬で読み取れる」「精度はほぼ100%」「現場でサクサク快適に動く」といった期待を抱かれます。
しかし、正直なところ、現場で使われるAI-OCRはそんなに都合のいい存在ではありません。
AI-OCRは魔法ではなく、万能でもないのです。
弊社が提供する「Growdea-OCR」は、活字文字の読み取りに特化したAI-OCRとして、主に製造業の現場で使われています。
ハンディターミナルやスマートフォンなどのモバイル端末で動かして、システムが止まれば作業自体が止まってしまう——そんな環境で試用されているシステムです。
そうした現場で、毎回必ず直面するテーマがあります。

AI‑OCRは、精度を上げようとすればするほどモデルデータが大きくなり、モデルデータが大きくなるほど処理が重くなります。
これは、どんなに工夫を重ねても避けられない問題です。
現場のプロジェクトでは、「高精度だが遅い」「速いが精度が悪い」どちらかの選択を迫られる場面が何度もあります。
ハードウェアの性能にも限界があるため、ソフトウェア側の工夫だけで解決できる話ではありません。
非常にもどかしいですが、これが実情です。
プロジェクトの立ち上げ時にお客様からよく聞くのは、
「最初は7~8割読めれば十分」
「最終的に人がチェックする前提です」
といった声です。
私たちはその前提で設計・調整し、テストを進めていきます。
ところが納品が近づくにつれ、ほぼ決まってこう言われます。
「やっぱり読み取り精度は9割以上は欲しいです」
「ここが読めないのは困ります」
お客様のお気持ちはよくわかります。せっかく作るならよりよいシステムにしたいという一心でしょう。
しかし、ここから話が一気に難しくなるのです。
読み取り精度を優先すると、どうしても処理時間がのびてしまい、OCR処理中の待ち時間が発生してしまいます。
この状態でお客様にお見せすると必ず、
「ちょっと遅くないですか?」
「これ、止まっていませんか?」
といった声が上がります。
実際の処理時間は数秒にすぎませんが、体感としては驚くほど長く感じられるのです。
当初私たちも、この問題を解決するには、とにかく処理速度を速くしなければいけないと考えていました。
しかし、現場の方とのやり取りを重ねていく中で、次第にわかっていったことがあります。
実は、最大の問題は処理速度ではありませんでした。
本当の問題は「終わりが見えないこと」だったのです。
当時のインターフェースは、処理中に画面上でカーソルが回るだけのものでした。
この状態ではいつ終わるのか、本当に動いているのか判断できず、結果的に5秒の処理時間が30秒にも1分にも感じられていたのです。
そこで私たちは、進捗表示を取り入れることにしました。
進捗表示自体は、一般的な業務アプリにおいて珍しいものではありません。
しかしAI-OCRでは話が違います。
AIの処理というのは、人間が頭の中で考え込んでいる状態に近いものです。
例えば、あなたが質問に対して回答を考えているとき、「今どれくらい考え終わったのか」「あと何秒で答えが出るのか」というのはわかりませんよね。
それはAIも同じで、AI自身が「今40%考え終わりました!」などと教えてくれるわけではないのです。

改修を進めていく中で、私たちは「進捗表示は必ずしも正確である必要はない」ということにたどり着きました。
実は、お客様にとって重要なのは、
このような「納得感」と「安心感」だったのです。
この納得感と安心感を提供するために、私たちは、処理を疑似的にステップ分けし、推定で進捗を算出して表示する手法を導入しました。
処理時間そのものが変わったわけではありません。それでも、お客様の反応は変わりました。
「少し待てばいいんですね」
「これくらいなら大丈夫」
同じ5秒が、「異様に長く感じる5秒」から、待てる5秒に変わったのです。
私たちがGrowdea-OCRの開発の中で感じること。それは、
「AI-OCRは読み取り精度や処理速度だけで評価されるものではない」
「人がどう感じるか、不安なく使えるか、そこまで考えてはじめて使えるAI-OCRになる」
ということです。
魔法のように万能なAI-OCRは存在しません。
ですが、人の心理に寄り添う設計を積み重ねていくことで、お客様にとって魔法のような、ずっと使いたくなるAI-OCRを作り上げていくことはできるのです。
このコラムが、AI‑OCRの導入を検討している方や、現場でお客様と日々向き合っている方にとって、「技術ってそういうものか」と感じられるきっかけになれば幸いです。

お客様と育てる(Grow)、オンリーワンのAI-OCR「Growdea-OCR」を搭載した、業務効率化のためのソフトウェアを展開しています。
オンプレミスで動作可能、買い切りタイプ、サブスクリプションタイプなど、現場からのご要望を多く反映したパッケージ群です。
帳票ソフトウェアのほか、検品、ポカヨケ、マスキングなど多種多様な商品をご用意しています。