株式会社センクリード

読み取り精度「9割の壁」を超えることの難しさについて。残りの1割に秘められた問題点とは

ほぼすべてのAI-OCR導入プロジェクトにおいて、読み取り精度「9割」が大きな壁となります。
9割を超えた途端にプロジェクトの進行が苦しくなるのはなぜなのか。また、残りの1割にはどんな問題点があるのか。

AI-OCRの専門家である私たちが、この問題について解説します。

AI-OCRが最も苦しくなる領域の話

読み取り精度9割の壁の狭間で一喜一憂する様子

AI-OCRの導入プロジェクトに携わっていると、ほぼ必ずといっていいほど出てくる数字があります。
それが、「9割」です。

精度9割。確かに、非常にキリがよくて、目標としてもわかりやすい数字です。

しかし、不思議なもので、この「9割」という数字はプロジェクトを前向きに進める指標となる一方で、開発側・現場双方を大きく疲弊させる境界線にもなりうるのです。

多くの現場において、読み取り精度8割までの調整は比較的スムーズに進みます。
なぜ、9割を目指した瞬間に突然苦しくなるのか。今回はその理由についてお伝えします。

 

7割・8割までは想定通りに進んでいく

AI-OCR導入の初期段階は、比較的進めやすいフェーズと言えます。

AI-OCRが最も力を発揮できる、きれいな帳票・書類などが、たいてい全体の7~8割を占めているからです。
この段階では、学習データを追加していけばどんどん精度が上がり、さらに調整を重ねると目に見えて成果が出てきます。

手ごたえが感じられて、プロジェクト全体の空気も前向きになります。

そして8割を超えてきたとき、お客様からよく聞く言葉があります。

「あと少しですね!」
「9割いけそうじゃないですか?」

しかし、問題はその先にあるのです。

 

残りの1割はたいてい「厄介者」である

読み取り精度向上の妨げになる厄介な文字の例

読み取り精度が9割に近づいたとき、まだ読めていない文字たちを見てみると、そのほとんどが同じような特徴を持っています。

かすれていたり、汚れや影が重なっていたり、他の文字が重なっていたり……
つまり、「人間が見ても迷ってしまうような文字」です。

この領域に入ると、学習データを増やしても改善があまり見られなくなり、調整を重ねても成果が出づらくなってきます。

努力に対するリターンが極端に落ち始めるゾーンです。

 

精度を上げようとするほど起こりはじめる問題

さらに厄介なのは、その「最後の1割」を読もうとしたときに起こり始める副作用です。

  • モデルデータが重くなることで、処理時間が長くなる
  • 今まで読めていたところで誤認識が起こる

といったように、精度を上げたはずなのに、使い勝手が悪くなってしまうことがあります。

精度を上げたのに、前より使いづらい……そんな、起こってほしくない状況が生まれてしまうのです。

 

精度を上げたのに、現場の反応が悪くなる?

それでも精度を上げ、9割を超えると、現場からよくあがる声があります。

処理の待ち時間が気になる、画面が固まる時間が増えた、作業が遅く感じる——
極めつけに、「前のほうが、正直使いやすかった」という一言が。

精度という数値と、現場が感じる「使いやすさ」に、ズレが生じ始めてしまうのです。

 

本当に100%を目指すべきなのか

読み取り精度と処理速度をはかりにかけて悩むエンジニア

この段階で、私たち開発側はある問いに向き合うことになります。

人の確認で補って、処理速度とのバランスを保つべきではないのか。
つまり、「ここから先、100%を目指す工程も、本当にAI-OCRでやりきるべきなのか?」という問いです。

しかし、この問いをお客様に伝えるのは非常にためらわれます。

なぜなら、これは精度を妥協する提案に聞こえてしまうからです。

 

9割を超えた先の問題は技術で解決できるのか

実際のところ、9割を超えた先の「最後の1割」は、AIの性能だけで解決すべき問題ではないケースが数多くあります。
業務設計上の問題であったり、運用ルールの問題であったり、理由はさまざまです。

複雑な問題をAIに解決させようとするのではなく、

  • 例外時だけ人が確認する
  • 特定の条件の場合、データを手入力する

といったように割り切ったほうが、全体として圧倒的に効率が良くなり、現場から好評を得られることも少なくありません。

 

Growdea-OCRが大切にしている考え方

それでも多くの現場が精度という数字に固執してしまいます。
理由はシンプルで、9割というと「あと少し」に見えるからです。

しかし、Growdea-OCRは、精度だけで良し悪しを判断しないようにしています。

現場のスピードは落ちていないか、人のストレスが増えていないか……。
精度という数字ではなく、現場の稼働そのものを重視しているのです。

時には、現場のために「割り切り」のご提案をする。
お客様の業務効率化のために、最上の方法を考える。

そこにこそ、私たちのAI-OCRベンダーとしての価値があると考えています。

 

お客様と一緒に育てる「Growdea-OCR」搭載商品のご案内

スクラッチ開発でこだわりぬいて作られたGrowdea-OCR搭載商品群、G-Correctionのご案内

お客様と育てる(Grow)、オンリーワンのAI-OCR「Growdea-OCR」を搭載した、業務効率化のためのソフトウェアを展開しています。
オンプレミスで動作可能、買い切りタイプ、サブスクリプションタイプなど、現場からのご要望を多く反映したパッケージ群です。

帳票ソフトウェアのほか、検品、ポカヨケ、マスキングなど多種多様な商品をご用意しています。

Growdea搭載シリーズG-Correctionについて詳しくはこちら