株式会社センクリード

AI-OCRを比較! 他社のAI-OCRとGrowdea-OCR、いったい何が違うのか

AI-OCR市場は成熟期に入り、精度やAIの性能だけでは違いがわかりにくくなってきました。
一見どれも同じように見えてくるAI-OCRですが、実は、見えない内部構造や設計思想が実務での運用に差をつけます。

本記事では、一般的なAI-OCRと、私たちセンクリードのGrowdea-OCRを、技術寄りの観点で比較していきます。

他社AI-OCRの一般的な技術構造

多くのAI-OCRは、次のような構造になっています。

入力画像→軽微な前処理(拡大・2値化 等)→検出AI(文字領域検出)→認識AI(文字変換) →結果出力

この構造の最大の特徴は、導入が容易かつ短納期であることです。

スピーディな導入が可能な一方で、画像品質のばらつきに弱かったり、誤認識の原因を確認することができなかったりという欠点があります。

いわゆる「前処理(AIに画像を渡す前、画像の段階で画像処理を行いきれいな画像にする)」が弱く、AIにとって読みづらい画像を渡すことになりやすいです。

そのため、傾き・濃度差などのスキャン差や、汚れ・かすれなどのノイズが発生すると、一気に精度が落ちてしまいます。

 

Growdea-OCRの技術構造

センクリードのAI-OCRは、設計思想が他社と根本的に異なります。

入力画像→画像加工処理層(Growdea)→情報検出層→認識・分岐制御層(自社開発AI)→結果出力

Growdea-OCRは、前処理に非常に力を入れています。

これにより他社をはるかにしのぐ精度を実現できる一方で、導入に時間がかかるというデメリットがあります。

前処理の調整作業はとても繊細なので、一朝一夕で終えられるものではないのです。

精度をとるか時間をとるか、というのが、Growdea-OCRを検討いただく際の大きな分岐点となります。

 

画像処理の「粒度」を比較!

他社のAI-OCRの画像処理は、全体の明るさ調整などの一括補正・単純拡大・二値化を基本の処理としています。

画像処理はおおまかに行い、あとは認識AIに頼る方式です。

一方、Growdea-OCRは

  • ピクセル単位での光量調整
  • 局所のコントラスト最適化
  • ストローク幅の正規化
  • 輪郭を保持しての超解像

など、画像処理だけで多くのステップを実行します。

認識AIが理解しやすい画像を先に作ることで、精度を向上させているのです。

 

空間やレイアウトの扱い方を比較!

他社AI-OCRとGrowdea-OCRの「空間やレイアウトの扱い方」を比較

他社のAI-OCRでは、空間やレイアウトは考慮せず、文字だけを読み取る方式が一般的です。
一意でノイズのない帳票を高速で読み取ることが可能ですが、わずかなずれで精度が著しく落ちるという特徴があります。

一方Growdea-OCRは、スラミング(SLAM系技術)を用いて空間構造・レイアウトを把握しています。

帳票の項目が変わったり、スキャンが斜めになってしまったりといったアクシデントがあっても精度が落ちません。
一方、一意できれいな帳票にはオーバースペック気味になります。

 

情報検出の考え方を比較!

他社のAI-OCRは、文字をまとめて検出してから処理します。

Growdea-OCRは、意味単位や領域単位で分解してから処理を行っています。

シンプルかつ一意で高品質なPDFデータなどは、まとめて検出したほうが早いです。
分割して処理する場合、複雑なレイアウトや文字が密集した帳票などに強くなります。

 

原因追及のしやすさを比較!

一般的なAI-OCRは、誤認識の原因を把握することができません。誤認識が改善されるかは再学習頼みになってしまいます。

Growdea-OCRは「どこで間違えたのか」を追跡できるように作られました。そのため間違えた箇所をピンポイントで修正することができます。

「Growdea」の調整がしやすいという特徴は、長期運用時に非常に重要なポイントです。

短期間だけの運用である場合は、一般的なAI-OCRを使用したほうが導入コストを抑えることができるでしょう。

長期運用には、いつでも修正・微調整ができるGrowdea-OCRがより向いていると言えます。

 

運用面での差まとめ

 

観点 他社AI-OCR Growdea-OCR
導入スピード 速い 遅い
帳票の追加 調整が必要 前処理で吸収可能
スキャン品質の差 品質によって精度がぶれる 精度が安定する
誤認識発生時の調整 原因が特定できないため調整が難しい 原因を追跡し調整できる

 

AI-OCRの差は単純な精度の比較では見えにくいものです。
導入難易度や適用シーンの見極めも含めて、業務要件や解決したい問題を明確にしたうえで選定する必要があります。

Growdea-OCRでお客様の要件を満たせるか、問題を解決できるか、というご相談もお受けしております。お気軽にお問い合わせください。

 

お問い合わせはこちらから

 

現場のためのAI-OCR「Growdea-OCR」搭載商品のご案内

活字AI-OCR業務効率化パッケージシリーズG-Correctionのイメージ

現場のことを第一に考えたAI-OCRであるGrowdea-OCRを搭載した、業務効率化のためのソフトウェアを展開しています。
オンプレミスで動作可能、買い切りタイプ・サブスクリプションタイプなど、現場からのご要望を多く反映したパッケージ群です。

帳票ソフトウェアのほか、検品、ポカヨケ、マスキングなど多種多様な商品をご用意しています。

Growdea搭載シリーズG-Correctionについて詳しくはこちら