手書き文字OCRと活字文字OCR。どちらもOCRという言葉でまとめられがちですが、実は全くの別物です。
それぞれに特徴があり、それぞれ違う開発の難しさがあります。
センクリードは今でこそ活字文字OCR一筋のプロフェッショナルですが、以前は手書き文字OCRも取り扱っていました。
本記事では、どちらのことも知っているからこそわかる違いや、両立させようとしたときに発生する問題などについて解説します。
手書き文字OCRと活字文字OCR。どちらもOCRという言葉でまとめられがちですが、実は全くの別物です。
それぞれに特徴があり、それぞれ違う開発の難しさがあります。
センクリードは今でこそ活字文字OCR一筋のプロフェッショナルですが、以前は手書き文字OCRも取り扱っていました。
本記事では、どちらのことも知っているからこそわかる違いや、両立させようとしたときに発生する問題などについて解説します。

AI-OCR導入検討のご相談を受ける際、手書き文字の読み取りと活字文字の読み取りを、同じ延長線上の技術として考えている方が多くいらっしゃいます。
しかし、技術的にみると、手書き文字OCRと活字文字OCRは、難易度が違うのではなく、そもそも解いている問題が違うのです。
まったくの別物、さらに言えば別次元の技術だと言えます。
両者を同一視すると、OCRやAI-OCRについての判断を大きく誤ることになってしまいます。
OCR、AI-OCRを正しく選び、正しく使うためにも、ぜひ本記事をお役立てください。
まず、前提として、OCRはただ文字を読む技術ではありません。
OCRとは、画像として存在する情報を、データとして一意に確定させるための技術です。
このとき、正解があいまいな問題を解くのか、正解が厳密に決まっている問題を解くのかによって、OCRの設計思想は大きく分かれることになります。

手書き文字が持っている特徴は明確です。
書き方が人によって違い、省略があったり、崩しがあったりと、正解の字形を完全に定義することができない点です。
つまり、手書き文字OCRには、「どれが正解かわからない中で、最もそれらしい解を推定する」という力が必要になります。
これには、確率や統計、それに「人間の解釈に近づける」という技術が用いられます。

一方、活字文字はまったく別の性質を持っています。
フォントは定義されていますし、字形が決まっているので、正解は1つだけです。
活字文字OCRに必要とされるのは、「正解がわかっている中で、どれだけ正確に回答できるか」という力なのです。
あいまいさが許されず、再現性・一貫性が必須という条件が課されます。
よく、「手書きOCRは難しく、活字OCRは比較的簡単」と考えている方がいらっしゃいますが、これは誤解です。
手書き文字の難しさと活字文字の難しさはまったく異なるので、同じ土俵で考えることはできません。
下記はそれぞれの難しいところの一例です。
手書き文字の難しさ
活字文字の難しさ
両者の違いは難易度ではなく、「難しさ」の方向性が違うという点なのです。
センクリードは、手書き文字AI-OCRと活字文字AI-OCR、両方の研究開発に取り組んできました。
そしてその結果見えたのは、
手書き文字は「推定する技術」であり、活字文字は「正規化と制御の技術」である、ということでした。
両者は技術体系からしてまったくの別物だったのです。
そこで、私たちは、確実に技術を進化させていくため、活字文字に特化したAI-OCRを作るという判断に至りました。
なぜ活字文字を選んだのかという詳しい理由については、また別の記事でお話しさせていただこうと思います。
私たちが活字文字のAI-OCR一本に絞って研究開発を進めていく中で、新たな壁にぶつかりました。
活字文字OCRが扱う対象は、決して「きれいな文字」だけではありませんでした。
など、活字文字でも、「人間でも読みづらい」ケースが多々あったのです。
あいまいな推定が許されない活字文字OCRで、条件の悪い画像を正解に収束させる——
この高難度領域に挑むことで、私たちのAI-OCRは進化してきました。

手書き文字OCRと活字文字OCRの話題に戻ります。
もし、手書き向けの「あいまい許容の設計」と、活字向けの「厳密に判定する設計」を同時に成立させようとすると、
手書きでは厳しすぎる
活字では甘すぎる
という矛盾が生まれてしまうのです。
手書き文字と活字文字を同一視して、ひとつのAI-OCRで読もうとした場合、
どちらも中途半端で「使えない」という評価につながってしまうことでしょう。
手書き文字OCRと活字文字OCRは、上下関係も包含関係もない、別次元のOCR技術であるというお話しをさせていただきました。
AI-OCRを正しく選定するためには、最初に「どんなOCRを必要としているのか」を明確にすることが最も重要です。
この記事をお読みくださった方が、ぴったりのOCR・AI-OCRに出会えることを祈っています。

活字文字特化のGrowdea-OCRを搭載した、業務効率化ソフトウェアを展開しています。
>>>>>オンプレミスで動作可能、買い切りタイプ・サブスクリプションタイプなど、現場からのご要望を多く反映したパッケージ群です。
帳票ソフトウェアのほか、検品、ポカヨケ、マスキングなど多種多様な商品をご用意しています。