OCR(Optical Character Recognition、光学文字認識)とは、紙や画像ファイルの文字をカメラやスキャンで読み取り、デジタルデータに変換する技術です。ECの受発注システムにOCR機能を実装してFAXや手書きなどの紙や画像からテキスト情報を抽出し、ECのデジタルデータとして取り扱えるようになります。
紙や画像の情報をOCRでデジタル化する方法には、次の4つがあります。
◆紙や画像の情報をOCRでデジタル化する4つの方法
② スキャン画像のテキスト情報を抽出する
③ スマートフォンのカメラで撮影した画像のテキスト情報を抽出する
④ メールに添付された画像やPDFのテキスト情報を抽出する
この記事では、インターファクトリーでマーケティングを担当している筆者が、OCRで紙や画像の情報をデジタル化して、ECの受発注システムで利用するための4つの方法を紹介します。
BtoBでは今も紙の伝票が使われている
2018年に経済産業省がデジタルトランスフォーメーション(DX)を提唱するなど、これまでもデジタル変革の取り組みが推進されてきましたが、コロナ禍を経て、ようやく人々のデジタル化に対する意識と需要が高まってきました。しかし、企業間取引(BtoB)では、現在も紙の帳票や文書に基づく取引が行われています。
以下は、株式会社アイルが2022年に実施した、中堅・中小企業のBtoBにおける受注業務の実態に関する調査結果です。
◆最も利用している受注手段(受注チャネル)
出典:ネットショップ担当者フォーラム「BtoB-EC導入も8割が『アナログ手法』が最も利用する受注手段。取引先のEC化率は平均4割【企業間取引の受注業務実態調査】」(2022年12月1日掲載)
上図を見ると、FAXやメールの添付ファイルとして届く発注書、営業への電話や口頭での注文依頼など、受発注システムに直接取り込めない、「アナログ」な手段による注文の割合が大きいことが分かります。
これらのアナログ情報をECの受発注システムに取り込むためにはデジタルデータに変換する必要がありますが、例えば、メモや帳票などを見ながら手入力していくような運用は、入力作業に時間を取られる上に、誤入力によるトラブルも発生しやすく、極めて非効率です。
受発注業務の効率化を目指すのであれば、OCRを導入し、アナログ情報をデジタルデータ化して受発注システムに登録するまでの一連の作業を自動化する必要があります。
OCRでアナログ情報をデジタルデータ化する4つの方法
OCR機能を使用して紙や画像などのアナログ情報をデジタルデータ化する方法は4つあります。いずれの方法でも、受発注システムとの自動連携も同時に実装することで、手入力では対応が困難な膨大なアナログ情報を、素早く、精度の高いデジタルデータとして取り扱えるようになります。
① FAX情報をデジタルデータ化する
受発注伝票などのFAXを受信した際にOCRで読み込み、テキストデータを抽出します。この方法では、FAXとOCR、および受発注システム間の自動連携機能を実装する必要がありますが、FAX受注のフロー自体は変更する必要がないため、手軽にOCRを導入することができます。
② スキャン画像のテキスト情報を抽出する
スキャナーを使って紙の帳票類をスキャンし、OCRでスキャン画像からテキストデータを抽出します。スキャナーとOCR、および受発注システム間の自動連携機能を実装することで、自動的に受発注システムにデータを取り込めるようになります。
③ スマートフォンのカメラで撮影した画像のテキスト情報を抽出する
スマートフォンのカメラアプリで帳票類を撮影し、OCRで写真からテキストデータを抽出します。スマートフォンさえあれば、いつでもどこでも、手軽に受発注システムにデータ登録が行えるため、外出先でも速やかに手続きを進められるようになります。
④ メールに添付された画像やPDFのテキスト情報を抽出する
ファイルが添付されたメールを受信した際にOCRで添付ファイルを読み込んで、画像やPDFからテキストデータを抽出します。メールシステムとOCR、および受発注システム間の自動連携機能を実装することで、メールを開封してPDFファイルを指定の場所に保存するといったアナログの手順も自動化できるため、メール受注の割合が多い場合には業務効率を大幅に向上できます。
OCRの最大の課題は文字認識率
OCRに最も期待される性能であり、最大の課題でもあるのが、文字認識率です。
OCRで印字を読み込んだ場合でも、フォントやサイズ、出力紙の質、出力時の文字のかすれなどが原因で、文字認識率が低下することがあり、ましてや、個々人で筆致の異なる手書き文字の認識率の精度を高めるのは難しく、一定の割合で認識エラーや読み取りミスが発生します。
そのため、早い時期にOCRを導入した企業の中には、相当数のデータを人間がチェックしたり、修正したりしなければならず、「効率化のためのデジタル化」なんて有名無実だと感じているケースも少なからずあるかもしれません。
また、OCR側で読み込む帳票類のレイアウトや項目をあらかじめ設定しておく必要があるため、固定フォーマットでしか運用できないという柔軟性の低さも、OCRの運用における大きな課題の一つでした。
AI-OCRの登場
OCRが長年抱えていた課題を解決するために登場したのが「AI-OCR(Artificial Intelligence-Optical Character Recognition)」です。AI-OCRは、OCR技術とAI(人工知能)技術を組み合わせ、AIが複数のパターンを学習することで、文字認識精度の向上と、非定型帳票やフリーフォーマットからの項目抽出を実現します。
従来型OCRと比べ、AI-OCRの文字認識率は大幅に向上しています。AIの学習能力によって、フォントの異なる印字や手書き文字なども、高精度に解析・抽出できるようになりました。
また、AI-OCRはフォーマットが異なる大量の帳票や文書のパターンも学習し、適応できるため、従来型OCRでは不可欠だった読み取り位置や項目などの詳細定義なども不要になります。
AI-OCRを使うことで、従来型OCRでは対応できなかった手書き文字や不規則なフォーマットの書類も高い精度で読み取ることができるため、業務効率を大幅に向上することができます。
AI-OCRは使用すれば使用するほど学習によって精度が向上していきます。導入初期は多少調整が必要な場面もあるかもしれませんが、業務を通じてAIが学習を重ねることで、文字認識の精度は飛躍的に改善されていくはずです。
現在AI-OCRは、受発注業務だけでなく、営業部門や物流部門などさまざまな部門で活用され始めており、業務スピードの向上、人的リソースの削減、データ精度の向上などの高い効果が期待できます。
AI-OCRの活用例
今回は、受発注業務におけるAI-OCRの活用例を3つほど紹介します。
① FAXや手書きの注文書をデータ化する
先ほどもお話ししたとおり、BtoBではFAXや手書きの帳票類を完全になくすことは難しく、例えば建設業や製造業などの現場からの注文は、すべて手書き伝票で届くというケースがほとんどです。
それらを手作業でデータ化しようとすると、膨大な時間がかかる上に、入力ミスなどのヒューマンエラーによるトラブルが増えやすく、さらにその対応にも時間を取られてしまいます。
AI-OCRでは個人差のある手書き文字も高精度で認識・抽出できますから、AI-OCRと受発注システムとを連携して、データベースに自動登録されるようにすることで、受発注の処理スピードを大幅に短縮でき、入力ミスなどのヒューマンエラーの発生も軽減することができます。
② フォーマットが異なる注文書をデータ化する
受発注業務では、取引先によって注文書のフォーマットが異なることがよくあります。従来型OCRは事前に定めたフォーマットに依存するため、それ以外の帳票を読み取ることはできませんでした。
AI-OCRではレイアウトが異なる帳票のテキストも、位置や形式を解析して正確に読み取ることができます。そのため、複数の取引先からの異なる形式の注文書も一括で処理できるため、業務効率が大幅に向上します。
③ 紙の注文書をデータ化する
先ほども述べたように、BtoBでは取引の一連の手続きは紙の帳票で行われています。AI-OCRではこれらの紙の帳票や文書を簡単にデータ化することができます。
例えば、紙の注文書をスキャンしてAI-OCRでテキストデータを抽出し、そのデータが受発注システムに自動登録されるようにすることで、手作業を最小限に抑えて、正確なデータを即時反映できるため、受発注の処理スピードを高速化できます。
まとめ
多くの企業でDXの取り組みが進められていますが、受発注業務では従来の慣習を変革することが難しいケースもあり、いまだにアナログな方法が用いられているのが現状のようですが、業務効率の向上を目指すのであれば、受発注業務のデジタル化を避けて通ることはできません。
OCR/AI-OCRと受発注システムを連携して、アナログ情報を自動でデータ化する方法であれば、従来の取引方法を大きく変更せずに、受発注業務のデジタル化を実現できます。
インターファクトリーのSaaS型ECプラットフォーム「ebisumart(エビスマート)」は、外部システムとの連携にも柔軟に対応でき、OCR/AI-OCR連携も実装できます。
ECでOCR/AI-OCRの使用を検討されている方は、ぜひ、下記の公式サイトで、ebisumartのサービスをご確認ください。
公式サイト:「ebisumart(エビスマート)」