2025/7/24
こんにちは。DX推進室長の北沢です。
DX関連のブログの投稿です。
世の中、業務効率化の一環でペーパーレス化が進んでおりますが、運送業界では荷物の運んだ記録、請求の用途として紙が重要な役割を担っているため、業務改善は非常に課題があります。
たとえば、RFIDを導入した場合は、使い捨てでかつスキャナーの高額なことから、設備投資もランニングコストも跳ね上がります。
そのため、私達は紙が存在し続ける前提で、業務が包括的に効率化をさせることに視点を切り替えました。
私達はこれまで手書きの配送伝票を1枚ずつ目視でデータ化し、月間約4,000枚の伝票処理に多大な工数を費やしてきました。
本取り組みでは、OCRを活用して約90%の認識精度で電子化を自動化し、業務効率を大幅に改善した事例をご紹介します。
運送業に限らず、あらゆる業界で手書き伝票のデジタル化ニーズは共通の課題ですが、自社システムへのOCR組み込みによってどれだけの効果が得られたかをシェアします。
手打ちでエクセルに入力
伝票を探し出すロス
伝票を探してPDFにしてメール送信
自動入力
データ検索で一発
即座に顧客側でも見える化
OCR(Optical Character Recognition:光学文字認識)は、紙や画像上の文字をデジタルテキストに変換する技術です。
従来の手作業によるデータ入力は、人的ミスや多くの時間を要するという課題がありました。しかし、OCRを導入することで、大量の文字情報を高速かつ高精度でデジタル化することが可能になります。
近年では、ディープラーニングや生成AIといった先進技術の進化により、OCRの精度は飛躍的に向上しました。これにより、GoogleやMicrosoftが提供するクラウドサービスなどを利用すれば、誰でも手軽に、手書きの日本語であっても高い精度でテキストを抽出できるようになっています。
ディープラーニング
お客様によっては専用伝票のケースがあり、各レイアウト分を学習させるコストとデータセットの問題から、採用しませんでした。
生成AI
応答速度が遅いことと、コストがかなり高額になるため不採用としました。
今後、OCRの結果の答え合わせとして人間がチェックをしている業務を生成AIに置き換える際に、活用したと考えています。
機械が理解をしやすいように伝票のレイアウトを工夫しました。
元の用紙は複写式で紙が薄く、抵抗が少ないためスキャナーの給紙がスムーズにいかないため、一般的な用紙に変更。
手書きで書く際に背景色をつけることで、記入場所をコントロールして読み取り精度を向上
今後のレイアウト変更等によるロジックの変更がしやすいように用紙にバージョン番号を埋め込み
選択肢を羅列してレ点でチェックをいれる方式ではOCRでは解析が難しいため、記述式に変更
「伝票番号」など機械が不必要な情報は削除
当初Google Cloud Visionのみで検証をしていましたが、精度が70%くらいから、どうやっても改善をしない課題にぶつかりました。
手書き文字の場合、行間によって、1つの文脈と理解されず、バラバラに抽出されてしまう。
台紙に書かれた文字と手書きを組み合わせるケース(例 ◯箱)のようにあとから、箱数をいれるような場合に、バラバラに抽出されてしまう。
Google Cloud Visionにはチューニングするパラメータがないため、頭打ちとなってしまったことから、
Azure AI Visionも組み合わせて、どちらかが正解するだろうということでハイブリット運用にしました。
利用サービス:Azure AI Vision と Google Cloud Vision API を併用
手法:両APIの結果を突合し、文字ブロック単位で最適な認識結果を採用
効果:単一OCR時の約70%から約90%へ大幅改善
※画面右側にGoogleとMicrosoftの文字起こし結果がそれぞれ表示されています。
2種類のパターンを作り現場に組み込みやすい方法を検討しました。
ScanSnapというスキャナーはSDKが非常に優秀で、控えめに言って最高でした。
複合機で読み取り後、サーバにメール送信
サーバ側で受信・OCR実行
メリット
既存複合機をそのまま活用可能
デメリット
複合機を現場に設置するには物理的に課題が多かった。
エラーが即座にわからない。
複合機の操作手順が複雑。
破格に安く実現できました。
1枚あたりOCRコスト:約1円
処理速度
サーバアップロード:3秒/枚
OCR処理:1.5秒/枚
初期投資:ScanSnap 約50,000円/台
ランニングコスト:月間4,000枚自動化で約4,000円
紙輸送工数の削減:本社へ伝票配送を人が届けていましたが、不要になりました。
作業工数削減率:事務が記録を取っていた業務が約70%削減。精算作業も自動化されました。
電子化:紙をいちいち探し出す作業がなくなりました。
荷主様も管理画面にて即座に受領書が確認ができるようになりました。
手書き伝票のOCR自動化により、人的入力の手間とミスを大幅に削減し、コストも最小限に抑えることができました。
業務フローに合わせた複数の導入パターンと、ハイブリッドOCRによる精度向上の工夫がポイントです。
今後はダブルチェックに別のOCR、生成AIを組み合わせることで、自動で修正し100%を機会で完結できる世界を目指したいと思います。
SITでは、物流をもっと楽しく、やりたいことに集中できるようにDXに取り組んでいます。
うちでも導入したいという会社さん、物流を自分の力でよりよくしたい方はご連絡お待ちしております。