パナソニックのAI-OCR

活字も、手書き文字も、
あらゆる帳票フォーマットを自動で文字認識!
約30年の研究開発ノウハウで、紙文書や
画像文書内の文字を高精度にテキストデータ化

約30年独自開発を続けた
パナソニックのOCR技術 × 最新のAI技術
用途ごとに特化したAI-OCRの実力をぜひお試しください

パナソニックのAI-OCRは、紙書類や帳票の手書き文字認識に加え、画像内の文字読み取りなど、幅広い用途に応じた複数のAI-OCR商品を提供しています。

AI-OCRの精度改善のための帳票に合わせた『画像処理』や『AI学習モデルの追加』によるご支援も可能です。
「約30年のOCR技術・ノウハウ」×「最新のAI技術」でお客様の課題解決をお手伝いします。

帳票向けAI-OCR

AI手書き文字認識

申込書やアンケート用紙などに記入された住所・氏名・会社名・電話番号などの「手書き文字」の読み取りに特化したAI-OCRです。

AI非定型帳票認識

請求書や領収書、注文書に記載された金額や日付・明細など、各社レイアウトが異なる「非定型帳票」の読み取りに特化したAI-OCRです。活字はもちろん、手書き文字も認識します。

画像内文字認識AI-OCR

AI情景内文字認識

テレビ番組・動画のテロップや製品・梱包の印字チェックなど、「背景のある画像内文字認識」に特化し、さまざまなユースケースに対応するAI-OCRです。

帳票の事前定義はもう不要、パナソニックのAI-OCRなら
手書き文字やフォーマットの異なる帳票を認識

AI技術(ディープラーニング)を用いて、手書き文字や非定型帳票を高精度にOCR処理し、テキストデータ化することで、注文書や請求書など、紙文書の入力業務を大幅に効率化します。

約30年の研究実績を超えるパナソニックのOCR技術をもとに、AIへ効果的に学習し、用途に特化したAI-OCRをWebAPIとしてご提供しています。インターネットを経由して、さまざまなアプリケーションやシステムに手書き文字や非定型帳票の認識機能を簡単に実装することができます。その精度をぜひお試しください。

AI技術「ディープラーニング」を活用

NEW

書類の種類や項目・認識領域も自動認識
誰もが手軽に使えるAI-OCRが、帳票入力業務を変革

AI非定型帳票認識では、さまざまな様式・種類の請求書、領収書、注文書の項目を自動認識することが可能です。帳票内の日付や合計金額などの多様な項目・認識する領域も自動で認識します。
また、経理業務などでよく使用されている台紙に貼り付けられた証憑も認識可能です。そのほか、消費税の税率・税額などの課税対象額の取得や、領収書に手書きで記入された金額や宛先なども認識可能です。

請求書のサンプルイメージ

事前の設定や調整は不要なので、
誰でもカンタンに書類・画像内の文字をデータ化できます。

AI-OCRをお探しのお客様、OCRのアプリ開発をご検討中のお客様
「認識精度の事前検証」や「OCRの技術相談」など、当社の専門家がお手伝いします!
30日間無料の体験版もございます。

パナソニック ソリューションテクノロジー株式会社
お問い合わせ受付窓口

電話番号: 0570-087870

受付時間: 9時00分~17時30分 (土・日・祝・当社指定休業日を除く)

カメラ画像などの複雑な背景内文字や特殊文字を検出・認識する
パナソニックの「AI情景内文字認識」

「AI情景内文字認識」は、カメラ画像などの複雑な背景と一体化している文字や、白抜き文字・飾り文字などの特殊な文字(情景内文字)を検出・認識して、文字コードに変換することができます。開発者向けツールキット(SDK)のライブラリーとしてご提供しています。※1

画像内文字の「領域・座標を検出」して「文字認識」を行う2つのAIエンジンを組み合わせ、当社が保有するAI画像認識ノウハウをもとに効果的な学習を実施したことで、高い精度での文字検出と文字認識を実現しています。お客様のアプリケーションやシステムに組み込み、業務用途に合わせてスピーディーに構築できます。

※1 本研究は総務省の情報通信技術の研究開発「グローバルコミュニケーション計画の推進-多言語音声翻訳技術の研究開発及び社会実証-(Ⅰ. 多言語音声翻訳技術の研究開発)」の一環として行われました。

撮影した写真画像から文字を検出・テキスト化

AI情景内文字認識の主な特長

梱包の印字不良チェック

梱包箱の印字イメージ

検査システムと組み合わせることで、生産工程や出荷検査における「製品の化粧箱」、「段ボール箱」などの印字不良チェック※2を行えます。生産現場での商品回収リスクを軽減するなど、業務効率化をご支援します。

※2 撮影条件(照明ムラなど)に合わせたAIモデルの追加学習が必要となる場合があります。

テレビ番組・動画のテロップをテキスト抽出

番組・動画テロップのイメージ

テレビ番組や動画内に流れるテロップをテキスト抽出することで、「メタ情報」、「画像内文字(タグ情報)」などのデータベース入力を補助します。
放送局や映像制作会社にて番組内容の入力補助・検索補助ツールとして、業務効率化をご支援します。

ポスターや観光地看板、メニューなどの画像内文字を翻訳

看板・メニューのイメージ

訪日外国人や在留外国人向けの多言語翻訳サービスと組み合わせることで、「街中のポスター」、「観光地の看板」、「商品パッケージ」、「メニュー」などの画像内文字をOCR処理し、翻訳まで行えます。

AIモデルの追加学習

用途に応じて最適なAIモデルを追加学習※3することで、さらに認識精度を向上させることができます。

※3 AIモデルの追加学習は、個別対応となります。詳しくは、お問い合わせください。

AI情景内文字認識のご利用シーン

SDKとして提供することでお客様のシステム・ソフトウェア・サービスに組み込み、業務用途にあわせて利用することができます。また、用途に応じ、最適なAIモデル追加学習など※3により、さらに認識精度を向上させることが可能です。

AI情景内文字認識のご利用イメージ

AI-OCRをお探しのお客様、OCRのアプリ開発をご検討中のお客様
「認識精度の事前検証」や「OCRの技術相談」など、当社の専門家がお手伝いします!
30日間無料の体験版もございます。

パナソニック ソリューションテクノロジー株式会社
お問い合わせ受付窓口

電話番号: 0570-087870

受付時間: 9時00分~17時30分 (土・日・祝・当社指定休業日を除く)

AI情景内文字認識
仕様・動作環境・関数一覧

仕様

入力画像 カメラ解像度 最大1,200万画素
※ 600万画素以上を推奨
対応形式
  • TIFF形式(非圧縮/G3/G4/LZW)(*.tif/*.tiff)
  • BMP形式(*.bmp)
  • JPEG形式(*.jpg/*.jpeg)
対象文字種 活字(英字、数字、ひらがな、カタカナ、漢字、記号)
対象文字サイズ 6~60ポイント(400dpiの場合)

開発環境

コンピューター本体 CPU Intel Core i7以上のCPUを搭載したパーソナルコンピューター
(インストール時にCD-ROMドライブが必須)
GPU GPUアーキテクチャ Turing世代
動作確認製品
  • NVIDIA Quadro P5000
  • NVIDIA GeForce RTX 2080 Ti
  • NVIDIA GeForce RTX 2060
ドライバー NVIDIA driver 418.96
※ ご使用のGPUに対応するドライバーバージョンがインストールされている必要があります。
基本ソフトウェア Microsoft Windows 10 Version 1903 / 1909
(Home、 Pro、 Enterprise、 Education)
ランタイム CUDA10.1
開発環境 Microsoft Visual Studio 2019
開発言語 Microsoft Visual C++

動作環境

コンピューター本体 CPU Intel Core i7以上のCPUを搭載したパーソナルコンピューター
(インストール時にCD-ROMドライブが必須)
GPU GPUアーキテクチャ Turing世代
動作確認製品
  • NVIDIA Quadro P5000
  • NVIDIA GeForce RTX 2080 Ti
  • NVIDIA GeForce RTX 2060
ドライバー NVIDIA driver 418.96
※ ご使用のGPUに対応するドライバーバージョンがインストールされている必要があります。
最小稼働メモリー お使いのOSが推奨する環境以上
基本ソフトウェア Microsoft Windows Server 2019 64bit
ランタイム CUDA10.1
Visual C++ライブラリーのランタイムコンポーネントが必要です。
x64のMicrosoft Visual C++ 2015 再頒布可能パッケージ を別途入手し、動作環境へインストールしてください。

基本関数

IDRSceneryInit OCRエンジンの初期化を行います。
IDRScenerySetImage OCRエンジンに認識対象の画像をセットします。
IDRSceneryDetectText 各認識対象フィールドの文字検出を行います。
IDRSceneryRecogText 各認識対象フィールドの文字認識を行います。
IDRFreeRecog 文字認識処理のためにOCRエンジン内部で確保したリソースを解放します。
IDRSceneryTerm OCRエンジンの終了処理を行います。

画像操作関数

IDRReceiptLoadImage 画像ファイルの読み込みを行います。
IDRReceiptFreeImage 画像データの破棄を行います。

価格

※ 価格と保守サポートメニューなどの詳細は、お問い合わせください。

AI-OCRをお探しのお客様、OCRのアプリ開発をご検討中のお客様
「認識精度の事前検証」や「OCRの技術相談」など、当社の専門家がお手伝いします!
30日間無料の体験版もございます。

パナソニック ソリューションテクノロジー株式会社
お問い合わせ受付窓口

電話番号: 0570-087870

受付時間: 9時00分~17時30分 (土・日・祝・当社指定休業日を除く)