情景内文字認識ライブラリー 商品概要

お問い合わせ受付窓口 お問い合わせ受付窓口

情景内文字認識ライブラリー NEW

「カラーOCRライブラリー」シリーズの新たな商品ラインアップとしてAIを活用した「情景内文字認識ライブラリー」を開発※1
「情景内文字認識ライブラリー」は、従来のOCR技術では正確に認識することが困難だったカメラ画像などの複雑な背景と一体化している文字や、白抜き文字・飾り文字などの特殊な文字(情景内文字)を検出・認識して、文字コードに変換する開発ツールキット(SDK)です。
画像内文字の「領域・座標を検出」して「文字認識」を行う2つのAIエンジンを組み合わせ、当社が保有するAI画像認識ノウハウをもとに効果的な学習を実施したことで、高い精度での文字検出と文字認識を実現しています。
本ライブラリーをお客様のアプリケーションやシステムに組み込み、業務用途に合わせてスピーディーに構築できます。

※1 本研究は総務省の情報通信技術の研究開発「グローバルコミュニケーション計画の推進-多言語音声翻訳技術の研究開発及び社会実証-(Ⅰ. 多言語音声翻訳技術の研究開発)」の一環として行われました。

情景内文字認識のご利用イメージ
情景内文字認識のご利用イメージ

■ 情景内文字認識ライブラリーの主な特長

梱包の印字不良チェック

梱包箱の印字イメージ

検査システムと組み合わせることで、生産工程や出荷検査における「製品の化粧箱」、「段ボール箱」などの印字不良チェック※2を行えます。生産現場での商品回収リスクを軽減するなど、業務効率化をご支援します。

※2 撮影条件(照明ムラなど)に合わせたAIモデルの追加学習が必要となる場合があります。

テレビ番組・動画のテロップをテキスト抽出

番組・動画テロップのイメージ

テレビ番組や動画内に流れるテロップをテキスト抽出することで、「メタ情報」、「画像内文字(タグ情報)」などのデータベース入力を補助します。
放送局や映像制作会社にて番組内容の入力補助・検索補助ツールとして、業務効率化をご支援します。

ポスターや観光地看板、メニューなどの画像内文字を翻訳

看板・メニューのイメージ

訪日外国人や在留外国人向けの多言語翻訳サービスと組み合わせることで、「街中のポスター」、「観光地の看板」、「商品パッケージ」、「メニュー」などの画像内文字をOCR処理し、翻訳まで行えます。

AIモデルの追加学習

用途に応じて最適なAIモデルを追加学習※3することで、さらに認識精度を向上させることができます。

※3 AIモデルの追加学習は、個別対応となります。詳しくは、お問い合わせください。

情景内文字認識ライブラリー