活字認識ライブラリー 仕様

お問い合わせ受付窓口 お問い合わせ受付窓口

活字認識ライブラリー Ver.15

入力画像

解像度

50~2,400dpi(400dpiを推奨)

原稿サイズ

最大A6版(1,200dpiの場合)
最大A4版(600dpiの場合)
最大A3版(400dpiの場合)
最大A2版(300dpiの場合)
最大A1版(200dpiの場合)
最大A0版(150dpiの場合)

対応形式

  • TIFF形式(非圧縮/G3/G4)(*.tif/*.tiff)
  • BMP形式(*.bmp)
  • JPEG形式(*.jpg/*.jpeg)
  • PDF形式(*.pdf)※1 ※2

※1 画像のみのPDFファイルに限り対応しています。
画像形式は、TIFF形式、BMP形式、JPEG形式に限り対応しています。セキュリティを設定したPDFファイルやアウトライン化したPDFファイルは読み込みできません。その他、形式によっては読み込みできない場合があります。

日本語文字認識

対象書体

マルチフォント
明朝体、ゴシック体、教科書体、ワープロ体、新聞文字など

対象文字

日本語

約6,800字
英字、数字、ひらがな、カタカナ、JIS記号(一部)168字、
ギリシャ文字(一部)32字、JIS第1水準漢字、
JIS第2水準漢字

英語

105字
英字、数字、記号43字

対象文字サイズ

6~60ポイント(400dpiの場合)

単語辞書

約180,000語(ユーザー登録も可能)

レイアウト認識

対象文書

印刷文書

抽出する領域

文字領域(縦書き/横書きを自動判定)、表領域、図形、画像

表認識

対象とする表

縦罫線と横罫線からなる表

対象線種

実線類、点線類、破線類、鎖線類

行列の最大値

98行×98列(セル数=9,604個)

画像出力

対応形式

  • TIFF形式(非圧縮/G4)
  • BMP形式
  • JPEG形式

画像補正

自動回転、自動傾き補正、ノイズ除去(3段階)、台形補正

※ 記載内容はVer.15.51における仕様です。

ファイルコンバートオプション Ver.4

認識結果
コンバート形式

ファイル書式

DOCX(Microsoft Word 2007 / 2010 / 2013 / 2016)
XLSX(Microsoft Excel 2007 / 2010 / 2013 / 2016)
PPTX(Microsoft PowerPoint 2007 / 2010 / 2013 / 2016)
PDF(透明文字、高圧縮)

※ 記載内容はVer.4.20における仕様です。

図形ベクター化オプション Ver.2

図形認識

対象画像

連続した面、および線が濃い単色で描画された線画

対象線種

直線、ベジェ曲線、円弧

出力色

各輪郭線の内部、および各中心線ごとに1色

線幅

線幅の出力は1種類(線幅の再現は行わない)