OCRソフト用開発キット「活字認識ライブラリー」 仕様
活字認識ライブラリー Ver.15
入力画像 |
解像度 |
50~2,400dpi(400dpiを推奨) |
|
---|---|---|---|
原稿サイズ |
最大A6版(1,200dpiの場合) |
||
対応形式 |
※1 画像のみのPDFファイルに限り対応しています。 |
||
日本語文字認識 |
対象書体 |
マルチフォント(明朝体、ゴシック体、教科書体、ワープロ体、新聞文字など) |
|
対象文字 |
日本語 |
約6,800字 |
|
英語 |
105字 |
||
対象文字サイズ |
6~60ポイント(400dpiの場合) |
||
単語辞書 |
約180,000語(ユーザー登録も可能) |
||
認識結果 |
文字コード |
UCS-2(Unicode) |
|
レイアウト認識 |
対象文書 |
印刷文書 |
|
抽出する領域 |
文字領域(縦書き/横書きを自動判定)、表領域、図形、画像 |
||
表認識 |
対象とする表 |
縦罫線と横罫線からなる表 |
|
対象線種 |
実線類、点線類、破線類、鎖線類 |
||
行列の最大値 |
98行×98列(セル数=9,604個) |
||
画像出力 |
対応形式 |
|
|
画像補正 |
自動回転、自動傾き補正、ノイズ除去(3段階)、台形補正 |
※ 記載内容はVer.15.70における仕様です。
活字認識ライブラリー for Linux
入力画像 |
解像度 |
50~2,400dpi(400dpiを推奨) |
|
---|---|---|---|
原稿サイズ |
最大A6版(1200dpiの場合) |
||
対応形式 |
TIFF形式(非圧縮 / G3 / G4 / LZW)(*.tif / *.tiff) |
||
文字認識 |
対象書体 |
マルチフォント(明朝体、ゴシック体、教科書体、ワープロ体、新聞文字など) |
|
対象文字 |
日本語 |
約6,800字 |
|
対象文字サイズ |
6~60ポイント(400dpiの場合) |
||
単語辞書 |
約180,000語 |
||
認識結果 |
文字コード |
UCS-2(Unicode) |
|
レイアウト認識 |
対象文書 |
印刷文書 |
|
抽出する領域 |
文字領域(縦書き / 横書きを自動判定)、表領域、図形、画像 |
||
表認識 |
対象とする表 |
縦罫線と横罫線からなる表 |
|
対象線種 |
実線類、点線類、破線類、鎖線類 |
||
行列の最大値 |
98行×98列(セル数=9,604個) |
||
画像出力 |
対応形式 |
TIFF形式(非圧縮 / G4) |
|
画像補正 |
自動回転、自動傾き補正、ノイズ除去(3段階)、台形補正 |
※ 記載内容はVer.15.70における仕様です。
ファイルコンバートオプション Ver.4
コンバート形式 |
ファイル形式 |
DOCX(Microsoft Word 2021 / 2019 / 2016) |
---|
※ 記載内容はVer.4.30における仕様です。
図形ベクター化オプション Ver.2
図形認識 |
対象画像 |
連続した面、および線が濃い単色で描画された線画 |
---|---|---|
対象線種 |
直線、ベジェ曲線、円弧 |
|
出力色 |
各輪郭線の内部、および各中心線ごとに1色 |
|
線幅 |
線幅の出力は1種類(線幅の再現は行わない) |
製品版と同じ環境を30日間無料でお試しいただけます!
ご不明な点がございましたらお気軽にご相談ください。