文字が正しくOCR処理されない

テキスト検索できるファイルを作成するときに、正常にOCR処理が行われないことがあります。その場合は、OCR処理の言語設定や、使用している原稿が適切かどうかを確認します。
言語設定を原稿に合わせて変更したり、本機が認識できる文字種と書体の原稿やOCR処理に適した原稿を使用したりすることで、処理精度が向上します。
重要
言語設定や原稿が適切でも正常にOCR処理が行われない場合
1 ページあたりの文字数が多い原稿は、処理精度が向上しないことがあります。
Word形式のOOXMLファイルを作成する場合は、以下のようなことがあります。
地色/字体/文字の大きさ/文字の傾きなどによっては、意図しない文字に置き換えられたり、文字が欠落したりする
段落/改行/表が再現されない
図/写真/印鑑などの画像の一部が文字として認識され、文字に置き換えられる

OCR処理の基準となる設定と言語

文字認識の基準となる言語の設定
OCR処理の設定時に選択した言語が、文字認識の基準となります。テキスト検索できるファイルを作成する - OCR処理
認識できるアジア言語
日本語、中国語(簡体字)、中国語(繁体字)、韓国語
※文字種と書体については、以下を参照してください。
認識できる欧州言語および言語グループ
言語
英語、フランス語、イタリア語、ドイツ語、スペイン語、オランダ語、ポルトガル語、アルバニア語、カタロニア語、デンマーク語、フィンランド語、アイスランド語、ノルウェー語、スウェーデン語、クロアチア語、チェコ語、ハンガリー語、ポーランド語、スロバキア語、エストニア語、ラトビア語、リトアニア語、ロシア語、ギリシャ語、トルコ語、スロベニア語*1、ルーマニア語*1、ブルガリア語*1、ヘブライ語*1
言語グループ
西ヨーロッパ言語(ISO)*2、中央ヨーロッパ言語(ISO)*3、バルト言語(ISO)*4
※文字種と書体については、以下を参照してください。
*1[OCR (欧米文字認識)]の場合にのみ選択可能です。
*2英語、フランス語、イタリア語、ドイツ語、スペイン語、オランダ語、ポルトガル語、アルバニア語、カタロニア語、デンマーク語、フィンランド語、アイスランド語、ノルウェー語、スウェーデン語が含まれます。
*3英語、クロアチア語、チェコ語、ハンガリー語、ポーランド語、スロバキア語が含まれます。
*4英語、エストニア語、ラトビア語、リトアニア語が含まれます。

認識できる文字種と書体(アジア言語)

認識できる文字種
日本語
アルファベット、数字、漢字*1、記号、ひらがな、カタカナ
中国語(簡体字)
GB2312-80(アルファベット、数字、漢字、記号)
中国語(繁体字)
Big5(アルファベット、数字、漢字、記号)
韓国語
KSC5601(アルファベット、数字、漢字、記号、ハングル)
認識できる書体
マルチフォント対応(推奨:明朝体)
※斜体で書かれた文字は認識できません。
認識できる文字サイズ
8 ポイント ~ 48 ポイント
OCR処理後の書体*2
日本語
アジア系文字:MS明朝
欧文文字:Century
中国語(簡体字)
アジア系文字:SimSun
欧文系文字:Calibri
中国語(繁体字)
アジア系文字:PMingLiU
欧文系文字:Calibri
韓国語
アジア系文字:Malgun Gothic
欧文系文字:Calibri
*1JIS第一水準のすべて、およびJIS第二水準の一部
*2Word形式のOOXMLファイル作成時のみ

認識できる文字種と書体(欧州言語)

認識できる文字種
アルファベット、認識言語の固有文字*1、数字、記号
認識できる書体
マルチフォント対応(推奨:Times、Century、Arial)*2
※斜体で書かれた文字を認識できます。
認識できる文字サイズ
6 ポイント ~ 72 ポイント
OCR処理後の書体*3
Calibri
※斜体は再現されません。
*1言語によっては一部認識できない固有文字があります。
*2[OCR (欧米文字認識)]の場合は、Arial系、Times New Roman系、Courier New系のフォントを認識可能
*3Word形式のOOXMLファイル作成時のみ

OCR処理に適した原稿

OCR処理に適した原稿を使用することで、処理精度をより向上させることができます。
原稿の形式
印刷文書、ワープロ文書
テキスト/図/写真/表で構成されていて傾きのないもの
テキストの形式
横書き、縦書き(横書きと縦書きが混在した文書も認識可能)*1
1 段組 ~ 3 段組で複雑な入り組みのないもの
文字サイズ
8 ポイント ~ 40 ポイント
表の形式*2
以下の条件を満たす表
実線の罫線で構成された四角形
列数が 32 列以下
行数が 32 行以下
*1欧州言語と韓国語の場合は、横書きのみ認識可能
*2Word形式のOOXMLファイル作成時のみ
CJ23-08E