文字無法正確執行 OCR 處理

建立可搜尋文字的檔案時,文字可能無法正確執行 OCR 處理。在這種情況下,請檢查 OCR 處理的語言設定和使用的原稿是否合適。
使用本機可識別的字元類型和字型的原稿,以及適合 OCR 處理的原稿,即可根據原稿變更語言設定,並提高處理的精確度。
須知
即使有適當的語言設定和原稿,OCR 處理仍無法正確執行
如果原稿每頁含有大量文字,可能無法提高處理精確度。
建立 Word 格式的 OOXML 檔案時,請注意以下事項:
根據背景顏色、字型、字型大小、斜體和其他因素,文字可能會更換為意料之外的字元,或者遺失字元。
段落、分行和表格可能無法重製。
某些影像 (如圖表、相片和印章) 可能會識別為文字並更換為文字。

OCR 處理的設定和語言標準

字元辨識的標準語言設定
設定 OCR 處理時選擇的語言是字元辨識的基礎。建立可搜尋文字的檔案 (OCR 處理)
可辨識的亞洲語言
日文、中文 (簡體)、中文 (繁體)、韓文
* 字元類型和字型請參閱以下內容:
可辨識的歐洲語言和語言群組
語言
英文、法文、義大利文、德文、西班牙文、荷蘭文、葡萄牙文、阿爾巴尼亞文、加泰隆尼亞文、丹麥文、芬蘭文、冰島文、挪威文、瑞典文、克羅地亞文、捷克文、匈牙利文、波蘭文、斯洛伐克文、愛沙尼亞文、拉脫維亞文、立陶宛文、俄文、希臘文、土耳其文、斯洛維尼亞文*1、羅馬尼亞文*1、保加利亞文*1、希伯來文*1
語言群組
西歐語系 (ISO)*2、中歐語系 (ISO)*3、波羅的海文 (ISO)*4
* 字元類型和字型請參閱以下內容:
*1只能和 [OCR(歐洲語言)] 一起選擇。
*2包括英文、法文、義大利文、德文、西班牙文、荷蘭文、葡萄牙文、阿爾巴尼亞文、卡達隆尼亞文、丹麥文、芬蘭文、冰島文、挪威文和瑞典文。
*3包括英文、克羅埃西亞文、捷克文、匈牙利文、波蘭文和斯洛伐克文。
*4包括英文、愛沙尼亞文、拉脫維亞文和立陶宛文。

可辨識的字元類型和字型 (亞洲語言)

可辨識的字元類型
日文
字母、數字、漢字*1、符號、平假名、片假名
中文 (簡體)
GB2312-80 (字母、數字、漢字、符號)
中文 (繁體)
Big5 (字母、數字、漢字、符號)
韓文
KSC5601 (字母、數字、漢字、符號、Hangul)
可辨識的字型
支援多種字型 (建議:Mincho)
* 斜體字元無法辨識。
可辨識的字型尺寸
8 pt. 至 48 pt.
OCR 處理後使用的字型*2
日文
亞洲字元:MS Mincho
歐洲字元:Century
中文 (簡體)
亞洲字元:SimSun
歐洲字元:Calibri
中文 (繁體)
亞洲字元:PMingLiU
歐洲字元:Calibri
韓文
亞洲字元:Malgun Gothic
歐洲字元:Calibri
*1所有 JIS 1 標準漢字和某些 JIS 2 標準漢字
*2僅在建立 Word 格式的 OOXML 檔案時

可辨識的字元類型和字型 (歐洲語言)

可辨識的字元類型
字母、辨識語言特有的字元*1、數字、符號
可辨識的字型
支援多種字型 (建議:Times、Century、Arial)*2
* 斜體字元可辨識。
可辨識的字型尺寸
6 pt. 至 72 pt.
OCR 處理後使用的字型*3
Calibri
* 斜體字元無法重製。
*1根據語言而定,某些獨特字元可能無法辨識。
*2[OCR(歐洲語言)] 可辨識 Arial、Times New Roman 和 Courier 新字型。
*3僅在建立 Word 格式的 OOXML 檔案時

適合 OCR 處理的原稿

您可以使用適合 OCR 處理的原稿,提高 OCR 處理的精確度。
原稿檔案格式
列印的文件、文字處理文件
由文字、圖表、相片和/或表格組成,而且不傾斜的原稿
文字格式
橫向或縱向書寫 (也可以辨識同時具有橫向和縱向書寫的文件)*1
不複雜的一到三欄位文件
字型
8 pt. 至 40 pt.
表格格式*2
符合下列條件的表格:
由實心邊框線組成的矩形格式
32 個欄位以下
32 個列數以下
*1歐洲語言和韓文僅可辨識橫向書寫。
*2僅在建立 Word 格式的 OOXML 檔案時
E1LF-082