須知
|
根據原稿的文字和檔案格式,即使按照原稿所用的語言執行OCR,也可能無法獲得正確的結果。
|
項目
|
檔案格式
|
|
PDF/XPS/PowerPoint
|
Word
|
|
識別語言
|
根據在「設定/註冊」的[參數選擇]中的[切換語言/鍵盤]中所選的語言,字元會被識別為下列語言或語言組之一*1*2
|
按[變更]從下列語言或語言組中選擇原稿所用的語言。根據所選的語言識別字元。
|
亞洲語言
|
會識別下列語言中的文字:
日文、中文(簡體)、中文(繁體)、韓文
|
|
歐洲語言
|
識別下列語言或語言組中的文字:
語言
英文、法文、義大利文、德文、西班牙文、荷蘭文、葡萄牙文、阿爾巴尼亞文、卡達隆尼亞文、丹麥文、芬蘭文、冰島文、挪威文、瑞典文、克羅埃西亞文、捷克文、匈牙利文、波蘭文、斯洛伐克文、愛沙尼亞文、拉脫維亞文、立陶宛文、俄文、希臘文、土耳其文
語言組
西歐語系(ISO)、中歐語系(ISO)、波羅的海文(ISO)*3
|
|
亞洲語言的字元識別
|
||
字元識別類型
|
日文:文數字字元、Kana字元、漢字字元(JIS first level、JIS second level(部分))、符號
中文(簡體):文數字字元、中文字元、符號(GB2312-80)
中文(繁體):文數字字元、中文字元、符號(Big5)
韓文:文數字字元、漢字字元、韓文字元、符號(KSC5601)
|
|
識別字型
|
支援多字型(建議使用Ming-cho類型)
無法識別Italic類型
|
|
轉換字型
|
-
|
選擇了「日文」時:
亞洲文字:MS Mincho
歐洲文字:Century
選擇了「中文(簡體)」時:
亞洲文字:SimSun
歐洲文字:Calibri
選擇了「中文(繁體)」時:
亞洲文字:PMingLiU
歐洲文字:Calibri
|
歐洲語言的字元識別
|
||
字元識別類型
|
文數字字元、識別語言的特殊字元*4、符號
|
|
識別字型
|
支援多字型(建議使用Times、Century和Arial)
能夠識別Italic類型
|
|
轉換字型
|
-
|
顯示為Calibli
無法轉換Italic類型
|
西歐語系(ISO):
|
英文、法文、義大利文、德文、西班牙文、荷蘭文、葡萄牙文、阿爾巴尼亞文、卡達隆尼亞文、丹麥文、芬蘭文、冰島文、挪威文、瑞典文
|
中歐語系(ISO):
|
克羅埃西亞文、捷克文、匈牙利文、波蘭文、斯洛伐克文
|
波羅的海文(ISO):
|
愛沙尼亞文、拉脫維亞文、立陶宛文
|
須知
|
若使用單頁包含大量文字的原稿,OCR可能無法正確執行。
若選擇Word格式,即使使用建議檔案格式的原稿,OCR也可能無法正確執行。
根據背景顏色、字元樣式、字元尺寸和字元傾斜狀況,某些字元可能會在OCR結果中被錯誤更換或缺失。
可能無法識別原稿中的段落、換行和表格。
可能會識別影像的一部分並更換為文字。
|
項目
|
詳細資訊
|
原稿格式
|
已列印文件、文字文件(包含文字、圖文框、影像、表格和無傾斜字元的文件)
|
文字格式
|
橫向書寫、縱向書寫
能夠識別包含橫向和縱向書寫的文件。
僅能夠識別橫向書寫的歐洲語言和韓文。
不包含複雜的字元行的文件
|
字元尺寸
|
8到40點
|
表格格式
(僅適用於Word文件)
|
滿足以下條件的表格
方形實線表格
行數為32或更少
欄數為32或更少
|