该模式下可以执行OCR(光学字符识别)从已扫描的图像中提取可识别为文本的数据并创建可搜索的PDF/XPS/OOXML (pptx/docx)文件。如果选择PDF 或 XPS作为文件格式,也可以设置<压缩>。 有关使用此功能需要安装的可选产品和文件格式的信息,请参阅系统可选配件 |
1 | 选择<PDF> ,按<设置详细说明> <OCR(可检索文本)>。 |
2 | 选择 OCR 所用的语言 ,然后按<确定>。 |
1 | 选择<XPS> ,按<设置详细说明> <OCR(可检索文本)>。 |
2 | 选择 OCR 所用的语言 ,然后按<确定>。 |
1 | 选择<OOXML> 从下拉列表中选择<Word>。 要更改OCR所用的语言,按<设置详细说明> <更改> 选择语言或语族 按<确定>。 根据已扫描的文档中使用的语言选择语言或语言组。 |
1 | 选择<OOXML> 从下拉列表中选择<PowerPoint>。 按<设置详细说明> <OCR(可检索文本)>。 |
2 | 选择OCR所用的语言,然后按<确定>。 |
如果选择<PDF;OCR>、<XPS;OCR>或<OOXML;OCR>作为文件格式,而且在<OCR(可检索文本)设置>/<OCR(速度优先)>中将<智能扫描>设为<打开>,将检测原稿方向,如有必要可以在发送文档之前将其自动旋转。<OCR(可检索文本)设置> 如果选择<PDF>或<XPS>作为文件格式,可以同时设置<压缩> 和<OCR(可检索文本)>。在这种情况下,<PDF;压缩> 或<XPS;压缩>将作为文件格式显示在“扫描并发送基本功能”屏幕上。 如果为<OOXML>选择<Word>,可以进行设置来删除已扫描的背景图像。可以生成易于编辑且没有多余图像的Word文件。<Word文件中包含背景图像> |
项目 | 详细说明 |
字符识别的语言设置 | 通过在<文件格式>中选择的OCR指定语言时: 根据您为每种文件格式选择的语言来识别字符。 |
可识别的亚洲语言 | 日语、中文(简体)、中文(繁体)、韩语 可识别的字符类型和字体(亚洲语言) |
可识别的欧洲语言和语族 | 语言: 英语、法语、意大利语、德语、西班牙语、荷兰语、葡萄牙语、阿尔巴尼亚语、加泰罗尼亚语、丹麦语、芬兰语、冰岛语、挪威语、瑞典语、克罗地亚语、捷克语、匈牙利语、波兰语、斯洛伐克语、爱沙尼亚语、拉脱维亚语、立陶宛语、俄语、希腊语、土耳其语 |
项目 | 详细说明 |
可识别的字符类型 | 日语: 字母数字字符、假名字符、汉字字符(JIS first level、部分JIS second level)、符号 中文(简体): 字母数字字符、中文字符、符号(GB2312-80) 中文(繁体): 字母数字字符、中文字符、符号(Big5) 韩语: 字母数字字符、汉字字符、韩语字符、符号(KSC5601) |
可识别的字体 | 支持多种字体。(推荐Ming-cho类型。) 无法识别斜体字符。 |
用于转换字符的字体(仅在Word选择为文件格式时) | 日语: 亚洲语言字符:MS Mincho 欧洲语言字符:Century 中文(简体): 亚洲语言字符:SimSun 欧洲语言字符:Calibri 中文(繁体): 亚洲语言字符:PMingLiU 欧洲语言字符:Calibri |
项目 | 详细说明 |
可识别的字符类型 | 字母数字字符、所识别语言的特殊字符*、符号 |
可识别的字体 | 支持多种字体。(推荐Times、Century和Arial。) 可识别斜体字符。 |
用于转换字符的字体(仅在Word选择为文件格式时) | Calibri 不复制Italic样式。 |
项目 | 详细说明 |
原稿格式 | 打印的文档、字处理器文档(包含文本、图形、照片、表格和无斜体字符的文档) |
文本格式 | 横向书写和纵向书写(也可以识别包含横向书写和纵向书写的文档) 欧洲语言和韩语文本仅可以识别横向书写。 无复杂纵列设置的1到3列文档 |
字符大小 | 8到40磅 |
表格格式(仅用于Word格式) | 符合以下条件的表格: 使用实线分隔的方形表格 最多含32列的表格 最多含32行的表格 |
适合OCR处理的某些原稿可能无法正确处理。每页包含大量文本的原稿可能无法实现高准确度。 由于原稿的背景颜色、字符格式和大小或斜体字符,字符可能会被替换为非预期的字符或丢失。* 可能无法复制段落符号、换行符或表格。* 插图、照片或印鉴的某些部分可能会被识别并替换为字符。* * 在Word选择为文件格式时。 |