Этот режим позволяет выполнить OCR (оптическое распознавание символов) для извлечения данных, которые могут быть распознаны в отсканированном изображении как текст, и создать файл PDF/XPS/OOXML (PPTX/DOCX) с возможностью поиска. Если выбран формат файла PDF или XPS, можно также задать режим <Компактный>. |
1 | Выберите <PDF> нажмите <OCR (Приоритет скорости)> или <OCR (Приоритет точности)>. Параметр OCR(Приоритет точности) нельзя использовать в приведенных ниже случаях. Если выбраны варианты <OCR(Приоритет точности)> и <Контур и сглаживание> Если выбраны варианты <OCR(Приоритет точности)> и <Огранич. цвета> Если задан как параметр <OCR (Приоритет точности)>, так и параметр <Компактный>, настройка <Уровень кач-ва изобр. для Огран. цв./Компактн.> отключается. <Уровень кач-ва изобр. для Огран. цв./Компактн.> Если создать PDF-файл с одновременно установленными параметрами <OCR (Приоритет точности)> и <Компактный>, качество изображения может отличаться от качества PDF-файла, созданного с заданными параметрами <OCR (Приоритет скорости)> и <Компактный>. |
1 | Выберите <XPS> нажмите <OCR (Поиск по тексту)>. |
1 | Выберите <OOXML> <Word>. |
1 | Выберите <OOXML> <PowerPoint> <OCR (Поиск по тексту)>. |
2 | Выберите язык для использования в OCR нажмите <OK>. |
В режиме <OCR (Поиск по тексту)> невозможно использовать оригиналы в виде длинной полосы (432 мм или более). |
Если выбран формат файла <PDF (OCR)>, <XPS (OCR)> или <OOXML (OCR)> и для параметра <Специальное сканирование> в разделе <OCR (Text Searchable) Settings>/<OCR (Приоритет скорости)> задано значение <Вкл.>, определяется ориентация оригинала и при необходимости документ перед отправкой автоматически поворачивается. <Параметры OCR (поиск по тексту)> Если выбран режим <OCR (Поиск по тексту)>, отправка возможна только с коэффициентом масштабирования <1:1> или <Auto>. Если в качестве формата файла выбран <PDF> или <XPS>, можно настроить режимы <Компактный> и <OCR (Поиск по тексту)> одновременно. В таком случае на экране основных функций сканирования и отправки для формата файла отображается значение <PDF (Компактный)> или <XPS (Компактный)>. Если выбран вариант <Word> для формата <OOXML>, можно задать удаление отсканированных фоновых изображений. Можно создавать удобные для редактирования файлы Word без ненужных изображений. <Включить фоновые изображ. в файл Word> Если вы используете функцию <Сканировать и сохранить>, язык OCR можно указать только когда значение <Word> выбрано для параметра <OOXML> или значение <OCR (Приоритет точности)> выбрано для параметра <PDF>. |
Элемент | Детали |
Параметры языка для распознавания текста | Если язык указан, а в разделе <Формат файла> выбран параметр OCR: распознавание текста выполняется на основе языка, выбранного для каждого формата файла. Если язык не указан, а в разделе <Формат файла> выбран параметр OCR: распознавание текста выполняется на основе языка, выбранного в меню <Перекл. языка/клавиатуры> (<Перекл. языка/клавиатуры>).*1 |
Азиатские языки, которые можно распознать*2 | Японский, китайский (упрощенное письмо), китайский (традиционное письмо), корейский Типы символов и шрифты, которые можно распознать (азиатские языки) |
Европейские языки и группы языков, которые можно распознать | Языки: английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский, шведский, хорватский, чешский, венгерский, польский, словацкий, эстонский, латышский, литовский, русский, греческий, турецкий, словенский*3, румынский*3, болгарский*3, иврит*3 Группы языков: западноевропейские (ISO)*4, центральноевропейские (ISO)*5, балтийские (ISO)*6 Типы символов и шрифты, которые можно распознать (европейские языки) |
Элемент | Детали |
Типы символов, которые можно распознать | Японский: буквенно-цифровые символы, символы каны, символы кандзи (первый уровень JIS, второй уровень JIS (частично)), знаки Китайский (упрощенное письмо): буквенно-цифровые символы, китайские символы, знаки (GB2312-80) Китайский (традиционное письмо): буквенно-цифровые символы, китайские символы, знаки (Big5) Корейский: буквенно-цифровые символы, символы кандзи, корейские символы хангыля, знаки (KSC5601) |
Шрифты, которые можно распознать | Поддержка многошрифтового распознавания. (рекомендуется стиль Ming-cho). Распознавание курсива невозможно. |
Шрифты для преобразованных символов (только если в качестве формата файла выбран Word) | Японский: Символы азиатских языков: MS Mincho Символы европейских языков: Century Китайский (упрощенное письмо): Символы азиатских языков: SimSun Символы европейских языков: Calibri Китайский (традиционное письмо): Символы азиатских языков: PMingLiU Символы европейских языков: Calibri |
Элемент | Детали |
Типы символов, которые можно распознать | Алфавитно-цифровые символы, специальные символы распознаваемого языка*1, знаки |
Шрифты, которые можно распознать | Поддержка многошрифтового распознавания. (Рекомендуются Times, Century и Arial.)*2 Возможно распознавание курсива. |
Шрифты для преобразованных символов (только если в качестве формата файла выбран Word) | Calibri Курсив не воспроизводится. |
Элемент | Детали |
Формат оригинала | Печатные документы, документы, созданные в текстовом редакторе Word (документы, которые включают текст, графические элементы, фотографии или таблицы и не содержат наклонных символов) |
Формат текста | Горизонтальное и вертикальное письмо (возможно распознавание документов, которые содержат как горизонтальное, так и вертикальное письмо) Для европейских языков и корейского языка возможно распознавание только горизонтального письма. Документы, содержащие не более трех колонок (без сложных колонок) |
Размер символов | 8–40 пунктов |
Формат таблицы (только для документов Word) | Таблицы, удовлетворяющие следующим условиям: таблица состоит из квадратов, разделенных толстыми границами; таблица содержит не более 32 столбцов; таблица содержит не более 32 строк. |
Оптическое распознавание некоторых оригиналов, поддерживающих такую возможность, может выполняться неправильно.Высокая точность распознавания не гарантируется, если на каждой странице оригинала содержится большой объем текста. В зависимости от цвета фона оригинала, формы и размеров символов, а также от наклона символов некоторые символы могут быть ошибочно заменены или могут отсутствовать *. Параграфы, разрывы строк и таблицы могут быть не распознаны*. Некоторые части иллюстраций, фотографий или оттисков печатей могут быть распознаны и заменены текстом*. * Если в качестве формата файла выбран Word. |