|
Этот режим позволяет выполнить OCR (оптическое распознавание символов) для извлечения данных, которые могут быть распознаны в отсканированном изображении как текст, и создать файл PDF/XPS/OOXML (PPTX/DOCX) с возможностью поиска. Если выбран формат файла PDF или XPS, можно также задать режим <Компактный>.
|
1
|
Выберите <PDF> нажмите <OCR (Приоритет скорости)> или <OCR (Приоритет точности)>.
Параметр OCR(Приоритет точности) нельзя использовать в приведенных ниже случаях.
Если выбраны варианты <OCR(Приоритет точности)> и <Контур и сглаживание>
Если выбраны варианты <OCR(Приоритет точности)> и <Огранич. цвета>
Если задан как параметр <OCR (Приоритет точности)>, так и параметр <Компактный>, настройка <Уровень кач-ва изобр. для Огран. цв./Компактн.> отключается. <Уровень кач-ва изобр. для Огран. цв./Компактн.>
Если создать PDF-файл с одновременно установленными параметрами <OCR (Приоритет точности)> и <Компактный>, качество изображения может отличаться от качества PDF-файла, созданного с заданными параметрами <OCR (Приоритет скорости)> и <Компактный>.
Чтобы изменить язык, используемый для OCR, нажмите <Язык OCR> выберите язык нажмите <OK>.
Функция <OCR (Приоритет точности)> позволяет распознать только европейские языки. Параметры и языки для функции OCR
|
1
|
Выберите <XPS> нажмите <OCR (Поиск по тексту)>.
Чтобы изменить язык, используемый для OCR, нажмите <Язык OCR> выберите язык нажмите <OK>.
|
1
|
Выберите <OOXML> <Word>.
Чтобы изменить язык, используемый для OCR, нажмите <Изменить> и выберите язык или языковую группу, затем нажмите <OK>.
Выберите язык или группу языков в соответствии с языком, используемым в сканируемых документах.
|
1
|
Выберите <OOXML> <PowerPoint> <OCR (Поиск по тексту)>.
|
2
|
Выберите язык для использования в OCR нажмите кнопку <OK>.
|
|
В режиме <OCR (Поиск по тексту)> невозможно использовать оригиналы в виде длинной полосы (432 мм или более).
|
|
Если выбран формат файла <PDF (OCR)>, <XPS (OCR)> или <OOXML (OCR)> и для параметра <Специальное сканирование> в разделе <OCR (Text Searchable) Settings>/<OCR (Приоритет скорости)> задано значение <Вкл.>, определяется ориентация оригинала и при необходимости документ перед отправкой автоматически поворачивается. <Параметры OCR (поиск по тексту)>
Если выбран режим <OCR (Поиск по тексту)>, отправка возможна только с коэффициентом масштабирования <1:1> или <Auto>.
Если в качестве формата файла выбран <PDF> или <XPS>, можно настроить режимы <Компактный> и <OCR (Поиск по тексту)> одновременно. В таком случае на экране основных функций сканирования и отправки для формата файла отображается значение <PDF (Компактный)> или <XPS (Компактный)>.
Если выбран вариант <Word> для формата <OOXML>, можно задать удаление отсканированных фоновых изображений. Можно создавать удобные для редактирования файлы Word без ненужных изображений. <Включить фоновые изображ. в файл Word>
Если вы используете функцию <Сканировать и сохранить>, язык OCR можно указать только когда значение <Word> выбрано для параметра <OOXML> или значение <OCR (Приоритет точности)> выбрано для параметра <PDF>.
|
Элемент
|
Детали
|
Параметры языка для распознавания текста
|
Если язык указан, а в разделе <Формат файла> выбран параметр OCR:
распознавание текста выполняется на основе языка, выбранного для каждого формата файла. Если язык не указан, а в разделе <Формат файла> выбран параметр OCR:
распознавание текста выполняется на основе языка, выбранного в меню <Перекл. языка/клавиатуры> (<Перекл. языка/клавиатуры>).*1 |
Азиатские языки, которые можно распознать*2
|
Японский, китайский (упрощенное письмо), китайский (традиционное письмо), корейский
Типы символов и шрифты, которые можно распознать (азиатские языки) |
Европейские языки и группы языков, которые можно распознать
|
Языки:
английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский, шведский, хорватский, чешский, венгерский, польский, словацкий, эстонский, латышский, литовский, русский, греческий, турецкий, словенский*3, румынский*3, болгарский*3, иврит*3 Группы языков:
западноевропейские (ISO)*4, центральноевропейские (ISO)*5, балтийские (ISO)*6 Типы символов и шрифты, которые можно распознать (европейские языки) |
Элемент
|
Детали
|
Типы символов, которые можно распознать
|
Японский:
буквенно-цифровые символы, символы каны, символы кандзи (первый уровень JIS, второй уровень JIS (частично)), знаки Китайский (упрощенное письмо):
буквенно-цифровые символы, китайские символы, знаки (GB2312-80) Китайский (традиционное письмо):
буквенно-цифровые символы, китайские символы, знаки (Big5) Корейский:
буквенно-цифровые символы, символы кандзи, корейские символы хангыля, знаки (KSC5601) |
Шрифты, которые можно распознать
|
Поддержка многошрифтового распознавания. (рекомендуется стиль Ming-cho).
Распознавание курсива невозможно.
|
Шрифты для преобразованных символов (только если в качестве формата файла выбран Word)
|
Японский:
Символы азиатских языков: MS Mincho Символы европейских языков: Century Китайский (упрощенное письмо):
Символы азиатских языков: SimSun Символы европейских языков: Calibri Китайский (традиционное письмо):
Символы азиатских языков: PMingLiU Символы европейских языков: Calibri |
Элемент
|
Детали
|
Типы символов, которые можно распознать
|
Алфавитно-цифровые символы, специальные символы распознаваемого языка*1, знаки
|
Шрифты, которые можно распознать
|
Поддержка многошрифтового распознавания. (Рекомендуются Times, Century и Arial.)*2
Возможно распознавание курсива.
|
Шрифты для преобразованных символов (только если в качестве формата файла выбран Word)
|
Calibri
Курсив не воспроизводится.
|
Элемент
|
Детали
|
Формат оригинала
|
Печатные документы, документы, созданные в текстовом редакторе Word (документы, которые включают текст, графические элементы, фотографии или таблицы и не содержат наклонных символов)
|
Формат текста
|
Горизонтальное и вертикальное письмо (возможно распознавание документов, которые содержат как горизонтальное, так и вертикальное письмо)
Для европейских языков и корейского языка возможно распознавание только горизонтального письма.
Документы, содержащие не более трех колонок (без сложных колонок)
|
Размер символов
|
8–40 пунктов
|
Формат таблицы (только для документов Word)
|
Таблицы, удовлетворяющие следующим условиям:
таблица состоит из квадратов, разделенных толстыми границами;
таблица содержит не более 32 столбцов;
таблица содержит не более 32 строк.
|
|
Оптическое распознавание некоторых оригиналов, поддерживающих такую возможность, может выполняться неправильно.Высокая точность распознавания не гарантируется, если на каждой странице оригинала содержится большой объем текста.
В зависимости от цвета фона оригинала, формы и размеров символов, а также от наклона символов некоторые символы могут быть ошибочно заменены или могут отсутствовать *.
Параграфы, разрывы строк и таблицы могут быть не распознаны*.
Некоторые части иллюстраций, фотографий или оттисков печатей могут быть распознаны и заменены текстом*.
* Если в качестве формата файла выбран Word.
|