![]() |
Этот режим позволяет выполнить OCR (оптическое распознавание символов) для извлечения данных, которые могут быть распознаны в отсканированном изображении как текст, и создать файл PDF/XPS/OOXML (PPTX/DOCX) с возможностью поиска. Если выбран формат файла PDF или XPS, можно также задать режим <Компактный>.
Сведения о дополнительно приобретаемом оборудовании, которое требуется для использования этой функции, а также о форматах файлов см. в разделе Дополнительные устройства системы
|
введите количество страниц для разделения
нажмите кнопку <OK>. Если требуется отсканировать изображения в виде одного файла, нажмите <Разделить на страницы>
<Отмена парам.>.
|
1
|
Выберите <PDF> или <XPS>
нажмите <OCR (Поиск по тексту)>.![]() |
|
2
|
Выберите язык для использования в OCR
нажмите <OK>. |

|
1
|
Выберите <OOXML>
<Word>.![]() ![]() Чтобы изменить язык, используемый для OCR, нажмите <Изменить>
выберите язык или группу языков нажмите <OK>.Выберите язык или группу языков в соответствии с языком, используемым в сканируемых документах.
|

|
1
|
Выберите <OOXML>
<PowerPoint> <OCR (Поиск по тексту)>.![]() |
|
2
|
Выберите язык для использования в OCR
нажмите <OK>. |
![]() |
|
В режиме <OCR (Поиск по тексту)> невозможно использовать оригиналы в виде длинной полосы (432 мм или более).
|
![]() |
|
Если выбран формат файла <PDF (OCR)>, <XPS (OCR)> или <OOXML (OCR)> и для параметра <Специальное сканирование> в разделе <OCR (Text Searchable) Settings> задано значение <Вкл.>, определяется ориентация оригинала и при необходимости документ перед отправкой автоматически поворачивается. <Параметры OCR (поиск по тексту)>
Если выбран режим <OCR (Поиск по тексту)>, отправка возможна только с коэффициентом масштабирования <1:1 (100%)> или <Auto>.
Если в качестве формата файла выбран <PDF> или <XPS>, можно настроить режимы <Компактный> и <OCR (Поиск по тексту)> одновременно. В таком случае на экране основных функций сканирования и отправки для формата файла отображается значение <PDF (Компактный)> или <XPS (Компактный)>.
Если выбран вариант <Word> для формата <OOXML>, можно задать удаление отсканированных фоновых изображений. Можно создавать удобные для редактирования файлы Word без ненужных изображений. <Включить фоновые изображ. в файл Word>
Если вы в настоящий момент используете функцию <Сканировать и сохранить>, можно выбирать языки для использования в функции оптического распознавания текста (OCR), только если <PowerPoint> выбрано в качестве значения для параметра <OOXML>.
|
|
Элемент
|
Детали
|
|
Параметры языка для распознавания текста
|
Для файлов PDF/XPS/PowerPoint:
Распознавание текста выполняется на основе языка, который выбран в разделе <Перекл. языка/клавиатуры> (<Перекл. языка/клавиатуры>) *1. Для файлов Word:
Распознавание текста выполняется на основе языка, который выбран после нажатия кнопки <Изменить> при создании файла Word. |
|
Азиатские языки, которые можно распознать
|
Японский, китайский (упрощенное письмо), китайский (традиционное письмо), корейский
Типы символов и шрифты, которые можно распознать (азиатские языки) |
|
Европейские языки и группы языков, которые можно распознать
|
Языки:
английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский, шведский, хорватский, чешский, венгерский, польский, словацкий, эстонский, латышский, литовский, русский, греческий, турецкий Группы языков:
западноевропейские (ISO)*2, центральноевропейские (ISO)*3, балтийские (ISO)*4 Типы символов и шрифты, которые можно распознать (европейские языки) |
|
Элемент
|
Детали
|
|
Типы символов, которые можно распознать
|
Японский:
буквенно-цифровые символы, символы каны, символы кандзи (первый уровень JIS, второй уровень JIS частично), знаки Китайский (упрощенное письмо):
буквенно-цифровые символы, китайские символы, знаки (GB2312-80) Китайский (традиционное письмо):
буквенно-цифровые символы, китайские символы, знаки (Big5) Корейский:
буквенно-цифровые символы, символы кандзи, корейские символы хангыля, знаки (KSC5601) |
|
Шрифты, которые можно распознать
|
Поддержка многошрифтового распознавания (рекомендуется стиль Ming-cho).
Распознавание курсива невозможно.
|
|
Шрифты для преобразованных символов (только если в качестве формата файла выбран Word)
|
Японский:
Символы азиатских языков: MS Mincho Символы европейских языков: Century Китайский (упрощенное письмо):
Символы азиатских языков: SimSun Символы европейских языков: Calibri Китайский (традиционное письмо):
Символы азиатских языков: PMingLiU Символы европейских языков: Calibri |
|
Элемент
|
Детали
|
|
Типы символов, которые можно распознать
|
Алфавитно-цифровые символы, специальные символы распознаваемого языка*1, знаки
|
|
Шрифты, которые можно распознать
|
Поддержка многошрифтового распознавания (рекомендуются Times, Century и Arial).
Распознавание курсива невозможно.
|
|
Шрифты для преобразованных символов (только если в качестве формата файла выбран Word)
|
Calibri
Курсив не воспроизводится.
|
|
Элемент
|
Детали
|
|
Формат оригинала
|
Печатные документы, документы, созданные в текстовом редакторе Word (документы, которые включают текст, графические элементы, фотографии или таблицы и не содержат наклонных символов)
|
|
Формат текста
|
Горизонтальное и вертикальное письмо (возможно распознавание документов, которые содержат как горизонтальное, так и вертикальное письмо)
Для европейских языков и корейского языка возможно распознавание только горизонтального письма.
Документы, содержащие не более трех колонок (без сложных колонок)
|
|
Размер символов
|
8–40 пунктов
|
|
Формат таблицы (только для документов Word)
|
Таблицы, удовлетворяющие следующим условиям:
таблица состоит из квадратов, разделенных толстыми границами;
таблица содержит не более 32 столбцов;
таблица содержит не более 32 строк.
|
![]() |
Оптическое распознавание некоторых оригиналов, поддерживающих такую возможность, может выполняться неправильно.Высокая точность распознавания не гарантируется, если на каждой странице оригинала содержится большой объем текста.
В зависимости от цвета фона оригинала, формы и размеров символов, а также от наклона символов некоторые символы могут быть ошибочно заменены или могут отсутствовать *.
Параграфы, разрывы строк и таблицы могут быть не распознаны*.
Некоторые части иллюстраций, фотографий или оттисков печатей могут быть распознаны и заменены текстом*.
* Если в качестве формата файла выбран Word.
|