Если функция OCR (возможность поиска текста) не выполняется надлежащим образом

В этом разделе рассматривается выполнение функции OCR (возможность поиска текста) при создании файлов PDF/XPS/OOXML с возможностью поиска и соответствующий формат файла для функции OCR (возможность поиска текста).
Если не удается получить надлежащий результат использования OCR (оптическое распознавание символов), см. следующие указания.

Функция OCR (возможность поиска текста) для создания файлов PDF/XPS/OOXML с возможностью поиска

При создании файлов PDF/XPS/OOXML с возможностью поиска работа функции OCR зависит от выбранного формата файла. Подробные сведения см. в таблице, приведенной ниже.
ВАЖНО
Даже в случае выполнения OCR в соответствии с языком, который используется в оригиналах, надлежащий результат может быть не получен, что зависит от текста формата файлов оригиналов.
Элемент настройки
Формат файла
PDF/XPS/PowerPoint
Word
Язык распознавания
Символы распознаются как символы одного из следующих языков или одной из групп языков в соответствии с языком, выбранным в пункте [Перекл. языка/клавиатуры] меню [Предпочтения] (Параметры/Регистрация)*1 *2
Нажмите клавишу [Изменить], чтобы выбрать язык, который используется в оригиналах, среди следующих языков или групп языков. Символы распознаются в соответствии с выбранным языком.
Азиатские языки
Распознается текст на следующих языках:
японский, китайский (упрощенный), китайский (традиционный), корейский
Европейские языки
Распознается текст на следующих языках или следующих групп языков:
Языки
Английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский, шведский, хорватский, чешский, венгерский, польский, словацкий, эстонский, латышский, литовский, русский, греческий, турецкий
Группы языков
Западноевропейские (ISO), центральноевропейские (ISO), балтийские (ISO) *3
Распознавание символов для азиатских языков
Тип распознавания символов
Японский: алфавитно-цифровые символы, символы каны, символы кандзи (первый уровень JIS, второй уровень JIS (частично)), знаки
Китайский (упрощенный): алфавитно-цифровые символы, китайские символы, знаки (GB2312-80)
Китайский (традиционный): алфавитно-цифровые символы, китайские символы, знаки (Big5)
Корейский: алфавитно-цифровые символы, символы кандзи, корейские символы хангыля, знаки (KSC5601)
Шрифт распознавания
Поддержка многошрифтового распознавания (рекомендуется стиль Ming-cho)
Распознавание курсива невозможно
Конвертированный шрифт
-
Если выбран японский
Азиатский текст: MS Mincho
Европейский текст: Century
Если выбран китайский (упрощенный)
Азиатский текст: SimSun
Европейский текст: Calibri
Если выбран китайский (традиционный)
Азиатский текст: PMingLiU
Европейский текст: Calibri
Распознавание символов для европейских языков
Тип распознавания символов
Алфавитно-цифровые символы, специальные символы распознаваемого языка*4, знаки
Шрифт распознавания
Поддержка многошрифтового распознавания (рекомендуются Times, Century и Arial)
Распознавание курсива возможно
Конвертированный шрифт
-
Отображается в виде Calibri
Преобразование курсива невозможно
*1 Отображаемый язык в списке языков в пункте [Перекл. языка/клавиатуры] меню [Предпочтения] (Параметры/Регистрация) может отличаться.
*2 Если в пункте [Перекл. языка/клавиатуры] меню [Предпочтения] (Параметры/Регистрация) выбрать английский, французский, итальянский, немецкий, испанский, тайский или вьетнамский, язык распознается как западноевропейский (ISO).
*3 Каждая группа языков состоит из следующих языков. Если выбрать группу языков, распознается текст на языках этой группы языков.
Западноевропейские (ISO):
английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский, шведский
Центральноевропейские (ISO):
хорватский, чешский, венгерский, польский, словацкий
Балтийские (ISO):
эстонский, латышский, литовский
*4 Если выбрать греческий, возможно распознавание следующих специальных символов. Если выбрать другие языки, возможно распознавание специальных символов для каждого языка. Некоторые специальные символы для некоторых языков не могут распознаваться.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Формат файла для создания PDF/XPS/OOXML с возможностью поиска

Выбрав подходящий формат файла для OCR, можно повысить точность результата OCR.
Если не удается получить надлежащий результат OCR, проверьте, подходит ли формат файла отсканированного оригинала для OCR.
ВАЖНО
Если используются оригиналы с большим количеством текста на каждой странице, OCR может выполняться ненадлежащим образом.
Если выбрать формат Word, OCR может выполняться ненадлежащим образом даже в случае использования оригиналов в рекомендуемом формате файлов.
В зависимости от цвета фона, стиля символов, размера символов и наклона символов некоторые символы могут быть ошибочно заменены или могут отсутствовать в результате OCR.
Параграфы, разрывы строк и таблицы в оригинале могут быть не распознаны.
Часть изображения, например графики, фотографий или оттисков печатей, может быть распознана и заменена текстом.
Элемент настройки
Сведения
Формат оригинала
Отпечатанные документы, текстовые документы (документ, который состоит из текста, рисунков, изображений, таблиц и не содержит наклонных символов)
Формат текста
Горизонтальное письмо, вертикальное письмо
Возможно распознавание документов, которые содержат как горизонтальное, так и вертикальное письмо.
Для европейских языков и корейского языка возможно распознавание только горизонтального письма.
Документ без сложных колонок
Размер символов
8–40 пунктов
Формат таблицы
(только для документов Word)
Таблицы, удовлетворяющие следующим условиям
Прямоугольные таблицы со сплошными линиями
Не более 32 строк
Не более 32 столбцов
25KH-0R5