Функция OCR некорректно обрабатывает текст

Текст может быть неправильно обработан с помощью функции OCR при создании файла с возможностью поиска по тексту. В этом случае проверьте, соответствует ли настройка языка для обработки OCR языку используемого оригинала.
Вы можете изменить настройку языка в соответствии с языком оригинала и повысить точность обработки, используя оригинал с типом символов и шрифтом, распознаваемыми аппаратом, а также оригинал, подходящий для обработки OCR.
ВАЖНО
Если обработка OCR выполняется неправильно даже при выборе настройки языка, соответствующей языку оригинала
Точность обработки может быть невозможно повысить для оригиналов с большим количеством текста на странице.
При создании файлов OOXML в формате Word обращайте внимание на следующее:
Текст может быть заменен непредусмотренными символами или символы могут отсутствовать в зависимости от цвета фона, шрифта, размера шрифта, наличия курсива и других факторов.
Параграфы, разрывы строк и таблицы могут не воспроизводятся.
Некоторые изображения, такие как диаграммы, фотографии и печати, могут распознаваться как текст и заменяться текстом.

Стандартные параметры и языки для функции OCR

Стандартные параметры языка для распознавания текста
Языки, выбранные при настройке функции OCR, являются основой для распознавания текста. Создание файла с возможностью поиска по тексту (функция OCR)
Азиатские языки, которые можно распознать
японский, китайский (упрощенный), китайский (традиционный), корейский
* Информацию о типах символов и шрифтах см. в следующих разделах:
Европейские языки и группы языков, которые можно распознать
Языки
Английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский, шведский, хорватский, чешский, венгерский, польский, словацкий, эстонский, латышский, литовский, русский, греческий, турецкий, словенский*1, румынский*1, болгарский*1, иврит*1
Группы языков
Западноевропейские (ISO)*2, центральноевропейские (ISO)*3, балтийские (ISO)*4
* Информацию о типах символов и шрифтах см. в следующих разделах:
*1Можно выбрать только с [OCR(Европейск. языки)].
*2Включая английский, французский, итальянский, немецкий, испанский, нидерландский, португальский, албанский, каталанский, датский, финский, исландский, норвежский и шведский языки.
*3Включая английский, хорватский, чешский, венгерский, польский и словацкий языки.
*4Включая английский, эстонский, латышский и литовский языки.

Типы символов и шрифты, которые можно распознать (азиатские языки)

Типы символов, которые можно распознать
Japanese
Буквы алфавита, цифры, кандзи*1, символы, хирагана и катакана
Китайский (упрощенный)
GB2312-80 (буквы алфавита, цифры, кандзи и символы)
Китайский (традиционный)
Big5 (буквы алфавита, цифры, кандзи и символы)
Корейский
KSC5601 (буквы алфавита, цифры, кандзи, символы и хангыль)
Шрифты, которые можно распознать
Поддержка многошрифтового распознавания (рекомендуется: Минчо)
* Распознавание курсива невозможно.
Распознаваемые размеры шрифтов
От 8 пт. до 48 пт.
Шрифты, используемые после обработки с использованием функции OCR*2
Japanese
Символы азиатских языков: MS Mincho
Символы европейских языков: Century
Китайский (упрощенный)
Символы азиатских языков: SimSun
Символы европейских языков: Calibri
Китайский (традиционный)
Символы азиатских языков: PMingLiU
Символы европейских языков: Calibri
Корейский
Символы азиатских языков: Malgun Gothic
Символы европейских языков: Calibri
*1Все стандартные символы кандзи JIS 1 и некоторые стандартные символы кандзи JIS 2
*2Только при создании файла OOXML в формате Word

Типы символов и шрифты, которые можно распознать (европейские языки)

Типы символов, которые можно распознать
Алфавит; символы, являющиеся уникальными для языка распознавания*1, цифры, символы
Шрифты, которые можно распознать
Поддержка многошрифтового распознавания (рекомендуется: Times, Century, Arial)*2
* Возможно распознавание выделенных курсивом символов.
Распознаваемые размеры шрифтов
6–72 пункта.
Шрифты, используемые после обработки с использованием функции OCR*3
Calibri
* Воспроизведение курсива невозможно.
*1В зависимости от языка некоторые уникальные символы могут не распознаваться.
*2Шрифты Arial, Times New Roman и Courier New могут распознаваться с помощью функции [OCR(Европейск. языки)].
*3Только при создании файла OOXML в формате Word

Оригиналы, пригодные для обработки OCR

Вы можете повысить точность обработки OCR, используя оригинал, подходящий для обработки OCR.
Формат файла оригинала
Печатные документы и документы текстовых редакторов
Оригиналы состоят из текста, схем, фотографий и/или таблиц и не наклонены
Формат текста
Горизонтальное или вертикальное письмо (также возможно распознавание документов, которые содержат как горизонтальное, так и вертикальное письмо)*1
Документы с одной-тремя колонками без усложненного форматирования
Размер шрифта
8–40 пунктов.
Формат таблиц*2
Таблицы, удовлетворяющие следующим условиям:
Прямоугольный формат, состоящий из сплошных линий границ
Не более 32 столбцов
Не более 32 строк
*1Для европейских языков и корейского языка возможно распознавание только горизонтального письма.
*2Только при создании файла OOXML в формате Word
AR47-086