Сканування з використанням функції оптичного розпізнавання символів (OCR)

Цей режим дає змогу виконати оптичне розпізнавання символів (OCR), щоб видобути зі сканованого зображення дані, які можуть бути розпізнані як текст, і створити файл у форматі PDF/XPS/OOXML (pptx/docx) із можливістю пошуку. Також можна встановити режим <Компактний>, якщо вибрано формат PDF або XPS.

Сканування з використанням функції OCR

1
Розмістіть оригінал. Розміщення оригіналів
2
Натисніть <Сканувати й надіслати>. Екран <Головний>
3
Укажіть адресата на екрані основних функцій сканування. Екран основних функцій сканування
4
За потреби вкажіть параметри сканування. Основні операції для сканування оригіналів
5
Виберіть формат файлу.
Якщо потрібно розділити кілька зображень і надіслати їх у вигляді окремих файлів, кожний із яких містить тільки одну сторінку, натисніть <Розділення на сторінки> , введіть кількість сторінок, на яку потрібно розділити, натисніть <OK>. Якщо зображення потрібно відсканувати як один файл, натисніть <Розділення на сторінки>  <Скасув. парам.>.
Вибір формату PDF
Вибір формату XPS
Вибір формату Word для OOXML
Вибір формату PowerPoint для OOXML
6
Натисніть <OK>.
Якщо вибрано формат файлу <PDF; OCR>, <XPS; OCR> або <OOXML; OCR>, а для параметра <Інтелектуальне сканування> встановлено значення <Увімк.> у розділі <OCR (Text Searchable) Settings>, визначається орієнтація оригіналу та за потреби документ автоматично обертається перед надсиланням. <Параметри OCR (Пошук у тексті)>
Якщо вибрати формати файлу <PDF> або <XPS>, можна одночасно встановити режими <Компактний> і <OCR (Пошук у тексті)>. У цьому випадку на екранах основних функцій сканування та основних функцій надсилання відображається формат файлу <PDF; компактний> або <XPS; Компактн.>.
Якщо вибрати варіант <Word> для формату <OOXML>, можна задати видалення відсканованих фонових зображень. Можна створювати прості в редагуванні файли Word без непотрібних зображень. <Включити фонові зображення у файл Word>
Виберіть одну мову або одну групу відповідно до мови, яка використовується в оригіналах, які потрібно відсканувати. Параметри й мови для функції оптичного розпізнавання символів (OCR)

Результати оптичного розпізнавання символів (OCR) незадовільні

Під час створення файлів у форматі PDF/XPS/OOXML, які підтримують пошук тексту, функція оптичного розпізнавання символів (OCR) може працювати неправильно. Це може бути викликано тим, що параметри апарата, мова, тип символів або формат вихідного документа не підтримуються функцією OCR.

Перевірка параметрів апарата та підтримуваних мов

Щоб поліпшити роботу функції OCR, можна налаштувати параметри апарата, пов’язані з розпізнаванням символів відповідно до типу оригіналу, а також шляхом використання в оригіналах відповідних типів символів або шрифтів, щоб апарат гарантовано розпізнав символи.

Параметри й мови для функції оптичного розпізнавання символів (OCR)

Елемент
Докладні відомості
Параметри мови для розпізнавання символів
Якщо мову вказано й у розділі <Формат файлу> вибрано параметр OCR:
розпізнавання тексту виконується на основі мови, вибраної для кожного формату файлу.
Якщо мову не вказано й у розділі <Формат файлу> вибрано параметр OCR:
розпізнавання тексту виконується на основі мови, вибраної в меню <Переключення мови/клавіатури> (<Переключення мови/клавіатури>).*1
Азійські мови, які можна розпізнати
Японська, китайська (спрощене письмо), китайська (традиційне письмо), корейська
Типи символів і шрифти, які можна розпізнати (азійські мови)
Європейські мови та мовні групи, які можна розпізнати
Мови:
англійська, французька, італійська, німецька, іспанська, нідерландська, португальська, албанська, каталонська, данська, фінська, ісландська, норвезька, шведська, хорватська, чеська, угорська, польська, словацька, естонська, латиська, литовська, російська, грецька, турецька
Мовні групи:
західноєвропейська (ISO)*2, центральноєвропейська (ISO)*3, балтійська (ISO)*4
Типи символів і шрифти, які можна розпізнати (європейські мови)
*1 Мови, які відображаються в списку мов, можуть відрізнятися. Якщо вибрати англійську, французьку, італійську, німецьку, іспанську, тайську або в’єтнамську мову, вибрана мова розпізнається як західноєвропейська (ISO).
*2 Зокрема англійська, французька, італійська, німецька, іспанська, нідерландська, португальська, албанська, каталонська, данська, фінська, ісландська, норвезька та шведська.
*3 Зокрема хорватська, чеська, угорська, польська та словацька.
*4 Зокрема естонська, латиська та литовська.

Типи символів і шрифти, які можна розпізнати (азійські мови)

Елемент
Докладні відомості
Типи символів, які можна розпізнати
Японська мова:
буквено-цифрові символи, символи кана, символи кандзі (JIS першого рівня, JIS другого рівня (частково)), знаки
Китайська мова (спрощене письмо):
буквено-цифрові символи, китайські символи, знаки (GB2312-80)
Китайська мова (традиційне письмо):
буквено-цифрові символи, китайські символи, знаки (Big5)
Корейська мова:
буквено-цифрові символи, символи кандзі, корейські літери хангиль, знаки (KSC5601)
Шрифти, які можна розпізнати
Підтримується кілька шрифтів. (Рекомендується тип Ming-cho.)
Символи, виділені курсивом, не розпізнаються.
Шрифти для перетворених символів (тільки якщо вибрано Word як формат файлу)
Японська мова:
Символи азійських мов: MS Mincho
Символи європейських мов: Century
Китайська мова (спрощене письмо):
Символи азійських мов: SimSun
Символи європейських мов: Calibri
Китайська мова (традиційне письмо):
Символи азійських мов: PMingLiU
Символи європейських мов: Calibri

Типи символів і шрифти, які можна розпізнати (європейські мови)

Елемент
Докладні відомості
Типи символів, які можна розпізнати
Буквено-цифрові символи, спеціальні символи мови, яка розпізнається*, знаки
Шрифти, які можна розпізнати
Підтримується кілька шрифтів. (Рекомендуються такі шрифти, як Times, Century та Arial.)
Символи, виділені курсивом, можуть розпізнаватися.
Шрифти для перетворених символів (тільки якщо вибрано Word як формат файлу)
Calibri
Курсив не відтворюється.
* Нижче перераховані символи грецької мови, які можна розпізнати. Також можна розпізнати спеціальні символи кожної мови. Деякі спеціальні символи розпізнати неможливо залежно від мов.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Перевірка формату оригінальних документів

Щоб поліпшити точність розпізнавання тексту під час створення файлів PDF/XPS/OOXML, які підтримують пошук тексту, скористайтесь оригіналами, які підходять для оптичного розпізнавання.
Елемент
Докладні відомості
Формат оригіналу
Друковані документи, документи, створені в текстовому редакторі Word (документи, які містять текст, графічні елементи, фотографії або таблиці й не містять похилих символів)
Формат тексту
Горизонтальне й вертикальне письмо (можливе розпізнавання документів, які містять як горизонтальне, так і вертикальне письмо)
Для європейських мов і корейської мови можливе розпізнавання лише горизонтального письма.
Документи, які містять не більше трьох стовпців (без складних стовпців)
Розмір символів
Від 8 до 40 пунктів
Формат таблиці (тільки для формату Word)
Таблиці, які відповідають наведеним нижче умовам:
таблиця складається з квадратів, розділених товстими лініями;
таблиця містить не більше 32 стовпців;
таблиця містить не більше 32 рядків.
Оптичне розпізнавання деяких оригіналів, які підтримують таку функцію, може виконуватися неправильно.
Висока точність розпізнавання не гарантується, якщо на кожній сторінці оригіналу міститься великий обсяг тексту.
Залежно від кольору фону оригіналу, форми й розмірів символів, а також від нахилу символів деякі символи можуть бути помилково замінені або можуть бути відсутні.*
Абзаци, розриви рядків й таблиці можуть не відтворюватися.*
Деякі частини ілюстрацій, фотографій або відбитків печаток можуть бути розпізнані й замінені текстом.*
* Якщо як формат файлу вибрано Word.
9XW6-08J