Сканиране с OCR функцията

Този режим ви позволява да извършвате OCR (оптично разпознаване на символи) за извличане на данни, които могат да се разпознават като текст от сканираното изображение и да създавате PDF/XPS/OOXML (pptx/docx) файл, в който може да се търси. Можете също така да зададете <Компактен>, ако изберете PDF или XPS като файлов формат.

Сканиране с OCR

1
Поставете оригинала. Поставяне на оригинали
2
Натиснете <Сканиране и изпращане>. Екран <Начало>
3
Задайте дестинацията на екрана с основни функции за сканиране. Екран с основни функции за сканиране
4
Задайте необходимите настройки за сканиране. Основни операции за сканиране на оригинали
5
Изберете файлов формат.
Ако желаете да разделите няколко изображения и да ги изпратите като отделни файлове, всеки от които да съдържа само една страница, натиснете <Разделяне на стр-ци>  въведете броя страници, който да се дели на , натиснете <OK>. Ако желаете да сканирате изображенията като един файл, натиснете <Разделяне на стр-ци>  <Отмяна настр.>.
За избиране на PDF
За избиране на XPS
За избиране на Word формат за OOXML
За избиране на PowerPoint формат за OOXML
6
Натиснете <OK>.
Ако изберете <PDF; OCR>, <XPS; OCR> или <OOXML; OCR> като файлов формат, а <Интелигентно сканиране> е зададено на <Вкл.> в <OCR (Text Searchable) Settings>, ориентацията на оригинала се открива и документът се завърта автоматично, ако е нужно, преди да се изпрати. <Настройки за OCR (Текстов)>
Ако изберете <PDF> или <XPS> като файлов формат, можете да зададете <Компактен> и <OCR (Текстов)> едновременно. В такъв случай <PDF; Компактен> или <XPS; Компактен> се показва като файлов формат на екрана за основни функции за сканиране и изпращане.
Ако изберете <Word> за <OOXML>, можете да зададете изтриване на сканираните фонови изображения. Можете да генерирате Word файлове, които са лесни за редактиране и нямат нежелани изображения. <Включване на фонови изображ.в Word файл>
Изберете език или езикова група според езика, използван в оригиналните документи за сканиране. Настройки и езици за OCR обработка

OCR резултатите са с лошо качество

Когато създавате PDF/XPS/OOXML файлове, в които може да се търси текст, OCR (оптично разпознаване на символи) може да не се обработва правилно. Това може да се дължи на настройките на машината или на езика, типа на символите или формата на оригиналния документ, които да не са подходящи за OCR обработка.

Проверка на настройките на машината и поддържаните езици

Можете да подобрите OCR обработката чрез персонализиране на настройките на машината по отношение на разпознаването на символи според оригиналите или чрез използване на подходящи типове символи или шрифтове в оригиналите, така че машината да може да разпознава символите.

Настройки и езици за OCR обработка

Елемент
Детайли
Настройки за език за разпознаване на символи
Когато е зададен език с OCR избрано в <Файлов формат>:
Символите се разпознават на базата на езика, избран за всеки файлов формат.
Когато не е зададен език с OCR избрано в <Файлов формат>:
Символите се разпознават на базата на езика, който сте избрали в <Превкл. Език/Клавиатура> (<Превкл. Език/Клавиатура>).*1
Разпознаваеми азиатски езици
Японски, китайски (опростен), китайски (традиционен), корейски
Разпознаваеми типове йероглифи и шрифтове (азиатски езици)
Разпознаваеми европейски езици и езикови групи
Езици:
Английски, френски, италиански, немски, испански, холандски, португалски, албански, каталонски, датски, финландски, исландски, норвежки, шведски, хърватски, чешки, унгарски, полски, словашки, естонски, латвийски, литовски, руски, гръцки, турски
Езикови групи:
Западноевропейски (ISO)*2, централноевропейски (ISO)*3, балтийски (ISO)*4
Разпознаваеми типове символи и шрифтове (европейски езици)
*1 Показваните езици в списъка могат да варират. Ако изберете английски, френски, италиански, немски, испански, тайландски или виетнамски, избраният език се разпознава като западноевропейски (ISO).
*2 Включително английски, френски, италиански, немски, испански, холандски, португалски, албански, каталонски, датски, финландски, исландски, норвежки и шведски.
*3 Включително хърватски, чешки, унгарски, полски и словашки.
*4 Включително естонски, латвийски и литовски.

Разпознаваеми типове йероглифи и шрифтове (азиатски езици)

Елемент
Детайли
Разпознаваеми типове символи
Японски:
Букви и цифри, кана йероглифи, канджи йероглифи (JIS първо ниво и части от JIS второ ниво), символи
Китайски (опростен):
Букви и цифри, китайски йероглифи, символи (GB2312-80)
Китайски (традиционен):
Букви и цифри, китайски йероглифи, символи (Big5)
Корейски:
Букви и цифри, китайски йероглифи, хангул йероглифи, символи (KSC5601)
Разпознаваеми шрифтове
Няколко шрифта се поддържат. (Тип Ming-cho тип се препоръчва.)
Наклонени йероглифи не могат да се разпознават.
Шрифтове, използвани за конвертирани символи (Само когато Word е избран като файлов формат)
Японски:
Азиатски йероглифи: MS Mincho
Европейски символи: Century
Китайски (опростен):
Азиатски йероглифи: SimSun
Европейски символи: Calibri
Китайски (традиционен):
Азиатски йероглифи: PMingLiU
Европейски символи: Calibri

Разпознаваеми типове символи и шрифтове (европейски езици)

Елемент
Детайли
Разпознаваеми типове символи
Букви и цифри, специални символи от разпознаван език*, символи
Разпознаваеми шрифтове
Няколко шрифта се поддържат. (препоръчителни са Times, Century и Arial)
Наклонени символи не могат да се разпознават.
Шрифтове, използвани за конвертирани символи (Само когато Word е избран като файлов формат)
Calibri
Italic стил не може да се възпроизвежда.
* Следните специални гръцки символи могат да се разпознават. Специални символи за всеки език могат също да се разпознават. Някои специални символи не могат да бъдат разпознати в зависимост от езиците.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Проверка на формата на оригиналните документи

Използвайте подходящи за OCR обработка оригинали, за да подобрите точността на обработка при създаване на PDF/XPS/OOXML файлове с възможност за търсене.
Елемент
Детайли
Формат на оригинала
Отпечатани документи, документи в Word процесор (документи, съдържащи текст, графика, снимки или таблици и без символи под наклон)
Формат на текста
Хоризонтален и вертикален текст (документи с хоризонтален и вертикален текст също могат да се разпознават)
Само хоризонтален текст може да бъде разпознаван за европейски езици и корейски.
Документи с една до три колони без сложни настройки за колоните
Размер на символа
От 8 до 40
Формат на таблицата (Само за Word формат)
Таблици, които отговарят на следните условия:
Таблиците се състоят от квадратчета, разделени от непрекъснати линии
Таблици с до 32 колони
Таблици с до 32 реда
Някои оригинали, подходящи за OCR обработка, може да не се обработят правилно.
При оригинали с голямо количество текст на всяка страница може да не се постигне висока точност.
Символите могат да бъдат заменени с нежелани символи или да липсват поради фоновия цвят на оригинала, формата и размера на символите или поради наклонени символи.*
Параграфи, нови редове или таблици може да не се възпроизведат.*
Някои части от илюстрации, снимки или печати може да се разпознаят като символи и да се заменят с такива.*
* Когато Word е избран като файловия формат.
9XU6-08J