Skenovanie s použitím funkcie OCR

Tento režim umožňuje vykonávať OCR (optické rozpoznanie znakov) na extrahovanie údajov, ktoré je možné rozpoznať ako text, z naskenovaného obrazu a vytvoriť súbor vo formáte PDF, XPS alebo OOXML (.pptx, .docx), v ktorom sa dá vyhľadávať. Ak vyberiete formát súboru PDF alebo XPS, môžete použiť aj nastavenie <Kompakt.>.
Informácie o voliteľných produktoch potrebných na používanie tejto funkcie a formátov súborov nájdete v časti Systémové doplnky.

Skenovanie s funkciou OCR

1
Umiestnite originál. Vkladanie originálov
2
Stlačte tlačidlo <Skenovať a odoslať>. Obrazovka <Domov>
3
Špecifikujte miesto určenia na obrazovke základných funkcií skenovania. Obrazovka základných funkcií skenovania
4
Špecifikujte podľa potreby nastavenia skenovania. Základné operácie pre naskenované originály
5
Zvoľte si formát súboru.
Ak chcete rozdeliť viac obrazov a odoslať ich ako samostatné súbory tak, aby každý z nich obsahoval vždy len jednu stranu, stlačte tlačidlo <Rozdeliť na strany>  zadajte počet strán na rozdelenie  stlačte tlačidlo <OK>. Ak chcete naskenovať obrazy ako jeden súbor, stlačte tlačidlo <Rozdeliť na strany>  <Zrušiť nastav.>.
Vybratie formátu PDF
Vybratie formátu XPS
Vybratie formátu programu Word pre súbor OOXML
Výber formátu programu PowerPoint pre súbor OOXML
6
Stlačte tlačidlo <OK>.
Ak vyberiete formát súboru <PDF; OCR>, <XPS; OCR> alebo <OOXML; OCR> a položka <Inteligentné skenovanie> je nastavená na možnosť <Zap.> v časti <OCR (Text Searchable) Settings>/<OCR (Prioritize Speed)>, použije sa funkcia rozpoznania orientácie originálu a dokument sa v prípade potreby pred odoslaním automaticky otočí. <Nastavenia OCR (Vyhľad. text)>
Ak vyberiete formát súboru <PDF> alebo <XPS>, nastavenia <Kompakt.> a <OCR (Vyhľad. text)> môžete použiť súčasne. V takom prípade sa na obrazovke základných funkcií skenovania a odosielania zobrazuje formát súboru <PDF; Kompakt.> alebo <XPS; Kompakt.>.
Ak vyberiete formát <Word> pre súbor <OOXML>, môžete nastaviť vymazanie naskenovaných obrázkov pozadia. Môžete generovať súbory programu Word, ktoré sa dajú poľahky upravovať bez nechcených obrázkov. <Zahrnúť obrázky pozadia v súbore Word>

Výsledky OCR nie sú uspokojivé

V prípade vytvárania súborov vo formáte PDF, XPS alebo OOXML s možnosťou vyhľadávania v texte nemusí funkcia OCR (optické rozpoznanie znakov) pracovať správne. Môže to byť spôsobené tým, že nastavenia zariadenia, jazyk, typ znakov či formát originálneho dokumentu nie sú vhodné na spracovanie pomocou funkcie OCR.

Kontrola nastavení zariadenia a podporovaných jazykov

Spracovanie textu pomocou funkcie OCR môžete zlepšiť prispôsobením nastavení zariadenia súvisiacich s rozpoznávaním znakov podľa originálov alebo použitím vhodných typov znakov či písiem v origináloch tak, aby zariadenie dokázalo rozpoznať znaky.

Nastavenia a jazyky na spracovanie pomocou funkcie OCR

Položka
Detaily
Nastavenia jazyka na rozpoznávanie znakov
Keď je špecifikovaný jazyk s vybratou možnosťou OCR v časti <Formát súboru>:
Rozpoznávanie znakov sa vykonáva na základe jazyka, ktorý vyberiete pre každý formát súborov.
Keď nie je špecifikovaný jazyk s vybratou možnosťou OCR v časti <Formát súboru>:
Rozpoznávanie znakov sa vykonáva na základe jazyka, ktorý vyberiete v časti <Prepnúť jazyk/klávesnicu> (<Prepnúť jazyk/klávesnicu>).*1
Rozpoznateľné ázijské jazyky
Japončina, čínština (zjednodušená), čínština (tradičná), kórejčina
Rozpoznateľné písma a typy znakov (ázijské jazyky)
Rozpoznateľné európske jazyky a jazykové skupiny
Jazyky:
angličtina, francúzština, taliančina, nemčina, španielčina, holandčina, portugalčina, albánčina, katalánčina, dánčina, fínčina, islandčina, nórčina, švédčina, chorvátčina, čeština, maďarčina, poľština, slovenčina, estónčina, lotyština, litovčina, ruština, gréčtina, turečtina.
Jazykové skupiny:
západoeurópske (ISO)*2, stredoeurópske (ISO)*3, baltické (ISO)*4
Rozpoznateľné písma a typy znakov (európske jazyky)
*1 Jazyky zobrazené v zozname sa môžu líšiť. Ak vyberiete angličtinu, francúzštinu, taliančinu, nemčinu, španielčinu, thajčinu alebo vietnamčinu, vybratý jazyk sa rozpozná ako západoeurópsky (ISO).
*2 Vrátane angličtiny, francúzštiny, taliančiny, nemčiny, španielčiny, holandčiny, portugalčiny, albánčiny, katalánčiny, dánčiny, fínčiny, islandčiny, nórčiny a švédčiny.
*3 Vrátane chorvátčiny, češtiny, maďarčiny, poľštiny a slovenčiny.
*4 Vrátane estónčiny, lotyštiny a litovčiny.

Rozpoznateľné písma a typy znakov (ázijské jazyky)

Položka
Detaily
Rozpoznateľné typy znakov
Japončina:
alfanumerické znaky, znaky kana, znaky kandži (prvá úroveň JIS a čiastočne druhá úroveň JIS), symboly
Čínština (zjednodušená):
alfanumerické znaky, čínske znaky, symboly (GB2312-80)
Čínština (tradičná):
alfanumerické znaky, čínske znaky, symboly (Big5)
Kórejčina:
alfanumerické znaky, čínske znaky, znaky abecedy hangul, symboly (KSC5601)
Rozpoznateľné písma
Podpora viacerých písiem. (Odporúča sa typ Ming-cho.)
Znaky zobrazené kurzívou nie je možné rozpoznať.
Písma používané pre konvertované znaky (iba keď je vybratý formát súborov Word)
Japončina:
Ázijské znaky: MS Mincho
Európske znaky: Century
Čínština (zjednodušená):
Ázijské znaky: SimSun
Európske znaky: Calibri
Čínština (tradičná):
Ázijské znaky: PMingLiU
Európske znaky: Calibri

Rozpoznateľné písma a typy znakov (európske jazyky)

Položka
Detaily
Rozpoznateľné typy znakov
Alfanumerické znaky, špeciálne znaky rozpoznaného jazyka*, symboly
Rozpoznateľné písma
Podpora viacerých písiem. (Odporúčajú sa písma Times, Century, a Arial.)
Znaky zobrazené kurzívou je možné rozpoznať.
Písma používané pre konvertované znaky (iba keď je vybratý formát súborov Word)
Calibri
Štýl kurzívy sa nereprodukuje.
* Nasledujúce špeciálne grécke znaky je možné rozpoznať. Zároveň je možné rozpoznať špeciálne znaky pre každý jazyk. V závislosti od jazykov nie je možné rozpoznať niektoré špeciálne znaky.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Kontrola formátu originálnych dokumentov

Na dosiahnutie vyššej presnosti spracovania pri vytváraní súborov vo formáte PDF, XPS alebo OOXML s možnosťou vyhľadávania používajte originály vhodné na spracovanie pomocou funkcie OCR.
Položka
Detaily
Originálny formát
Tlačené dokumenty, dokumenty spracované v textovom procesore Word (dokumenty obsahujúce text, grafické prvky, fotografie alebo tabuľky, bez šikmých znakov)
Textový formát
Horizontálne a vertikálne písmo (rozpoznať sa dajú aj dokumenty obsahujúce horizontálne aj vertikálne písmo)
V prípade európskych jazykov a kórejčiny sa dá rozpoznať iba horizontálne písmo.
Dokumenty rozdeleného do jedného až troch stĺpcov bez komplexných nastavení stĺpcov
Veľkosť znaku
8 až 40 bodov
Tabuľkový formát (iba v prípade formátu programu Word)
Tabuľky, ktoré spĺňajú nasledujúce podmienky:
Tabuľky pozostávajúce zo štvorcov oddelených neprerušovanými čiarami
Tabuľky s maximálne 32 stĺpcami
Tabuľky s maximálne 32 riadkami
Niektoré originály vhodné na spracovanie pomocou funkcie OCR sa nemusia spracovať správne.
V prípade originálov s veľkým množstvom textu na každej strane sa nemusí podariť dosiahnuť vysokú úroveň presnosti.
Môže dôjsť k nahradeniu znakov nesprávnymi znakmi alebo k strate znakov v dôsledku farby pozadia originálu, tvaru a veľkosti znakov alebo prítomnosti šikmých znakov.*
V reprodukovanom texte nemusia zostať zachované odstavce, zlomy riadkov alebo tabuľky.*
Niektoré časti ilustrácií, fotografií alebo pečiatok sa môžu rozpoznať ako text a môže dôjsť k ich nahradeniu znakmi.*
* Keď je vybratý formát súboru programu Word.
6W29-072