Skenování pomocí funkce OCR

Tento režim umožňuje použít funkci OCR (optické rozpoznání znaků), která z naskenovaného obrazu extrahuje data, jež lze rozpoznat jako text, a vytvoří soubor PDF/XPS/OOXML (pptx/docx), jehož text lze prohledávat. Vyberete-li jako typ souboru PDF nebo XPS, můžete také nastavit <Kompakt>.

Skenování se službou OCR

Výsledky OCR nejsou uspokojivé

Skenování se službou OCR

Uložte originál. Ukládání originálů

Stiskněte tlačítko <Skenovat a Odeslat>. Obrazovka <Hlavní obrazovka>

Zadejte místo určení na obrazovce základních funkcí skenování. Obrazovka základních funkcí skenování

Podle potřeby zadejte nastavení skenování. Základní operace pro skenování originálů

Vyberte typ souboru.

Chcete-li více obrázků oddělit a odesílat je jako samostatné soubory, z nichž každý má pouze jednu stranu, stiskněte <Rozdělit na stránky>

zadejte počet stran k rozdělení

a stiskněte <OK>. Chcete-li obrazy naskenovat do jednoho souboru, stiskněte <Rozdělit na stránky>

<Zrušit nastavení>.

Pro výběr PDF

Vyberte <PDF>

stiskněte <OCR (Upřednostnit rychlost)> nebo <OCR (Upřednostnit přesnost)>.

OCR (Upřednostnit přesnost) nelze provést, pokud <Trace & Smooth> je vybrána pomocí <OCR (Upřednostnit přesnost)>.

Nastavíte-li oba režimy <OCR (Upřednostnit přesnost)> a <Kompakt>, nastavení <Úroveň kvality obrazu pro Kompakt> se zakáže. <Úroveň kvality obrazu pro Kompakt>

Pokud vytvoříte soubor PDF s oběma režimy <OCR (Upřednostnit přesnost)> a <Kompakt>, kvalita obrazu se může lišit od souboru PDF vytvořeného pomocí <OCR (Upřednostnit rychlost)> a sady <Kompakt>.

Chcete-li změnit jazyk pro OCR, stiskněte <Jazyk OCR>

vyberte jazyk

stiskněte <OK>.

Pomocí <OCR (Upřednostnit přesnost)> lze rozpoznávat pouze evropské jazyky. Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Pro výběr XPS

1	Vyberte <XPS> a stiskněte <OCR (Prohl. text)>. Chcete-li změnit jazyk pro OCR, stiskněte <Jazyk OCR> vyberte jazyk stiskněte <OK>.

Výběr formátu Word pro OOXML

1	Vyberte možnost <OOXML> <Word>. Chcete-li změnit jazyk pro OCR, stiskněte <Změnit> vyberte jazyk nebo skupinu jazyků stiskněte <OK>. Vyberte jazyk nebo jazykovou skupinu podle jazyka použitého v naskenovaných dokumentech.

Výběr formátu PowerPoint pro OOXML

1	Vyberte možnost <OOXML> <PowerPoint> <OCR (Prohl. text)>.
2	Vyberte jazyk pro OCR a stiskněte <OK>.

Stiskněte tlačítko <OK>.


V případě dlouhých originálů (432 mm nebo delší) nelze použít režim <OCR (Prohl. text)>.


Vyberete-li typ souboru <PDF (OCR)>, <XPS (OCR)>, nebo <OOXML (OCR)> jako formát souboru a <Inteligentní skenování> je nastaveno na <Zap> v <OCR (Text Searchable) Settings>/<OCR (Upřednostnit rychlost)>, stroj rozpozná orientaci originálu a, je-li třeba, dokument před odesláním automaticky otočí. <Nastavení OCR (Prohl. text)> Vyberete-li <OCR (Prohl. text)>, můžete odesílat pouze s nastavením poměru zvětšení/zmenšení <1:1> nebo <Auto>. Vyberete-li jako typ souboru <PDF> nebo <XPS>, režimy <Kompakt> a <OCR (Prohl. text)> můžete nastavit současně. V tom případě se na obrazovce základních funkcí skenování a odesílání jako typ souboru zobrazí <PDF (Kompakt)> nebo <XPS (Kompakt)>. Vyberete-li <Word> pro <OOXML>, můžete nastavit smazání obrazů naskenovaných na pozadí. Můžete tak vytvářet soubory Word, které lze snadno upravovat a odstraňovat z nich nežádoucí obrazy. <Zahrnout obrazy pozadí do souboru Word> Když používáte funkci <Skenovat a Uložit>, lze jazyk OCR zadat jenom v případě, že je v nabídce <OOXML> vybrána možnost <Word> nebo v nabídce <PDF> je vybrána možnost <OCR (Upřednostnit přesnost)>.

Vyberete-li typ souboru <PDF (OCR)>, <XPS (OCR)>, nebo <OOXML (OCR)> jako formát souboru a <Inteligentní skenování> je nastaveno na <Zap> v <OCR (Text Searchable) Settings>/<OCR (Upřednostnit rychlost)>, stroj rozpozná orientaci originálu a, je-li třeba, dokument před odesláním automaticky otočí. <Nastavení OCR (Prohl. text)>

Vyberete-li <OCR (Prohl. text)>, můžete odesílat pouze s nastavením poměru zvětšení/zmenšení <1:1> nebo <Auto>.

Vyberete-li jako typ souboru <PDF> nebo <XPS>, režimy <Kompakt> a <OCR (Prohl. text)> můžete nastavit současně. V tom případě se na obrazovce základních funkcí skenování a odesílání jako typ souboru zobrazí <PDF (Kompakt)> nebo <XPS (Kompakt)>.

Vyberete-li <Word> pro <OOXML>, můžete nastavit smazání obrazů naskenovaných na pozadí. Můžete tak vytvářet soubory Word, které lze snadno upravovat a odstraňovat z nich nežádoucí obrazy. <Zahrnout obrazy pozadí do souboru Word>

Když používáte funkci <Skenovat a Uložit>, lze jazyk OCR zadat jenom v případě, že je v nabídce <OOXML> vybrána možnost <Word> nebo v nabídce <PDF> je vybrána možnost <OCR (Upřednostnit přesnost)>.

Výsledky OCR nejsou uspokojivé

Když vytvoříte soubory PDF/XPS/OOXML umožňující hledání v textu, optické rozpoznávání znaků OCR (Optical Character Recognition) se nemusí provést správně. K tomu může dojít, protože pro zpracování OCR nejsou vhodná nastavení na stroji nebo jazyk, typ znaků nebo formát originálního dokumentu.

Kontrola nastavení stroje a podporovaných jazyků

Optické rozpoznávání znaků OCR (Optical Character Recognition) můžete zlepšit tak, že upravíte nastavení stroje týkající se rozpoznání znaků podle originálů, nebo tak, že v originálech budete používat vhodné typy znaků nebo písem, aby stroj dokázal znaky rozpoznat.

Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Položka	Detaily
Nastavení jazyka pro rozpoznávání znaků	Když je jazyk určen se zvoleným OCR v části <Typ souboru>: Znaky jsou rozpoznávány na základě jazyka, který zvolíte pro každý typ souboru. Když není jazyk určen se zvoleným OCR v části <Typ souboru>: Znaky jsou rozpoznávány na základě jazyka, který zvolíte v <Přepnout jazyk/klávesnici> (<Přepnout jazyk/klávesnici>).*1
Rozpoznatelné asijské jazyky*2	Japonština, čínština (zjednodušená), čínština (tradiční), korejština Typy rozpoznatelných znaků a písma (asijské jazyky)
Rozpoznatelné evropské jazyky a jazykové skupiny	Jazyky: angličtina, francouzština, italština, němčina, španělština, nizozemština, portugalština, albánština, katalánština, dánština, finština, islandština, norština, švédština, chorvatština, čeština, maďarština, polština, slovenština, estonština, lotyština, litevština, ruština, řečtina, turečtina, slovinština3, rumunština3, bulharština3, hebrejština3 Jazykové skupiny: západoevropské (ISO)4, středoevropské (ISO)5, baltské (ISO)*6 Typy rozpoznatelných znaků a písma (evropské jazyky)

*1 Jazyky zobrazené v seznamu se mohou lišit. Jestliže vyberete angličtinu, francouzštinu, italštinu, němčinu, španělštinu, thajštinu nebo vietnamštinu, jazyk bude rozpoznán jako západoevropský (ISO).

*2 Asijské jazyky nelze zjistit v případě výběru možnosti <OCR (Upřednostnit přesnost)>.

*3 Tuto položku lze vybrat pouze s možností <OCR (Upřednostnit přesnost)>.

*4 Zahrnují angličtinu, francouzštinu, italštinu, němčinu, španělštinu, nizozemštinu, portugalštinu, albánštinu, katalánštinu, dánštinu, finštinu, islandštinu, norštinu a švédštinu.

*5 Zahrnují chorvatštinu, češtinu, maďarštinu, polštinu a slovenštinu.

*6 Zahrnují estonštinu, lotyštinu a litevštinu.

Typy rozpoznatelných znaků a písma (asijské jazyky)

Položka	Detaily
Typy rozpoznatelných znaků	Japonština: Alfanumerické znaky, znaky Kana, znaky Kandži (první úroveň dle JIS – Japanese Industrial Standard, některé druhé úrovně dle JIS), symboly Čínština (zjednodušená): Alfanumerické znaky, čínské znaky, symboly (GB2312-80) Čínština (tradiční): Alfanumerické znaky, čínské znaky, symboly (Big5) Korejština: Alfanumerické znaky, čínské znaky, znaky Hangul, symboly (KSC5601)
Rozpoznatelná písma	Je podporováno více písem. (Je doporučen typ Ming-cho.) Rozpoznávání znaků v kurzívě není možné.
Písma používaná pro konvertované znaky (Pouze když je jako souborový formát vybrán Word.)	Japonština: Asijské znaky: MS Mincho Evropské znaky: Century Čínština (zjednodušená): Asijské znaky: SimSun Evropské znaky: Calibri Čínština (tradiční): Asijské znaky: PMingLiU Evropské znaky: Calibri

Typy rozpoznatelných znaků a písma (evropské jazyky)

Položka	Detaily
Typy rozpoznatelných znaků	Alfanumerické znaky, speciální znaky rozpoznávaného jazyka*1, symboly
Rozpoznatelná písma	Je podporováno více písem. (Doporučena jsou písma Times, Century a Arial.)*2 Rozpoznávání znaků v kurzívě je možné.
Písma používaná pro konvertované znaky (Pouze když je jako souborový formát vybrán Word.)	Calibri Kurzíva není reprodukována.

*1 Rozpoznávání následujících speciálních řeckých znaků je možné. Rozpoznávání speciálních znaků jednotlivých jazyků je také možné. Rozpoznávání některých speciálních znaků není možné; závisí to na konkrétních jazycích.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

*2 Když je zvolena možnost <OCR (Upřednostnit přesnost)>, písma typu Arial, Times New Roman a Courier New budou rozpoznána.

Kontrola formátu originálních dokumentů

Používejte originály vhodné pro zpracování OCR v zájmu zvýšení přesnosti zpracování při vytváření prohledávatelných souborů PDF/XPS/OOXML.

Položka	Detaily
Původní formát	Tištěné dokumenty, dokumenty Word (dokumenty obsahující text, grafiku, fotografie nebo tabulky a bez žádných šikmých znaků)
Textový formát	Horizontální a vertikální text (je také možné rozpoznávání dokumentů obsahující horizontální i vertikální text) V případě evropských jazyků a korejského textu je možné rozpoznání pouze horizontálního psaní. Dokumenty s jedním až třemi sloupci bez složitého rozložení sloupců
Velikost znaků	8 až 40 bodů
Tabulkový formát (Pouze pro Word formát)	Tabulky, které splňující následující podmínky: Tabulky skládající se z polí oddělených pevnými čarami Tabulky s maximálně 32 sloupci Tabulky s maximálně 32 řádky


Může se stát, že některé originály vhodné pro zpracování OCR nebudou zpracovány řádně. Vysoké přesnosti nemusí být dosaženo u originálů s velkým množstvím textu na každé stránce. Může se stát, že znaky budou nahrazeny nežádoucími znaky nebo budou znaky chybět kvůli barvě pozadí originálu, formě a velikosti znaků nebo kvůli nakloněným znakům.* Nemusí být reprodukovány odstavce, zalamování řádků nebo tabulky.* Některé části ilustrací, fotografií nebo otisků razítek mohou být rozpoznány jako znaky nebo mohou být nahrazeny znaky.* * Když je vybrán souborový formát Word.

Může se stát, že některé originály vhodné pro zpracování OCR nebudou zpracovány řádně.

Vysoké přesnosti nemusí být dosaženo u originálů s velkým množstvím textu na každé stránce.

Může se stát, že znaky budou nahrazeny nežádoucími znaky nebo budou znaky chybět kvůli barvě pozadí originálu, formě a velikosti znaků nebo kvůli nakloněným znakům.*

Nemusí být reprodukovány odstavce, zalamování řádků nebo tabulky.*

Některé části ilustrací, fotografií nebo otisků razítek mohou být rozpoznány jako znaky nebo mohou být nahrazeny znaky.*

* Když je vybrán souborový formát Word.