Skenování pomocí funkce OCR

Tento režim umožňuje použít funkci OCR (optické rozpoznání znaků), která z naskenovaného obrazu extrahuje data, jež lze rozpoznat jako text, a vytvoří soubor PDF/XPS/OOXML (pptx/docx), jehož text lze prohledávat. Vyberete-li jako typ souboru PDF nebo XPS, můžete také nastavit <Kompakt>.

Skenování se službou OCR

Výsledky OCR nejsou uspokojivé

Skenování se službou OCR

Uložte originál. Ukládání originálů

Stiskněte <Skenovat a Odeslat>. Obrazovka <Hlavní obrazovka>

Zadejte místo určení na obrazovce základních funkcí skenování. Obrazovka základních funkcí skenování

Podle potřeby zadejte nastavení skenování. Základní operace pro skenování originálů

Vyberte typ souboru.

Chcete-li více obrázků oddělit a odesílat je jako samostatné soubory, z nichž každý má pouze jednu stranu, stiskněte <Rozdělit na stránky>

zadejte počet stran k rozdělení

stiskněte <OK>. Chcete-li obrazy naskenovat do jednoho souboru, stiskněte <Rozdělit na stránky>

<Zrušit nastavení>.

Pro výběr PDF

1	Vyberte <PDF> a stiskněte <Nastavit detaily> <OCR (Prohl. text)>.
2	Chcete-li změnit jazyk pro OCR, stiskněte <Jazyk OCR> vyberte jazyk a stiskněte tlačítko <OK>.

Pro výběr XPS

1	Vyberte <XPS> a stiskněte <Nastavit detaily> <OCR (Prohl. text)>.
2	Chcete-li změnit jazyk pro OCR, stiskněte <Jazyk OCR> vyberte jazyk stiskněte <OK>.

Pro výběr formátu Word pro OOXML

1	Vyberte <OOXML> z rozevíracího seznamu vyberte možnost <Word>.

Chcete-li změnit jazyk pro OCR, stiskněte <Nastavit detaily>

<Změnit>

vyberte jazyk

stiskněte <OK>.

Pro výběr formátu PowerPoint pro OOXML

1	Vyberte možnost <OOXML> z rozevíracího seznamu vyberte možnost <PowerPoint>.
2	Vyberte <Nastavit detaily> <OCR (Prohl. text)>.
3	Chcete-li změnit jazyk pro OCR, stiskněte <Jazyk OCR> vyberte jazyk a stiskněte tlačítko <OK>.

Stiskněte <OK>.


Vyberete-li typ souboru <PDF; OCR>, <XPS; OCR>, nebo <OOXML; OCR> jako formát souboru a <Inteligentní skenování> je nastaveno na <Zap> v <Nastavení OCR (Prohl. text)>, stroj rozpozná orientaci originálu a, je-li třeba, dokument před odesláním automaticky otočí. <Nastavení OCR (Prohl. text)> Vyberete-li jako typ souboru <PDF> nebo <XPS>, režimy <Kompakt> a <OCR (Prohl. text)> můžete nastavit současně. V tom případě se na obrazovce základních funkcí skenování a odesílání jako typ souboru zobrazí <PDF; Kompakt> nebo <XPS; Kompakt>. Vyberete-li <Word> pro <OOXML>, můžete nastavit smazání obrazů naskenovaných na pozadí. Můžete tak vytvářet soubory Word, které lze snadno upravovat a odstraňovat z nich nežádoucí obrazy. <Zahrnout obrazy pozadí do souboru Word> Vyberte jeden jazyk nebo jednu skupinu na základě jazyka použitého v originálech, které chcete skenovat. Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Vyberete-li typ souboru <PDF; OCR>, <XPS; OCR>, nebo <OOXML; OCR> jako formát souboru a <Inteligentní skenování> je nastaveno na <Zap> v <Nastavení OCR (Prohl. text)>, stroj rozpozná orientaci originálu a, je-li třeba, dokument před odesláním automaticky otočí. <Nastavení OCR (Prohl. text)>

Vyberete-li jako typ souboru <PDF> nebo <XPS>, režimy <Kompakt> a <OCR (Prohl. text)> můžete nastavit současně. V tom případě se na obrazovce základních funkcí skenování a odesílání jako typ souboru zobrazí <PDF; Kompakt> nebo <XPS; Kompakt>.

Vyberete-li <Word> pro <OOXML>, můžete nastavit smazání obrazů naskenovaných na pozadí. Můžete tak vytvářet soubory Word, které lze snadno upravovat a odstraňovat z nich nežádoucí obrazy. <Zahrnout obrazy pozadí do souboru Word>

Vyberte jeden jazyk nebo jednu skupinu na základě jazyka použitého v originálech, které chcete skenovat. Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Výsledky OCR nejsou uspokojivé

Když vytvoříte soubory PDF/XPS/OOXML umožňující hledání v textu, optické rozpoznávání znaků OCR (Optical Character Recognition) se nemusí provést správně. K tomu může dojít, protože pro zpracování OCR nejsou vhodná nastavení na stroji nebo jazyk, typ znaků nebo formát originálního dokumentu.

Kontrola nastavení stroje a podporovaných jazyků

Optické rozpoznávání znaků OCR (Optical Character Recognition) můžete zlepšit tak, že upravíte nastavení stroje týkající se rozpoznání znaků podle originálů, nebo tak, že v originálech budete používat vhodné typy znaků nebo písem, aby stroj dokázal znaky rozpoznat.

Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Položka	Detaily
Nastavení jazyka pro rozpoznávání znaků	Když je jazyk určen se zvoleným OCR v části <Typ souboru>: Znaky jsou rozpoznávány na základě jazyka, který zvolíte pro každý typ souboru. Když není jazyk určen se zvoleným OCR v části <Typ souboru>: Znaky jsou rozpoznávány na základě jazyka, který zvolíte v <Přepnout jazyk/klávesnici> (<Přepnout jazyk/klávesnici>).*1
Rozpoznatelné asijské jazyky	Japonština, čínština (zjednodušená), čínština (tradiční), korejština Typy rozpoznatelných znaků a písma (asijské jazyky)
Rozpoznatelné evropské jazyky a jazykové skupiny	Jazyk: Angličtina, francouzština, italština, němčina, španělština, nizozemština, portugalština, albánština, katalánština, dánština, finština, islandština, norština, švédština, chorvatština, čeština, maďarština, polština, slovenština, estonština, lotyština, litevština, ruština, řečtina, turečtina Jazykové skupiny: západoevropské (ISO)2, středoevropské (ISO)3, baltské (ISO)*4 Typy rozpoznatelných znaků a písma (evropské jazyky)

*1 Jazyky zobrazené v seznamu se mohou lišit. Jestliže vyberete angličtinu, francouzštinu, italštinu, němčinu, španělštinu, thajštinu nebo vietnamštinu, jazyk bude rozpoznán jako západoevropský (ISO).

*2 Zahrnují angličtinu, francouzštinu, italštinu, němčinu, španělštinu, nizozemštinu, portugalštinu, albánštinu, katalánštinu, dánštinu, finštinu, islandštinu, norštinu a švédštinu.

*3 Zahrnují chorvatštinu, češtinu, maďarštinu, polštinu a slovenštinu.

*4 Zahrnují estonštinu, lotyštinu a litevštinu.

Typy rozpoznatelných znaků a písma (asijské jazyky)

Položka	Detaily
Typy rozpoznatelných znaků	Japonština: Alfanumerické znaky, znaky Kana, znaky Kandži (první úroveň dle JIS – Japanese Industrial Standard, některé druhé úrovně dle JIS), symboly Čínština (zjednodušená): Alfanumerické znaky, čínské znaky, symboly (GB2312-80) Čínština (tradiční): Alfanumerické znaky, čínské znaky, symboly (Big5) Korejština: Alfanumerické znaky, čínské znaky, znaky Hangul, symboly (KSC5601)
Rozpoznatelná písma	Je podporováno více písem. (Je doporučen typ Ming-cho.) Rozpoznávání znaků v kurzívě není možné.
Písma používaná pro konvertované znaky (Pouze když je jako souborový formát vybrán Word.)	Japonština: Asijské znaky: MS Mincho Evropské znaky: Century Čínština (zjednodušená): Asijské znaky: SimSun Evropské znaky: Calibri Čínština (tradiční): Asijské znaky: PMingLiU Evropské znaky: Calibri

Typy rozpoznatelných znaků a písma (evropské jazyky)

Položka	Detaily
Typy rozpoznatelných znaků	Alfanumerické znaky, speciální znaky rozpoznávaného jazyka*, symboly
Rozpoznatelná písma	Je podporováno více písem. (Doporučena jsou písma Times, Century a Arial.) Rozpoznávání znaků v kurzívě je možné.
Písma používaná pro konvertované znaky (Pouze když je jako souborový formát vybrán Word.)	Calibri Kurzíva není reprodukována.

* Rozpoznávání následujících speciálních řeckých znaků je možné. Rozpoznávání speciálních znaků jednotlivých jazyků je také možné. Rozpoznávání některých speciálních znaků není možné; závisí to na konkrétních jazycích.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Kontrola formátu originálních dokumentů

Používejte originály vhodné pro zpracování OCR v zájmu zvýšení přesnosti zpracování při vytváření prohledávatelných souborů PDF/XPS/OOXML.

Položka	Detaily
Původní formát	Tištěné dokumenty, dokumenty Word (dokumenty obsahující text, grafiku, fotografie nebo tabulky a bez žádných šikmých znaků)
Textový formát	Horizontální a vertikální text (je také možné rozpoznávání dokumentů obsahující horizontální i vertikální text) V případě evropských jazyků a korejského textu je možné rozpoznání pouze horizontálního psaní. Dokumenty s jedním až třemi sloupci bez složitého rozložení sloupců
Velikost znaků	8 až 40 bodů
Tabulkový formát (Pouze pro Word formát)	Tabulky, které splňují následující podmínky: Tabulky skládající se z polí oddělených pevnými čarami Tabulky s maximálně 32 sloupci Tabulky s maximálně 32 řádky


Může se stát, že některé originály vhodné pro zpracování OCR nebudou zpracovány řádně. Vysoké přesnosti nemusí být dosaženo u originálů s velkým množstvím textu na každé stránce. Může se stát, že znaky budou nahrazeny nežádoucími znaky nebo budou znaky chybět kvůli barvě pozadí originálu, formě a velikosti znaků nebo kvůli nakloněným znakům.* Nemusí být reprodukovány odstavce, zalamování řádků nebo tabulky.* Některé části ilustrací, fotografií nebo otisků razítek mohou být rozpoznány jako znaky nebo mohou být nahrazeny znaky.* * Když je vybrán souborový formát Word.

Může se stát, že některé originály vhodné pro zpracování OCR nebudou zpracovány řádně.

Vysoké přesnosti nemusí být dosaženo u originálů s velkým množstvím textu na každé stránce.

Může se stát, že znaky budou nahrazeny nežádoucími znaky nebo budou znaky chybět kvůli barvě pozadí originálu, formě a velikosti znaků nebo kvůli nakloněným znakům.*

Nemusí být reprodukovány odstavce, zalamování řádků nebo tabulky.*

Některé části ilustrací, fotografií nebo otisků razítek mohou být rozpoznány jako znaky nebo mohou být nahrazeny znaky.*

* Když je vybrán souborový formát Word.