Skenování pomocí funkce OCR

Tento režim umožňuje použít funkci OCR (optické rozpoznání znaků), která z naskenovaného obrazu extrahuje data, jež lze rozpoznat jako text, a vytvoří soubor PDF/XPS/OOXML (pptx/docx), jehož text lze prohledávat. Vyberete-li jako typ souboru PDF nebo XPS, můžete také nastavit <Kompakt>.

Skenování se službou OCR

1
Uložte originál. Ukládání originálů
2
Stiskněte <Skenovat a Odeslat>. Obrazovka <Hlavní obrazovka>
3
Zadejte místo určení na obrazovce základních funkcí skenování. Obrazovka základních funkcí skenování
4
Podle potřeby zadejte nastavení skenování. Základní operace pro skenování originálů
5
Vyberte typ souboru.
Chcete-li více obrázků oddělit a odesílat je jako samostatné soubory, z nichž každý má pouze jednu stranu, stiskněte <Rozdělit na stránky>  zadejte počet stran k rozdělení  stiskněte <OK>. Chcete-li obrazy naskenovat do jednoho souboru, stiskněte <Rozdělit na stránky>  <Zrušit nastavení>.
Pro výběr PDF
Pro výběr XPS
Pro výběr formátu Word pro OOXML
Pro výběr formátu PowerPoint pro OOXML
6
Stiskněte <OK>.
Vyberete-li typ souboru <PDF; OCR>, <XPS; OCR>, nebo <OOXML; OCR> jako formát souboru a <Inteligentní skenování> je nastaveno na <Zap> v <Nastavení OCR (Prohl. text)>, stroj rozpozná orientaci originálu a, je-li třeba, dokument před odesláním automaticky otočí. <Nastavení OCR (Prohl. text)>
Vyberete-li jako typ souboru <PDF> nebo <XPS>, režimy <Kompakt> a <OCR (Prohl. text)> můžete nastavit současně. V tom případě se na obrazovce základních funkcí skenování a odesílání jako typ souboru zobrazí <PDF; Kompakt> nebo <XPS; Kompakt>.
Vyberete-li <Word> pro <OOXML>, můžete nastavit smazání obrazů naskenovaných na pozadí. Můžete tak vytvářet soubory Word, které lze snadno upravovat a odstraňovat z nich nežádoucí obrazy. <Zahrnout obrazy pozadí do souboru Word>
Vyberte jeden jazyk nebo jednu skupinu na základě jazyka použitého v originálech, které chcete skenovat. Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Výsledky OCR nejsou uspokojivé

Když vytvoříte soubory PDF/XPS/OOXML umožňující hledání v textu, optické rozpoznávání znaků OCR (Optical Character Recognition) se nemusí provést správně. K tomu může dojít, protože pro zpracování OCR nejsou vhodná nastavení na stroji nebo jazyk, typ znaků nebo formát originálního dokumentu.

Kontrola nastavení stroje a podporovaných jazyků

Optické rozpoznávání znaků OCR (Optical Character Recognition) můžete zlepšit tak, že upravíte nastavení stroje týkající se rozpoznání znaků podle originálů, nebo tak, že v originálech budete používat vhodné typy znaků nebo písem, aby stroj dokázal znaky rozpoznat.

Nastavení a jazyky pro optické rozpoznávání znaků OCR (Optical Character Recognition)

Položka
Detaily
Nastavení jazyka pro rozpoznávání znaků
Když je jazyk určen se zvoleným OCR v části <Typ souboru>:
Znaky jsou rozpoznávány na základě jazyka, který zvolíte pro každý typ souboru.
Když není jazyk určen se zvoleným OCR v části <Typ souboru>:
Znaky jsou rozpoznávány na základě jazyka, který zvolíte v <Přepnout jazyk/klávesnici> (<Přepnout jazyk/klávesnici>).*1
Rozpoznatelné asijské jazyky
Japonština, čínština (zjednodušená), čínština (tradiční), korejština
Typy rozpoznatelných znaků a písma (asijské jazyky)
Rozpoznatelné evropské jazyky a jazykové skupiny
Jazyk:
Angličtina, francouzština, italština, němčina, španělština, nizozemština, portugalština, albánština, katalánština, dánština, finština, islandština, norština, švédština, chorvatština, čeština, maďarština, polština, slovenština, estonština, lotyština, litevština, ruština, řečtina, turečtina
Jazykové skupiny:
západoevropské (ISO)*2, středoevropské (ISO)*3, baltské (ISO)*4
Typy rozpoznatelných znaků a písma (evropské jazyky)
*1 Jazyky zobrazené v seznamu se mohou lišit. Jestliže vyberete angličtinu, francouzštinu, italštinu, němčinu, španělštinu, thajštinu nebo vietnamštinu, jazyk bude rozpoznán jako západoevropský (ISO).
*2 Zahrnují angličtinu, francouzštinu, italštinu, němčinu, španělštinu, nizozemštinu, portugalštinu, albánštinu, katalánštinu, dánštinu, finštinu, islandštinu, norštinu a švédštinu.
*3 Zahrnují chorvatštinu, češtinu, maďarštinu, polštinu a slovenštinu.
*4 Zahrnují estonštinu, lotyštinu a litevštinu.

Typy rozpoznatelných znaků a písma (asijské jazyky)

Položka
Detaily
Typy rozpoznatelných znaků
Japonština:
Alfanumerické znaky, znaky Kana, znaky Kandži (první úroveň dle JIS – Japanese Industrial Standard, některé druhé úrovně dle JIS), symboly
Čínština (zjednodušená):
Alfanumerické znaky, čínské znaky, symboly (GB2312-80)
Čínština (tradiční):
Alfanumerické znaky, čínské znaky, symboly (Big5)
Korejština:
Alfanumerické znaky, čínské znaky, znaky Hangul, symboly (KSC5601)
Rozpoznatelná písma
Je podporováno více písem. (Je doporučen typ Ming-cho.)
Rozpoznávání znaků v kurzívě není možné.
Písma používaná pro konvertované znaky (Pouze když je jako souborový formát vybrán Word.)
Japonština:
Asijské znaky: MS Mincho
Evropské znaky: Century
Čínština (zjednodušená):
Asijské znaky: SimSun
Evropské znaky: Calibri
Čínština (tradiční):
Asijské znaky: PMingLiU
Evropské znaky: Calibri

Typy rozpoznatelných znaků a písma (evropské jazyky)

Položka
Detaily
Typy rozpoznatelných znaků
Alfanumerické znaky, speciální znaky rozpoznávaného jazyka*, symboly
Rozpoznatelná písma
Je podporováno více písem. (Doporučena jsou písma Times, Century a Arial.)
Rozpoznávání znaků v kurzívě je možné.
Písma používaná pro konvertované znaky (Pouze když je jako souborový formát vybrán Word.)
Calibri
Kurzíva není reprodukována.
* Rozpoznávání následujících speciálních řeckých znaků je možné. Rozpoznávání speciálních znaků jednotlivých jazyků je také možné. Rozpoznávání některých speciálních znaků není možné; závisí to na konkrétních jazycích.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Kontrola formátu originálních dokumentů

Používejte originály vhodné pro zpracování OCR v zájmu zvýšení přesnosti zpracování při vytváření prohledávatelných souborů PDF/XPS/OOXML.
Položka
Detaily
Původní formát
Tištěné dokumenty, dokumenty Word (dokumenty obsahující text, grafiku, fotografie nebo tabulky a bez žádných šikmých znaků)
Textový formát
Horizontální a vertikální text (je také možné rozpoznávání dokumentů obsahující horizontální i vertikální text)
V případě evropských jazyků a korejského textu je možné rozpoznání pouze horizontálního psaní.
Dokumenty s jedním až třemi sloupci bez složitého rozložení sloupců
Velikost znaků
8 až 40 bodů
Tabulkový formát (Pouze pro Word formát)
Tabulky, které splňují následující podmínky:
Tabulky skládající se z polí oddělených pevnými čarami
Tabulky s maximálně 32 sloupci
Tabulky s maximálně 32 řádky
Může se stát, že některé originály vhodné pro zpracování OCR nebudou zpracovány řádně.
Vysoké přesnosti nemusí být dosaženo u originálů s velkým množstvím textu na každé stránce.
Může se stát, že znaky budou nahrazeny nežádoucími znaky nebo budou znaky chybět kvůli barvě pozadí originálu, formě a velikosti znaků nebo kvůli nakloněným znakům.*
Nemusí být reprodukovány odstavce, zalamování řádků nebo tabulky.*
Některé části ilustrací, fotografií nebo otisků razítek mohou být rozpoznány jako znaky nebo mohou být nahrazeny znaky.*
* Když je vybrán souborový formát Word.
A130-08J