Jestliže OCR (Prohl. text) funguje neadekvátně

V této části je vysvětleno, jak funkce OCR (Prohl. text) funguje při tvorbě souborů PDF/XPS/OOXML, v nichž lze provádět hledání, a hovoří se zde o adekvátním formátu souboru pro funkci OCR (Prohl. text).
Jestliže u OCR (optické rozpoznávání znaků) nemůžete dosáhnout adekvátního výsledku, řiďte se níže uvedenými instrukcemi.

Funkce OCR (Prohl. text) pro tvorbu prohledávatelných souborů PDF/XPS/OOXML

Při tvorbě prohledávatelných souborů PDF/XPS/OOXML se výkonnost a výsledek OCR liší v závislosti na vybraném souborovém formátu. Detaily viz v níže uvedené tabulce.
DŮLEŽITÉ
Přestože provedete OCR na základě jazyka použitého na originálech, může se stát, že nedosáhnete patřičného výsledku; závisí to na textu a souborovém formátu originálu.
Položka
Formát souboru
PDF/XPS/PowerPoint
Word
Rozpoznávaný jazyk
Znaky jsou rozpoznávány jako jeden z následujících jazyků nebo jazykových skupin podle jazyka vybraného v [Přepnout jazyk/klávesnici] v [Možnosti] (Nastavení/Uložení)*1 *2
Stiskněte [Změnit] a vyberte jazyk používaný na originálech z následujících jazyků nebo jazykových skupin. Znaky jsou rozpoznávány podle vybraného jazyka.
Asijské jazyky
Text je rozpoznáván v následujících jazycích:
Japonština, čínština (zjednodušená), čínština (tradiční), korejština
Evropské jazyky
Text je rozpoznáván v následujících jazycích nebo jazykových skupinách:
Jazyky
Angličtina, francouzština, italština, němčina, španělština, nizozemština, portugalština, albánština, katalánština, dánština, finština, islandština, norština, švédština, chorvatština, čeština, maďarština, polština, slovenština, estonština, lotyština, litevština, ruština, řečtina, turečtina
Jazykové skupiny
Západoevropské (ISO), středoevropské (ISO), baltické (ISO) *3
Rozpoznávání znaků pro asijské jazyky
Typ rozpoznávaných znaků
Japonština: Alfanumerické znaky, znaky Kana, znaky Kanji (první úroveň dle JIS – Japanese Industrial Standard, druhá úroveň dle JIS (částečně)), symboly
Čínština (zjednodušená): Alfanumerické znaky, čínské znaky, symboly (GB2312-80)
Čínština (tradiční): Alfanumerické znaky, čínské znaky, symboly (Big5)
Korejština: Alfanumerické znaky, znaky Kanji, korejské znaky Hangul, symboly (KSC5601)
Rozpoznávaný font
Podpora více fontů (doporučen typ Ming-cho)
Rozpoznávání kurzívy není možné.
Konvertovaný font
-
Když je vybrána japonština:
Asijský text: MS Mincho
Evropský text: Century
Když je vybrána čínština (zjednodušená):
Asijský text: SimSun
Evropský text: Calibri
Když je vybrána čínština (tradiční):
Asijský text: PMingLiU
Evropský text: Calibri
Rozpoznávání znaků pro evropské jazyky
Typ rozpoznávaných znaků
Alfanumerické znaky, speciální znaky rozpoznávaného jazyka*4, symboly
Rozpoznávaný font
Podpora více fontů (doporučeny Times, Century a Arial)
Rozpoznávání kurzívy je možné.
Konvertovaný font
-
Zobrazeno v Calibri
Konverze kurzívy není možná.
*1 Zobrazený jazyk v seznamu jazyků v [Přepnout jazyk/klávesnici] v [Možnosti] (Nastavení/Uložení) se může lišit.
*2 Jestliže vyberete angličtinu, francouzštinu, italštinu, němčinu, španělštinu, thajštinu nebo vietnamštinu v [Přepnout jazyk/klávesnici] v [Možnosti] (Nastavení/Uložení), jazyk bude rozpoznán jako západoevropský (ISO).
*3 Každá jazyková skupina sestává z následujících jazyků. Vyberete-li jazykovou skupinu, bude rozpoznán text napsaný v jazycích této jazykové skupiny.
Západoevropské (ISO):
Angličtina, francouzština, italština, němčina, španělština, nizozemština, portugalština, albánština, katalánština, dánština, finština, islandština, norština, švédština
Středoevropské (ISO):
chorvatština, čeština, maďarština, polština, slovenština
Baltické (ISO):
estonština, lotyština, litevština
*4 Vyberete-li řečtinu, lze provádět rozpoznání následujících speciálních znaků. Vyberete-li jiné jazyky, lze provádět rozpoznání speciálních znaků příslušných jednotlivých jazyků. Některé speciální znaky nelze rozpoznat; závisí to na konkrétních jazycích.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Souborový formát pro vytváření prohledávatelných souborů PDF/XPS/OOXML

Použitím náležitého souborového formátu pro OCR můžete zvýšit přesnost výsledku OCR.
Nedaří-li se vám dosáhnout patřičného výsledku OCR, zkontrolujte, zda je souborový formát skenovaného originálu vhodný pro OCR.
DŮLEŽITÉ
Používáte-li originály, které obsahují velké množství textu na stránku, OCR se nemusí provést patřičným způsobem.
Když vyberete formát Word, OCR se nemusí provést patřičným způsobem, i když použijete originály v doporučeném souborovém formátu.
Vlivem barvy pozadí, stylu znaků, velikosti znaků a sklonu znaků se může stát, že některé znaky budou nahrazeny nesprávně nebo budou ve výsledku OCR chybět.
Odstavce, zalamování a tabulky na originálu nemusejí být rozpoznány.
Část obrazu, jako např. grafika, fotografie nebo otisky razítka, mohou být rozpoznány a nahrazeny textem.
Položka
Detaily
Formát originálu
Tištěné dokumenty, textové dokumenty (dokument sestávající z textu, schémat, obrázků, tabulek a bez sklonu znaků)
Formát textu
Horizontální psaní, Vertikální psaní
Lze provádět rozpoznávání dokumentů, které obsahují jak horizontální, tak vertikální psaní.
V případě evropských jazyků a korejštiny je možné rozpoznání pouze horizontálního psaní.
Dokument bez složitých sloupců
Velikost znaků
8 až 40 bodů
Formát tabulky
(pouze pro dokumenty Word)
Tabulky, které splňující následující podmínky
Pravoúhlé tabulky s výraznými linkami
Počet řádků je 32 nebo méně
Počet sloupců je 32 nebo méně
25JJ-0R5