Text není technologií OCR zpracován správně

Při vytváření souboru s možností vyhledávání textu nemusí být text technologií OCR správně zpracován. V tomto případě zkontrolujte, zda je nastavení jazyka pro zpracování OCR a použitého originálu vhodné.
Můžete změnit nastavení jazyka podle originálu a zlepšit přesnost zpracování použitím originálu s typem znaků a fontem rozpoznatelnými přístrojem a použitím originálu vhodného pro zpracování OCR.
DŮLEŽITÉ
Když zpracování OCR není prováděno správně ani s vhodným nastavením jazyka a originálu
Přesnost zpracování nemusí být možné zlepšit u originálů s velkým objemem textu na stránku.
Při vytváření souboru OOXML ve formátu Word pamatuje na následující:
Text může být nahrazen nechtěnými znaky nebo znaky mohou chybět v závislosti na barvě pozadí, písmu, velikosti písma, kurzívě a dalších faktorech.
Odstavce, zalamování řádků a tabulky nejsou reprodukovány.
Některé obrázky, například diagramy, fotografie a pečetě, mohou být rozpoznány jako text a nahrazeny textem.

Nastavení a jazykový standard pro zpracování OCR

Standardní nastavení jazyka pro rozpoznávání znaků
Jazyky vybrané při nastavení zpracování OCR jsou základem pro rozpoznávání znaků. Vytvoření souboru s možností vyhledávání textu (zpracování OCR)
Rozpoznatelné asijské jazyky
Japonština, čínština (zjednodušená), čínština (tradiční), korejština
* Typy znaků a písma viz následující:
Rozpoznatelné evropské jazyky a jazykové skupiny
Jazyky
angličtina, francouzština, italština, němčina, španělština, nizozemština, portugalština, albánština, katalánština, dánština, finština, islandština, norština, švédština, chorvatština, čeština, maďarština, polština, slovenština, estonština, lotyština, litevština, ruština, řečtina, turečtina, slovinština*1, rumunština*1, bulharština*1, hebrejština*1
Jazykové skupiny
západoevropské (ISO)*2, středoevropské (ISO)*3, baltské (ISO)*4
* Typy znaků a písma viz následující:
*1Tuto položku lze vybrat pouze s [OCR (Upředn. přesnost)].
*2Obsahuje angličtinu, francouzštinu, italštinu, němčinu, španělštinu, nizozemštinu, portugalštinu, albánštinu, katalánštinu, dánštinu, finštinu, islandštinu, norštinu a švédštinu.
*3Obsahuje angličtinu, chorvatštinu, češtinu, maďarštinu, polštinu a slovenštinu.
*4Obsahuje angličtinu, estonštinu, lotyštinu a litevštinu.

Typy rozpoznatelných znaků a písma (asijské jazyky)

Rozpoznatelné typy znaků
Japonsky
Abeceda, číslice, kandži*1, symboly, hiragana a katakana
Čínština (zjednodušená)
GB2312-80 (abeceda, číslice, kandži a symboly)
Čínština (tradiční)
Big5 (abeceda, číslice, kandži a symboly)
Korejština
KSC5601 (abeceda, číslice, kandži, symboly a hangul)
Rozpoznatelná písma
Podpora více písem (doporučeno: Mincho)
*Znaky psané kurzívou nelze rozpoznat.
Rozpoznatelné velikosti písma
8 až 48 bodů
Písma použitá po zpracování OCR*2
Japonsky
Asijské znaky: MS Mincho
Evropské znaky: Century
Čínština (zjednodušená)
Asijské znaky: SimSun
Evropské znaky: Calibri
Čínština (tradiční)
Asijské znaky: PMingLiU
Evropské znaky: Calibri
Korejština
Asijské znaky: Malgun Gothic
Evropské znaky: Calibri
*1Všechny standardní kanji JIS 1 a některé standardní kanji JIS 2
*2Pouze při vytváření souboru ve formátu OOXML Word

Typy rozpoznatelných znaků a písma (evropské jazyky)

Rozpoznatelné typy znaků
Abeceda, znaky jedinečné pro jazyk rozpoznávání*1, čísla, symboly
Rozpoznatelná písma
Podpora více písem (doporučeno: Times, Century, Arial)*2
*Lze rozpoznávat znaky v kurzívě.
Rozpoznatelné velikosti písma
6 až 72 bodů
Písma použitá po zpracování OCR*3
Calibri
*Kurzívu nelze reprodukovat.
*1V závislosti na jazyku nemusí být některé jedinečné znaky rozpoznány.
*2Písma Arial, Times New Roman a Courier New lze pomocí [OCR (Upředn. přesnost)] rozpoznat.
*3Pouze při vytváření souboru ve formátu OOXML Word

Originály vhodné pro zpracování OCR

Přesnost zpracování OCR můžete zlepšit použitím originálu vhodného pro zpracování OCR.
Formát souboru originálu
Tištěné dokumenty a dokumenty pro zpracování textu
Originály složené z textu, diagramů, fotografií a/nebo tabulek a které nejsou našikmo
Textový formát
Vodorovný nebo svislý text (rozpoznávat lze také dokumenty s vodorovným a svislým textem)*1
Dokumenty s jedním až třemi sloupci a bez různých složitostí
Velikost písma
8 až 40 bodů
Formát tabulky*2
Tabulky, které splňující následující podmínky:
Obdélníkový formát skládající se z plných ohraničujících čar
Do 32 sloupců
Do 32 řádků
*1U evropských jazyků a korejštiny lze rozpoznávat pouze vodorovný text.
*2Pouze při vytváření souboru ve formátu OOXML Word
C434-086