Tekst wordt niet correct door OCR verwerkt

Tekst wordt mogelijk niet correct door OCR verwerkt bij het maken van een tekst doorzoekbaar bestand. Controleer in dit geval of de taalinstelling voor OCR-verwerking en het gebruikte origineel geschikt zijn.
U kunt de taalinstelling aanpassen aan het origineel en de verwerkingsnauwkeurigheid verbeteren door een origineel te gebruiken met een tekentype en lettertype die door de machine worden herkend en een origineel te gebruiken dat geschikt is voor OCR-verwerking.
BELANGRIJK
Wanneer OCR-verwerking niet correct wordt uitgevoerd, zelfs met een juiste taalinstelling en origineel
De verwerkingsnauwkeurigheid kan mogelijk niet worden verbeterd voor originelen met veel tekst per pagina.
Let op het volgende bij het maken van een OOXML-bestand in Word-formaat:
De tekst kan worden vervangen door onbedoelde tekens of er kunnen tekens ontbreken, afhankelijk van de achtergrondkleur, het lettertype, de lettergrootte, cursivering en andere factoren.
Alinea's, regeleindes of tabellen worden niet overgenomen.
Sommige afbeeldingen zoals diagrammen, foto's en zegels kunnen worden herkend als tekst en worden vervangen door tekst.

Instellingen en talen standaard voor OCR-verwerking

Standaard taalinstellingen voor tekenherkenning
De geselecteerde talen bij het instellen van OCR-verwerking vormen de basis voor tekenherkenning. Een doorzoekbaar tekstbestand maken (OCR-verwerking)
Herkenbare Aziatische talen
Japans, Chinees (vereenvoudigd), Chinese (traditioneel), Koreaans
* Voor de tekentypen en lettertypen raadpleegt u het volgende:
Herkenbare Europese talen en taalgroepen
Talen
Engels, Frans, Italiaans, Duits, Spaans, Nederlands, Portugees, Albanees, Catalaans, Deens, Fins, IJslands, Noors, Zweeds, Kroatisch, Tsjechisch, Hongaars, Pools, Slowaaks, Ests, Lets, Litouws, Russisch, Grieks, Turks, Sloveens*1, Roemeens*1, Bulgaars*1, Hebreeuws*1
Taalgroepen
West-Europees (ISO)*2, Centraal-Europees (ISO)*3, Baltisch (ISO)*4
* Voor de tekentypen en lettertypen raadpleegt u het volgende:
*1Dit kan alleen worden geselecteerd met [OCR (Precisieprioriteit)].
*2Inclusief Engels, Frans, Italiaans, Duits, Spaans, Nederlands, Portugees, Albanees, Catalaans, Deens, Fins, IJslands, Noors en Zweeds.
*3Inclusief Engels, Kroatisch, Tsjechisch, Hongaars, Pools en Slowaaks.
*4Inclusief Engels, Estisch, Lets en Litouws.

Herkenbare tekentypes en lettertypes (Aziatische talen)

Herkenbare tekentypen
Japanese
Alfabet, cijfers, kanji*1, symbolen, hiragana en katakana
Chinees (vereenvoudigd)
GB2312-80 (alfabet, cijfers, kanji en symbolen)
Chinees (traditioneel)
Big5 (alfabet, cijfers, kanji en symbolen)
Koreaans
KSC5601 (alfabet, cijfers, kanji, symbolen en Hangul)
Herkenbare lettertypen
Meerdere lettertypen worden ondersteund (aanbevolen: Mincho)
* Cursieve tekens kunnen niet worden herkend.
Herkenbare lettergrootten
van 8 pt tot 48 pt
Lettertypen die worden gebruikt na verwerking met OCR*2
Japanese
Aziatische tekens: MS Mincho
Europese tekens: Century
Chinees (vereenvoudigd)
Aziatische tekens: SimSun
Europese tekens: Calibri
Chinees (traditioneel)
Aziatische tekens: PMingLiU
Europese tekens: Calibri
Koreaans
Aziatische tekens: Malgun Gotisch
Europese tekens: Calibri
*1JIS 1 standaard kanji en sommige JIS 2 standaard kanji
*2Alleen als er een OOXML-bestand met Word-indeling wordt gemaakt

Herkenbare tekentypes en lettertypes (Europese talen)

Herkenbare tekentypen
Alfabet, tekens die uniek zijn voor de herkenningstaal*1, cijfers, symbolen
Herkenbare lettertypen
Meerdere lettertypen worden ondersteund (aanbevolen: Times, Century, Arial)*2
*Cursieve tekens kunnen worden herkend.
Herkenbare lettergrootten
van 6 pt tot 72 pt
Lettertypen die worden gebruikt na verwerking met OCR*3
Calibri
*Cursief kan niet worden gereproduceerd.
*1Afhankelijk van de taal worden sommige unieke tekens mogelijk niet herkend.
*2De lettertypen Arial, Times New Roman en Courier New kunnen worden herkend met [OCR (Precisieprioriteit)].
*3Alleen als er een OOXML-bestand met Word-indeling wordt gemaakt

Originelen geschikt voor OCR-verwerking

U kunt de nauwkeurigheid van de OCR-verwerking verbeteren door een origineel te gebruiken dat geschikt is voor OCR-verwerking.
Bestandsformaat van origineel
Gedrukte documenten en tekstverwerkingsdocumenten
Originelen met tekst, diagrammen, foto's en/of tabellen die niet schuin staan
Tekstformaat
Horizontaal of verticaal schrift (Documenten met zowel horizontaal als verticaal schrift kunnen ook worden herkend)*1
Documenten met één tot drie kolommen en zonder ingewikkelde details
Lettergrootte
van 8 pt tot 40 pt
Tabelformaat*2
Tabellen die aan de volgende voorwaarden voldoen:
Rechthoekig formaat bestaande uit stevige randlijnen
32 kolommen of minder
32 rijen of minder
*1Alleen horizontaal schrift is herkenbaar voor Europese talen en Koreaans.
*2Alleen als er een OOXML-bestand met Word-indeling wordt gemaakt
E9AC-088