Als OCR (Doorzoekbare tekst) niet goed werkt

In dit gedeelte wordt toegelicht hoe de OCR (Doorzoekbare tekst)-functie werkt bij het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden, en over het juiste bestandsindeling voor de OCR (Doorzoekbare tekst)-functie.

Raadpleeg de volgende instructies als OCR (Optical Character Recognition) geen goede resultaten oplevert.

OCR (Doorzoekbare tekst)-functie voor het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden

Bestandsindeling voor het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden

OCR (Doorzoekbare tekst)-functie voor het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden

Afhankelijk van de geselecteerde bestandsindeling verschilt het resultaat van OCR bij het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden. Raadpleeg onderstaande tabel voor meer informatie.

BELANGRIJK
Zelfs als u OCR uitvoert in de taal van het origineel, hoeft het resultaat niet altijd goed te zijn, afhankelijk van de tekst en het bestandsindeling van het origineel.

Item	Bestandsindeling
Item	PDF/XPS/PowerPoint	Word
Herkenning van taal	Tekens worden herkend als een van de volgende talen of taalgroepen op grond van de taal die is geselecteerd in [Andere Taal/Toetsenbord] in [Voorkeuren] (Instellingen/Registratie)1 2	Druk op [Wijzigen] om een taal die wordt gebruikt in het origineel, uit de volgende talen of taalgroepen te selecteren. Tekens worden herkend op grond van de geselecteerde taal.
Aziatische talen	Tekst in de volgende talen wordt herkend: Japans, Chinees (vereenvoudigd), Chinese (traditioneel), Koreaans
Europese talen	Tekst in de volgende talen of taalgroepen wordt herkend: Talen Engels, Frans, Italiaans, Duits, Spaans, Nederlands, Portugees, Albanees, Catalaans, Deens, Fins, IJslands, Noors, Zweeds, Kroatisch, Tsjechisch, Hongaars, Pools, Slovaaks, Ests, Lets, Litouws, Russisch, Grieks, Turks Taalgroepen West-Europees (ISO), Centraal-Europees (ISO), Baltisch (ISO) *3
Tekenherkenning voor Aziatische talen
Herkenning van tekentype	Japans: Alfanumerieke tekens, Kana-tekens, Kanji-tekens (JIS eerste niveau, JIS tweede niveau (deels)), symbolen Chinees (vereenvoudigd): Alfanumerieke tekens, Chinese tekens, symbolen (GB2312-80) Chinees (traditioneel): Alfanumerieke tekens, Chinese tekens, symbolen (Big5) Koreaans: Alfanumerieke tekens, Kanji-tekens, Koreaanse Hangul-tekens, symbolen (KSC5601)
Herkenning van lettertype	Meerdere lettertypes worden ondersteund (Ming-cho-type wordt aanbevolen) Cursief type wordt niet herkend
Geconverteerd lettertype	-	Wanneer Japans wordt geselecteerd: Aziatische tekst: MS Mincho Europese tekst: Century Wanneer Chinees (vereenvoudigd) wordt geselecteerd: Aziatische tekst: SimSun Europese tekst: Calibri Wanneer Chinees (traditioneel) wordt geselecteerd: Aziatische tekst: PMingLiU Europese tekst: Calibri
Tekenherkenning voor Europese talen
Herkenning van tekentype	Alfanumerieke tekens, speciale tekens van de herkende taal*4, symbolen
Herkenning van lettertype	Meerdere lettertypes worden ondersteund (Times, Century en Arial worden aanbevolen) Cursief type wordt herkend
Geconverteerd lettertype	-	Weergegeven in Calibli Cursief type kan niet worden geconverteerd

*1 Weergegeven taal in de talenlijst in [Andere Taal/Toetsenbord] in [Voorkeuren] (Instellingen/Registratie) kan afwijken.

*2 Als u Engels, Frans, Italiaans, Duits, Spaans, Thai of Vietnamees in [Andere Taal/Toetsenbord] in [Voorkeuren] (Instellingen/Registratie) selecteert, wordt de taal herkend als West-Europees (ISO).

*3 Elke taalgroep bestaat uit de volgende talen. Als u een taalgroep selecteert, wordt tekst die is geschreven in talen uit de taalgroep, herkend.

West-Europees (ISO):	Engels, Frans, Italiaans, Duits, Spaans, Nederlands, Portugees, Albanees, Catalaans, Deens, Fins, IJslands, Noors, Zweeds
Centraal-Europees (ISO):	Kroatisch, Tsjechisch, Hongaars, Pools, Slovaaks
Baltisch (ISO):	Ests, Lets, Litouws

*4 Als u Grieks selecteert, kunnen de volgende speciale tekens worden herkend. Als u andere talen selecteert, kunnen speciale tekens uit elke taal worden herkend. Sommige speciale tekens kunnen niet worden herkend, afhankelijk van de talen.

Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Bestandsindeling voor het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden

Als u een geschikte bestandsindeling voor OCR gebruikt, kunt u de nauwkeurigheid van het OCR-resultaat verbeteren.

Als OCR geen goed resultaat oplevert, controleer dan of de bestandsindeling van het gescande origineel geschikt is voor OCR.

BELANGRIJK
Wanneer u originelen gebruikt met een grote hoeveelheid tekst op de pagina's, werkt OCR wellicht niet goed. Wanneer u Word-indeling selecteert, werkt OCR wellicht niet goed, zelfs niet als u originelen in de aanbevolen bestandsindeling gebruikt. Afhankelijk van de achtergrondkleur, het tekenopmaakprofiel, de tekengrootte en de tekenhelling worden sommige tekens soms verkeerd vervangen of ontbreken ze in het OCR-resultaat. Alinea's, eindemarkeringen en tabellen in het origineel worden soms niet herkend. Een deel van een afbeelding, zoals grafieken, foto's of zegelstempels worden soms herkend en vervangen door tekst.

BELANGRIJK

Wanneer u originelen gebruikt met een grote hoeveelheid tekst op de pagina's, werkt OCR wellicht niet goed.

Wanneer u Word-indeling selecteert, werkt OCR wellicht niet goed, zelfs niet als u originelen in de aanbevolen bestandsindeling gebruikt.

Afhankelijk van de achtergrondkleur, het tekenopmaakprofiel, de tekengrootte en de tekenhelling worden sommige tekens soms verkeerd vervangen of ontbreken ze in het OCR-resultaat.

Alinea's, eindemarkeringen en tabellen in het origineel worden soms niet herkend.

Een deel van een afbeelding, zoals grafieken, foto's of zegelstempels worden soms herkend en vervangen door tekst.

Item	Details
Indeling van het origineel	Afgedrukte documenten, tekstdocumenten (een document dat bestaat uit tekst, figuren, afbeeldingen, tabellen en zonder tekenhelling)
Indeling van tekst	Horizontale tekst, verticale tekst Documenten met zowel horizontale als verticale tekst kunnen worden herkend. Alleen horizontale tekst kan worden herkend voor Europese talen en Koreaans. Document zonder complexe kolommen
Tekengrootte	8- tot 40-punts
Indeling van tabel (alleen voor Word-documenten)	Tabellen die aan de volgende voorwaarden voldoen Vierkante tabellen met ononderbroken strepen Het aantal rijen is 32 of minder Het aantal kolommen is 32 of minder