Als OCR (Doorzoekbare tekst) niet goed werkt

In dit gedeelte wordt toegelicht hoe de OCR (Doorzoekbare tekst)-functie werkt bij het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden, en over het juiste bestandsindeling voor de OCR (Doorzoekbare tekst)-functie.
Raadpleeg de volgende instructies als OCR (Optical Character Recognition) geen goede resultaten oplevert.

OCR (Doorzoekbare tekst)-functie voor het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden

Afhankelijk van de geselecteerde bestandsindeling verschilt het resultaat van OCR bij het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden. Raadpleeg onderstaande tabel voor meer informatie.
BELANGRIJK
Zelfs als u OCR uitvoert in de taal van het origineel, hoeft het resultaat niet altijd goed te zijn, afhankelijk van de tekst en het bestandsindeling van het origineel.
Item
Bestandsindeling
PDF/XPS/PowerPoint
Word
Herkenning van taal
Tekens worden herkend als een van de volgende talen of taalgroepen op grond van de taal die is geselecteerd in [Andere Taal/Toetsenbord] in [Voorkeuren] (Instellingen/Registratie)*1 *2
Druk op [Wijzigen] om een taal die wordt gebruikt in het origineel, uit de volgende talen of taalgroepen te selecteren. Tekens worden herkend op grond van de geselecteerde taal.
Aziatische talen
Tekst in de volgende talen wordt herkend:
Japans, Chinees (vereenvoudigd), Chinese (traditioneel), Koreaans
Europese talen
Tekst in de volgende talen of taalgroepen wordt herkend:
Talen
Engels, Frans, Italiaans, Duits, Spaans, Nederlands, Portugees, Albanees, Catalaans, Deens, Fins, IJslands, Noors, Zweeds, Kroatisch, Tsjechisch, Hongaars, Pools, Slovaaks, Ests, Lets, Litouws, Russisch, Grieks, Turks
Taalgroepen
West-Europees (ISO), Centraal-Europees (ISO), Baltisch (ISO) *3
Tekenherkenning voor Aziatische talen
Herkenning van tekentype
Japans: Alfanumerieke tekens, Kana-tekens, Kanji-tekens (JIS eerste niveau, JIS tweede niveau (deels)), symbolen
Chinees (vereenvoudigd): Alfanumerieke tekens, Chinese tekens, symbolen (GB2312-80)
Chinees (traditioneel): Alfanumerieke tekens, Chinese tekens, symbolen (Big5)
Koreaans: Alfanumerieke tekens, Kanji-tekens, Koreaanse Hangul-tekens, symbolen (KSC5601)
Herkenning van lettertype
Meerdere lettertypes worden ondersteund (Ming-cho-type wordt aanbevolen)
Cursief type wordt niet herkend
Geconverteerd lettertype
-
Wanneer Japans wordt geselecteerd:
Aziatische tekst: MS Mincho
Europese tekst: Century
Wanneer Chinees (vereenvoudigd) wordt geselecteerd:
Aziatische tekst: SimSun
Europese tekst: Calibri
Wanneer Chinees (traditioneel) wordt geselecteerd:
Aziatische tekst: PMingLiU
Europese tekst: Calibri
Tekenherkenning voor Europese talen
Herkenning van tekentype
Alfanumerieke tekens, speciale tekens van de herkende taal*4, symbolen
Herkenning van lettertype
Meerdere lettertypes worden ondersteund (Times, Century en Arial worden aanbevolen)
Cursief type wordt herkend
Geconverteerd lettertype
-
Weergegeven in Calibli
Cursief type kan niet worden geconverteerd
*1 Weergegeven taal in de talenlijst in [Andere Taal/Toetsenbord] in [Voorkeuren] (Instellingen/Registratie) kan afwijken.
*2 Als u Engels, Frans, Italiaans, Duits, Spaans, Thai of Vietnamees in [Andere Taal/Toetsenbord] in [Voorkeuren] (Instellingen/Registratie) selecteert, wordt de taal herkend als West-Europees (ISO).
*3 Elke taalgroep bestaat uit de volgende talen. Als u een taalgroep selecteert, wordt tekst die is geschreven in talen uit de taalgroep, herkend.
West-Europees (ISO):
Engels, Frans, Italiaans, Duits, Spaans, Nederlands, Portugees, Albanees, Catalaans, Deens, Fins, IJslands, Noors, Zweeds
Centraal-Europees (ISO):
Kroatisch, Tsjechisch, Hongaars, Pools, Slovaaks
Baltisch (ISO):
Ests, Lets, Litouws
*4 Als u Grieks selecteert, kunnen de volgende speciale tekens worden herkend. Als u andere talen selecteert, kunnen speciale tekens uit elke taal worden herkend. Sommige speciale tekens kunnen niet worden herkend, afhankelijk van de talen.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Bestandsindeling voor het maken van doorzoekbare PDF-/XPS-/OOXML-bestanden

Als u een geschikte bestandsindeling voor OCR gebruikt, kunt u de nauwkeurigheid van het OCR-resultaat verbeteren.
Als OCR geen goed resultaat oplevert, controleer dan of de bestandsindeling van het gescande origineel geschikt is voor OCR.
BELANGRIJK
Wanneer u originelen gebruikt met een grote hoeveelheid tekst op de pagina's, werkt OCR wellicht niet goed.
Wanneer u Word-indeling selecteert, werkt OCR wellicht niet goed, zelfs niet als u originelen in de aanbevolen bestandsindeling gebruikt.
Afhankelijk van de achtergrondkleur, het tekenopmaakprofiel, de tekengrootte en de tekenhelling worden sommige tekens soms verkeerd vervangen of ontbreken ze in het OCR-resultaat.
Alinea's, eindemarkeringen en tabellen in het origineel worden soms niet herkend.
Een deel van een afbeelding, zoals grafieken, foto's of zegelstempels worden soms herkend en vervangen door tekst.
Item
Details
Indeling van het origineel
Afgedrukte documenten, tekstdocumenten (een document dat bestaat uit tekst, figuren, afbeeldingen, tabellen en zonder tekenhelling)
Indeling van tekst
Horizontale tekst, verticale tekst
Documenten met zowel horizontale als verticale tekst kunnen worden herkend.
Alleen horizontale tekst kan worden herkend voor Europese talen en Koreaans.
Document zonder complexe kolommen
Tekengrootte
8- tot 40-punts
Indeling van tabel
(alleen voor Word-documenten)
Tabellen die aan de volgende voorwaarden voldoen
Vierkante tabellen met ononderbroken strepen
Het aantal rijen is 32 of minder
Het aantal kolommen is 32 of minder
6Y5H-0SE