Hvis OCR (søgbar tekst) ikke udføres korrekt

Dette afsnit beskriver, hvordan OCR-funktionen (søgbar tekst) virker, når der oprettes søgbare PDF/XPS/OOXML-filer, og om det relevante filformat for OCR-funktionen (søgbar tekst).

Se følgende instruktioner, hvis du ikke kan få de rigtige resultater med OCR (optisk tegngenkendelse).

Funktionen OCR (søgbar tekst) til oprettelse af søgbare PDF/XPS/OOXML-filer

Filformat til oprettelse af søgbare PDF/XPS/OOXML-filer

Funktionen OCR (søgbar tekst) til oprettelse af søgbare PDF/XPS/OOXML-filer

Ved oprettelse af søgbare PDF/XPS/OOXML-filer varierer OCR-ydelsen, det afhænger af det valgte filformat. Se tabellen herunder for detaljer.

VIGTIGT!
Selvom du udfører OCR efter et sprog, der bruges i originaldokumenterne, kan du muligvis ikke få det rigtige resultat, afhængigt af teksten og originalernes filformat.

Element	Filformat
Element	PDF/XPS/PowerPoint	Word
Genkendelsessprog	Tegnene genkendes som et af følgende sprog eller en af følgende sproggrupper, alt efter hvilket sprog der er valgt i [Skift Sprog/tastaturskift] i [Præferencer] (Indstillinger/Registrering)1 2	Tryk på [Skift] for at vælge et sprog, der anvendes i originalerne, blandt følgende sprog eller sproggrupper. Tegnene genkendes i overensstemmelse med det valgte sprog.
Asiatiske sprog	Tekst på følgende sprog genkendes: japansk, kinesisk (forenklet), kinesisk (traditionelt), koreansk
Europæiske sprog	Tekst på følgende sprog eller fra følgendes sproggrupper genkendes Sprog Engelsk, fransk, italiensk, tysk, spansk, hollandsk, portugisisk, albansk, catalansk, dansk, finsk, islandsk, norsk, svensk, kroatisk, tjekkisk, ungarsk, polsk, slovakisk, estisk, litauisk, russisk, græsk, tyrkisk Sproggrupper Vesteuropæisk (ISO), centraleuropæisk (ISO), baltisk (ISO) *3
Tegngenkendelse for asiatiske sprog
Tegngenkendelsestype	Japansk: alfanumeriske tegn, Kana-tegn, Kanji-tegn (JIS første niveau, JIS andet niveau (delvist)), symboler Kinesisk (forenklet): Alfanumeriske tegn, kinesiske tegn, symboler (GB2312-80) Kinesisk (traditionelt): Alfanumeriske tegn, kinesiske tegn, symboler (Big5) Koreansk: Alfanumeriske tegn, Kanji-tegn, koreanske Hangul-tegn, symboler (KSC5601)
Genkendelsesskrifttype	Understøttelse af flere skrifttyper (Ming-cho-typen anbefales) Kursiv kan ikke genkendes
Konverteret skrifttype	-	Hvis du vælger japansk: Asiatisk tekst: MS Mincho Europæisk tekst: Century Hvis du vælger kinesisk (forenklet): Asiatisk tekst: SimSun Europæisk tekst: Calibri Hvis du vælger kinesisk (traditionelt): Asiatisk tekst: PMingLiU Europæisk tekst: Calibri
Tegngenkendelse for europæiske sprog
Tegngenkendelsestype	alfanumeriske tegn, specialtegn i det genkendte sprog*4, symboler
Genkendelsesskrifttype	Understøttelse af flere skrifttyper (Times, Century og Arial anbefales) Kursiv kan genkendes
Konverteret skrifttype	-	Vist med Calibri Kursiv skrift kan ikke konverteres

*1 Vist sprog på sproglisten i [Skift Sprog/tastaturskift] i [Præferencer] (Indstillinger/Registrering) kan variere.

*2 Hvis du vælger engelsk, fransk, italiensk, tysk, spansk, thai eller vietnamesisk i [Skift Sprog/tastaturskift] i [Præferencer] (Indstillinger/Registrering), genkendes sproget som vesteuropæisk (ISO).

*3 Hver sproggruppe består af følgende sprog. Hvis du vælger en sproggruppe, genkendes tekst, der er skrevet på sprogene i sproggruppen.

Vesteuropæisk (ISO):	engelsk, fransk, italiensk, tysk, spansk, hollandsk, portugisisk, albansk, catalansk, dansk, finsk, islandsk, norsk, svensk
Centraleuropæisk (ISO):	kroatisk, tjekkisk, ungarsk, polsk, slovakisk
Baltisk (ISO):	estisk, lettisk, litauisk

*4 Hvis du vælger græsk, kan følgende specialtegn genkendes. Hvis du vælger andre sprog, kan der genkendes specialtegn for hvert sprog. Visse specialtegn kan ikke genkendes, afhængigt af sprogene.

Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Filformat til oprettelse af søgbare PDF/XPS/OOXML-filer

Hvis du bruger et korrekt filformat til OCR, kan du forbedre nøjagtigheden af OCR-resultatet.

Hvis du ikke kan få et korrekt OCR-resultat, skal du bekræfte, at filformatet for den scannede original er korrekt til OCR.

VIGTIGT!
Hvis du bruger originaler, der indeholder en stor mængde tekst pr. side, kan OCR muligvis ikke udføres korrekt. Når du vælger Word-format, udføres OCR måske ikke korrekt, heller ikke hvis du anvender originaler i det anbefalede filformat. Afhængigt af baggrundsfarven, skriftsnittet, tegnstørrelsen og tegnenes hældning erstattes nogle tegn måske fejlagtigt, eller de kan mangle i OCR-resultatet. Afsnit, linjeskift og tabeller i originalerne genkendes muligvis ikke. En del af et billede, som f.eks. grafik, fotos eller prægning, kan blive genkendt og erstattet med tekst.

VIGTIGT!

Hvis du bruger originaler, der indeholder en stor mængde tekst pr. side, kan OCR muligvis ikke udføres korrekt.

Når du vælger Word-format, udføres OCR måske ikke korrekt, heller ikke hvis du anvender originaler i det anbefalede filformat.

Afhængigt af baggrundsfarven, skriftsnittet, tegnstørrelsen og tegnenes hældning erstattes nogle tegn måske fejlagtigt, eller de kan mangle i OCR-resultatet.

Afsnit, linjeskift og tabeller i originalerne genkendes muligvis ikke.

En del af et billede, som f.eks. grafik, fotos eller prægning, kan blive genkendt og erstattet med tekst.

Element	Detaljer
Originalformat	Udskrevne dokumenter, tekstdokumenter (et dokument, der består af tekst, figurere, billeder, tabeller og ingen tegnhældning)
Format af tekst	Skrevet vandret, skrevet lodret Dokumenter, der både indeholder tekst, der er skrevet vandret og lodret, kan genkendes. For europæiske sprog og koreansk er det kun muligt at genkende vandret skrift. Dokument uden komplekse kolonner
Tegnstørrelse	8 til 40 punkt
Tabelformat (kun for Word-dokumenter)	Tabeller, der opfylder følgende betingelser Firkantede tabeller med kraftige streger Rækkeantallet er 32 eller mindre Kolonneantallet er 32 eller mindre