Hvis OCR (søgbar tekst) ikke udføres korrekt

Dette afsnit beskriver, hvordan OCR-funktionen (søgbar tekst) virker, når der oprettes søgbare PDF/XPS/OOXML-filer, og om det relevante filformat for OCR-funktionen (søgbar tekst).
Se følgende instruktioner, hvis du ikke kan få de rigtige resultater med OCR (optisk tegngenkendelse).

Funktionen OCR (søgbar tekst) til oprettelse af søgbare PDF/XPS/OOXML-filer

Ved oprettelse af søgbare PDF/XPS/OOXML-filer varierer OCR-ydelsen, det afhænger af det valgte filformat. Se tabellen herunder for detaljer.
VIGTIGT!
Selvom du udfører OCR efter et sprog, der bruges i originaldokumenterne, kan du muligvis ikke få det rigtige resultat, afhængigt af teksten og originalernes filformat.
Element
Filformat
PDF/XPS/PowerPoint
Word
Genkendelsessprog
Tegnene genkendes som et af følgende sprog eller en af følgende sproggrupper, alt efter hvilket sprog der er valgt i [Skift Sprog/tastaturskift] i [Præferencer] (Indstillinger/Registrering)*1 *2
Tryk på [Skift] for at vælge et sprog, der anvendes i originalerne, blandt følgende sprog eller sproggrupper. Tegnene genkendes i overensstemmelse med det valgte sprog.
Asiatiske sprog
Tekst på følgende sprog genkendes:
japansk, kinesisk (forenklet), kinesisk (traditionelt), koreansk
Europæiske sprog
Tekst på følgende sprog eller fra følgendes sproggrupper genkendes
Sprog
Engelsk, fransk, italiensk, tysk, spansk, hollandsk, portugisisk, albansk, catalansk, dansk, finsk, islandsk, norsk, svensk, kroatisk, tjekkisk, ungarsk, polsk, slovakisk, estisk, litauisk, russisk, græsk, tyrkisk
Sproggrupper
Vesteuropæisk (ISO), centraleuropæisk (ISO), baltisk (ISO) *3
Tegngenkendelse for asiatiske sprog
Tegngenkendelsestype
Japansk: alfanumeriske tegn, Kana-tegn, Kanji-tegn (JIS første niveau, JIS andet niveau (delvist)), symboler
Kinesisk (forenklet): Alfanumeriske tegn, kinesiske tegn, symboler (GB2312-80)
Kinesisk (traditionelt): Alfanumeriske tegn, kinesiske tegn, symboler (Big5)
Koreansk: Alfanumeriske tegn, Kanji-tegn, koreanske Hangul-tegn, symboler (KSC5601)
Genkendelsesskrifttype
Understøttelse af flere skrifttyper (Ming-cho-typen anbefales)
Kursiv kan ikke genkendes
Konverteret skrifttype
-
Hvis du vælger japansk:
Asiatisk tekst: MS Mincho
Europæisk tekst: Century
Hvis du vælger kinesisk (forenklet):
Asiatisk tekst: SimSun
Europæisk tekst: Calibri
Hvis du vælger kinesisk (traditionelt):
Asiatisk tekst: PMingLiU
Europæisk tekst: Calibri
Tegngenkendelse for europæiske sprog
Tegngenkendelsestype
alfanumeriske tegn, specialtegn i det genkendte sprog*4, symboler
Genkendelsesskrifttype
Understøttelse af flere skrifttyper (Times, Century og Arial anbefales)
Kursiv kan genkendes
Konverteret skrifttype
-
Vist med Calibri
Kursiv skrift kan ikke konverteres
*1 Vist sprog på sproglisten i [Skift Sprog/tastaturskift] i [Præferencer] (Indstillinger/Registrering) kan variere.
*2 Hvis du vælger engelsk, fransk, italiensk, tysk, spansk, thai eller vietnamesisk i [Skift Sprog/tastaturskift] i [Præferencer] (Indstillinger/Registrering), genkendes sproget som vesteuropæisk (ISO).
*3 Hver sproggruppe består af følgende sprog. Hvis du vælger en sproggruppe, genkendes tekst, der er skrevet på sprogene i sproggruppen.
Vesteuropæisk (ISO):
engelsk, fransk, italiensk, tysk, spansk, hollandsk, portugisisk, albansk, catalansk, dansk, finsk, islandsk, norsk, svensk
Centraleuropæisk (ISO):
kroatisk, tjekkisk, ungarsk, polsk, slovakisk
Baltisk (ISO):
estisk, lettisk, litauisk
*4 Hvis du vælger græsk, kan følgende specialtegn genkendes. Hvis du vælger andre sprog, kan der genkendes specialtegn for hvert sprog. Visse specialtegn kan ikke genkendes, afhængigt af sprogene.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Filformat til oprettelse af søgbare PDF/XPS/OOXML-filer

Hvis du bruger et korrekt filformat til OCR, kan du forbedre nøjagtigheden af OCR-resultatet.
Hvis du ikke kan få et korrekt OCR-resultat, skal du bekræfte, at filformatet for den scannede original er korrekt til OCR.
VIGTIGT!
Hvis du bruger originaler, der indeholder en stor mængde tekst pr. side, kan OCR muligvis ikke udføres korrekt.
Når du vælger Word-format, udføres OCR måske ikke korrekt, heller ikke hvis du anvender originaler i det anbefalede filformat.
Afhængigt af baggrundsfarven, skriftsnittet, tegnstørrelsen og tegnenes hældning erstattes nogle tegn måske fejlagtigt, eller de kan mangle i OCR-resultatet.
Afsnit, linjeskift og tabeller i originalerne genkendes muligvis ikke.
En del af et billede, som f.eks. grafik, fotos eller prægning, kan blive genkendt og erstattet med tekst.
Element
Detaljer
Originalformat
Udskrevne dokumenter, tekstdokumenter (et dokument, der består af tekst, figurere, billeder, tabeller og ingen tegnhældning)
Format af tekst
Skrevet vandret, skrevet lodret
Dokumenter, der både indeholder tekst, der er skrevet vandret og lodret, kan genkendes.
For europæiske sprog og koreansk er det kun muligt at genkende vandret skrift.
Dokument uden komplekse kolonner
Tegnstørrelse
8 til 40 punkt
Tabelformat
(kun for Word-dokumenter)
Tabeller, der opfylder følgende betingelser
Firkantede tabeller med kraftige streger
Rækkeantallet er 32 eller mindre
Kolonneantallet er 32 eller mindre
6Y5E-0SE