Om OCR (Sökbar text) inte fungerar tillfredsställande

I det här avsnittet beskrivs hur funktionen OCR (Sökbar text) fungerar för att skapa sökbar PDF/XPS/OOXML-filer och om passande filformat för funktionen OCR (Sökbar text).
Se följande anvisningar om du inte får rätt resultat av OCR (Optical Character Recognition).

Använda funktionen OCR (Sökbar text) för att skapa PDF/XPS/OOXML-filer med sökbar text

När du skapar PDF/XPS/OOXML-filer med sökbar text, varierar resultatet beroende på det aktuella filformat. Se tabellen nedan för mer information.
VIKTIGT!
Även om du utför OCR enligt språket som används i originalet varierar resultatet beroende på text och filformat för originalen.
Egenskap
Filformat
PDF/XPS/PowerPoint
Word
Igenkänningssspråk
Tecken har identifierats som något av följande språk eller språkgrupper i enlighet med ett språk som du angav i [Växla språk/tangentbord] i [Preferenser] (Inställningar/Registrering)*1 *2
Tryck på [Ändra] för att välja ett språk som används i original från följande språk eller språkgrupper. Tecken har identifierats i enligt det valda språket.
Asiatiska språk
Text i följande språk kan identifieras:
Japanska, kinesiska (förenklad), kinesiska (traditionell), koreanska
Europeiska språk
Text i följande språk eller språkgrupper kan identifieras
Språk
Engelska, franska, italienska, tyska, spanska, nederländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska, svenska, kroatiska, tjeckiska, ungerska, polska, slovakiska, estniska, lettiska, litauiska, ryska, grekiska, turkiska
Språkgrupper
Västeuropeiska (ISO), centraleuropeiska (ISO), baltiska (ISO) *3
Teckenigenkänning för asiatiska språk
Igenkänning av teckentyp
Japanska: Alfanumeriska tecken, kana-tecken, kanji-tecken (första nivån av JIS, andra nivån av JIS (delvis)), symboler
Kinesiska (förenklad): Alfanumeriska tecken, kinesiska tecken, symboler (GB2312-80)
Kinesisk (traditionell): Alfanumeriska tecken, kinesiska tecken, symboler (Big5)
Koreanska: Alfanumeriska tecken, kanji-tecken, koreanska hangul-tecken, symboler (KSC5601)
Igenkänning av teckensnitt
Flera teckensnitt stöds (ming-cho-typ rekommenderas)
Kursiv typ kan inte identifieras
Konverterade teckensnitt
-
Om japanska har valts:
Asiatisk text: MS Mincho
Europeisk text: Century
Om kinesiska (förenklad) har valts:
Asiatisk text: SimSun
Europeisk text: Calibri
Om kinesiska (traditionell) har valts:
Asiatisk text: PMingLiU
Europeisk text: Calibri
Teckenigenkänning för europeiska språk
Igenkänning av teckentyp
Alfanumeriska tecken, specialtecken för det identifierade språket*4, symboler
Igenkänning av teckensnitt
Flera teckensnitt stöds (Times, Century och Arial rekommenderas)
Kursiv typ kan kännas igen
Konverterade teckensnitt
-
Visas i Calibli
Kursiv typ inte kan konverteras
*1 Visat språk i språklista i [Växla språk/tangentbord] i [Preferenser] (Inställningar/Registrering) kan variera.
*2 Om du väljer engelska, franska, italienska, tyska, spanska, thailändska eller vietnamesiska i [Växla språk/tangentbord] i [Preferenser] (Inställningar/Registrering), identifieras språk som västeuropeiska (ISO).
*3 Varje språkgrupp består av följande språk. Om du väljer en språkgrupp, identifieras text för språket i den språkgruppen.
Västeuropeiska (ISO):
Engelska, franska, italienska, tyska, spanska, holländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska, svenska
Centraleuropeiska (ISO):
Kroatiska, tjeckiska, ungerska, polska, slovakiska
Baltiska (ISO):
Estniska, lettiska, litauiska
*4 Om du väljer grekiska, kan följande specialtecken identifieras. Om du väljer andra språk, kan specialtecken för varje språk identifieras. Vissa specialtecken kan inte identifieras, beroende på språk.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Filformat för att skapa sökbar text-filer i PDF/XPS/OOXML-format

Genom att använda ett lämpligt filformat för OCR, kan du förbättra noggrannheten för OCR-resultatet.
Om du inte får ett godtagbart OCR-resultat, kontrollera att filformatet för det scannade originalet är lämpligt för OCR.
VIKTIGT!
Om du använder original som innehåller en stor mängd text per sida, kan det hända att OCR inte fungerar korrekt.
Om du väljer Word-format, kan det hända att OCR inte fungerar korrekt även om du använder original i rekommenderat filformat.
Beroende på bakgrundsfärg, teckenformat, teckenstorlek och lutning kan vissa tecken ersättas fel eller saknas i OCR-resultatet.
Paragrafer, radbrytningar och tabeller i originalet kan inte identifieras.
Delar av bilder, t.ex. grafik, foton eller sigillavtryck kan identifieras och ersättas med text.
Egenskap
Detaljer
Originalformat
Utskrivna dokument, textdokument (ett dokument som består av text, siffror, bilder, tabeller och ingen lutning)
Textformat
Horisontell skrift, vertikal skrift
Dokument som innehåller både horisontell och vertikal skrift kan identifieras.
Bara horisontell skrift kan kännas igen för europeiska språk och koreanska.
Dokument utan att komplexa kolumner
Teckenstorlek
8 till 40 punkter
Filformat för tabeller
(endast för Word-dokument)
Tabeller som uppfyller följande villkor
Fyrkantig tabell med fasta linjer
Antalet rader är 32 eller lägre
Antalet kolumner 32 eller lägre
6Y5R-0SE