Om OCR (Sökbar text) inte fungerar tillfredsställande

I det här avsnittet beskrivs hur funktionen OCR (Sökbar text) fungerar för att skapa sökbar PDF/XPS/OOXML-filer och om passande filformat för funktionen OCR (Sökbar text).

Se följande anvisningar om du inte får rätt resultat av OCR (Optical Character Recognition).

Använda funktionen OCR (Sökbar text) för att skapa PDF/XPS/OOXML-filer med sökbar text

Filformat för att skapa sökbar text-filer i PDF/XPS/OOXML-format

Använda funktionen OCR (Sökbar text) för att skapa PDF/XPS/OOXML-filer med sökbar text

När du skapar PDF/XPS/OOXML-filer med sökbar text, varierar resultatet beroende på det aktuella filformat. Se tabellen nedan för mer information.

VIKTIGT!
Även om du utför OCR enligt språket som används i originalet varierar resultatet beroende på text och filformat för originalen.

Egenskap	Filformat
Egenskap	PDF/XPS/PowerPoint	Word
Igenkänningssspråk	Tecken har identifierats som något av följande språk eller språkgrupper i enlighet med ett språk som du angav i [Växla språk/tangentbord] i [Preferenser] (Inställningar/Registrering)1 2	Tryck på [Ändra] för att välja ett språk som används i original från följande språk eller språkgrupper. Tecken har identifierats i enligt det valda språket.
Asiatiska språk	Text i följande språk kan identifieras: Japanska, kinesiska (förenklad), kinesiska (traditionell), koreanska
Europeiska språk	Text i följande språk eller språkgrupper kan identifieras Språk Engelska, franska, italienska, tyska, spanska, nederländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska, svenska, kroatiska, tjeckiska, ungerska, polska, slovakiska, estniska, lettiska, litauiska, ryska, grekiska, turkiska Språkgrupper Västeuropeiska (ISO), centraleuropeiska (ISO), baltiska (ISO) *3
Teckenigenkänning för asiatiska språk
Igenkänning av teckentyp	Japanska: Alfanumeriska tecken, kana-tecken, kanji-tecken (första nivån av JIS, andra nivån av JIS (delvis)), symboler Kinesiska (förenklad): Alfanumeriska tecken, kinesiska tecken, symboler (GB2312-80) Kinesisk (traditionell): Alfanumeriska tecken, kinesiska tecken, symboler (Big5) Koreanska: Alfanumeriska tecken, kanji-tecken, koreanska hangul-tecken, symboler (KSC5601)
Igenkänning av teckensnitt	Flera teckensnitt stöds (ming-cho-typ rekommenderas) Kursiv typ kan inte identifieras
Konverterade teckensnitt	-	Om japanska har valts: Asiatisk text: MS Mincho Europeisk text: Century Om kinesiska (förenklad) har valts: Asiatisk text: SimSun Europeisk text: Calibri Om kinesiska (traditionell) har valts: Asiatisk text: PMingLiU Europeisk text: Calibri
Teckenigenkänning för europeiska språk
Igenkänning av teckentyp	Alfanumeriska tecken, specialtecken för det identifierade språket*4, symboler
Igenkänning av teckensnitt	Flera teckensnitt stöds (Times, Century och Arial rekommenderas) Kursiv typ kan kännas igen
Konverterade teckensnitt	-	Visas i Calibli Kursiv typ inte kan konverteras

*1 Visat språk i språklista i [Växla språk/tangentbord] i [Preferenser] (Inställningar/Registrering) kan variera.

*2 Om du väljer engelska, franska, italienska, tyska, spanska, thailändska eller vietnamesiska i [Växla språk/tangentbord] i [Preferenser] (Inställningar/Registrering), identifieras språk som västeuropeiska (ISO).

*3 Varje språkgrupp består av följande språk. Om du väljer en språkgrupp, identifieras text för språket i den språkgruppen.

Västeuropeiska (ISO):	Engelska, franska, italienska, tyska, spanska, holländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska, svenska
Centraleuropeiska (ISO):	Kroatiska, tjeckiska, ungerska, polska, slovakiska
Baltiska (ISO):	Estniska, lettiska, litauiska

*4 Om du väljer grekiska, kan följande specialtecken identifieras. Om du väljer andra språk, kan specialtecken för varje språk identifieras. Vissa specialtecken kan inte identifieras, beroende på språk.

Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Filformat för att skapa sökbar text-filer i PDF/XPS/OOXML-format

Genom att använda ett lämpligt filformat för OCR, kan du förbättra noggrannheten för OCR-resultatet.

Om du inte får ett godtagbart OCR-resultat, kontrollera att filformatet för det scannade originalet är lämpligt för OCR.

VIKTIGT!
Om du använder original som innehåller en stor mängd text per sida, kan det hända att OCR inte fungerar korrekt. Om du väljer Word-format, kan det hända att OCR inte fungerar korrekt även om du använder original i rekommenderat filformat. Beroende på bakgrundsfärg, teckenformat, teckenstorlek och lutning kan vissa tecken ersättas fel eller saknas i OCR-resultatet. Paragrafer, radbrytningar och tabeller i originalet kan inte identifieras. Delar av bilder, t.ex. grafik, foton eller sigillavtryck kan identifieras och ersättas med text.

VIKTIGT!

Om du använder original som innehåller en stor mängd text per sida, kan det hända att OCR inte fungerar korrekt.

Om du väljer Word-format, kan det hända att OCR inte fungerar korrekt även om du använder original i rekommenderat filformat.

Beroende på bakgrundsfärg, teckenformat, teckenstorlek och lutning kan vissa tecken ersättas fel eller saknas i OCR-resultatet.

Paragrafer, radbrytningar och tabeller i originalet kan inte identifieras.

Delar av bilder, t.ex. grafik, foton eller sigillavtryck kan identifieras och ersättas med text.

Egenskap	Detaljer
Originalformat	Utskrivna dokument, textdokument (ett dokument som består av text, siffror, bilder, tabeller och ingen lutning)
Textformat	Horisontell skrift, vertikal skrift Dokument som innehåller både horisontell och vertikal skrift kan identifieras. Bara horisontell skrift kan kännas igen för europeiska språk och koreanska. Dokument utan att komplexa kolumner
Teckenstorlek	8 till 40 punkter
Filformat för tabeller (endast för Word-dokument)	Tabeller som uppfyller följande villkor Fyrkantig tabell med fasta linjer Antalet rader är 32 eller lägre Antalet kolumner 32 eller lägre