Texten är inte OCR-bearbetad korrekt

Texten kanske inte OCR-bearbetas korrekt när du skapar en textsökbar fil. Kontrollera i så fall om språkinställningen för OCR-bearbetningen och originalet som används är lämpliga.
Du kan ändra språkinställningen enligt originalet och förbättra bearbetningsnoggrannheten genom att använda ett original med en teckentyp och teckensnitt som känns igen av maskinen och använda ett original som lämpar sig för OCR-bearbetning.
VIKTIGT!
När OCR-bearbetning inte utförs korrekt även med en lämplig språkinställning och original
Bearbetningsnoggrannheten kanske inte kan förbättras för original med en stor volym text per sida.
Observera följande när du skapar en OOXML-fil i Word-format:
Texten kan ersättas med oavsiktliga tecken eller så kan tecken saknas beroende på bakgrundsfärg, teckensnitt, teckenstorlek, kursivering och andra faktorer.
Stycken, radbrytningar och tabeller återges inte.
Vissa bilder, t.ex. diagram, foton och sigill, kan uppfattas som text och ersättas med text.

Inställningar och språkstandard för OCR-bearbetning

Standardspråkinställningar för teckenigenkänning
De språk som väljs vid inställning av OCR-bearbetning är grunden för teckenigenkänning. Skapa en textsökbar fil (OCR-bearbetning)
Asiatiska språk som kan kännas igen
Japanska, kinesiska (förenklad), kinesiska (traditionell), koreanska
* För teckentyper och teckensnitt, se följande:
Europeiska språk och språkgrupper som kan kännas igen
Språk
Engelska, franska, italienska, tyska, spanska, nederländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska, svenska, kroatiska, tjeckiska, ungerska, polska, slovakiska, estniska, lettiska, litauiska, ryska, grekiska, turkiska, slovenska*1, rumänska*1, bulgariska*1, hebreiska*1
Språkgrupper
Västeuropeiska (ISO)*2, Centraleuropeiska (ISO)*3, Baltiska (ISO)*4
* För teckentyper och teckensnitt, se följande:
*1Kan endast väljas med [OCR (Prioritera precision)].
*2Inkluderar engelska, franska, italienska, tyska, spanska, nederländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska och svenska.
*3Inkluderar engelska, kroatiska, tjeckiska, ungerska, polska och slovakiska.
*4Inkluderar engelska, estniska, lettiska och litauiska.

Teckentyper och teckensnitt som kan kännas igen (asiatiska språk)

Teckentyper som kan kännas igen
Japanese
Bokstäver, siffror, kanji*1, symboler, hiragana och katakana
Kinesiska (förenklad)
GB2312-80 (bokstäver, siffror, kanji och symboler)
Kinesisk (traditionell)
Big5 (bokstäver, siffror, kanji och symboler)
Koreanska
KSC5601 (bokstäver, siffror, kanji, symboler och hangul)
Teckensnitt som kan kännas igen
Stöd för flera teckensnitt (rekommenderas: Mincho)
* Kursiverade tecken kan inte identifieras.
Igenkännbara teckenstorlekar
8 pt. till 48 pt.
Teckensnitt som används efter OCR-bearbetning*2
Japanese
Asiatiska karaktärer: MS Mincho
Europeiska karaktärer: Century
Kinesiska (förenklad)
Asiatiska karaktärer: SimSun
Europeiska karaktärer: Calibri
Kinesisk (traditionell)
Asiatiska karaktärer: PMingLiU
Europeiska karaktärer: Calibri
Koreanska
Asiatiska karaktärer: Malgun Gothic
Europeiska karaktärer: Calibri
*1Alla JIS 1 standard kanji och vissa JIS 2 standard kanji
*2Endast när du skapar en OOXML-fil i Word-format

Teckentyper och teckensnitt som kan kännas igen (europeiska språk)

Teckentyper som kan kännas igen
Bokstäver, tecken som är unika för igenkänningsspråket*1, siffror, symboler
Teckensnitt som kan kännas igen
Stöd för flera teckensnitt (rekommenderas: Times, Century, Arial)*2
* Kursiverade tecken kan identifieras.
Igenkännbara teckenstorlekar
6 pt. till 72 pt.
Teckensnitt som används efter OCR-bearbetning*3
Calibri
* Kursiv stil kan inte återges.
*1Beroende på språk kan det hända att vissa unika tecken inte känns igen.
*2Teckensnitten Arial, Times New Roman och Courier New kan kännas igen med [OCR (Prioritera precision)].
*3Endast när du skapar en OOXML-fil i Word-format

Original som lämpar sig för OCR-bearbetning

Du kan förbättra OCR-bearbetningsnoggrannheten genom att använda ett original som är lämpligt för OCR-bearbetning.
Originalets filformat
Tryckta dokument och ordbehandlingsdokument
Original består av text, diagram, foton och/eller tabeller och är inte sneda
Textformat
Horisontell eller vertikal skrift (dokument med både horisontell och vertikal skrift kan också identifieras)*1
Dokument med en till tre kolumner och utan komplexa krångligheter
Teckenstorlek
8 pt. till 40 pt.
Tabellformat*2
Tabeller som uppfyller följande villkor:
Rektangulärt format bestående av heldragna kantlinjer
32 kolumner eller färre
32 rader eller färre
*1Endast horisontell skrift är igenkännlig för europeiska språk och koreanska.
*2Endast när du skapar en OOXML-fil i Word-format
E9E3-088