|
Standardspråkinställningar för teckenigenkänning
|
De språk som väljs vid inställning av OCR-bearbetning är grunden för teckenigenkänning. Skapa en textsökbar fil (OCR-bearbetning)
|
|
Asiatiska språk som kan kännas igen
|
Japanska, kinesiska (förenklad), kinesiska (traditionell), koreanska
* För teckentyper och teckensnitt, se följande:
|
|
Europeiska språk och språkgrupper som kan kännas igen
|
Språk
Engelska, franska, italienska, tyska, spanska, nederländska, portugisiska, albanska, katalanska, danska, finska, isländska, norska, svenska, kroatiska, tjeckiska, ungerska, polska, slovakiska, estniska, lettiska, litauiska, ryska, grekiska, turkiska, slovenska*1, rumänska*1, bulgariska*1, hebreiska*1
Språkgrupper
Västeuropeiska (ISO)*2, Centraleuropeiska (ISO)*3, Baltiska (ISO)*4
* För teckentyper och teckensnitt, se följande:
|
|
Teckentyper som kan kännas igen
|
Japanese
Bokstäver, siffror, kanji*1, symboler, hiragana och katakana
Kinesiska (förenklad)
GB2312-80 (bokstäver, siffror, kanji och symboler)
Kinesisk (traditionell)
Big5 (bokstäver, siffror, kanji och symboler)
Koreanska
KSC5601 (bokstäver, siffror, kanji, symboler och hangul)
|
|
Teckensnitt som kan kännas igen
|
Stöd för flera teckensnitt (rekommenderas: Mincho)
* Kursiverade tecken kan inte identifieras.
|
|
Igenkännbara teckenstorlekar
|
8 pt. till 48 pt.
|
|
Teckensnitt som används efter OCR-bearbetning*2
|
Japanese
Asiatiska karaktärer: MS Mincho
Europeiska karaktärer: Century
Kinesiska (förenklad)
Asiatiska karaktärer: SimSun
Europeiska karaktärer: Calibri
Kinesisk (traditionell)
Asiatiska karaktärer: PMingLiU
Europeiska karaktärer: Calibri
Koreanska
Asiatiska karaktärer: Malgun Gothic
Europeiska karaktärer: Calibri
|
|
Teckentyper som kan kännas igen
|
Bokstäver, tecken som är unika för igenkänningsspråket*1, siffror, symboler
|
|
Teckensnitt som kan kännas igen
|
Stöd för flera teckensnitt (rekommenderas: Times, Century, Arial)*2
* Kursiverade tecken kan identifieras.
|
|
Igenkännbara teckenstorlekar
|
6 pt. till 72 pt.
|
|
Teckensnitt som används efter OCR-bearbetning*3
|
Calibri
* Kursiv stil kan inte återges.
|
|
Originalets filformat
|
Tryckta dokument och ordbehandlingsdokument
Original består av text, diagram, foton och/eller tabeller och är inte sneda
|
|
Textformat
|
Horisontell eller vertikal skrift (dokument med både horisontell och vertikal skrift kan också identifieras)*1
Dokument med en till tre kolumner och utan komplexa krångligheter
|
|
Teckenstorlek
|
8 pt. till 40 pt.
|
|
Tabellformat*2
|
Tabeller som uppfyller följande villkor:
Rektangulärt format bestående av heldragna kantlinjer
32 kolumner eller färre
32 rader eller färre
|