Text wird nicht korrekt mit OCR verarbeitet

Bei der Erstellung einer durchsuchbaren Textdatei wird der Text möglicherweise nicht korrekt mit OCR verarbeitet. Prüfen Sie in diesem Fall, ob die Spracheinstellung für die OCR-Verarbeitung und das verwendete Original übereinstimmen.
Sie können die Spracheinstellung entsprechend dem Original ändern und die Verarbeitungsgenauigkeit verbessern, indem Sie ein Original mit einem Zeichentyp und einem Font verwenden, der vom Gerät erkannt wird, und ein Original verwenden, das für die OCR-Verarbeitung geeignet ist.
WICHTIG
Wenn die OCR-Verarbeitung auch bei geeigneter Spracheinstellung und Original nicht korrekt durchgeführt wird
Die Verarbeitungsgenauigkeit kann bei Originalen mit einer großen Textmenge pro Seite möglicherweise nicht verbessert werden.
Beachten Sie beim Erstellen einer OOXML-Datei im Word-Format Folgendes:
Je nach Hintergrundfarbe, Font, Schriftgröße, Kursivschrift und anderen Faktoren kann der Text durch unbeabsichtigte Zeichen ersetzt werden oder es können Zeichen fehlen.
Absätze, Zeilenumbrüche oder Tabellen werden nicht reproduziert.
Einige Bilder wie Diagramme, Fotos und Stempel können als Text erkannt und durch Text ersetzt werden.

Standard für Einstellungen und Sprachen bei der OCR-Verarbeitung

Standard-Spracheinstellungen für die Zeichenerkennung
Die bei der Einstellung der OCR-Verarbeitung ausgewählten Sprachen sind die Grundlage für die Zeichenerkennung. Erstellen einer textdurchsuchbaren Datei (OCR-Verarbeitung)
Erkennbare asiatische Sprachen
Japanisch, Chinesisch (vereinfacht), Chinesisch (traditionell), Koreanisch
* Informationen zu den Zeichentypen und Fonts finden Sie wie folgt:
Erkennbare europäische Sprachen und Sprachengruppen
Sprachen
Englisch, Französisch, Italienisch, Deutsch, Spanisch, Niederländisch, Portugiesisch, Albanisch, Katalanisch, Dänisch, Finnisch, Isländisch, Norwegisch, Schwedisch, Kroatisch, Tschechisch, Ungarisch, Polnisch, Slowakisch, Estnisch, Lettisch, Litauisch, Russisch, Griechisch, Türkisch, Slowenisch*1, Rumänisch*1, Bulgarisch*1, Hebräisch*1
Sprachgruppen
Westeuropäisch (ISO)*2, Zentraleuropäisch (ISO)*3, Baltisch (ISO)*4
* Informationen zu den Zeichentypen und Fonts finden Sie wie folgt:
*1Kann nur mit [OCR (Präzision Vorrang geben)] ausgewählt werden.
*2Enthält Englisch, Französisch, Italienisch, Deutsch, Spanisch, Niederländisch, Portugiesisch, Albanisch, Katalanisch, Dänisch, Finnisch, Isländisch, Norwegisch und Schwedisch.
*3Enthält Englisch, Kroatisch, Tschechisch, Ungarisch, Polnisch und Slowakisch.
*4Enthält Englisch, Estnisch, Lettisch und Litauisch.

Erkennbare Zeichentypen und Fonts (asiatische Sprachen)

Erkennbare Zeichentypen
Japanisch
Alphabet, Zahlen, Kanji*1, Symbole, Hiragana und Katakana
Chinesisch (vereinfacht)
GB2312-80 (Alphabet, Nummern, Kanji und Symbole)
Chinesisch (traditionell)
Big5 (Alphabet, Nummern, Kanji und Symbole)
Koreanisch
KSC5601 (Alphabet, Nummern, Kanji, Symbole und Hangul)
Erkennbare Fonts
Unterstützung mehrerer Fonts (empfohlen: Mincho)
* Kursiv gedruckte Zeichen können nicht erkannt werden.
Erkennbare Fontgrößen
8 pt. bis 48 pt.
Nach der OCR-Verarbeitung verwendete Fonts*2
Japanisch
Asiatische Schriftzeichen: MS Mincho
Europäische Schriftzeichen: Century
Chinesisch (vereinfacht)
Asiatische Schriftzeichen: SimSun
Europäische Schriftzeichen: Calibri
Chinesisch (traditionell)
Asiatische Schriftzeichen: PMingLiU
Europäische Schriftzeichen: Calibri
Koreanisch
Asiatische Schriftzeichen: Malgun Gothic
Europäische Schriftzeichen: Calibri
*1Alle JIS-1-Standard-Kanji und einige JIS-2-Standard-Kanji
*2Nur beim Erstellen einer OOXML-Datei im Word-Format

Erkennbare Zeichentypen und Fonts (europäische Sprachen)

Erkennbare Zeichentypen
Alphabet, Zeichen, die nur in der Erkennungssprache vorkommen*1, Nummern, Symbole
Erkennbare Fonts
Unterstützung mehrerer Fonts (Empfohlen: Times, Century, Arial)*2
* Kursiv gedruckte Zeichen können erkannt werden.
Erkennbare Fontgrößen
6 pt. bis 72 pt.
Nach der OCR-Verarbeitung verwendete Fonts*3
Calibri
* Kursivschrift kann nicht reproduziert werden.
*1Je nach Sprache werden einige eindeutige Zeichen möglicherweise nicht erkannt.
*2Die Fonts Arial, Times New Roman und Courier New können mit [OCR (Präzision Vorrang geben)] erkannt werden.
*3Nur beim Erstellen einer OOXML-Datei im Word-Format

Für die OCR-Verarbeitung geeignete Originale

Sie können die Genauigkeit der OCR-Verarbeitung verbessern, indem Sie ein für die OCR-Verarbeitung geeignetes Original verwenden.
Dateiformat des Originals
Gedruckte Dokumente und Textverarbeitungsdokumente
Originale, die aus Text, Diagrammen, Fotos und/oder Tabellen bestehen und nicht schräg sind
Textformat
Horizontale und vertikale Schrift (Dokumente mit sowohl horizontaler als auch vertikaler Schrift können ebenfalls erkannt werden)*1
Dokumente mit einer bis drei Spalten und ohne komplexe Feinheiten
Fontgröße
8 pt. bis 40 pt.
Tabellenformat*2
Tabellen, die folgenden Bedingungen entsprechen:
Rechteckiges Format, bestehend aus durchgehenden Randlinien
Maximal 32 Spalten
Maximal 32 Zeilen
*1Nur bei den europäischen Sprachen und dem Koreanischen ist eine horizontale Schrift erkennbar.
*2Nur beim Erstellen einer OOXML-Datei im Word-Format
CYSJ-084