Jeżeli funkcja OCR (wyszukiwalny tekst) nie działa prawidłowo

W tym rozdziale opisano sposób działania funkcji OCR (wyszukiwalny tekst) podczas tworzenia wyszukiwalnego pliku PDF/XPS/OOXML, oraz odpowiedni format pliku dla funkcji OCR (wyszukiwalny tekst).
Zapoznaj się z poniższymi instrukcjami jeżeli nie potrafisz utworzyć prawidłowego pliku OCR (optyczne rozpoznawanie znaków).

Funkcja OCR (wyszukiwalny tekst) umożliwiająca tworzenie przeszukiwalnych plików PDF/XPS/OOXML

Podczas tworzenia przeszukiwalnych plików PDF/XPS/OOXML, efektywność funkcji OCR różni się, w zależności od wybranego formatu plików. Patrz poniższa tabela, aby uzyskać więcej informacji.
WAŻNE
Nawet jeśli przeprowadzisz OCR zgodnie z językiem oryginału, możesz nie uzyskać zadowalających wyników, w zależności od tekstu i formatu pliku oryginału.
Element
Format pliku
PDF/XPS/PowerPoint
Word
Rozpoznawany język
Znaki są rozpoznawane zgodnie z poniższymi językami lub grupą językową, zgodnie z językiem wybranym w [Przełączanie Języka/Klawiatury] w [Właściwości] (Ustawienia/rejestrowanie)*1 *2
Naciśnij na [Zmień], aby wybrać język oryginałów z poniższych języków lub grup językowych. Znaki są rozpoznawane zgodnie z wybranym językiem.
Języki azjatyckie
Tekst napisany w poniższych językach jest rozpoznawany:
Japoński, chiński (uproszczony), chiński (tradycyjny), koreański
Języki europejskie
Tekst napisany w poniższych językach lub grupie językowej jest rozpoznawany:
Języki
Angielski, francuski, włoski, niemiecki, hiszpański, holenderski, portugalski, albański, duński, fiński, islandzki, norweski, szwedzki, chorwacki, czeski, węgierski, polski, słowacki, estoński, łotewski, litewski, rosyjski, grecki, turecki
Grupy językowe
Zachodnioeuropejska (ISO), środkowoeuropejska (ISO), bałtycka (ISO) *3
Rozpoznawanie znaków dla języków azjatyckich
Rodzaj rozpoznawania znaków
Japoński: Znaki alfanumeryczne, znaki Kana, znaki Kanji (pierwszy poziom JIS, drugi poziom JIS (częściowo)), symbole
Chiński (uproszczony): Znaki alfanumeryczne, chińskie znaki, symbole (GB2312-80)
Chiński (tradycyjny): Znaki alfanumeryczne, chińskie znaki, symbole (Big5)
Koreański: Znaki alfanumeryczne, znaki Kanji, znaki Korean Hangul, symbole (KSC5601)
Rozpoznanie czcionki
Obsługiwanych jest wiele czcionek (zaleca się stosowanie Ming-cho)
Czcionka Italic nie może być rozpoznana
Czcionki zamienione
-
Jeżeli wybrano japoński:
Tekst azjatycki: MS Mincho
Tekst europejski: Century
Jeżeli wybrano chiński (uproszczony):
Tekst azjatycki: SimSun
Tekst europejski: Calibri
Jeżeli wybrano chiński (tradycyjny):
Tekst azjatycki: PMingLiU
Tekst europejski: Calibri
Rozpoznawanie znaków dla języków europejskich
Rodzaj rozpoznawania znaków
Znaki alfanumeryczne, znaki specjalne dla rozpoznanego języka*4, symbole
Rozpoznanie czcionki
Obsługiwanych jest wiele czcionek (Times, Century i Arial są zalecane)
Czcionka Italic może być rozpoznana
Czcionki zamienione
-
Wyświetlane czcionka - Calibli
Czcionka Italic nie może być zamieniana
*1 Wyświetlane języki w formie listy w [Przełączanie Języka/Klawiatury] w [Właściwości] (Ustawienia/rejestrowanie) mogą się różnić.
*2 Jeżeli wybrano angielski, francuski, włoski, niemiecki, hiszpański, tajski lub wietnamski w [Przełączanie Języka/Klawiatury] w [Właściwości] (Ustawienia/rejestrowanie), język jest rozpoznawany jako zachodnioeuropejski (ISO).
*3 Każda grupa językowa składa się z poniższych języków. Jeżeli wybierzesz grupę językową, tekst napisany w języku danej grupy będzie rozpoznawany.
Zachodnioeuropejska (ISO):
Angielski, francuski, włoski, niemiecki, hiszpański, holenderski, portugalski, albański, kataloński, duński, fiński, islandzki, norweski, szwedzki,
Środkowoeuropejska (ISO):
Chorwacki, czeski, węgierski, polski, słowacki
Bałtycka (ISO):
Estoński, łotewski, litewski
*4 Jeżeli wybierzesz grecki, poniższe znaki specjalne mogą być rozpoznawane. Jeżeli wybierzesz inne języki, znaki specjalne dla każdego języka mogą być rozpoznawane. Niektóre znaki specjalne nie mogą być rozpoznawane, w zależności od danego języka.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Formaty plików dla tworzenia przeszukiwalnych plików PDF/XPS/OOXML

Korzystając z odpowiedniego formatu dla OCR, możesz ulepszyć jakość OCR.
Jeżeli nie możesz osiągnąć satysfakcjonujących wyników OCR, potwierdź, że format pliku zeskanowanego oryginału jest odpowiedni dla OCR.
WAŻNE
Jeżeli korzystasz z oryginałów, które zawierają dużo tekstu na 1 stronę, OCR może nie być przeprowadzane prawidłowo.
Jeżeli wybierzesz format programu Word, OCR może nie być przeprowadzane prawidłowo nawet, jeżeli korzystasz z oryginałów w formacie zalecanym.
W zależności od koloru tła, stylu znaków, formatu znaków i pochylenia czcionki, niektóre znaki mogą być rozpoznane błędnie lub może ich brakować.
Paragrafy, przerwy i tabele zawarte w oryginale mogą nie być rozpoznawane.
Część obrazu (grafiki, zdjęcia, pieczątki) mogą zostać rozpoznane i zastąpione przez tekst.
Element
Szczegóły
Format oryginału
Drukowane dokumenty, dokumenty tekstowe (dokument zawierający tekst, rysunki, obrazy, tabele i czcionkę bez pochylenia)
Format tekstu
Napis poziomy, napis pionowy
Dokumenty, które zawierają zarówno teksty poziome, jak i pionowe mogą być rozpoznawane.
Dla języków europejskich i koreańskiego dostępne jest wyłącznie rozpoznawanie w poziomie.
Dokumenty zawierające skomplikowane kolumny
Rozmiar znaku
8 do 40
Format tabeli
(tylko dla dokumentów w formacie Word)
Tabel spełniające poniższe warunki
Kwadratowe tabele o wyraźnych liniach
Liczba rzędów wynosi 32 lub mniej
Liczba kolumn wynosi 32 lub mniej
25KE-0R5