Nuskaitymas naudojant OCR funkciją

Šis režimas leidžia atlikti OCR (optinio rašto simbolių atpažinimo) funkciją ir iš nuskaityto atvaizdo paimti duomenis, kuriuos galima atpažinti kaip tekstą, ir sukurti PDF/XPS/OOXML (pptx/docx) failą, kuriame būtų galima atlikti paiešką. Taip pat galite nustatyti <Kompakt.> jei kaip failo formatą pasirinkote PDF arba XPS.
Informacijos apie pasirinktinius priedus, kurių reikia norint naudoti šią funkciją, ir apie failų formatus rasite Sistemos pasirinktinė įranga.

Nuskaitymas naudojant OCR funkciją

1
Padėkite originalą. Originalų padėjimas
2
Paspauskite <Skenavimas ir siuntimas>. Ekranas <Pagrindinis>
3
Pagrindinių nuskaitymo funkcijų ekrane nurodykite adresatą. Pagrindinių nuskaitymo funkcijų ekranas
4
Jei reikia, nurodykite nuskaitymo parametrus. Originalų nuskaitymo pagrindinės operacijos
5
Pasirinkite failo formatą.
Jei norite atskirti kelis atvaizdus ir siųsti juos kaip atskirus failus, kurių kiekvienas susideda tik iš vieno puslapio, paspauskite <Pad. į atsk. puslapius>  įveskite iš  dalijamų puslapių skaičių ir paspauskite <Gerai>. Jei norite nuskaityti atvaizdus kaip vieną failą, paspauskite <Pad. į atsk. puslapius>  <Param. atšauk.>.
PDF pasirinkimas
XPS pasirinkimas
„Word“ formato pasirinkimas naudojant OOXML
„PowerPoint“ formato pasirinkimas naudojant OOXML
6
Paspauskite <Gerai>.
Jei pasirinkote <PDF; OCR>, <XPS; OCR> ar <OOXML; OCR> kaip failo formatą, o <Sumanusis skenavimas> nustatyta kaip <Įjungt.> dalyje <OCR (Text Searchable) Settings>/<OCR (greičio pirmumas)>, aptinkama originalo padėtis ir dokumentas prireikus prieš siuntimą automatiškai pasukamas. <OCR (paieška tekste) parametrai>
Jei pasirinkote <PDF> ar <XPS> kaip failo formatą, galite nustatyti <Kompakt.> ir <OCR (paieška tekste)> vienu metu. Tokiu atveju <PDF; Kompakt.> ar <XPS; Kompakt.> rodoma kaip failo formatas nuskaitymo ir siuntimo pagrindinių savybių ekrane.
Jei pasirinkote <Word> dalyje <OOXML>, galite nustatyti, kad nuskaityti fono atvaizdai būtų pašalinti. Galite generuoti „Word“ failus, kuriuos lengva redaguoti be nepageidaujamų atvaizdų. <Įtraukti fono atvaizdus į „Word“ failą>

Netenkina OCR rezultatai

Kai kuriate PDF / XPS / OOXML failus, kuriuose galima ieškoti teksto, OCR (optinis simbolių atpažinimas) gali būti netinkamai apdorotas. Taip gali būti todėl, kad aparato parametrai arba originalo dokumento kalba, simbolių tipas ar formatas netinkami OCR apdoroti.

Mašinos parametrų ir palaikomų kalbų tikrinimas

Galite patobulinti OCR apdorojimą pritaikydami mašinos parametrus, susijusius su simbolių atpažinimu pagal originalus, arba originaluose naudodami tinkamus simbolių tipus ar šriftus, kad aparatas simbolius atpažintų.

OCR apdorojimo nuostatos ir kalbos

Elementas
Išsami informacija
Simbolių atpažinimo kalbos nuostatos
Kai kalba nurodoma pasirinkus OCR <Failo formatas>:
simboliai atpažįstami pagal kalbą, kurią parenkate kiekvienam failo formatui.
Kai kalba nenurodoma pasirinkus OCR <Failo formatas>,
simboliai atpažįstami pagal kalbą, kurią parenkate <Kalbos/klaviatūros perjungimas> (<Kalbos/klaviatūros perjungimas>).*1
Atpažįstamos Azijos kalbos
Japonų, kinų (supaprastinta), kinų (tradicinė), korėjiečių
Atpažįstamų simbolių tipai ir šriftai (Azijos kalbos)
Atpažįstamos Europos kalbos ir kalbų grupės
Kalbos:
anglų, prancūzų, italų, vokiečių, ispanų, nyderlandų, portugalų, albanų, katalonų, danų, suomių, islandų, norvegų, švedų, kroatų, čekų, vengrų, lenkų, slovakų, estų, latvių, lietuvių, rusų, graikų, turkų
Kalbų grupės:
Vakarų Europos (ISO)*2, Vidurio Europos (ISO)*3, Baltijos šalių (ISO)*4
Atpažįstamų simbolių tipai ir šriftai (Europos kalbos)
*1 Sąraše rodomos kalbos gali skirtis. Jei pasirinksite anglų, prancūzų, italų, vokiečių, ispanų, tajų arba vietnamiečių, kalba bus atpažinta kaip Vakarų Europos (ISO).
*2 Įskaitant anglų, prancūzų, italų, vokiečių, ispanų, nyderlandų, portugalų, albanų, katalonų, danų, suomių, islandų, norvegų ir švedų kalbas
*3 Įskaitant kroatų, čekų, vengrų, lenkų ir slovakų kalbas.
*4 Įskaitant estų, latvių ir lietuvių kalbas.

Atpažįstamų simbolių tipai ir šriftai (Azijos kalbos)

Elementas
Išsami informacija
Atpažįstamų simbolių tipas
Japonų kalba:
raidės ir skaičiai, Kana simboliai, Kanji simboliai (JIS pirmo lygio ir kai kurie JIS antro lygio) simboliai
Kinų kalba (supaprastinta):
raidės ir skaičiai, kinų simboliai, simboliai (GB2312-80)
Kinų kalba (tradicinė):
raidės ir skaičiai, kinų simboliai, simboliai (Big5)
Korėjiečių kalba:
raidės ir skaičiai, kinų simboliai, Hangul simboliai, simboliai (KSC5601)
Atpažįstami šriftai
Palaikomi keli šriftai. (Rekomenduojamas Ming-cho tipas)
Simboliai pasviruoju šriftu negali būti atpažinti.
Šriftai, naudojami konvertuojamiems simboliams (tik tada, kai failo formatas pasirinktas „Word“)
Japonų kalba:
Azijos kalbų simboliai: MS Mincho
Europos kalbų simboliai: Century
Kinų kalba (supaprastinta):
Azijos kalbų simboliai: SimSun
Europos kalbų simboliai: Calibri
Kinų kalba (tradicinė):
Azijos kalbų simboliai: PMingLiU
Europos kalbų simboliai: Calibri

Atpažįstamų simbolių tipai ir šriftai (Europos kalbos)

Elementas
Išsami informacija
Atpažįstamų simbolių tipas
Raidės ir skaičiai, atpažįstamos kalbos specialieji simboliai*, simboliai
Atpažįstami šriftai
Palaikomi keli šriftai. (Rekomenduojamas „Times“, „Century“ ir „Arial“)
Simboliai pasviruoju šriftu gali būti atpažinti.
Šriftai, naudojami konvertuojamiems simboliams (tik tada, kai failo formatas pasirinktas „Word“)
Calibri
Pasvirasis stilius neatkuriamas.
* Atpažįstami toliau nurodyti specialieji graikų kalbos simboliai. Gali būti atpažįstami kiekvienos kalbos specialieji simboliai. Priklausomai nuo kalbos kurie specialieji simboliai nebus atpažįstami.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Originalių dokumentų formato tikrinimas

Kurdami ieškomus PDF / XPS / OOXML failus, naudokite OCR apdoroti tinkamus originalus.
Elementas
Išsami informacija
Originalus formatas
Spausdinti dokumentai, „Word“ tekstų rengyklės dokumentai (dokumentai, kuriuos sudaro tekstas, iliustracijos, nuotraukos, lentelės ir nėra simbolių pakreipimo)
Teksto formatas
Horizontalus ir vertikalus rašymas (galima atpažinti dokumentus, kuriuose yra ir horizontalaus, ir vertikalaus rašymo tekstų)
galima atpažinti tik Europos kalbų ir korėjiečių teksto horizontalų rašymą.
Nuo vieno iki trijų stulpelių dokumentų be sudėtingų stulpelių parametrų
Simbolių dydis
Nuo 8 iki 40 taškų
Lentelės formatas (tik „Word“ formatas)
Lentelės, atitinkančios šias sąlygas:
Lenteles sudaro kvadratai, padalyti vientisomis linijomis
Lentelės su iki 32 stulpelių
Lentelės su iki 32 eilučių
Kai kurie OCR apdorojimui tinkami originalai gali būti netinkamai apdoroti.
Didelio tikslumo gali nepavykti pasiekti dirbant su originalais, kurių kiekviename puslapyje yra daug teksto.
Simboliai gali būti pakeisti netyčiniais simboliais arba jų gali trūkti dėl originalo fono spalvos, simbolių formos ir dydžio arba pasvirusių ženklų.*
Pastraipos, eilučių lūžiai ar lentelės gali būti neatkuriamos.*
Kai kurios iliustracijų, nuotraukų ar antspaudų dalys gali būti atpažįstamos kaip simboliai ir pakeistos simboliais.*
* Kai failo formatas pasirinktas „Word“.
6W24-072