Skenēšana, izmantojot funkciju OCR

Šis režīms ļauj izpildīt OCR (rakstzīmju optisko pazīšanu), lai no skenētā attēla izgūtu datus, ko var atpazīt kā tekstu, un izveidotu PDF/XPS/OOXML (pptx/docx) failu, kurā var veikt meklēšanu. Tāpat varat iestatīt arī <Kompakts>, ja esat atlasījis faila formātu PDF vai XPS.
Informāciju par papildaprīkojumu, kas nepieciešams šīs funkcijas lietošanai, un failu formātiem skatiet sadaļā Sistēmas iespējas.

Skenēšana, izmantojot OCR

1
Novietojiet oriģinālu. Oriģinālu novietošana
2
Nospiediet <Skenēt un sūtīt>. Ekrāns <Sākums>
3
Skenēšanas pamatfunkciju ekrānā norādiet adresātu. Skenēšanas pamatfunkciju ekrāns
4
Norādiet nepieciešamos skenēšanas iestatījumus. Dokumentu skenēšanas pamatdarbības
5
Atlasiet faila formātu.
Lai vairākus attēlus atdalītu vienu no otra un nosūtītu tos kā atsevišķus failus tā, lai katrā būtu tikai viena lappuse, nospiediet <Dalīt lappusēs> ievadiet atdalāmo lappušu skaitu  nospiediet <OK>. Ja vēlaties skenēt attēlus kā vienu failu, nospiediet <Dalīt lappusēs>  <Atcelt iestat.>.
PDF atlasīšana
XPS atlasīšana
OOXML Word formāta atlasīšana
OOXML PowerPoint formāta atlasīšana
6
Nospiediet <OK>.
Ja ir atlasīts faila formāts <PDF; OCR>, <XPS; OCR> vai <OOXML; OCR> un opcija <Viedā skenēšana> ir iestatīta kā <Iesl.> izvēlnē <OCR (Text Searchable) Settings>/<OCR (prioritāte ātrumam)>, tiek noteikta oriģināla orientācija un pirms nosūtīšanas dokuments automātiski tiek pagriezts, ja tas ir nepieciešams. <OCR (pārmeklējams teksts) iestatījumi>
Atlasot faila formātu <PDF> vai <XPS>, vienlaicīgi varat iestatīt arī <Kompakts> un <OCR (pārmekl. teksts)>. Šādā gadījumā skenēšanas un sūtīšanas pamatfunkciju ekrānā tiek parādīts faila formāts <PDF; kompakts> vai <XPS; Kompakts>.
Opcijai <OOXML> atlasot iestatījumu <Word>, varat iestatīt skenēto fona attēlu dzēšanu. Varat ģenerēt tādus Word failus bez nevēlamiem attēliem, kurus var viegli rediģēt. <Iekļaut fona attēlus Word failā>

Neapmierinoši OCR rezultāti

Kad izveidojat PDF/XPS/OOXML failus ar pārmeklējamu tekstu, funkcija OCR (optiskā rakstzīmju pazīšana) var netikt izpildīta pareizi. Tas var būt tādēļ, ka iekārtas vai dokumenta valodas, rakstzīmju veida vai formāta iestatījumi nav piemēroti OCR izpildei.

Iekārtas iestatījumu un atbalstīto valodu pārbaude

OCR izpildi var uzlabot, pielāgojot ar rakstzīmju atpazīšanu saistītos iekārtas iestatījumus atbilstoši oriģināliem vai oriģinālos izmantojot piemērotus rakstzīmju veidus vai fontus, lai iekārta varētu atpazīt rakstzīmes.

Iestatījumi un valodas OCR izpildei

Vienums
Detalizēti
Valodas iestatījumi rakstzīmju atpazīšanai
Kad valoda ir norādīta, lietojot opcijai <Faila formāts> atlasīto funkciju OCR:
rakstzīmes tiek atpazītas, izmantojot valodu, ko atlasījāt katram faila formātam.
Kad valoda nav norādīta, lietojot opcijai <Faila formāts> atlasīto funkciju OCR:
rakstzīmes tiek atpazītas, izmantojot valodu, ko atlasījāt opcijai <Pārslēgt valodu/tastatūru> (<Pārslēgt valodu/tastatūru>).*1
Atpazīstamās Āzijas valodas
Japāņu, ķīniešu (vienkāršotā), ķīniešu (tradicionālā), korejiešu
Atpazīstamie rakstzīmju veidi un fonti (Āzijas valodas)
Atpazīstamās Eiropas valodas un valodu grupas
Valodas:
angļu, franču, itāliešu, vācu, spāņu, holandiešu, portugāļu, albāņu, katalāņu, dāņu, somu, īslandiešu, norvēģu, zviedru, horvātu, čehu, ungāru, poļu, slovāku, igauņu, latviešu, lietuviešu, krievu, grieķu, turku
Valodu grupas:
Rietumeiropas (ISO)*2, Centrāleiropas (ISO)*3, Baltijas (ISO)*4
Atpazīstamie rakstzīmju veidi un fonti (Eiropas valodas)
*1 Sarakstā parādītās valodas var atšķirties. Atlasot angļu, franču, itāliešu, vācu, spāņu, taju vai vjetnamiešu valodu, atlasītā valoda tiek atpazīta kā Rietumeiropas (ISO).
*2 Ietver angļu, franču, itāliešu, vācu, spāņu, holandiešu, portugāļu, albāņu, katalāņu, dāņu, somu, īslandiešu, norvēģu, zviedru
*3 Ietver horvātu, čehu, ungāru, poļu, slovāku
*4 Ietver igauņu, latviešu un lietuviešu.

Atpazīstamie rakstzīmju veidi un fonti (Āzijas valodas)

Vienums
Detalizēti
Atpazīstamie rakstzīmju veidi
Japāņu:
burtciparu rakstzīmes, kana rakstzīmes, kandži rakstzīmes (JIS pirmais līmenis un dažas JIS otrā līmeņa), simboli
Ķīniešu (vienkāršotā):
burtciparu rakstzīmes, ķīniešu rakstzīmes, simboli (GB2312-80)
Ķīniešu (tradicionālā):
burtciparu rakstzīmes, ķīniešu rakstzīmes, simboli (Big5)
Korejiešu:
burtciparu rakstzīmes, ķīniešu rakstzīmes, hangul rakstzīmes, simboli (KSC5601)
Atpazīstamie fonti
Tiek atbalstīti vairāki fonti. (Ieteicams izmantot Ming-cho veidu.)
Rakstzīmes slīprakstā nevar atpazīt.
Pārveidotajām rakstzīmēm izmantotie fonti (tikai tad, kad ir atlasīts faila formāts Word)
Japāņu:
Āzijas rakstzīmes: MS Mincho
Eiropas rakstzīmes: Century
Ķīniešu (vienkāršotā):
Āzijas rakstzīmes: SimSun
Eiropas rakstzīmes: Calibri
Ķīniešu (tradicionālā):
Āzijas rakstzīmes: PMingLiU
Eiropas rakstzīmes: Calibri

Atpazīstamie rakstzīmju veidi un fonti (Eiropas valodas)

Vienums
Detalizēti
Atpazīstamie rakstzīmju veidi
Burtciparu rakstzīmes, atpazīto valodu speciālās rakstzīmes*, simboli
Atpazīstamie fonti
Tiek atbalstīti vairāki fonti. (Ieteicams izmantot Times, Century un Arial.)
Rakstzīmes slīprakstā nevar atpazīt.
Pārveidotajām rakstzīmēm izmantotie fonti (tikai tad, kad ir atlasīts faila formāts Word)
Calibri
Slīpraksts netiek atveidots.
* Var atpazīt tālāk minētās speciālās grieķu rakstzīmes. Var atpazīt arī katras valodas speciālās rakstzīmes. Atkarībā no valodas dažas speciālās rakstzīmes nevar atpazīt.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Oriģinālo dokumentu formāta pārbaude

Lai uzlabotu OCR izpildes precizitāti, kad veidojat PDF/XPS/OOXML failus ar pārmeklējamu tekstu, izmantojiet oriģinālus, kas ir piemēroti šādai izpildei.
Vienums
Detalizēti
Oriģināla formāts
Drukātie dokumenti, tekstapstrādes dokumenti (dokumenti, kas sastāv no teksta, grafikas, fotoattēliem vai tabulām un kuriem nav slīpu rakstzīmju)
Teksta formāts
Teksts horizontālā un vertikālā virzienā (var atpazīt arī dokumentus, kuros teksts ir gan horizontālā, gan vertikāla virzienā)
Eiropas valodām un korejiešu valodai tekstu var atpazīt tikai horizontālā virzienā.
Dokumenti ar vienu līdz trim slejām un bez sarežģītiem sleju iestatījumiem
Rakstzīmju lielums
8 līdz 40 punkti
Tabulas formāts (tikai Word formātam)
Tabulas, kas atbilst šādiem nosacījumiem:
tabulas sastāv no kvadrātiem, kas ir atdalīti ar nepārtrauktām līnijām;
tabulas ar līdz 32 kolonnām;
tabulas ar līdz 32 rindām.
Daži OCR izpildei piemēroti oriģināli var netikt apstrādāti pareizi.
Augsta precizitāte var netikt panākta dokumentiem, kuru katrā lapā ir daudz teksta.
Rakstzīmes var tikt aizstātas ar neparedzētām rakstzīmēm vai tās var trūkt oriģināla fona krāsas, rakstzīmju formas un lieluma vai slīpu rakstzīmju dēļ.*
Rindkopas, rindiņu pārtraukumi vai tabulas var netikt atveidoti.*
Dažas ilustrāciju, fotoattēlu vai zīmogu nospiedumu daļas var tikt atpazītas kā rakstzīmes un aizstātas ar tām.*
* Kad ir atlasīts faila formāts Word.
6W25-072