OCR funtzioarekin eskaneatzea

Modu honek aukera ematen dizu OCR (karaktere-ezagutze optikoa) erabiltzeko eskaneatutako iruditik testu gisa ezagut daitezkeen datuak ateratzeko eta PDF/XPS/OOXML (pptx/docx) fitxategi kontsultagarri bat sortzeko. <Konpaktua> ere ezar dezakezu fitxategi-formatu gisa PDF edo XPS hautatzen baduzu.

OCR erabiliz eskaneatzea

1
Kokatu originala. Originalak kokatzea
2
Sakatu <Eskaneatu eta bidali>. <Etxea> pantaila
3
Zehaztu helmuga Eskanerraren oinarrizko funtzioen pantailan. Eskaneatzearen oinarrizko eginbideen pantaila
4
Zehaztu eskaneatze ezarpenak beharrezkoa bada. Originalak eskaneatzeko oinarrizko eragiketak
5
Fitxategi-formatu bat hautatu.
Hainbat irudi bereizi eta orrialde bakarreko fitxategi bereizi gisa bidali nahi izanez gero, sakatu <Zatitu orrialdeetan>  sartu  bereizi beharreko orrialde kopurua eta sakatu <Ados>. Irudiak fitxategi bakar gisa eskaneatu nahi izanez gero, sakatu <Zatitu orrialdeetan>  <Utzi ezarpenak>.
PDFa hautatzeko
XPS hautatzeko
OOXMLrako Word formatua hautatzeko
OOXMLrako PowerPoint formatua hautatzeko
6
Sakatu <Ados>.
Fitxategi-formatu gisa <PDF; OCR>, <XPS; OCR> edo <OOXML; OCR> hautatuz gero, eta <Eskaneatze adimenduna> <Bai> gisa ezarrita badago <OCR (Text Searchable) Settings> aukeran, jatorrizkoaren orientazioa hautematen da eta, beharrezkoa izanez gero, dokumentua automatikoki biratuko da bidali aurretik. <OCR (testu arakagarria) ezarpenak>
Fitxategi-formatu gisa <PDF> edo <XPS> hautatzen baduzu, <Konpaktua> eta <OCR (testu arakagarria)> aldi berean ezar ditzakezu. Kasu horretan, <PDF; Konpaktua> edo <XPS; Konpaktua> bistaratzen da fitxategi-formatu gisa Eskaneatu eta bidali oinarrizko funtzioen pantailan.
<OOXML> sekzioko <Word> aukera hautatzen baduzu, eskaneatutako atzealdeko irudiak ezabatzeko ezar ditzakezu. Editatzeko errazak diren Word fitxategiak sor ditzakezu nahi ez duzun irudirik gabe. <Gehitu atzealdeko irudiak Word fitxategian>
Hautatu hizkuntza bat edo talde bat originaletan erabilitako hizkuntzaren arabera, eskaneatzeko. OCR prozesamendurako ezarpenak eta hizkuntzak

OCR emaitzak ez dira egokiak

Testu kontsultagarriak dituzten PDF/XPS/OOXML fitxategiak sortzen dituzunean, baliteke OCR (karaktere-ezagutze optikoa) ongi ez prozesatzea. Hori gerta liteke makinako ezarpenak, hizkuntza, karaktere mota edo dokumentu originalaren formatua ez delako egokia OCRa prozesatzeko.

Makinaren ezarpenak eta hizkuntza bateragarriak egiaztatzea

OCR prozesamendua hobe dezakezu makinaren ezarpenak pertsonalizatuz originalen arabera karaktereak ezagutzeko edo originaletan karaktere-mota edo tipo egokiak erabiliz makinak karaktereak ezagut ditzan.

OCR prozesamendurako ezarpenak eta hizkuntzak

Elementua
Xehetasunak
Karaktereak ezagutzeko hizkuntza-ezarpenak
<Fitxategi-formatua>-(e)n hautatutako hizkuntza bat OCRrekin zehazten denean:
Karaktereak ezagutzen dira fitxategi-formatu bakoitzerako hautatu duzun hizkuntzan oinarrituta.
<Fitxategi-formatua>-(e)n hautatutako hizkuntza bat ez denean OCRrekin zehazten:
Karaktereak ezagutzen dira <Aldatu hizkuntzaz/teklatuz>-(e)n (<Aldatu hizkuntzaz/teklatuz>) hautatu duzun hizkuntzan oinarrituta. *1
Ezagut daitezkeen Asiako hizkuntzak
Japoniera, txinera (soildua), txinera (tradizionala), koreera
Ezagut daitezkeen karaktere-motak eta tipoak (Asiako hizkuntzak)
Ezagut daitezkeen Europako hizkuntzak eta hizkuntza-taldeak
Hizkuntzak:
Ingelesa, frantsesa, italiera, alemana, gaztelania, nederlandera, portugesa, albaniera, katalana, daniera, finlandiera, islandiera, norvegiera, suediera, kroaziera, txekiera, hungariera, poloniera, eslovakiera, estoniera, letoniera, lituaniera, errusiera, greziera, turkiera
Hizkuntza-taldeak:
Europako Mendebaldekoa (ISO)*2, Europako Erdialdekoa (ISO)*3, Baltikokoa (ISO)*4
Ezagut daitezkeen karaktere-motak eta tipoak (Europako hizkuntzak)
*1 Zerrendan bistaratutako hizkuntzak alda litezke. Ingelesa, frantsesa, italiera, alemana, gaztelania, thailandiera edo vietnamera hautatzen baduzu, hautatutako hizkuntza Europako Mendebaldekoa (ISO) gisa ezagutzen da.
*2 Ingelesa, frantsesa, italiera, alemana, gaztelania, nederlandera, portugesa, albaniera, katalana, daniera, finlandiera, islandiera, norvegiera eta suediera barne.
*3 Kroaziera, txekiera, hungariera, poloniera eta eslovakiera barne.
*4 Estoniera, letoniera eta lituaniera barne.

Ezagut daitezkeen karaktere-motak eta tipoak (Asiako hizkuntzak)

Elementua
Xehetasunak
Ezagut daitezkeen karaktere-motak
Japoniera:
Karaktere alfanumerikoak, kana karaktereak, kanji karaktereak (lehenengo mailako JIS eta bigarren mailako JIS batzuk), ikurrak
Txinera (soildua):
Karaktere alfanumerikoak, karaktere txinatarrak, ikurrak (GB2312-80)
Txinera (tradizionala):
Karaktere alfanumerikoak, karaktere txinatarrak, ikurrak (Big5)
Koreera:
Karaktere alfanumerikoak, karaktere txinatarrak, hangul karaktereak, ikurrak (KSC5601)
Ezagut daitezkeen tipoak
Hainbat tipo bateragarri daude. (Ming-cho mota gomendatzen da).
Ezin dira karaktere etzanak ezagutu.
Bihurtutako karaktereentzat erabilitako tipoak (soilik Word fitxategi-formatu gisa hautatzen denean)
Japoniera:
Karaktere asiarrak: MS Mincho
Karaktere europarrak: Century
Txinera (soildua):
Karaktere asiarrak: SimSun
Karaktere europarrak: Calibri
Txinera (tradizionala):
Karaktere asiarrak: PMingLiU
Karaktere europarrak: Calibri

Ezagut daitezkeen karaktere-motak eta tipoak (Europako hizkuntzak)

Elementua
Xehetasunak
Ezagut daitezkeen karaktere-motak
Karaktere alfanumerikoak, ezagututako hizkuntzaren karaktere bereziak*, ikurrak
Ezagut daitezkeen tipoak
Hainbat tipo bateragarri daude. (Times, Century eta Arial gomendatzen dira).
Karaktere etzanak ezagut daitezke.
Bihurtutako karaktereentzat erabilitako tipoak (soilik Word fitxategi-formatu gisa hautatzen denean)
Calibri
Estilo etzana ez da erreproduzitzen.
* Honako karaktere grekoak ezagut daitezke. Hizkuntza bakoitzaren karaktere bereziak ere ezagut daitezke. Hizkuntzaren arabera ezin dira karaktere berezi batzuk ezagutu.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ, υ, φ, χ, ψ, ω

Dokumentu originalen formatua egiaztatzea

Erabili OCR prozesamendurako aproposak diren originalak PDF/XPS/OOXML fitxategi kontsultagarriak sortzean prozesamendu-zehaztasuna hobetzeko.
Elementua
Xehetasunak
Formatu originala
Inprimatutako dokumentuak, testu-tratamenduko dokumentuak (testua, irudiak, grafikoak, argazkiak edo taulak dituzten dokumentuak, baina okertutako karaktererik ez dutenak)
Testu-formatua
Idazkera horizontala eta bertikala (idazkera horizontala zein bertikala duten dokumentuak ere ezagut daitezke)
Europako hizkuntzetan eta koreeraz idatzitako testuetan idazkera horizontala ezagut daiteke soilik.
Bat eta hiru zutabe artean dituzten dokumentuak, zutabe konplexu ezarpen gabeak
Karaktere-tamaina
8 eta 40 puntu artean
Taula-formatua (soilik Word formaturako)
Honako baldintzak betetzen dituzten taulak:
Lerro jarraiekin banatutako laukiz osatutako taulak
Gehienez 32 zutabe dituzten taulak
Gehienez 32 errenkada dituzten taulak
Baliteke OCR prozesamendurako egokiak diren original batzuk ongi ez prozesatzea.
Baliteke zehaztasun handirik ez lortzea orrialde guztietan testu ugari duten originaletan.
Baliteke karaktereak nahi ez diren karaktereekin ordezkatzea edo faltatzea originalaren atzealdearen kolorearengatik, karaktereen forma eta tamainarengatik edo okertutako karaktereengatik.*
Baliteke paragrafoak, lerro-jauziak edo taulak ez erreproduzitzea.*
Baliteke ilustrazioen, argazkien edo zigilu-inprimaketen zati batzuk karaktere gisa ezagutzea eta karaktereekin ordezkatzea.*
* Word fitxategi-formatu gisa hautatzen denean.
A133-08H