Skanning med OCR-funksjonen

Denne innstillingen lar deg utføre OCR (optisk tegngjenkjenning) for å trekke ut data som kan gjenkjennes som tekst fra det skannede bildet, og opprette en PDF/XPS/OOXML (pptx/docx)-fil man kan søke i. Du kan også angi <Compact> hvis du velger PDF eller XPS som filformat.

Skanning med OCR

1
Legg inn dokumentet. Plassere originaler
2
Trykk på <Skanne og sende>. <Hjem>-skjermbilde
3
Angi mottakeren på skjermbildet Grunnleggende funksjoner for skanning. Skjermbildet Grunnleggende funksjoner for skanning
4
Spesifiser skanneinnstillingene som nødvendig. Grunnleggende operasjoner for skanning av dokumenter
5
Velg et filformat.
Hvis du vil separere flere bilder og sende dem som separate filer, og hver av dem består kun av en side, trykker du på <Del i sider>  skriver inn antall sider du vil dele etter og trykker på <OK>. Hvis du ønsker å skanne bildene som en enkelt fil, trykker du på <Del i sider>  <Avbryte innst.>.
Slik velger du PDF
Slik velger du XPS
Slik velger du Word-format for OOXML
Slik velger du PowerPoint-format for OOXML
6
Trykk på <OK>.
Hvis du velger <PDF; OCR>, <XPS; OCR> eller <OOXML; OCR> som filformat og <Smart skanning> er angitt til <På> i <OCR (tekstsøking) innstillinger>, toppdages retningen til originalen, og dokumentet roteres automatisk om nødvendig før det sendes. <OCR (søkbar tekst) innstillinger>
Hvis du velger <PDF> eller <XPS> som filformat, kan du angi <Compact> og <OCR (søkbar tekst)> samtidig. <PDF; Kompakt> eller <XPS; Kompakt> vises i tilfelle som filformat på skjermbildet Basisfunksjoner for skanning og sending.
Hvis du velger <Word> for <OOXML>, kan du stille inn at de skannede bakgrunnsbildene skal slettes. Du kan generere Word-filer som er enkle å redigere uten uønskede bilder. <Ta med bakgrunnsbilder i Word-fil>
Velg et språk eller en språkgruppe i henhold til språket som brukes i originalene som skal skannes. Innstillinger og språk for OCR-behandling

OCR-resultatet er ikke tilfredsstillende

Når du oppretter tekst-søkbare PDF/XPS/OOXML-filer, er det mulig at OCR (optisk tegngjenkjenning) ikke blir bearbeidet ordentlig. Dette kan skyldes at innstillingene på maskinen, eller språket, tegntypen eller formatet til originaldokumentet ikke er passende for OCR-behandling.

Kontrollere maskininnstillingene og språk som støttes

Du kan forbedre OCR-behandlingen ved å tilpasse maskininnstillingene angående tegngjenkjenning i henhold til originalene, eller ved å bruke passende tegntyper eller skrifttyper i originalene, slik at maskinen kan gjenkjenne tegnene.

Innstillinger og språk for OCR-behandling

Punkt
Detaljer
Språkinnstillinger for tegngjenkjenning
Når et språk er angitt med OCR valgt i <Filformat>:
gjenkjennes tegnene basert på språket du velger for hvert filformat.
Når et språk ikke er angitt med OCR valgt i <Filformat>:
gjenkjennes tegnene basert på språket du velger i <Bytt språk/tastatur> (<Bytt språk/tastatur>).*1
Gjenkjennelige asiatiske språk
Japansk, kinesisk (forenklet), kinesisk (tradisjonelt), koreansk
Gjenkjennelige tegntyper og skrifttyper (asiatiske språk)
Gjenkjennelige europeiske språk og språkgrupper
Språk:
Engelsk, fransk, italiensk, tysk, spansk, nederlandsk, portugisisk, albansk, katalansk, dansk, finsk, islandsk, norsk, svensk, kroatisk, tsjekkisk, ungarsk, polsk, slovakisk, estisk, latvisk, litauisk, russisk, gresk, tyrkisk
Språkgrupper:
Vesteuropeisk (ISO)*2, Sentraleuropeisk (ISO)*3, Baltisk (ISO)*4
Gjenkjennelige tegntyper og skrifttyper (europeiske språk)
*1 Viste språk i listen kan variere. Hvis du velger engelsk, fransk, italiensk, tysk, spansk, thailandsk eller vietnamesisk, gjenkjennes det valgte språket som vesteuropeisk (ISO).
*2 Inkludert engelsk, fransk, italiensk, tysk, spansk, nederlandsk, portugisisk, albansk, katalansk, dansk, finsk, islandsk, norsk og svensk.
*3 Inkludert kroatisk, tsjekkisk, ungarsk, polsk og slovakisk.
*4 Inkludert estisk, latvisk og litauisk.

Gjenkjennelige tegntyper og skrifttyper (asiatiske språk)

Punkt
Detaljer
Gjenkjennelige tegntyper
Japansk:
Alfanumeriske tegn, Kana-tegn, Kanji-tegn (JIS første nivå, og noen av JIS andre nivå), symboler
Kinesisk (forenklet):
Alfanumeriske tegn, kinesiske tegn, symboler (GB2312-80)
Kinesisk (tradisjonell):
Alfanumeriske tegn, kinesiske tegn, symboler (Big5)
Koreansk:
Alfanumeriske tegn, kinesiske tegn, Hangul-tegn, symboler (KSC5601)
Gjenkjennelige skrifttyper
Flere skrifttyper støttes. (Ming-cho-type anbefales.)
Kursiverte tegn kan ikke gjenkjennes.
Skrifttyper som brukes til konverterte tegn (bare når Word er valgt som filformat)
Japansk:
Asiatiske tegn: MS Mincho
Europeiske tegn: Century
Kinesisk (forenklet):
Asiatiske tegn: SimSun
Europeiske tegn: Calibri
Kinesisk (tradisjonell):
Asiatiske tegn: PMingLiU
Europeiske tegn: Calibri

Gjenkjennelige tegntyper og skrifttyper (europeiske språk)

Punkt
Detaljer
Gjenkjennelige tegntyper
Alfanumeriske tegn, spesialtegn i det gjenkjente språket*, symboler
Gjenkjennelige skrifttyper
Flere skrifttyper støttes. (Times, Century og Arial anbefales.)
Kursiverte tegn kan gjenkjennes.
Skrifttyper som brukes til konverterte tegn (bare når Word er valgt som filformat)
Calibri
Kursiv stil gjengis ikke.
* Følgende greske spesialtegn kan gjenkjennes. Spesialtegn for hvert språk kan også gjenkjennes. Avhengig av språkene er det noen spesialtegn som ikke gjenkjennes.
Α, Β, Γ, Δ, Ε, Ζ, Η, Θ, Ι, Κ, Λ, Μ, Ν, Ξ, Ο, Π, Ρ, Σ, Τ, Υ, Φ, Χ, Ψ, Ω, α, β, γ, δ, ε, ζ, η, θ, ι, κ, λ, μ, ν, ξ, ο, π, ρ, σ, τ,υ, φ, χ, ψ, ω

Kontrollerer formatet på originaldokumentene

Bruk originaler som er egnet for OCR-behandling for å forbedre behandlingsnøyaktigheten når du lager søkbare PDF/XPS/OOXML-filer.
Punkt
Detaljer
Originalt format
Trykte dokumenter, tekstbehandlingsdokumenter (dokumenter som består av tekst, grafikk, fotografier eller tabeller, og uten skråstilte tegn)
Tekstformat
Horisontal og vertikal skriving (dokumenter som inneholder både horisontal og vertikal skriving kan også gjenkjennes)
Bare horisontal skriving kan gjenkjennes for europeiske språk og koreansk tekst.
En til tre kolonnedokumenter uten komplekse kolonneinnstillinger
Tegnstørrelse
8 til 40 punkt
Tabellformat (kun for Word-format)
Tabeller som oppfyller følgende betingelser:
Tabeller som består av firkanter delt med hele linjer
Tabeller med opptil 32 kolonner
Tabeller med opptil 32 rader
Noen originaler som er egnet for OCR-behandling, behandles kanskje ikke ordentlig.
Høy nøyaktighet oppnås kanskje ikke med originaler inkludert en stor mengde tekst på hver side.
Tegn kan erstattes med utilsiktede tegn eller mangler på grunn av bakgrunnsfargen på originalen, form og størrelse på tegn eller skråstilte tegn.*
Avsnitt, linjeskift eller tabeller kan ikke reproduseres.*
Noen deler av illustrasjoner, fotografier eller seglavtrykk kan gjenkjennes som tegn og erstattes med tegn.*
* Når Word er valgt som filformat.
7J2E-071