اسکن با عملکرد OCR

با این حالت می توانید OCR (تشخیص نویسه نوری) را برای استخراج داده ای اجرا کنید که می تواند به عنوان متن از تصویر اسکن شده تشخیص داده شود و یک فایل PDF/XPS/OOXML (‏pptx/docx) ایجاد کنید که قابل جستجو باشد. اگر PDF یا XPS را به عنوان فرمت فایل انتخاب نکنید، می توانید <Compact> را هم تنظیم کنید.

اسکن با OCR

1
سند اصلی را قرار دهید. قرار دادن اسناد اصلی
2
<Scan and Send‎> را فشار دهید. صفحه <Home>
3
مقصد را در صفحه "ویژگی های اصلی اسکن" مشخص کنید. صفحه "ویژگی های اصلی اسکن"
4
در صورت نیاز تنظیمات اسکن را مشخص کنید. عملیات اصلی برای اسکن کردن اسناد اصلی
5
فرمت فایل را انتخاب کنید.
اگر می خواهید چندین تصویر را جدا کنید و آنها را به صورت فایل های جداگانه ارسال کنید به صورتی که هر کدام شامل تنها یک صفحه شود، <Divide into Pages>‏  را فشار دهید شماره صفحات مورد نظر برای تقسیم را با  وارد کنید و گزینه <OK> را فشار دهید. اگر می خواهید تصاویر را به صورت یک فایل تکی اسکن کنید، <Divide into Pages>‏  <Cancel Settings> را فشار دهید.
انتخاب PDF‏
انتخاب XPS‏
انتخاب فرمت Word برای OOXML
انتخاب فرمت PowerPoint برای OOXML‏
6
<OK‎> را فشار دهید.
اگر <PDF; OCR>، ‏<XPS; OCR> یا <OOXML; OCR> را به عنوان فرمت فایل انتخاب کنید و <Smart Scan> روی <On> در ‎‎<OCR (Text Searchable)‎ Settings>‎‎ تنظیم شده باشد، جهت سند اصلی تشخیص داده می شود و در صورت لزوم سند قبل از ارسال به طور خودکار چرخانده می شود. ‎<OCR (Text Searchable)‎ Settings>‎
اگر <PDF> یا <XPS> را به عنوان فرمت فایل انتخاب کنید، می توانید <Compact> و ‎‎<OCR (Text Searchable)‎>‎‎ را همزمان تنظیم کنید. در این حالت، <PDF; Compact> یا <XPS; Compact> به عنوان فرمت فایل در صفحه ویژگی های اصلی ارسال و اسکن نشان داده می شود.
اگر <Word> را برای <OOXML> انتخاب کنید می توانید تنظیم کنید تصاویر پس زمینه اسکن شده حذف شوند. می توانید فایل های Word ایجاد کنید که ویرایش آنها بدون تصاویر ناخواسته آسان باشد. <Include Background Images in Word File>
یک زبان یا یک گروه را بر اساس زبان مورد استفاده در اسناد اصلی که باید اسکن شوند، انتخاب کنید. تنظیمات و زبان ها برای پردازش OCR

نتایج OCR رضایتبخش نیستند

زمانی که فایل های PDF/XPS/OOXML قابل جستجوی متنی ایجاد می کنید ممکن است OCR (تشخیص نویسه نوری) به درستی پردازش نشود. ممکن است به این علت باشد که تنظیمات دستگاه یا زبان، نوع نویسه یا فرمت سند اصلی برای پردازش OCR مناسب نباشند.

بررسی تنظیمات دستگاه و زبان های پشتیبانی شده

می توانید با سفارشی سازی تنظیمات دستگاه که به تشخیص نویسه مطابق با اسناد اصلی مربوط می شود یا از طریق استفاده از قلم ها یا انواع نویسه های مناسب در اسناد اصلی، پردازش OCR را بهبود ببخشید تا دستگاه بتواند نویسه ها را تشخیص دهد.

تنظیمات و زبان ها برای پردازش OCR

مورد
جزئیات
تنظیمات زبان برای تشخیص نویسه
زمانی که زبان با OCR انتخاب شده در <File Format> مشخص می شود:
نویسه ها بر اساس زبانی که برای هر فرمت فایل انتخاب می کنید تشخیص داده می شوند.
زمانی که زبان با OCR انتخاب شده در ‎<File Format>‎ مشخص نمی شود:
نویسه ها بر اساس زبانی که در ‎<Switch Language/Keyboard>‎ (<Switch Language/Keyboard>) انتخاب می کنید تشخیص داده می شوند.‎‏*1
زبان های آسیایی قابل تشخیص
ژاپنی، چینی (ساده شده)، چینی (سنتی)، کره ای
قلم ها و انواع نویسه های قابل تشخیص (زبان های آسیایی)
گروه های زبانی و زبان های اروپایی قابل تشخیص
زبان ها:
انگلیسی، فرانسوی، ایتالیایی، آلمانی، اسپانیایی، هلندی، پرتغالی، آلبانیایی، کاتالان، دانمارکی، فنلاندی، ایسلندی، نروژی، سوئدی، کرواتی، چک، مجارستانی، لهستانی، اسلواکی، استونی، لتونی، لیتوانیایی، روسی، یونانی، ترکی
گروه های زبانی:
اروپای غربی (ISO)‏‎*2، اروپای مرکزی (ISO)‏‎*3، بالتیک (ISO)‏‎*‎4
قلم ها و انواع نویسه های قابل تشخیص (زبان های اروپایی)
*1 زبان های نشان داده شده در لیست ممکن است فرق داشته باشد. اگر انگلیسی، فرانسوی، ایتالیایی، آلمانی، اسپانیایی، تایلندی یا ویتنامی را انتخاب کنید، زبان انتخابی به عنوان اروپای غربی (ISO) تشخیص داده می شود.
*2 شامل انگلیسی، فرانسوی، ایتالیایی، آلمانی، اسپانیایی، هلندی، پرتغالی، آلبانیایی، کاتالان، دانمارکی، فنلاندی، ایسلندی، نروژی و سوئدی می شود.
*3 شامل کرواتی، چک، مجارستانی، لهستانی و اسلواکی می شود.
*4 شامل استونی، لتونی و لیتوانیایی می شود.

قلم ها و انواع نویسه های قابل تشخیص (زبان های آسیایی)

مورد
جزئیات
انواع نویسه های قابل تشخیص
ژاپنی:
نویسه های الفبایی عددی، نویسه های کانا، نویسه های کانجی (JIS سطح اول و تعدادی JIS سطح دوم)، نمادها
چینی (ساده شده):
نویسه های الفبایی عددی، نویسه های چینی، نمادها (GB2312-80)
چینی (سنتی):
نویسه های الفبایی عددی، نویسه های چینی، نمادها (Big5)
کره ای:
نویسه های الفبایی عددی، نویسه های چینی، نویسه های هانگول، نمادها (KSC5601)
قلم های قابل تشخیص
چندین قلم پشتیبانی می شود. (نوع مینگ-چو توصیه می شود.)
نویسه های ایتالیایی قابل تشخیص نیست.
قلم های مورد استفاده برای نویسه های تبدیل شده (تنها زمانی که Word به عنوان فرمت فایل انتخاب شود)
ژاپنی:
نویسه های آسیایی: MS Mincho
نویسه های اروپایی: Century
چینی (ساده شده):
نویسه های آسیایی: SimSun
نویسه های اروپایی: Calibri
چینی (سنتی):
نویسه های آسیایی: PMingLiU
نویسه های اروپایی: Calibri

قلم ها و انواع نویسه های قابل تشخیص (زبان های اروپایی)

مورد
جزئیات
انواع نویسه های قابل تشخیص
نویسه های الفبایی عددی، نویسه های خاص زبان تشخیص داده شده*، نمادها
قلم های قابل تشخیص
چندین قلم پشتیبانی می شود. (Times، Century و Arial توصیه می شوند.)
نویسه های کج قابل تشخیص است.
قلم های مورد استفاده برای نویسه های تبدیل شده (تنها زمانی که Word به عنوان فرمت فایل انتخاب شود)
Calibri
سبک مورب بازتولید نمی شود.
* نویسه های یونانی خاص زیر قابل تشخیص هستند. نویسه های خاص برای هر زبان نیز قابل تشخیص است. برخی نویسه های خاص بسته به زبان ها قابل تشخیص نیستند.
‏Α، Β، Γ‏، Δ‏، Ε‏، Ζ‏، Η‏، Θ‏، Ι‏، Κ‏، Λ‏، Μ‏، Ν، Ξ‏، Ο، Π‏، Ρ، Σ‏، Τ، Υ‏، Φ، Χ‏، Ψ، Ω‏، α، β‏، γ‏، δ‏، ε‏، ζ‏، η، θ‏، ι‏، κ‏، λ‏، μ‏، ν‏، ξ‏، ο‏، π‏، ρ‏، σ‏، τ‏،‏υ‏، φ‏، χ‏، ψ‏، ω

بررسی فرمت اسناد اصلی

هنگام ایجاد فایل های PDF/XPS/OOXML قابل جستجو، از اسناد اصلی مناسب برای پردازش OCR جهت بهبود دقت پردازش استفاده کنید.
مورد
جزئیات
فرمت سند اصلی
اسناد چاپی، اسناد پردازشگر Word (اسناد حاوی متن، گرافیک، عکس یا جدول و بدون نویسه کچ)
فرمت متنی
نوشته های افقی و عمودی (اسناد حاوی نوشته های افقی و عمودی نیز قابل تشخیص هستند)
برای زبان های اروپایی و متن کره ای، تنها نوشته های افقی قابل تشخیص است.
اسناد یک تا سه ستونی بدون تنظیمات پیچیده ستون
اندازه نویسه
8 تا 40 نقطه
فرمت جدول (فقط برای فرمت Word)
جدول هایی که با شرایط زیر مطابقت دارند:
جدول های حاوی مربع هایی که با خطوط تقسیم شده اند
جدول های دارای حداکثر 32 ستون
جدول های دارای حداکثر 32 ردیف
برخی اسناد اصلی مناسب برای پردازش OCR ممکن است به درستی پردازش نشوند.
با اسناد اصلی که شامل مقدار زیادی متن در هر صفحه می باشند، ممکن است دقت بالایی به دست نیاید.
ممکن است به دلیل رنگ پس زمینه سند اصلی، فرم و اندازه نویسه ها یا نویسه های کج، نویسه ها با نویسه های ناخواسته جایگزین شوند یا جا بیفتند.*
ممکن است پاراگراف ها، شکست های خط یا جدول ها بازتولید نشوند.*
ممکن است برخی از بخش های تصاویر، عکس ها یا چاپ های مهری به عنوان نویسه تشخیص داده شوند و با نویسه ها جایگزین شوند.*
* وقتی Word به عنوان فرمت فایل انتخاب شود.
838E-09K