إجراء المسح الضوئي باستخدام وظيفة التعرف البصري على الحروف (OCR)

يمكّنك هذا الوضع من إجراء التعرف البصري على الحروف (OCR) لاستخراج البيانات التي يمكن التعرف عليها كنص من الصورة الممسوحة ضوئيًا وإنشاء ملف PDF / XPS / OOXML (بتنسيق pptx/docx) يمكن البحث فيه. يُمكنك أيضًا تعيين <مضغوط> إذا حددت PDF أو XPS كتنسيق الملف.

المسح الضوئي باستخدام OCR

1
ضع المستند الأصلي. وضع المستندات الأصلية
2
اضغط على <مسح ضوئي وإرسال>. شاشة <الرئيسية>
3
حدد الوجهة على شاشة الميزات الأساسية للمسح الضوئي. شاشة الميزات الأساسية للمسح الضوئي
4
حدّد إعدادات المسح الضوئي حسب الحاجة. العمليات الأساسية للمسح الضوئي للمستندات الأصلية
5
حدد تنسيق ملف.
إذا كنت ترغب في فصل صور متعددة وإرسالها كملفات منفصلة، يتكون كل منها من صفحة واحدة فقط، فاضغط على <تقسيم إلى صفحات>‏  وأدخل رقم الصفحات لتقسيمها بواسطة  واضغط على <موافق>. إذا كنت ترغب في مسح الصور ضوئيًا كملف واحد، فاضغط على <تقسيم إلى صفحات>‏  <إلغاء الإعدادات>.
لتحديد PDF‏
لتحديد XPS
لتحديد تنسيق Word لـ OOXML‏
لتحديد تنسيق PowerPoint لـ OOXML‏
6
اضغط على <موافق>.
إذا حددت <PDF ؛OCR>، أو <XPS؛ OCR>، أو<OOXML؛ OCR> كتنسيق ملف، وقمت بضبط <مسح ضوئي ذكي> على <تشغيل> في ‎<OCR (Text Searchable) Settings>‎، يتم اكتشاف اتجاه المستند الأصلي، ويتم تدوير المستند تلقائيًا إذا لزم الأمر قبل إرساله. ‎<إعدادات OCR (نص قابل للبحث)>‎
إذا حددت <PDF> أو <XPS> كتنسيق ملف، فيُمكنك تعيين <مضغوط>و‎<تنسيق OCR (نص قابل للبحث فيه)>‎ في الوقت نفسه. في هذه الحالة، يتم عرض <PDF؛ مضغوط> أو <XPS؛ Compact> كتنسيق ملف على شاشة الميزات الأساسية "مسح ضوئي وإرسال".
إذا حددت <Word> لـ <OOXML>، فيمكنك الضبط لحذف صور الخلفية الممسوحة ضوئيًا. يمكنك إنشاء ملفات Word التي يسهل تحريرها دون صور غير مرغوب فيها. <تضمين صور الخلفية في ملف Word>
حدد لغة أو مجموعة لغات وفقًا للغة المستخدمة في المستندات الممسوحة ضوئيًا. الإعدادات واللغات لمعالجة OCR

نتائج OCR غير مُرضية

عند إنشاء ملفات PDF / XPS / OOXML قابلة للبحث فيها، قد لا تتم معالجة التعرف البصري على الحروف (OCR) بشكل صحيح. قد يكون السبب في ذلك أن الإعدادات الموجودة على الجهاز أو اللغة أو نوع الحرف أو تنسيق المستند الأصلي غير مناسبة لمعالجة OCR.

التحقق من إعدادات الجهاز واللغات المدعومة

يمكنك تحسين معالجة OCR من خلال تخصيص إعدادات الجهاز فيما يتعلق بالتعرف على الحروف وفقًا للمستندات الأصلية، أو باستخدام أنواع الحروف المناسبة أو الخطوط في المستندات الأصلية حتى يتسنى للجهاز التعرف على الحروف.

الإعدادات واللغات لمعالجة OCR

العنصر
التفاصيل
إعدادات اللغة للتعرف على الحروف
عندما يتم تحديد لغة باستخدام OCR المحدد في <تنسيق الملف>:
يتم التعرف على الحروف بناءً على اللغة التي تحددها لكل تنسيق ملف.
عندما لا يتم تحديد لغة باستخدام OCR المحدد في ‎<تنسيق الملف>‎:
يتم التعرف على الحروف بناءً على اللغة التي تحددها في ‎<تبديل اللغة/لوحة المفاتيح>‎ (<تبديل اللغة/لوحة المفاتيح>).*1
اللغات الآسيوية التي يمكن التعرف عليها
اليابانية، والصينية (المبسطة)، والصينية (التقليدية)، والكورية
أنواع وخطوط الحروف التي يمكن التعرف عليها (اللغات الآسيوية)
اللغات ومجموعات اللغات الأوروبية التي يمكن التعرف عليها
اللغات:
الإنجليزية، الفرنسية، الإيطالية، الألمانية، الإسبانية، الهولندية، البرتغالية، الألبانية، الكاتالانية، الدانماركية، الفنلندية، الآيسلندية، النرويجية، السويدية، الكرواتية، التشيكية، المجرية، البولندية، السلوفاكية، الإستونية، اللاتفية، الليتوانية، الروسية، اليونانية، التركية
مجموعات اللغات:
لغة أوروبا الغربية (ISO)‏*2، لغة وسط أوروبا (ISO)‏*3، البلطقية (ISO)*4
أنواع وخطوط الحروف التي يمكن التعرف عليها (اللغات الأوربية)
*1 قد تختلف اللغات المعروضة في القائمة. إذا حددت الإنجليزية أو الفرنسية أو الإيطالية أو الألمانية أو الإسبانية أو التايلندية أو الفيتنامية، يتم التعرف على اللغة المُحددة كلغة أوروبا الغربية (ISO).
*2 بما في ذلك الإنجليزية، والفرنسية، والإيطالية، والألمانية، والإسبانية، والهولندية، والبرتغالية، والألبانية، والكاتالانية، والدانمركية، والفنلندية، والآيسلندية، والنرويجية، والسويدية.
*3 بما في ذلك الكرواتية، والتشيكية، والمجرية، والبولندية، والسلوفاكية.
*4 بما في ذلك الإستونية، واللاتفية والليتوانية.

أنواع وخطوط الحروف التي يمكن التعرف عليها (اللغات الآسيوية)

العنصر
التفاصيل
أنواع الحروف التي يمكن التعرف عليها
اليابانية:
الحروف الأبجدية الرقمية، وحروف كانا، وحروف كانجي (المستوى الأول من JIS، وبعض المستوى الثاني من JIS)، والرموز
الصينية (المبسطة):
الحروف الأبجدية الرقمية، والحروف الصينية، والرموز (GB2312-80)
الصينية (التقليدية):
الحروف الأبجدية الرقمية، والحروف الصينية، والرموز (Big5)
الكورية:
الأحرف الأبجدية الرقمية، والحروف الصينية، وحروف هانغل، والرموز (KSC5601)
الخطوط التي يمكن التعرف عليها
يدعم الجهاز العديد من الخطوط. (ينصح باختيار نوع الخط مينغ تشو.)
لا يمكن التعرف على الحروف المائلة.
الخطوط المستخدمة للحروف المحولة بالمسح الضوئي (فقط عند تحديد Word باعتباره تنسيق الملف).
اليابانية:
الحروف الآسيوية: MS Mincho
الحروف الأوروبية: Century
الصينية (المبسطة):
الحروف الآسيوية: SimSun
الحروف الأوروبية: Calibri
الصينية (التقليدية):
الحروف الآسيوية: PMingLiU
الحروف الأوروبية: Calibri

أنواع وخطوط الحروف التي يمكن التعرف عليها (اللغات الأوربية)

العنصر
التفاصيل
أنواع الحروف التي يمكن التعرف عليها
الحروف الأبجدية الرقمية، والحروف الخاصة باللغة التي يتم التعرف عليها* والرموز
الخطوط التي يمكن التعرف عليها
يدعم الجهاز العديد من الخطوط. (يوصى باختيار الخطوط Times وCentury وArial)
يمكن التعرف على الحروف المائلة.
الخطوط المستخدمة للحروف المحولة بالمسح الضوئي (فقط عند تحديد Word باعتباره تنسيق الملف).
Calibri
لا يمكن نسخ أي نمط مائل.
* يمكن التعرف على الحروف اليونانية الخاصة التالية. يمكن أيضًا التعرف على الحروف الخاصة لكل لغة. لا يمكن التعرف على بعض الأحرف الخاصة اعتمادًا على اللغات.
Α،‏ Β،‏ Γ،‏ Δ،‏ Ε،‏ Ζ،‏ Η،‏ Θ،‏ Ι،‏ Κ،‏ Λ،‏ Μ،‏ Ν،‏ Ξ،‏ Ο،‏ Π،‏ Ρ،‏ Σ،‏ Τ،‏ Υ،‏ Φ،‏ Χ،‏ Ψ،‏ Ω،‏ α،‏ β،‏ γ،‏ δ،‏ ε،‏ ζ،‏ η،‏ θ،‏ ι،‏ κ،‏ λ،‏ μ،‏ ν،‏ ξ،‏ ο،‏ π،‏ ρ،‏ σ،‏ τ،‏υ،‏ φ،‏ χ،‏ ψ،‏ ω

التحقق من تنسيق المستندات الأصلية

استخدم المستندات الأصلية المناسبة لمعالجة OCR لتحسين دقة المعالجة عند إنشاء ملفات PDF / XPS / OOXML قابلة للبحث فيها.
العنصر
التفاصيل
تنسيق المستند الأصلي
المستندات المطبوعة أو مستندات معالجات الكلمات (مستندات تتكون من نصوص أو رسومات أو صور فوتوغرافية أو جداول، ومن دون ميل للحروف)
تنسيق النص
الكتابة الأفقية والرأسية (يمكن أيضًا التعرف على المستندات التي تحتوي على الكتابة الأفقية والرأسية)
يمكن التعرف على الكتابة الأفقية فقط للغات الأوروبية والنصوص الكورية.
مستندات ذات أعمدة يتراوح عددها من واحد إلى ثلاثة مع عدم وجود إعدادات أعمدة معقدة
حجم الحرف
من 8 إلى 40 نقطة
تنسيق الجدول (لتنسيق Word فقط)
الجداول التي تُلبي الشروط التالية:
تتكون الجداول من مربعات مقسمة بخطوط ثابتة
الجداول التي بها ما يصل إلى 32 عمودًا
الجداول التي بها ما يصل إلى 32 صفًا
قد لا تتم معالجة بعض المستندات الأصلية المناسبة لمعالجة OCR بشكل صحيح.
لا يمكن تحقيق دقة عالية مع المستندات الأصلية بما في ذلك كمية كبيرة من النص في كل صفحة.
قد يتم استبدال الحروف بحروف غير مقصودة أو قد تكون مفقودة بسبب لون خلفية المستند الأصلي أو شكل الحروف أو حجمها أو الأحرف المائلة.*
لا يجوز إعادة نسخ الفقرات أو فواصل الأسطر أو الجداول.*
قد يتم التعرف على بعض أجزاء الرسوم التوضيحية أو الصور الفوتوغرافية أو بصمات الختم كحروف ويمكن استبدالها بحروف.*
* عند تحديد Word كتنسيق الملف.
A12S-08H