एक तकनीक जो मुद्रित या हस्तलिखित पाठ की छवियों का विश्लेषण करती है और उन्हें मशीन-पठनीय, संपादन योग्य पाठ में परिवर्तित करती है।

OCR (Optical Character Recognition) — यह कैसे काम करता है

तकनीकी विवरण

आधुनिक OCR पाइपलाइन में इमेज प्रीप्रोसेसिंग (डीस्क्यूइंग, बाइनराइज़ेशन, नॉइज़ रिमूवल), लेआउट एनालिसिस (टेक्स्ट ब्लॉक और रीडिंग ऑर्डर की पहचान), कैरेक्टर सेगमेंटेशन और न्यूरल नेटवर्क-आधारित रिकग्निशन शामिल हैं। Tesseract (ओपन-सोर्स) और क्लाउड-आधारित API अग्रणी इंजन हैं। सटीकता इनपुट गुणवत्ता पर निर्भर करती है — सीधा, उच्च-कंट्रास्ट टेक्स्ट 99%+ सटीकता देता है, जबकि हस्तलिखित या कम-रिज़ॉल्यूशन वाला इनपुट महत्वपूर्ण चुनौतियां प्रस्तुत करता है।

```javascript // OCR: PDF manipulation example import { PDFDocument } from 'pdf-lib'; const pdfDoc = await PDFDocument.load(fileBytes); const pages = pdfDoc.getPages(); console.log(`Pages: ${pages.length}`); ```

Categories

OCR

तकनीकी विवरण

उदाहरण

संबंधित टूल्स

संबंधित शब्द