OCR
OCR (Optical Character Recognition)
एक तकनीक जो मुद्रित या हस्तलिखित पाठ की छवियों का विश्लेषण करती है और उन्हें मशीन-पठनीय, संपादन योग्य पाठ में परिवर्तित करती है।
तकनीकी विवरण
आधुनिक OCR पाइपलाइन में इमेज प्रीप्रोसेसिंग (डीस्क्यूइंग, बाइनराइज़ेशन, नॉइज़ रिमूवल), लेआउट एनालिसिस (टेक्स्ट ब्लॉक और रीडिंग ऑर्डर की पहचान), कैरेक्टर सेगमेंटेशन और न्यूरल नेटवर्क-आधारित रिकग्निशन शामिल हैं। Tesseract (ओपन-सोर्स) और क्लाउड-आधारित API अग्रणी इंजन हैं। सटीकता इनपुट गुणवत्ता पर निर्भर करती है — सीधा, उच्च-कंट्रास्ट टेक्स्ट 99%+ सटीकता देता है, जबकि हस्तलिखित या कम-रिज़ॉल्यूशन वाला इनपुट महत्वपूर्ण चुनौतियां प्रस्तुत करता है।
उदाहरण
```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```