OCR
OCR (광학 문자 인식)
인쇄되거나 손으로 쓴 텍스트의 이미지를 분석하여 컴퓨터에서 편집하고 검색할 수 있는 기계 판독 가능 텍스트로 변환하는 기술입니다.
기술 세부사항
현대 OCR 파이프라인에는 이미지 전처리(기울기 보정, 이진화, 노이즈 제거), 문자 분할, CNN 또는 트랜스포머 기반 모델을 이용한 특징 추출, 그리고 후처리(사전 기반 맞춤법 교정, 맥락 분석)가 포함됩니다. Tesseract(오픈소스)와 Google Cloud Vision(클라우드)이 널리 사용되는 엔진입니다.
예시
```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```
관련 도구
M
Merge PDF
S
Split PDF
C
Compress PDF
R
Rotate PDF
A
Add Page Numbers
P
PDF to JPG
W
Watermark PDF
R
Reorder PDF Pages
F
Flatten PDF
E
Edit PDF Metadata
S
Sign PDF
J
JPG to PDF
E
Extract Text from PDF
P
PDF 페이지 삭제
P
PDF 역순 정렬
P
PDF 페이지 추출
홀
홀수/짝수 페이지 추출
P
PDF 페이지 크기 변경
P
PDF 자르기
빈
빈 페이지 삽입
P
PDF 페이지 복제
P
PDF를 PNG로 변환
머
머리글 및 바닥글 추가
P
PDF에 텍스트 추가
P
PDF에 이미지 추가