Tổng quan
Aspose.OCR for Java tập trung vào nhận dạng ký tự và optical mark recognition cho ứng dụng Java. API này phục vụ các bài toán OCR/OMR khi cần đọc nội dung từ ảnh, tài liệu scan và biểu mẫu mà không phải tự xây dựng engine nhận dạng từ đầu.

Phạm vi đầu vào bao gồm JPEG, PNG, TIFF, GIF, Bitmap, Scanned PDF, Multi-page PDF, ZIP và thư mục. Cách tiếp cận này phù hợp cho cả xử lý từng ảnh riêng lẻ lẫn batch OCR trên tập tài liệu nhiều trang hoặc archive.
API OCR và OMR cho Java, hỗ trợ nhận dạng văn bản từ ảnh, PDF scan, thư mục, ZIP và URL. Xuất kết quả sang Text, PDF, Word, Excel, HTML, RTF, ePub, JSON, XML và CSV.
Tính năng nổi bật
- Thêm OCR và OMR trực tiếp vào ứng dụng Java.
- Trích xuất văn bản từ ảnh smartphone với scan-level accuracy.
- Chuyển bản scan thành searchable PDF có thể chỉnh sửa.
- Nhận dạng ảnh từ URL mà không cần tải về máy cục bộ.
- Đọc hàng loạt ảnh từ multi-page documents, folders và archives.
- Nhận diện văn bản với nhiều font và style phổ biến.
- Tinh chỉnh từng tham số OCR để điều chỉnh kết quả nhận dạng.
Ứng dụng thực tế
- Số hóa tài liệu scan thành nội dung có thể tìm kiếm và tái sử dụng.
- Xử lý OCR hàng loạt cho thư mục ảnh, ZIP và PDF nhiều trang.
- Đọc dữ liệu từ ảnh chụp điện thoại trong ứng dụng Java.
- Nhận dạng biểu mẫu và optical marks trong quy trình xử lý hồ sơ.
- Xuất dữ liệu OCR sang Word, Excel hoặc các định dạng JSON, XML, CSV.
Đối tượng sử dụng phù hợp
- Java developers
- Technical leads
- QA/test engineers kiểm thử pipeline OCR
- Nhóm xây dựng hệ thống số hóa tài liệu
Thông tin kỹ thuật
Câu hỏi thường gặp
Aspose.OCR for Java hỗ trợ Java phiên bản nào?
Thành phần hỗ trợ Java SE 8 and later.
Có thể chạy trên hệ điều hành nào?
Sản phẩm hỗ trợ Windows, Linux và macOS.
Những định dạng đầu vào nào có thể nhận dạng?
Danh sách gồm JPEG, PNG, TIFF, GIF, Bitmap, Scanned PDF, Multi-page PDF, ZIP và Folder.
Kết quả OCR có thể xuất sang những định dạng nào?
Có thể xuất sang Text, PDF, Microsoft Word, Microsoft Excel, HTML, RTF, ePub, JSON, XML và CSV.
API có hỗ trợ tài liệu đa ngôn ngữ không?
Có. API hỗ trợ hơn 140 ngôn ngữ nhận dạng và tự động phát hiện ngôn ngữ.




Bình luận