Tổng quan
Aspose.OCR for.NET tập trung vào việc bổ sung OCR/OMR cho ứng dụng.NET thông qua một API có tập lớp điều khiển nhận dạng ký tự. Thư viện hỗ trợ các định dạng ảnh phổ biến và cho phép xử lý cả ảnh scan lẫn tài liệu nhiều trang.

Khả năng nhận dạng bao phủ nhiều tình huống thực tế như đọc ký tự và font từ ảnh, nhận diện kiểu chữ bold và italic, khử nhiễu, quét toàn bộ ảnh hoặc chỉ một vùng ảnh.
Ảnh cũng có thể được nhận dạng trực tiếp từ URL mà không cần tải cục bộ.
Tính năng nổi bật
- Trích xuất văn bản từ ảnh chụp smartphone với độ chính xác ở mức scan.
- Chuyển bản scan thành PDF có thể tìm kiếm và lập chỉ mục.
- Nhận dạng ảnh từ URL mà không cần tải về máy cục bộ.
- Đọc ảnh trong tài liệu nhiều trang, thư mục và archive.
- Nhận diện văn bản trên nhiều typeface và style phổ biến.
- Tinh chỉnh từng tham số OCR cho kết quả nhận dạng phù hợp hơn.
- Tự động sửa lỗi chính tả trong đầu ra OCR.
Ứng dụng thực tế
- Số hóa tài liệu scan thành nội dung có thể tìm kiếm và lập chỉ mục.
- Trích xuất dữ liệu văn bản từ ảnh, PDF scan, thư mục tài liệu và file nén.
- Xử lý ảnh chụp từ smartphone trong quy trình nhập liệu hoặc lưu trữ hồ sơ.
- Nhận dạng tài liệu đa ngôn ngữ có nội dung trộn nhiều hệ chữ viết.
- Xuất kết quả OCR sang Word, Excel, HTML, JSON, XML hoặc CSV để tích hợp hệ thống.
Đối tượng sử dụng phù hợp
- Lập trình viên.NET cần tích hợp OCR vào ứng dụng desktop, server hoặc cross-platform
- Nhóm kỹ thuật xây dựng quy trình số hóa tài liệu và trích xuất dữ liệu
- Tech lead cần thư viện OCR hỗ trợ nhiều framework.NET và nhiều hệ điều hành
- Đơn vị xử lý tài liệu đa ngôn ngữ hoặc tài liệu scan nhiều trang
Thông tin kỹ thuật
Câu hỏi thường gặp
Aspose.OCR for.NET xử lý những nguồn đầu vào nào?
Thư viện hỗ trợ JPEG, PNG, TIFF, BMP, GIF, Scanned PDF, Multi-page PDF, DjVu, ZIP Folder và Batch OCR.
Kết quả OCR có thể xuất sang định dạng nào?
Kết quả có thể xuất sang Text, PDF, Microsoft Word, Microsoft Excel, HTML, RTF, ePub, JSON, XML và CSV.
Thư viện có hỗ trợ tài liệu đa ngôn ngữ không?
Có. Aspose.OCR for.NET hỗ trợ hơn 140 ngôn ngữ và nhận dạng tài liệu trộn nhiều ngôn ngữ như Chinese/English hoặc Arabic/French.
Có thể dùng trên hệ điều hành nào?
Phần tương thích liệt kê nhiều phiên bản Microsoft Windows x64, cùng macOS và Linux.
Có hỗ trợ hậu xử lý bằng LLM không?
Có. Thư viện có AI-powered correction, semantic postprocessing và plug-in LLM pipelines.




Bình luận