Tổng quan
Aspose.OCR for C++ tập trung vào bài toán nhận dạng ký tự quang học trong ứng dụng C++. API này hỗ trợ phát hiện các mảnh văn bản, nhờ đó có thể nhận diện tiêu đề và đoạn văn trên những trang chứa hình ảnh hoặc bảng.

Thư viện xử lý nhiều nguồn đầu vào quen thuộc như JPEG, PNG, TIFF, BMP, PDF nhiều trang, thư mục và tệp ZIP. Kết quả nhận dạng có thể xuất sang Text, PDF, Microsoft Word, Microsoft Excel, RTF, JSON và XML để phục vụ các quy trình xử lý dữ liệu tiếp theo.
API OCR cho C++ giúp trích xuất văn bản từ ảnh, PDF nhiều trang, thư mục và tệp ZIP. Hỗ trợ nhận diện hơn 140 ngôn ngữ, vùng văn bản, URL image và xuất kết quả sang PDF, Word, Excel, JSON, XML.
Tính năng nổi bật
- Trích xuất văn bản từ ảnh smartphone với độ chính xác ở mức scan.
- Nhận diện tiêu đề và đoạn văn nhờ hỗ trợ text fragment detection.
- Đọc toàn bộ trang hoặc chỉ một dòng theo nhu cầu xử lý.
- Xử lý JPEG, PNG, TIFF và BMP trong cùng quy trình OCR.
- Đọc ảnh từ PDF nhiều trang, thư mục và tệp ZIP.
- Chuyển bản scan thành PDF có thể tìm kiếm và lập chỉ mục.
- Nhận diện ảnh từ URL mà không cần tải cục bộ.
Ứng dụng thực tế
- Số hóa nội dung từ ảnh và tài liệu scan trong phần mềm C++ nội bộ.
- Tạo PDF có thể tìm kiếm từ hồ sơ scan nhiều trang.
- Xử lý OCR hàng loạt cho thư mục ảnh, kho ZIP và PDF nhiều trang.
- Tìm kiếm chuỗi văn bản hoặc biểu thức chính quy trong tập ảnh.
- Đối chiếu nội dung văn bản giữa hai ảnh trong quy trình kiểm thử hoặc kiểm tra dữ liệu.
Đối tượng sử dụng phù hợp
- Lập trình viên C++ xây dựng tính năng OCR trong desktop app hoặc backend service
- Nhóm kỹ thuật cần trích xuất dữ liệu từ ảnh, scan và tài liệu nhiều trang
- QA và test engineer cần so sánh nội dung văn bản giữa các ảnh đầu vào
- Technical buyer đang tìm thư viện OCR thương mại cho môi trường Windows, macOS hoặc Ubuntu
Thông tin kỹ thuật
Câu hỏi thường gặp
Aspose.OCR for C++ dùng trong môi trường nào?
Thư viện dành cho C++ và hỗ trợ Microsoft Visual Studio 2017 từ phiên bản 15.3, Visual Studio 2019 và Visual Studio for Mac từ phiên bản 7.1.
Có thể OCR tài liệu nhiều trang không?
Có. Sản phẩm hỗ trợ Multi-page PDF và Batch OCR cho thư mục hoặc tệp ZIP.
Kết quả nhận dạng xuất ra được những định dạng nào?
Text, PDF, Microsoft Word, Microsoft Excel, RTF, JSON và XML.
Thư viện có hỗ trợ tiếng Việt không?
Có. Danh sách ngôn ngữ nhận dạng bao gồm Vietnamese trong nhóm Extended Latin alphabet.
Có thể chỉ OCR một phần ảnh không?
Có. Thư viện hỗ trợ nhận diện các vùng cụ thể của ảnh và cũng có thể đọc chỉ một dòng.




Bình luận