Tổng quan
GroupDocs.Parser Product Family tập trung vào bài toán trích xuất text, image và metadata từ nhiều định dạng tài liệu. Bộ sản phẩm gồm hai thành phần cho.NET và Java, phù hợp khi cần đưa khả năng đọc nội dung tài liệu vào ứng dụng nội bộ hoặc hệ thống xử lý tài liệu.

Với GroupDocs.Parser for.NET, API phục vụ các ứng dụng nghiệp vụ phát triển bằng C#, ASP.NET và các công nghệ.NET khác. Thành phần này hỗ trợ trích xuất raw text, formatted text, structured text cùng metadata từ các tệp thuộc định dạng được hỗ trợ.
API trích xuất text, image và metadata từ nhiều định dạng tài liệu, gồm thành phần cho.NET và Java. Hỗ trợ phân tích raw, formatted, structured text và tài liệu có mật khẩu.
Tính năng nổi bật
- Trích xuất text, image và metadata từ nhiều định dạng tài liệu.
- Bao gồm thành phần riêng cho.NET và Java.
- Phân tích raw text trong ứng dụng.NET.
- Camera Metadata — Phân tích structured text cho quy trình xử lý tài liệu.
- Truy xuất metadata từ các định dạng tệp được hỗ trợ.
- Xử lý tài liệu có mật khẩu trong các định dạng phổ biến.
- Đọc Microsoft Word documents để lấy text và metadata.
Ứng dụng thực tế
- Tích hợp chức năng đọc nội dung tài liệu vào ứng dụng.NET hoặc Java.
- Xây dựng dịch vụ trích xuất metadata từ kho tài liệu nhiều định dạng.
- Phân tích tài liệu văn phòng có mật khẩu trong hệ thống nội bộ.
- Tạo pipeline xử lý PDF, Word, Excel, PowerPoint, OneNote và ZIP.
- Phù hợp cho ứng dụng nghiệp vụ cần đọc nội dung và metadata từ tài liệu.
Đối tượng sử dụng phù hợp
- Lập trình viên.NET
- Lập trình viên Java
- Nhóm phát triển ứng dụng nghiệp vụ
- Technical buyer cần API parsing tài liệu
Thông tin kỹ thuật
Câu hỏi thường gặp
GroupDocs.Parser Product Family bao gồm những gì?
Bộ sản phẩm bao gồm các thành phần cho.NET và Java.
API này có thể trích xuất những loại dữ liệu nào?
API hỗ trợ trích xuất text, image và metadata.
Có hỗ trợ tài liệu có mật khẩu không?
Có. Cả thành phần.NET và Java đều hỗ trợ phân tích tệp hoặc tài liệu có mật khẩu trong các định dạng phổ biến được nêu.
Những định dạng nào được nhắc đến rõ ràng?
Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, OneNote, PDF files và ZIP archives.




Bình luận