Ứng dụngJava, J2SE 6.0 (1.6)
Nền tảngWindows, macOS, Linux
LicensePerpetual
LoạiJava Component
GroupDocs

GroupDocs.Parser for Java

API Java dùng để trích xuất text, image và metadata từ tài liệu, PDF, archive và email; hỗ trợ cả file có mật khẩu, quét QR code, tách bảng và hyperlink.

  • Trích xuất text từ office documents, PDF files và images.
  • Lấy image từ office documents và PDF files.
  • Quét và giải mã QR code trong tài liệu và nội dung hình ảnh.
  • Trích xuất metadata của các định dạng tệp được hỗ trợ.
Bản quyền chính hãngTư vấn phiên bản và license phù hợp theo nhu cầu sử dụng.
Tư vấn license phù hợpHỗ trợ lựa chọn license theo quy mô triển khai và ngân sách.
Hỗ trợ doanh nghiệpTư vấn mua hàng, triển khai và hồ sơ doanh nghiệp.
Báo giá theo nhu cầuBáo giá theo phiên bản, số lượng và hình thức license.

Tổng quan

GroupDocs.Parser for Java tập trung vào bài toán trích xuất text, image và metadata từ tài liệu, bản trình bày, archive và email trong ứng dụng Java. API này hỗ trợ parsing raw text, structured text và formatted text, phù hợp cho các quy trình đọc nội dung tài liệu hoặc thu thập dữ liệu từ nhiều nguồn tệp.

Screenshot of GroupDocs.Parser for Java

Khả năng xử lý file có mật khẩu là điểm đáng chú ý khi làm việc với các định dạng phổ biến như word processing documents, Microsoft Excel spreadsheets, Microsoft PowerPoint presentations, Microsoft OneNote, PDF files và ZIP archives.

Metadata của các định dạng được hỗ trợ cũng có thể được truy xuất trực tiếp.

Tính năng nổi bật

  • Trích xuất text từ office documents, PDF files và images.
  • Lấy image từ office documents và PDF files.
  • Quét và giải mã QR code trong tài liệu và nội dung hình ảnh.
  • Trích xuất metadata của các định dạng tệp được hỗ trợ.
  • Nhận diện và tách dữ liệu bảng từ PDF documents.
  • Tìm hyperlink và email address trong office documents hoặc PDF files.
  • Parse dữ liệu từ PDF Forms có trường nhập liệu.

Ứng dụng thực tế

  • Xây dựng dịch vụ backend Java để trích xuất nội dung và metadata từ kho tài liệu doanh nghiệp.
  • Tự động đọc bảng, hyperlink hoặc dữ liệu biểu mẫu từ PDF trong quy trình xử lý hồ sơ.
  • Phân tích file đính kèm email và archive để thu thập dữ liệu phục vụ indexing hoặc kiểm tra nội dung.
  • Tạo công cụ tìm kiếm nội dung tài liệu theo từ khóa hoặc pattern trong hệ thống nội bộ.
  • Xử lý tài liệu số hóa có chứa QR code hoặc hình ảnh cần trích xuất.

Đối tượng sử dụng phù hợp

  • Java developers xây dựng hệ thống xử lý tài liệu
  • Technical leads phụ trách tích hợp API parsing vào backend services
  • QA và test engineers cần kiểm tra dữ liệu trích xuất từ nhiều định dạng tệp
  • Đội ngũ kỹ thuật mua sắm thư viện Java cho nhu cầu document parsing và metadata extraction

Thông tin kỹ thuật

Supported Java Versions:J2SE 6.0 (1.6), J2SE 7.0 (1.7), J2SE 8.0 (1.8) or above.
Supported Operating Systems:Microsoft Windows 2003 Server (x64, x86), Microsoft Windows 2008 Server (x64, x86), Microsoft Windows 2012 Server (x64, x86), Microsoft Windows 2012 R2 Server (x64, x86), Microsoft Windows 2016 Server (x64, x86), Microsoft Windows 2019 Server (x64, x86), Microsoft Windows Vista (x64, x86), Microsoft Windows XP (x64, x86), Microsoft Windows 7 (x64, x86), Microsoft Windows 8,8.1 (x64, x86), Microsoft Windows 10 (x64, x86).
Cloud platform:Microsoft Azure.
Linux support:Linux (Ubuntu, OpenSUSE, CentOS, and others).
Mac support:Mac OS X.
Supported Word formats:DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF.
Nhận báo giá phần mềm bản quyền

Điền thông tin để chúng tôi có thể gửi báo giá phù hợp trong thời gian sớm nhất.

Câu hỏi thường gặp

GroupDocs.Parser for Java dùng để làm gì?

API này dùng để trích xuất text, image và metadata từ documents, presentations, archives và emails trong ứng dụng Java.

Có hỗ trợ file có mật khẩu không?

Có. API hỗ trợ trích xuất text và metadata từ password protected files trong nhiều định dạng phổ biến.

Có thể parse dữ liệu từ PDF Forms không?

Có. API hỗ trợ parse dữ liệu từ PDF Forms với các trường nhập liệu.

Những hệ điều hành nào được hỗ trợ?

Sản phẩm hỗ trợ Windows, Linux, Mac OS X và Microsoft Azure.

Java version nào tương thích?

Hỗ trợ J2SE 6.0 (1.6), J2SE 7.0 (1.7), J2SE 8.0 (1.8) hoặc cao hơn.

Bình luận

Để lại bình luận

Email của bạn sẽ không được công khai. Trường bắt buộc có dấu *.