Tổng quan
GroupDocs.Classification for.NET tập trung vào bài toán phân loại văn bản và tài liệu trong các ứng dụng.NET. API này hướng tới C#, ASP.NET, VB.NET, J# và các môi trường.NET khác, cho phép đưa chức năng classification vào quy trình xử lý nội dung mà không cần phụ thuộc công cụ ngoài.

Nền tảng hỗ trợ bốn taxonomy gồm IAB-2, Document, Sentiment và Sentiment3. IAB-2 phục vụ gán danh mục văn bản chuẩn hóa, Document taxonomy áp dụng cho nhiều loại tài liệu, còn Sentiment và Sentiment3 phục vụ phân tích cảm xúc trên nội dung đầu vào.
API phân loại văn bản và tài liệu cho ứng dụng.NET, hỗ trợ taxonomy IAB-2, Document, Sentiment và Sentiment3. Xử lý PDF, Word, OpenDocument, RTF, TXT mà không cần cài công cụ ngoài.
Tính năng nổi bật
- Phân loại văn bản và tài liệu bằng taxonomy nâng cao.
- Hỗ trợ IAB-2 để gán danh mục văn bản chuẩn hóa.
- Áp dụng Document taxonomy cho nhiều loại tài liệu.
- Thực hiện sentiment classification với Sentiment và Sentiment3.
- Phân tích nội dung ở mức văn bản, câu và từng từ.
- Trả về số lượng kết quả phân loại theo cấu hình.
- Điều chỉnh cân bằng precision và recall cho Documents taxonomy classification.
Ứng dụng thực tế
- Phân loại nội dung bài viết hoặc văn bản theo taxonomy IAB-2 trong hệ thống content analysis.
- Gán loại tài liệu cho kho lưu trữ PDF, Word, OpenDocument và TXT.
- Phân tích sentiment cho nội dung đa ngôn ngữ với language auto-detection.
- Bổ sung API classification vào ứng dụng web ASP.NET hoặc ứng dụng desktop Windows.
Đối tượng sử dụng phù hợp
- Lập trình viên.NET cần tích hợp classification API vào ứng dụng
- Nhóm phát triển ASP.NET xử lý văn bản và tài liệu trên máy chủ
- Technical lead xây dựng hệ thống phân loại nội dung hoặc tài liệu doanh nghiệp
- Đội ngũ kỹ thuật cần đánh giá lựa chọn thư viện classification cho nền tảng.NET
Thông tin kỹ thuật
Câu hỏi thường gặp
GroupDocs.Classification for.NET xử lý loại dữ liệu nào?
API này phân loại văn bản và tài liệu, bao gồm nội dung ở mức văn bản, câu và từng từ.
Những taxonomy nào có trong sản phẩm?
Các taxonomy được nêu gồm IAB-2, Document, Sentiment và Sentiment3.
Có hỗ trợ định dạng PDF và Word không?
Có. Danh sách định dạng gồm PDF, DOC, DOCM, DOCX, DOT, DOTM, DOTX, RTF, ODT, OTT và TXT.
Sentiment classification hỗ trợ ngôn ngữ nào?
English, Chinese, Spanish và German, kèm language auto-detection.
Có cần cài thêm công cụ xử lý tài liệu bên ngoài không?
Không. Thư viện sử dụng document processing engine riêng và không yêu cầu external tools.




Bình luận