Huấn luyện

Tại EasyChatGPT, sau khi khởi tạo AI chatbot bằng tên miền, bạn có thể huấn luyện AI chatbot bằng cách nhập câu hỏi mẫu, tệp tài liệu... tại mục Nguồn dữ liệu.

Dữ liệu từ website

AI chatbot được khởi tạo sẽ mặc định học dữ liệu từ tên miền website đã nhập, EasyChatGPT sẽ ưu tiên các liên kết thuộc các trang quan trọng như Trang chủ, Giới thiệu, Sản phẩm, Dịch vụ...

Lưu ý: EasyChatGPT chỉ có thể quét các trang đã khai báo sitemap với công cụ tìm kiếm. Trước khi nạp dữ liệu cho EasyChatGPT, bạn cần:

  • Kiểm tra trang web trong chế độ "Disable JavaScript": Sử dụng các công cụ dành cho nhà phát triển của trình duyệt để xem trang web của bạn trông như thế nào khi JS bị tắt.

  • Sử dụng rendering trên phía máy chủ (SSR): SSR giúp đảm bảo rằng nội dung của trang web luôn có sẵn cho Google Bot, ngay cả khi JS bị tắt.

  • Tối ưu hóa cho các công cụ tìm kiếm (SEO): Đảm bảo rằng nội dung của trang web được cấu trúc rõ ràng và dễ hiểu cho cả người dùng và bot.

  • Sử dụng các công cụ kiểm tra SEO: Các công cụ này có thể giúp bạn xác định các vấn đề liên quan đến SEO trên trang web của bạn.

>>> Xem thêm: Hướng dẫn chuẩn hoá dữ liệu cho AI chatbot EasyChatGPT

Dữ liệu từ câu hỏi mẫu Q&A

Câu hỏi mẫu là nguồn dữ liệu bổ trợ cho những nội dung chưa được cập nhật trên website, nhắm trực diện vào những thắc mắc thường gặp của người dùng.

Chúng tôi chấp nhận các định dạng văn bản (text), liên kết trong phần câu trả lời của câu hỏi mẫu.

Lưu ý: số lượng câu hỏi mẫu không giới hạn. Khi nhập câu hỏi, bạn nên:

  • Nhóm các câu hỏi theo chủ đề (ví dụ: Sản phẩm, Đơn hàng, Bảo hành, Thông tin liên hệ).

  • Viết câu hỏi theo cách khách hàng thường hỏi.

  • Cung cấp câu trả lời ngắn gọn, chứa từ khoá tìm kiếm.

  • Cập nhật câu hỏi và câu trả lời thường xuyên dựa trên phản hồi của khách hàng.

Dữ liệu từ Tệp tài liệu

Chúng tôi chấp nhận các định dạng tệp: PDF, CSV, DOC, TXT, XLS tối đa 10MB/tệp. Mỗi tài khoản đăng ký gói Cơ bản/Nâng cao/Tuỳ chỉnh sẽ giới hạn số lượng tệp khác nhau.

Yêu cầu:

  • PDF: Đảm bảo văn bản có thể được trích xuất (không phải ảnh quét).

  • CSV: Sử dụng hàng đầu tiên làm tiêu đề cột, giải thích ý nghĩa của mỗi cột.

  • DOC/DOCX: Sử dụng các styles có sẵn để định dạng văn bản.

  • TXT: Tổ chức thông tin theo cấu trúc rõ ràng, sử dụng dấu cách hoặc ký tự đặc biệt để phân tách các phần.

  • XLS/XLSX: Đặt tên rõ ràng cho mỗi sheet, sử dụng hàng đầu làm tiêu đề.

Bạn có thể kiểm tra nội dung tài liệu đã được quét hoặc đổi tên tệp tại giao diện tài liệu chi tiết.

Dữ liệu từ liên kết đơn

Bao gồm các liên kết ngoài site map trong miền mặc định. Liên kết này thường phù hợp với các website có nhiều miền phụ hoặc các doanh nghiệp sở hữu nhiều website khác nhau nhưng muốn dùng 1 bot để hiểu sâu về doanh nghiệp và tư vấn tổng quan nhất.

(Sắp ra mắt) Dữ liệu từ liên kết YouTube