Giao diện
Câu hỏi thường gặp (FAQ) — AI Knowledge Base
Cài đặt và cấu hình
Có cần vector database riêng không?
Không bắt buộc. Plugin hỗ trợ lưu vector trực tiếp trong PostgreSQL thông qua extension pgvector. Nếu database hiện tại là PostgreSQL, chỉ cần cài extension:
sql
CREATE EXTENSION IF NOT EXISTS vector;Với quy mô lớn (hàng triệu vectors), có thể cân nhắc vector database chuyên dụng như Pinecone hoặc Weaviate.
Nên dùng embedding model nào?
| Model | Nhà cung cấp | Ưu điểm | Nhược điểm |
|---|---|---|---|
text-embedding-3-small | OpenAI | Cân bằng chi phí/chất lượng | Cần API key |
text-embedding-3-large | OpenAI | Chất lượng cao nhất | Chi phí gấp 5 lần |
text-embedding-ada-002 | OpenAI | Tương thích ngược | Cũ hơn, kém hơn v3 |
| Ollama embeddings | Local | Miễn phí, riêng tư | Chất lượng phụ thuộc model |
Khuyến nghị: Bắt đầu với text-embedding-3-small — phù hợp hầu hết trường hợp sử dụng.
Plugin này khác gì AI Skills trong plugin-ai?
- AI Knowledge Base: Quản lý tài liệu đầy đủ (upload, chunking, embedding, search)
- AI Skills: Giao diện để gán knowledge base vào bot — là cầu nối giữa knowledge base và AI bot
Hai plugin bổ trợ nhau: Knowledge Base quản lý dữ liệu, AI Skills gắn kết với bot.
Sử dụng
Upload tài liệu nhưng bot trả lời sai?
Đây là vấn đề phổ biến nhất. Thử các bước sau:
- Kiểm tra tài liệu: Đảm bảo nội dung liên quan đến câu hỏi thực sự có trong tài liệu
- Giảm chunk size: Chunk nhỏ hơn (500–800) cho kết quả tìm kiếm chính xác hơn với câu hỏi cụ thể
- Tăng topK: Lấy nhiều kết quả hơn (10–15) để LLM có thêm ngữ cảnh
- Kiểm tra format file: PDF dạng scan (hình ảnh) cần OCR — nếu không có OCR, nội dung sẽ trống
- System prompt: Hướng dẫn bot ưu tiên thông tin từ knowledge base và trích dẫn nguồn
Có thể cập nhật tài liệu đã upload không?
Không hỗ trợ cập nhật trực tiếp. Quy trình cập nhật:
- Xoá tài liệu cũ (xoá luôn chunks + embeddings)
- Upload phiên bản mới
- Hệ thống tự động tạo lại chunks và embeddings
Làm sao biết tài liệu đã xử lý xong?
Xem trường status của tài liệu:
| Trạng thái | Ý nghĩa | Hành động |
|---|---|---|
processing | Đang chunking + embedding | Chờ hoàn tất |
ready | Sẵn sàng tìm kiếm | Có thể sử dụng |
failed | Xử lý lỗi | Kiểm tra log, thử upload lại |
Nên tổ chức knowledge base như thế nào?
- Theo chủ đề: "Nhân sự", "Sản phẩm", "Hỗ trợ kỹ thuật" — mỗi chủ đề một KB
- Theo phòng ban: Bot nhân sự gán KB nhân sự, bot bán hàng gán KB sản phẩm
- Tránh gộp tất cả tài liệu vào một KB — tìm kiếm kém chính xác, tốn token
Lỗi thường gặp
Lỗi "Embedding failed"
- API key của LLM provider không có quyền sử dụng embedding model
- Kiểm tra API key còn quota (billing credit)
- Với OpenAI: đảm bảo key có quyền truy cập
text-embedding-*models
Tìm kiếm không trả về kết quả
| Nguyên nhân | Giải pháp |
|---|---|
Tài liệu chưa xử lý xong (processing) | Chờ status chuyển sang ready |
| Câu hỏi không liên quan đến nội dung | Kiểm tra tài liệu có chứa thông tin cần tìm |
| TopK quá thấp | Tăng topK lên 10–15 |
| Embedding model không phù hợp | Thử model khác (ví dụ: từ ada-002 lên text-embedding-3-small) |
Tài liệu PDF không trích xuất được nội dung
- PDF dạng scan (hình ảnh chụp) cần OCR để chuyển thành text
- Kiểm tra file PDF có thể copy-paste text hay không — nếu không thì cần convert trước
- PDF có password protection sẽ không đọc được — bỏ password trước khi upload