T
Trinh Digital
Dịch vụ AI

Custom GPT bị hallucinate: Khi AI tự 'bịa' thông tin về sản phẩm bạn

Trinh Digital · · 10 phút đọc

Hình dung thế này: bạn vừa triển khai chatbot AI cho website bán thiết bị y tế. Khách hàng hỏi “Máy đo huyết áp Omron HEM-7156 có đo được nhịp tim không?” Chatbot trả lời tự tin: “Có, model HEM-7156 có tính năng đo nhịp tim tích hợp, hiển thị trên màn hình LED.” Nghe rất chuyên nghiệp — ngoại trừ việc thông tin này hoàn toàn sai. Model HEM-7156 không có tính năng đó. Đây chính là hiện tượng AI hallucination — khi AI tự “bịa” thông tin một cách rất thuyết phục.

Bài viết này phân tích sâu về AI hallucination: tại sao nó xảy ra, hậu quả thực tế cho doanh nghiệp, và quan trọng nhất — cách khắc phục triệt để.

AI Hallucination là gì?

AI hallucination (ảo giác AI) là hiện tượng mô hình AI tạo ra thông tin sai sự thật nhưng trình bày với sự tự tin cao, khiến người đọc tin rằng đó là sự thật.

Thuật ngữ “hallucination” (ảo giác) được mượn từ y học — giống như bệnh nhân nhìn thấy thứ không tồn tại. AI “nhìn thấy” patterns trong training data và tạo ra thông tin nghe hợp lý nhưng không chính xác.

Các dạng hallucination phổ biến

DạngVí dụMức nguy hiểm
Bịa số liệu”Sản phẩm X đạt chứng nhận FDA năm 2023” (chưa bao giờ có)Rất cao
Bịa tính năng”Model Y hỗ trợ kết nối Bluetooth 5.0” (thực tế không có)Cao
Bịa chính sách”Bảo hành 5 năm” (thực tế chỉ 2 năm)Rất cao
Trộn thông tinLấy spec của sản phẩm A gán cho sản phẩm BCao
Bịa nguồn tham chiếu”Theo nghiên cứu của ĐH Bách Khoa 2025…” (không tồn tại)Trung bình
Tự tin với thông tin cũTrả lời giá từ 2024 khi giá đã đổiTrung bình

Tại sao AI hallucinate? Nguyên nhân kỹ thuật (giải thích đơn giản)

1. AI không “biết” — AI “đoán” từ tiếp theo

ChatGPT, GPT-4, Claude — tất cả đều hoạt động bằng cách dự đoán từ tiếp theo hợp lý nhất. Khi bạn hỏi “Máy đo huyết áp Omron HEM-7156 có tính năng gì?”, AI tìm trong “ký ức” (training data) các patterns liên quan đến “Omron”, “máy đo huyết áp”, “tính năng”… rồi ghép lại thành câu trả lời nghe hợp lý.

Vấn đề: nếu training data không chứa thông tin chính xác về model cụ thể đó, AI sẽ lấy thông tin từ model khác hoặc bịa ra — vì “không biết” không phải option mặc định.

2. AI không phân biệt được “biết” vs “không biết”

Con người biết khi nào mình không biết. AI thì không. Khi thiếu thông tin, AI không nói “Tôi không biết” mà sẽ tạo ra câu trả lời có vẻ hợp lý nhất từ các patterns đã học. Đây là hạn chế cốt lõi của kiến trúc LLM hiện tại.

3. Custom GPT: Tốt hơn nhưng chưa đủ

Custom GPT giúp giảm hallucination bằng cách cung cấp knowledge files. Nhưng:

  • Giới hạn context: Chỉ xử lý được ~128K tokens cùng lúc
  • Retrieval không hoàn hảo: AI có thể “bỏ qua” thông tin trong files nếu câu hỏi phức tạp
  • Fallback sang general knowledge: Khi không tìm thấy trong files, AI sẽ trả lời từ training data — và hallucinate

Hậu quả thực tế: Khi hallucination gây thiệt hại cho doanh nghiệp

Case 1: Chatbot bán hàng bịa spec sản phẩm

Một công ty bán thiết bị điện tử dùng Custom GPT làm chatbot tư vấn. Chatbot bịa rằng laptop model X “có pin 12 tiếng” (thực tế chỉ 6 tiếng). Khách mua, phát hiện sai → khiếu nại → công ty phải đổi trả + mất uy tín.

Thiệt hại ước tính: 50 triệu VND (đổi trả + chi phí xử lý khiếu nại) + mất 15 khách hàng tiềm năng (word of mouth tiêu cực).

Case 2: AI bịa chính sách bảo hành

Chatbot của một cửa hàng nội thất nói “Sản phẩm này được bảo hành 10 năm” — trong khi chính sách thực tế là 3 năm. Khách hàng screenshot và đòi quyền lợi sau 5 năm.

Thiệt hại: Phải honor cam kết do chatbot đưa ra (theo Luật Bảo vệ quyền lợi người tiêu dùng), chi phí sửa chữa/thay thế ~30 triệu VND.

Case 3: AI cho thông tin y tế sai

Chatbot của nhà thuốc trả lời sai liều lượng thuốc. May mắn khách hàng kiểm chứng với dược sĩ trước khi uống.

Rủi ro tiềm ẩn: Nghiêm trọng — có thể ảnh hưởng sức khỏe, gây ra trách nhiệm pháp lý.

Đo lường: Hallucination rate theo giải pháp

Giải phápHallucination rateĐiều kiện
ChatGPT thuần15-25%Không có context doanh nghiệp
Custom GPT8-15%Có knowledge files nhưng giới hạn
RAG cơ bản3-8%Knowledge base đầy đủ
RAG + Guardrails1-3%Có validation layer
RAG + Human-in-the-loop< 1%AI + con người verify

Nguồn: Tổng hợp từ các benchmark nội bộ Trinh Digital và nghiên cứu Stanford HAI 2025.

Cách khắc phục: Từ “bịa thông tin” đến “chính xác 97%+“

Giải pháp 1: RAG — Cho AI “sách giáo khoa” thay vì để tự bịa

RAG (Retrieval-Augmented Generation) là giải pháp hiệu quả nhất để giảm hallucination. Thay vì để AI trả lời từ “ký ức”, RAG buộc AI phải truy xuất thông tin từ knowledge base trước khi trả lời.

Cơ chế hoạt động:

  1. Khách hỏi: “Máy X có tính năng gì?”
  2. Hệ thống tìm trong knowledge base → Tìm thấy tài liệu spec của máy X
  3. AI trả lời DỰA TRÊN tài liệu đã tìm được
  4. Nếu không tìm thấy → AI nói “Tôi không có thông tin về vấn đề này, xin liên hệ hotline…”

Kết quả: Hallucination rate giảm từ 15-25% xuống 3-8%.

Giải pháp 2: Guardrails — “Hàng rào an toàn” cho AI

Guardrails là lớp validation giữa AI và người dùng:

Fact-checking tự động:

  • AI trả lời → Hệ thống kiểm tra xem câu trả lời có khớp với knowledge base không
  • Nếu phát hiện mâu thuẫn → Flagging hoặc từ chối câu trả lời

Output filtering:

  • Không cho AI đưa ra cam kết pháp lý (bảo hành, đền bù)
  • Không cho AI tư vấn y tế, pháp luật
  • Bắt buộc trích dẫn nguồn cho mọi claim

Confidence scoring:

  • AI gắn điểm tin cậy cho mỗi câu trả lời
  • Confidence < 80% → “Tôi không chắc chắn, xin xác nhận với nhân viên”
  • Confidence < 50% → “Tôi không có thông tin, xin liên hệ hotline”

Giải pháp 3: Human-in-the-loop — Con người giám sát AI

Cho các use case critical (y tế, tài chính, pháp lý):

  • AI soạn draft câu trả lời
  • Nhân viên review và approve trước khi gửi cho khách
  • Dần dần mở rộng auto-response cho câu hỏi có confidence cao

Giải pháp 4: Prompt Engineering — “Dạy” AI thành thật

Những instruction cần có trong system prompt:

- Chỉ trả lời dựa trên thông tin trong knowledge base
- Nếu không tìm thấy thông tin, nói rõ: "Tôi không có thông tin về vấn đề này"
- Không bao giờ bịa số liệu, thông số, hoặc chính sách
- Khi không chắc chắn, đề xuất khách liên hệ hotline/email
- Luôn trích dẫn nguồn cho thông tin quan trọng

So sánh chi phí khắc phục

Giải phápChi phíHallucination ratePhù hợp cho
Prompt Engineering0-2 triệu VNDGiảm 30-50%Bước đầu, mọi DN
RAG30-100 triệu VNDGiảm 80-90%SME cần accuracy cao
RAG + Guardrails50-150 triệu VNDGiảm 95%+DN có use case critical
RAG + Human-in-loop80-200 triệu VNDGiảm 99%+Y tế, tài chính, pháp lý

Checklist: Đánh giá rủi ro hallucination cho doanh nghiệp bạn

Rủi ro CAO — Cần RAG + Guardrails

  • Chatbot trả lời về thông số kỹ thuật sản phẩm
  • AI tư vấn về chính sách bảo hành, đổi trả
  • AI đưa ra thông tin liên quan đến sức khỏe
  • AI trả lời câu hỏi pháp lý, hợp đồng
  • AI xử lý thông tin tài chính (giá, chiết khấu)

Rủi ro TRUNG BÌNH — RAG là đủ

  • Chatbot FAQ chung về doanh nghiệp
  • AI hỗ trợ nhân viên nội bộ tra cứu quy trình
  • AI gợi ý sản phẩm (recommendation)
  • AI tổng hợp báo cáo từ data nội bộ

Rủi ro THẤP — Custom GPT có thể chấp nhận

  • AI viết content marketing
  • AI brainstorm ý tưởng
  • AI dịch thuật, tóm tắt tài liệu
  • AI hỗ trợ soạn email (người review trước khi gửi)

FAQ — Câu hỏi thường gặp

Có cách nào loại bỏ hoàn toàn hallucination không?

Với công nghệ hiện tại (2026), chưa thể loại bỏ 100%. Nhưng có thể giảm xuống mức chấp nhận được (< 1%) bằng RAG + Guardrails + Human-in-the-loop. Quan trọng hơn: xây dựng “graceful fallback” — khi AI không chắc chắn, nó chuyển sang nhân viên thay vì bịa câu trả lời.

Tôi đang dùng Custom GPT và thấy ổn, có cần nâng cấp không?

Phụ thuộc vào use case. Nếu chatbot chỉ trả lời câu hỏi chung chung, Custom GPT có thể đủ. Nhưng nếu chatbot cần trả lời chính xác về sản phẩm cụ thể, chính sách, hoặc thông tin nhạy cảm — bạn CHẮC CHẮN cần nâng cấp lên RAG. Hallucination rate 8-15% nghĩa là cứ 7-12 câu trả lời, có 1 câu sai — đủ để mất khách hàng.

Khách hàng phát hiện chatbot trả lời sai thì xử lý thế nào?

(1) Xin lỗi ngay và cung cấp thông tin chính xác; (2) Ghi nhận lỗi để cập nhật knowledge base; (3) Nếu khách đã hành động dựa trên thông tin sai (mua hàng, ký hợp đồng), cần honor cam kết hoặc đền bù thỏa đáng; (4) Review toàn bộ hệ thống để ngăn lỗi tương tự. Minh bạch và nhanh chóng xử lý là cách tốt nhất để giữ trust.

Kết luận

AI hallucination không phải lý do để từ chối ứng dụng AI — nhưng là lý do để triển khai AI đúng cách. Custom GPT là bước khởi đầu tốt, nhưng cho use case doanh nghiệp nghiêm túc, bạn cần RAG + Guardrails để đảm bảo AI trả lời chính xác và đáng tin cậy.

Đừng để chatbot “bịa” thông tin làm mất uy tín doanh nghiệp bạn.

👉 Liên hệ Trinh Digital để được tư vấn giải pháp AI chính xác, an toàn cho doanh nghiệp bạn.

#accuracy#AI#RAG#hallucination
Chia sẻ: Z

Sẵn sàng chuyển đổi số cùng Trinh Digital?

Liên hệ ngay để nhận tư vấn miễn phí. Đội ngũ chuyên gia sẽ phân tích nhu cầu và đề xuất giải pháp tối ưu.

Zalo