AI bịa thông tin — hay còn gọi là hallucination — đang trở thành rủi ro ít người để ý khi triển khai AI trong doanh nghiệp.
“ChatGPT nói thế cơ mà?” — câu này đang trở thành lý do để nhiều người tin vào những thông tin chưa được kiểm chứng. Vấn đề là các công cụ AI tạo sinh có một đặc tính ít người để ý: chúng có thể bịa ra thông tin sai và trình bày nó bằng giọng văn tự tin như thể đó là sự thật. Hiện tượng này có tên: AI bịa thông tin, hay “hallucination”.
Phụ lục
ToggleAI bịa thông tin (hallucination) là gì?
Hallucination là khi mô hình AI tạo ra nội dung nghe hợp lý nhưng sai sự thật, hoặc hoàn toàn không có thật: một con số thống kê không tồn tại, một điều luật bịa đặt, một trích dẫn gán cho người chưa từng nói câu đó, hay một “nguồn tham khảo” dẫn tới bài viết không hề tồn tại.
Điểm khiến hallucination nguy hiểm không phải là việc AI sai — con người cũng sai — mà là việc AI sai một cách đầy tự tin. Nó không nói “tôi không chắc”. Nó trả lời trơn tru, đúng văn phong, đúng định dạng, khiến người đọc khó nghi ngờ.

Vì sao AI lại bịa thông tin?
Bản chất của các mô hình ngôn ngữ lớn (LLM) là dự đoán từ tiếp theo có xác suất cao nhất, dựa trên dữ liệu chúng được huấn luyện. Chúng tối ưu cho việc tạo ra câu trả lời “nghe đúng”, không phải câu trả lời “đã được kiểm chứng là đúng”. Một vài nguyên nhân chính:
Mô hình không tra cứu nguồn thực tế khi trả lời, mà tái tạo lại theo trí nhớ thống kê — dễ “lấp” khoảng trống bằng thông tin tự suy ra. Khi câu hỏi nằm ngoài dữ liệu huấn luyện hoặc quá cụ thể (số liệu mới, tài liệu nội bộ), mô hình vẫn cố trả lời thay vì nói “không biết”. Ngoài ra, dữ liệu huấn luyện bản thân cũng có thể chứa thông tin sai, lỗi thời hoặc mâu thuẫn.
3 tình huống hallucination gây thiệt hại thật cho doanh nghiệp
Với doanh nghiệp và cơ quan tổ chức, rủi ro không nằm ở việc AI viết sai một bài blog, mà ở những nơi thông tin được dùng để ra quyết định:
Báo cáo trình lãnh đạo: một con số AI bịa lọt vào slide họp hội đồng có thể dẫn tới quyết định đầu tư sai.
Rà soát hợp đồng và pháp lý: AI “nhớ nhầm” một điều khoản hoặc viện dẫn điều luật không tồn tại.
Tra cứu tài liệu nội bộ: nhân viên hỏi AI về quy định công ty và nhận câu trả lời nghe hợp lý nhưng không khớp tài liệu gốc.

Làm sao để giảm thiểu rủi ro AI bịa thông tin?

Không thể “tắt” hoàn toàn hallucination ở các chatbot AI mở, nhưng có thể kiểm soát nó bằng cách thay đổi cách AI làm việc:
Thứ nhất, bắt AI trả lời dựa trên tài liệu thật do bạn cung cấp, thay vì dựa vào “trí nhớ” chung chung — đây là kỹ thuật grounding, còn gọi là RAG (Retrieval-Augmented Generation).
Thứ hai, yêu cầu AI luôn trích dẫn nguồn cụ thể — đoạn nào, trang nào trong tài liệu gốc — để người dùng có thể kiểm chứng ngay.
Thứ ba, thiết kế hệ thống cho phép AI nói “không tìm thấy trong tài liệu” thay vì cố suy diễn câu trả lời.
Sự khác biệt giữa một hệ thống AI đáng tin và một chatbot thông thường nằm ở đây: không phải AI nào “nghe mượt” cũng là AI bạn dám đặt chữ ký lên kết quả của nó.


