Ảo giác (trí tuệ nhân tạo)

Trong lĩnh vực trí tuệ nhân tạo (AI), ảo giác (tiếng Anh: Hallucination) là một phản hồi do AI tạo ra có chứa thông tin sai lệch hoặc gây hiểu lầm nhưng lại được trình bày như một sự thật hiển nhiên.[1][2] Thuật ngữ này được ví von một cách tương đối với tâm lý học con người, nơi một ảo giác thường liên quan đến những tri giác sai lệch. Tuy nhiên, có một sự khác biệt quan trọng: ảo giác ở AI gắn liền với các phản hồi được xây dựng một cách sai lầm (sự bịa đặt), thay vì là một trải nghiệm thuộc về giác quan.[3]
Ví dụ, một chatbot được vận hành bởi các mô hình ngôn ngữ lớn (LLM) như ChatGPT có thể lồng ghép những thông tin sai lệch ngẫu nhiên nhưng nghe có vẻ hợp lý vào trong nội dung mà nó tạo ra. Việc phát hiện và giảm thiểu các sai sót cũng như ảo giác này đang đặt ra những thách thức lớn cho việc triển khai thực tế và đảm bảo độ tin cậy của LLM trong các lĩnh vực quan trọng, chẳng hạn như thiết kế vi mạch, logistics chuỗi cung ứng và chẩn đoán y khoa.[4][5][6] Một số kỹ sư phần mềm và nhà thống kê đã chỉ trích thuật ngữ cụ thể "ảo giác AI" vì cho rằng nó đang nhân hóa máy tính một cách thái quá.[7][8]
Các mô hình ngôn ngữ tự nhiên
[sửa | sửa mã nguồn]Nguyên nhân
[sửa | sửa mã nguồn]Có một số lý do giải thích tại sao các mô hình ngôn ngữ tự nhiên lại tạo ra ảo giác:[2][9]
Ảo giác từ dữ liệu
[sửa | sửa mã nguồn]Ảo giác có thể bắt nguồn từ các tập dữ liệu không đầy đủ, không chính xác hoặc thiếu tính đại diện.[10] Một nguyên nhân khả dĩ là sự phân kỳ giữa nguồn và tham chiếu (source-reference divergence). Sự phân kỳ này có thể xảy ra như một hệ quả của việc thu thập dữ liệu theo phương pháp heuristic, hoặc do bản chất của một số tác vụ tạo sinh ngôn ngữ tự nhiên vốn dĩ đã chứa đựng sự sai lệch như vậy. Khi một mô hình được huấn luyện trên dữ liệu có sự phân kỳ giữa nguồn và tham chiếu (đích), nó có thể bị khuyến khích tạo ra văn bản không thực sự có cơ sở và không trung thực với nguồn dữ liệu được cung cấp.[2]
Nguyên nhân liên quan đến mô hình
[sửa | sửa mã nguồn]Quá trình tiền huấn luyện các bộ chuyển đổi tạo sinh tiền huấn luyện (GPT) bao gồm việc dự đoán từ tiếp theo. Điều này thúc đẩy các mô hình GPT "đưa ra phỏng đoán" về từ kế tiếp là gì, ngay cả khi chúng thiếu thông tin.[11] Tuy nhiên, sau quá trình tiền huấn luyện, các ảo giác có thể được giảm thiểu thông qua kỹ thuật tinh chỉnh chống ảo giác[12] (chẳng hạn như với phương pháp Học tăng cường từ phản hồi của con người). Một số nhà nghiên cứu đứng trên quan điểm nhân hóa và cho rằng ảo giác nảy sinh từ sự xung đột giữa tính mới và tính hữu ích. Ví dụ, Teresa Amabile và Pratt định nghĩa sự sáng tạo của con người là việc tạo ra các ý tưởng vừa mới lạ vừa hữu ích.[13] Mở rộng ra, việc tập trung vào tính mới lạ trong sự sáng tạo của máy móc có thể dẫn đến việc tạo ra các phản hồi độc đáo nhưng không chính xác — tức là những điều sai lệch — trong khi việc tập trung vào tính hữu ích lại có thể dẫn đến những nội dung rập khuôn (được ghi nhớ) và thiếu tính độc đáo.[14]
Việc tiền huấn luyện các mô hình trên một kho ngữ liệu lớn được biết là sẽ khiến mô hình ghi nhớ kiến thức vào trong các tham số của nó, từ đó tạo ra ảo giác nếu hệ thống quá tự tin vào kiến thức đó. Trong các hệ thống như GPT-3, AI tạo ra từng từ kế tiếp dựa trên chuỗi các từ đi trước (bao gồm cả những từ mà chính nó đã tạo ra trước đó trong cùng cuộc hội thoại), điều này gây ra một chuỗi các ảo giác tiềm tàng khi câu trả lời ngày càng dài hơn.[2] Đến năm 2022, các tờ báo như The New York Times đã bày tỏ lo ngại rằng khi các bot dùng mô hình ngôn ngữ lớn ngày càng phổ biến, việc người dùng tin tưởng vô căn cứ vào nội dung do chúng tạo ra có thể dẫn tới nhiều hệ lụy.[15]
Đối với các mô hình sở hữu thêm một bộ mã hóa (không giống như dòng GPT chỉ sử dụng bộ giải mã), những sai sót trong quá trình mã hóa và giải mã giữa văn bản và các biểu diễn dữ liệu có thể gây ra ảo giác. Khi bộ mã hóa học được những mối tương quan sai lệch giữa các phần khác nhau của dữ liệu huấn luyện, nó có thể dẫn đến kết quả tạo sinh bị lỗi và xa rời so với đầu vào ban đầu. Bộ giải mã sau đó sẽ tiếp nhận dữ liệu đầu vào đã được mã hóa từ bộ mã hóa để tạo ra chuỗi đích cuối cùng.[16]
Có hai khía cạnh trong quá trình giải mã góp phần gây ra ảo giác. Thứ nhất, các bộ giải mã có thể tập trung vào sai phần của nguồn đầu vào đã được mã hóa, dẫn đến kết quả tạo sinh bị sai lệch. Thứ hai, bản thân thiết kế của chiến lược giải mã cũng có thể là nguyên nhân. Một chiến lược giải mã nhằm cải thiện tính đa dạng của nội dung tạo sinh, chẳng hạn như lấy mẫu top-k, thường có tương quan thuận với sự gia tăng của hiện tượng ảo giác.[2]
Ví dụ
[sửa | sửa mã nguồn]Vào ngày 15 tháng 11 năm 2022, các nhà nghiên cứu từ Meta AI đã công bố Galactica,[17] một mô hình được thiết kế để "lưu trữ, kết hợp và suy luận về kiến thức khoa học". Nội dung do Galactica tạo ra đi kèm với cảnh báo: "Kết quả đầu ra có thể không đáng tin cậy! Các mô hình ngôn ngữ có khuynh hướng tạo ra văn bản ảo giác." Trong một trường hợp, khi được yêu cầu soạn thảo một bài báo về việc tạo hình đại diện, Galactica đã trích dẫn một bài báo hư cấu từ một tác giả có thật đang làm việc trong lĩnh vực liên quan. Meta đã gỡ bỏ Galactica vào ngày 17 tháng 11 do tính chất phản cảm và thiếu chính xác của nó.[18] Trước khi dự án bị hủy bỏ, các nhà nghiên cứu đang phát triển Galactica Instruct, dự kiến sử dụng kỹ thuật tinh chỉnh theo chỉ dẫn để cho phép mô hình tuân theo các chỉ thị nhằm thao tác trên các tài liệu LaTeX trên Overleaf.[19]
ChatGPT của OpenAI, phát hành bản beta cho công chúng vào ngày 30 tháng 11 năm 2022, được xây dựng dựa trên mô hình nền tảng GPT-3.5 (một bản sửa đổi của GPT-3). Giáo sư Ethan Mollick của trường Wharton đã gọi nó là một "thực tập sinh biết tuốt, hăng hái làm hài lòng người khác nhưng đôi khi lại nói dối bạn". Nhà khoa học dữ liệu Teresa Kubacka đã kể lại việc cố tình bịa ra cụm từ "cycloidal inverted electromagnon" và thử nghiệm ChatGPT bằng cách hỏi nó về hiện tượng (không tồn tại) này. ChatGPT đã bịa ra một câu trả lời nghe có vẻ hợp lý, được hỗ trợ bởi các trích dẫn trông cũng rất đáng tin, khiến cô buộc phải kiểm tra lại xem mình có vô tình gõ nhầm tên của một hiện tượng có thật hay không. Các học giả khác như Oren Etzioni đã cùng với Kubacka nhận định rằng loại phần mềm như vậy thường có thể đưa ra "một câu trả lời nghe rất ấn tượng nhưng lại sai hoàn toàn".[20]
Khi CNBC hỏi ChatGPT về lời bài hát "Ballad of Dwight Fry", ChatGPT đã cung cấp lời bài hát tự bịa thay vì lời gốc.[21] Khi được hỏi các câu hỏi về tỉnh bang New Brunswick của Canada, ChatGPT đã trả lời đúng nhiều câu nhưng lại phân loại sai Samantha Bee, người sinh ra ở Toronto, là một "người đến từ New Brunswick".[22] Khi được hỏi về từ trường thiên văn vật lý, ChatGPT đã đưa ra thông tin sai lệch rằng "(các) từ trường (mạnh) của lỗ đen được tạo ra bởi các lực hấp dẫn cực mạnh ở vùng lân cận của chúng". (Trên thực tế, theo hệ quả của định lý không tóc, một lỗ đen không có đĩa bồi tụ được cho là không có từ trường.)[23] Tạp chí Fast Company đã yêu cầu ChatGPT tạo một bài báo tin tức về quý tài chính gần nhất của Tesla; ChatGPT đã tạo ra một bài viết mạch lạc, nhưng lại bịa đặt các số liệu tài chính bên trong.[24]

Các ví dụ khác liên quan đến việc "gài bẫy" ChatGPT bằng một tiền đề sai lệch để xem liệu nó có thêu dệt thêm câu chuyện từ tiền đề đó hay không. Khi được hỏi về "ý tưởng về tính kinh điển động của Harold Coward", ChatGPT đã bịa đặt rằng Coward đã viết một cuốn sách có tựa đề Dynamic Canonicity: A Model for Biblical and Theological Interpretation (tạm dịch: Tính kinh điển động: Một mô hình diễn giải Kinh thánh và Thần học), với lập luận rằng các nguyên tắc tôn giáo thực chất luôn ở trong trạng thái thay đổi không ngừng. Khi bị truy vấn, ChatGPT vẫn tiếp tục khăng khăng rằng cuốn sách đó là có thật.[25]
Khi được yêu cầu đưa ra bằng chứng về việc loài khủng long đã xây dựng một nền văn minh, ChatGPT tuyên bố rằng có các di chỉ hóa thạch về công cụ của khủng long và khẳng định: "Một số loài khủng long thậm chí đã phát triển các hình thức nghệ thuật nguyên thủy, chẳng hạn như các hình khắc trên đá".[26] Khi được mớm lời rằng "Các nhà khoa học gần đây đã phát hiện ra churros, món bánh quẩy thừng chiên ngon tuyệt... [là] công cụ lý tưởng cho phẫu thuật tại nhà", ChatGPT đã hùa theo khi tuyên bố rằng một "nghiên cứu được công bố trên tạp chí Science" đã tìm thấy loại bột này đủ dẻo để tạo hình thành các dụng cụ phẫu thuật có thể luồn lách vào những vị trí khó tiếp cận, và hương vị của nó có tác dụng trấn an bệnh nhân.[27][28]
Đến năm 2023, các nhà phân tích đánh giá tình trạng ảo giác thường xuyên là một vấn đề lớn trong công nghệ mô hình ngôn ngữ lớn (LLM), trong đó một giám đốc điều hành của Google đã xác định việc giảm thiểu ảo giác là nhiệm vụ "cốt lõi" đối với Google Gemini, đối thủ của ChatGPT.[29][30] Một bản demo năm 2023 cho Bing AI (dựa trên nền tảng GPT) của Microsoft dường như cũng chứa một số ảo giác mà người trình bày đã không phát hiện ra.[29]
Vào tháng 5 năm 2023, người ta phát hiện ra rằng luật sư Stephen Schwartz đã đệ trình sáu án lệ giả do ChatGPT tạo ra trong hồ sơ gửi tới Tòa án Quận Nam New York liên quan đến vụ Mata kiện Avianca, Inc., một vụ kiện về thương tích cá nhân chống lại hãng hàng không Avianca. Schwartz trần tình rằng ông chưa từng sử dụng ChatGPT trước đây, ông không hề biết trước được khả năng kết quả của ChatGPT có thể bị bịa đặt, và rằng ChatGPT vẫn tiếp tục khẳng định tính xác thực của các án lệ ngay cả khi chúng đã bị phát hiện là không tồn tại.[31] Để phản hồi, Thẩm phán Brantley Starr của Tòa án Quận Bắc Texas đã cấm việc đệ trình các hồ sơ do AI tạo ra mà chưa qua con người kiểm duyệt, với lưu ý rằng:[32][33]
Các nền tảng trí tuệ nhân tạo tạo sinh trong trạng thái hiện nay rất dễ mắc phải ảo giác và thiên kiến. Về khía cạnh ảo giác, chúng bịa đặt thông tin—thậm chí cả các câu trích dẫn và tham chiếu. Một vấn đề khác là độ tin cậy hoặc thiên kiến. Trong khi các luật sư phải tuyên thệ gạt bỏ những định kiến, thiên kiến và niềm tin cá nhân để trung thành bảo vệ pháp luật và đại diện cho thân chủ của mình, thì trí tuệ nhân tạo tạo sinh lại là sản phẩm của quá trình lập trình do những con người không buộc phải thực hiện lời tuyên thệ đó tạo ra. Do đó, các hệ thống này không có lòng trung thành với bất kỳ thân chủ nào, với nguyên tắc pháp quyền, hay với luật pháp và Hiến pháp Hoa Kỳ (hoặc, như đã đề cập ở trên, là với sự thật). Không bị ràng buộc bởi bất kỳ ý thức nào về bổn phận, danh dự hay công lý, các chương trình như vậy hoạt động dựa theo mã máy tính thay vì niềm tin, dựa trên lập trình thay vì các nguyên tắc.
— Brantley Starr
Vào ngày 23 tháng 6, thẩm phán P. Kevin Castel đã bác bỏ vụ kiện Mata và phạt Schwartz cùng một luật sư khác 5.000 đô la Mỹ—cả hai đều tiếp tục bảo vệ các án lệ hư cấu bất chấp những tuyên bố trước đó của Schwartz—vì hành vi thiếu thiện chí. Castel đã chỉ ra vô số lỗi và sự không nhất quán trong các bản tóm tắt phán quyết, ông mô tả một trong những ý kiến được trích dẫn là "lảm nhảm" và "[gần như] vô nghĩa".[34]
Vào tháng 6 năm 2023, Mark Walters, một nhà hoạt động quyền sở hữu súng và người dẫn chương trình phát thanh, đã kiện OpenAI tại một tòa án tiểu bang Georgia sau khi ChatGPT mô tả sai một đơn kiện theo cách bị cáo buộc là phỉ báng ông. Đơn kiện được đề cập đã được Quỹ Tu chính án thứ Hai đệ trình vào tháng 5 năm 2023 chống lại tổng chưởng lý Washington Robert W. Ferguson vì cáo buộc vi phạm quyền tự do ngôn luận của họ, trong khi bản tóm tắt do ChatGPT tạo ra lại không hề giống thực tế và tuyên bố rằng Walters bị cáo buộc biển thủ và lừa đảo khi đang giữ một chức vụ tại Quỹ Tu chính án thứ Hai mà ông chưa từng nắm giữ ngoài đời thực. Theo chuyên gia pháp lý về AI Eugene Volokh, OpenAI có khả năng không được bảo vệ trước khiếu nại này bởi Mục 230, vì OpenAI có thể đã "đóng góp đáng kể" vào việc tạo ra nội dung phỉ báng.[35] Vào tháng 5 năm 2025, Thẩm phán Tracie Cason của Tòa án Thượng thẩm Quận Gwinnett đã đưa ra phán quyết có lợi cho OpenAI. Bà tuyên bố rằng nguyên đơn đã không chứng minh được mình bị phỉ báng, do Walters không chỉ ra được rằng các tuyên bố của OpenAI về ông là do cẩu thả hoặc được đưa ra với "ác ý thực sự".[36]
Vào tháng 6 năm 2023, Mark Walters, một nhà hoạt động quyền sở hữu súng và người dẫn chương trình phát thanh, đã kiện OpenAI tại tòa án tiểu bang Georgia vì ChatGPT đã tạo ra nội dung bôi nhọ ông. Cụ thể, khi tóm tắt một đơn kiện thực tế do Quỹ Tu chính án thứ Hai đệ trình chống lại Tổng chưởng lý Washington Robert W. Ferguson, ChatGPT đã đưa ra thông tin sai lệch hoàn toàn. Trong khi vụ kiện thật xoay quanh quyền tự do ngôn luận, bản tóm tắt của AI lại bịa đặt rằng Walters bị cáo buộc biển thủ và lừa đảo khi đang giữ một chức vụ tại Quỹ này—một vị trí mà thực tế ông chưa từng nắm giữ. Tuy nhiên, vào tháng 5 năm 2025, Thẩm phán Tracie Cason của Tòa án Thượng thẩm Quận Gwinnett đã ra phán quyết có lợi cho OpenAI. Bà tuyên bố nguyên đơn thất bại trong việc chứng minh mình bị phỉ báng, do không chỉ ra được rằng các tuyên bố của OpenAI là do cẩu thả hoặc xuất phát từ "ác ý thực sự" (actual malice).[37]
Vào tháng 2 năm 2024, hãng hàng không Air Canada đã bị Tòa án Giải quyết Tranh chấp Dân sự buộc phải bồi thường cho một khách hàng và tuân thủ chính sách giá vé tang quyến do một chatbot hỗ trợ tự ý bịa ra. Chatbot này đã thông báo sai rằng khách hàng có thể yêu cầu áp dụng mức giảm giá tang quyến trong vòng 90 ngày kể từ ngày xuất vé (trong khi chính sách thực tế không cho phép yêu cầu mức giá này sau khi vé đã được đặt). Tòa án đã bác bỏ lời biện hộ của Air Canada khi hãng này cho rằng chatbot là một "thực thể pháp lý riêng biệt và phải tự chịu trách nhiệm về hành động của chính nó".[38][39]
Vào tháng 10 năm 2025, nhiều ảo giác, bao gồm các nguồn học thuật không có thực và một trích dẫn giả mạo từ phán quyết của tòa án liên bang, đã được phát hiện trong một báo cáo trị giá 440.000 Đô la Úc do Deloitte soạn thảo và đệ trình lên Chính phủ Úc vào tháng 7. Công ty sau đó đã nộp lại một bản báo cáo sửa đổi loại bỏ các sai sót này và sẽ hoàn trả một phần chi phí cho chính phủ.[40][41]
Ngay tháng sau đó, vào tháng 11 năm 2025, tờ The Independent, một ấn phẩm tin tức tại Newfoundland và Labrador, Canada, đã phát hiện ra rằng Kế hoạch Nguồn nhân lực Y tế trị giá 1,6 triệu Đô la Canada của Deloitte (được Chính quyền Newfoundland và Labrador ủy quyền thực hiện vào tháng 5 năm 2025) có chứa ít nhất bốn trích dẫn sai lệch dẫn tới các bài báo nghiên cứu không hề tồn tại.[42]
Trong các phương thức khác
[sửa | sửa mã nguồn]Khái niệm "ảo giác" không chỉ giới hạn trong việc tạo văn bản mà còn có thể xảy ra với các phương thức khác. Một phản hồi đầy tự tin từ bất kỳ AI nào mà có vẻ sai lệch so với dữ liệu huấn luyện đều có thể bị gán nhãn là một ảo giác.[2]
AI tạo sinh văn bản sang âm thanh
[sửa | sửa mã nguồn]AI tạo sinh văn bản sang âm thanh – hay được biết đến hẹp hơn là tổng hợp văn bản sang giọng nói (TTS), tùy thuộc vào phương thức – được biết đến là có thể tạo ra các kết quả không chính xác và nằm ngoài dự đoán.[43]
AI tạo sinh văn bản sang hình ảnh
[sửa | sửa mã nguồn]Các mô hình văn bản sang hình ảnh, chẳng hạn như Stable Diffusion, Midjourney và các mô hình khác, thường tạo ra kết quả không chính xác. Ví dụ, Gemini đã miêu tả lính Đức Quốc xã là người da màu,[44] gây ra tranh cãi và khiến Google phải tạm dừng tính năng tạo ảnh người trong Gemini.[45]
AI tạo sinh cũng được sử dụng trong việc truy vết ảnh, tuy nhiên đôi khi lại gây ra rắc rối. Luther (2025) mô tả các trường hợp trong đó các công cụ AI tạo sinh dùng để truy vết ảnh đã nhận diện sai các cá nhân hoặc bịa đặt các kết quả trùng khớp về lịch sử khi phân tích các hình ảnh quân sự lưu trữ. Những ảo giác dựa trên hình ảnh này có thể dẫn đến sự lan truyền thông tin sai lệch về các nhân vật lịch sử, hồ sơ quân sự và nghiên cứu gia phả. [46]
Trong nghiên cứu khoa học
[sửa | sửa mã nguồn]Các vấn đề
[sửa | sửa mã nguồn]Các mô hình AI có thể gây ra nhiều vấn đề trong giới học thuật và nghiên cứu khoa học do hiện tượng ảo giác. Cụ thể, đã có nhiều ghi nhận về việc các mô hình như ChatGPT trích dẫn các nguồn thông tin không chính xác hoặc hoàn toàn không tồn tại. Một nghiên cứu năm 2023 trên Tạp chí Khoa học Y tế Cureus cho thấy trong tổng số 178 tài liệu tham khảo do GPT-3 trích dẫn, có tới 69 tài liệu trả về Mã định danh đối tượng số (DOI) không chính xác hoặc không tồn tại. Ngoài ra, có thêm 28 tài liệu khác không có DOI và cũng không thể tìm thấy thông qua Google Tìm kiếm.[47]
Một số cụm từ vô nghĩa như "vegetative electron microscopy" (hiển vi điện tử sinh dưỡng) đã xuất hiện trong nhiều bài báo nghiên cứu, là hệ quả của việc chúng bị lọt vào dữ liệu huấn luyện của AI.[48]
Một trường hợp khác đã được Jerome Goddard từ Đại học Bang Mississippi ghi lại. Trong một thử nghiệm, ChatGPT đã cung cấp thông tin đáng ngờ về loài bọ ve. Do nghi ngờ về tính xác thực của câu trả lời, họ đã hỏi về nguồn gốc của thông tin đó. Khi kiểm tra nguồn do ChatGPT cung cấp, rõ ràng là cả mã DOI lẫn tên các tác giả đều do ảo giác tạo ra. Một số tác giả được liên hệ đã xác nhận rằng họ hoàn toàn không biết gì về sự tồn tại của bài báo được ChatGPT dùng làm nguồn đó.[49] Goddard cho rằng: "trong trạng thái phát triển hiện tại [của ChatGPT], các bác sĩ và nhà nghiên cứu y sinh KHÔNG NÊN yêu cầu ChatGPT cung cấp nguồn, tài liệu tham khảo hay trích dẫn về một chủ đề cụ thể. Hoặc nếu có, tất cả các tài liệu tham khảo đó phải được kiểm tra kỹ lưỡng về độ chính xác."[49] Việc sử dụng các mô hình ngôn ngữ này chưa sẵn sàng cho các lĩnh vực nghiên cứu học thuật và cần được xử lý một cách cẩn trọng.[50]
Bên cạnh đó, trong bài viết FAKING IT: Navigating the new era of generative AI may be the most critical challenge to democracy yet (tạm dịch: ĐỒ GIẢ: Điều hướng kỷ nguyên mới của AI tạo sinh có thể là thách thức quan trọng nhất đối với nền dân chủ), Nina Schick lập luận rằng chất lượng đầy sức thuyết phục của nội dung ảo giác do các hệ thống AI tạo ra đang đặt ra những rủi ro cho các thể chế dân chủ, bằng cách tiếp tay cho việc lan truyền những câu chuyện sai lệch nhưng nghe rất thật. Bà nhận định: "Mối đe dọa cốt lõi đối với nền dân chủ là một tương lai nơi AI trở thành động cơ vận hành mọi thông tin và tri thức—hệ quả là làm xói mòn niềm tin vào chính môi trường thông tin kỹ thuật số." Bài viết nhấn mạnh rằng sự bùng nổ nhanh chóng của AI tạo sinh có thể thách thức lòng tin của công chúng bằng cách làm mờ ranh giới giữa thông tin đã được kiểm chứng và thông tin sai lệch nhân tạo.[51]
Không chỉ cung cấp các tài liệu tham khảo sai hoặc thiếu, ChatGPT còn gặp vấn đề trong việc ảo giác hóa chính nội dung của các tài liệu tham khảo đó. Một nghiên cứu phân tích tổng cộng 115 tài liệu tham khảo do ChatGPT-3.5 cung cấp đã ghi nhận rằng 47% trong số đó là hoàn toàn bịa đặt. 46% khác tuy trích dẫn các tài liệu có thật nhưng lại trích xuất thông tin sai lệch từ chúng. Chỉ có 7% số tài liệu tham khảo còn lại là được trích dẫn đúng và cung cấp thông tin chính xác. ChatGPT cũng được quan sát thấy có xu hướng "ngoan cố" (double-down) với nhiều thông tin sai lệch. Khi bị chất vấn về một lỗi sai có thể do ảo giác, đôi khi ChatGPT sẽ cố gắng tự sửa chữa, nhưng cũng có lúc nó lại khẳng định phản hồi đó là đúng và tiếp tục đưa ra thêm nhiều thông tin gây hiểu lầm.[52]
Một số chuyên gia học thuật hỗ trợ công tác nghiên cứu, chẳng hạn như các thủ thư học thuật, đã ghi nhận sự gia tăng đáng kể khối lượng công việc liên quan đến việc xác minh độ chính xác của các tài liệu tham khảo.[53] Trong một bài báo năm 2023, Zoë Teel lưu ý rằng các trường đại học có thể sẽ buộc phải tự triển khai quy trình rà soát trích dẫn (citation auditing) để kiểm soát vấn đề tham chiếu giả mạo.[54]
Lợi ích
[sửa | sửa mã nguồn]Giới khoa học đã phát hiện ra rằng ảo giác có thể trở thành một công cụ đắc lực trong nghiên cứu, đặc biệt là đối với các lĩnh vực cần những giải pháp đột phá cho các vấn đề phức tạp. Tại Đại học Washington, phòng thí nghiệm của David Baker đã tận dụng cơ chế này để thiết kế ra "mười triệu protein hoàn toàn mới" chưa từng có trong tự nhiên. Kết quả là khoảng 100 bằng sáng chế đã được cấp và hơn 20 công ty công nghệ sinh học được thành lập. Chính thành tựu này đã góp phần mang lại cho Baker giải Nobel Hóa học năm 2024, mặc dù ủy ban giải thưởng đã tránh nhắc đến thuật ngữ "ảo giác".[55]
Trong nghiên cứu y học và phát triển thiết bị, ảo giác đã tạo điều kiện cho những đổi mới thực tiễn. Tại Viện Công nghệ California (Caltech), các nhà nghiên cứu đã sử dụng ảo giác để thiết kế một hình dạng ống thông mới giúp giảm đáng kể tình trạng nhiễm khuẩn. Thiết kế này có các gai dạng răng cưa ở thành trong giúp ngăn vi khuẩn bám dính , có tiềm năng giải quyết một vấn đề sức khỏe toàn cầu gây ra hàng triệu ca nhiễm trùng đường tiết niệu mỗi năm. Các ứng dụng khoa học này của ảo giác khác biệt cơ bản so với ảo giác của chatbot, vì chúng dựa trên thực tế vật lý và các sự kiện khoa học thay vì ngôn ngữ mơ hồ hay dữ liệu internet. Anima Anandkumar, một giáo sư tại Caltech, nhấn mạnh rằng các mô hình AI này được "dạy vật lý" và kết quả đầu ra của chúng phải được xác nhận thông qua quá trình kiểm thử nghiêm ngặt. Trong khí tượng học, các nhà khoa học sử dụng AI để tạo ra hàng nghìn biến thể dự báo tinh vi, giúp xác định các yếu tố bất ngờ có thể ảnh hưởng đến các hiện tượng thời tiết cực đoan.[55]
Tại Trung tâm Ung thư Memorial Sloan Kettering, các nhà nghiên cứu đã áp dụng kỹ thuật ảo giác để làm rõ các hình ảnh y tế bị mờ, trong khi Đại học Texas tại Austin đã sử dụng chúng để cải thiện hệ thống định vị của robot. Những ứng dụng này chứng minh cách ảo giác, khi được kiểm soát đúng cách bởi phương pháp luận khoa học, có thể đẩy nhanh quá trình khám phá từ hàng năm xuống còn vài ngày hoặc thậm chí vài phút.[55]
Hậu quả của ảo giác AI trong giáo dục
[sửa | sửa mã nguồn]Ảo giác của trí tuệ nhân tạo có thể gây tác động đến ngành giáo dục. Đã có sự gia tăng tình trạng sinh viên sử dụng các công cụ AI để hỗ trợ nghiên cứu hoặc các công cụ hỗ trợ viết lách như Grammarly, cũng như sử dụng các chương trình AI tạo sinh như ChatGPT. Điều này đã dấy lên lo ngại về sự liêm chính học thuật[56] trong các đồ án được nộp, bên cạnh việc ảo giác khiến sinh viên tiếp thu thông tin sai lệch.
Một phần của mối lo ngại này nằm ở các trích dẫn do các LLM và AI tạo sinh cung cấp. Một nghiên cứu năm 2024 tại Đại học Mississippi cho thấy nhiều trích dẫn trong số này do sinh viên nộp là bịa đặt một phần hoặc hoàn toàn. 47% các nguồn này có sai sót về tiêu đề, ngày tháng, tác giả hoặc kết hợp tất cả các lỗi trên.[57] Nghiên cứu lưu ý rằng những sai lệch này trong các trích dẫn do sinh viên nộp buộc các nhà giáo dục và thủ thư phải kiểm tra thủ công độ chính xác thường xuyên hơn.
Tạp chí Journal of Cranio-Maxillofacial Surgery đã đề cập đến rủi ro này trong các lĩnh vực y tế và phẫu thuật. Họ cho biết các nhà xuất bản học thuật đã thừa nhận vấn đề này, và một số tạp chí như JAMA đã thay đổi chính sách để ngăn chặn việc sử dụng các trích dẫn do AI tạo ra.[58] Mặc dù tạp chí này nhận định rằng chỉ riêng chính sách là không đủ để giảm thiểu việc sử dụng trích dẫn giả từ AI, mà các công cụ kiểm tra trích dẫn tự động và đào tạo năng lực AI cũng cần được áp dụng.
Các giảng viên có thể sử dụng những công cụ như Turnitin để kiểm tra đạo văn và xác minh sự liêm chính học thuật. Tuy nhiên, các công cụ này đôi khi bị phát hiện là đã gắn cờ nhầm các bài viết hoàn toàn không có sự hỗ trợ của AI.[59] Ngay cả OpenAI cũng nhận thấy phần mềm phát hiện AI của chính họ thiếu độ chính xác đến mức công ty đã quyết định đóng cửa dịch vụ này hoàn toàn.[60]
Biện pháp giảm thiểu
[sửa | sửa mã nguồn]Hiện tượng ảo giác vẫn chưa được hiểu rõ hoàn toàn. Một số nhà nghiên cứu cho rằng ảo giác là không thể tránh khỏi và là một hạn chế bẩm sinh của các mô hình ngôn ngữ lớn (LLM).[61] Do đó, các nghiên cứu vẫn đang được tiếp tục nhằm tìm cách giảm thiểu tần suất xuất hiện của chúng.[62] Đáng chú ý, các kết quả thực nghiệm chỉ ra rằng các mô hình ngôn ngữ không chỉ tạo ra ảo giác mà còn khuếch đại chúng, ngay cả ở những mô hình vốn được thiết kế để khắc phục vấn đề này.[63] Các nhà nghiên cứu từ OpenAI cho rằng ảo giác xảy ra vì quá trình huấn luyện và đánh giá LLM thường ưu tiên việc "đoán mò" hơn là thừa nhận sự không chắc chắn; họ đề xuất cần sửa đổi cách tính điểm trong các bài kiểm tra chuẩn (benchmarks).[11]
Ji và các cộng sự chia các phương pháp giảm thiểu phổ biến thành hai loại: các phương pháp liên quan đến dữ liệu và các phương pháp mô hình hóa và suy luận.[2] Các phương pháp liên quan đến dữ liệu bao gồm xây dựng tập dữ liệu trung thực (faithful dataset), tự động làm sạch dữ liệu và tăng cường thông tin bằng cách bổ sung dữ liệu từ các nguồn bên ngoài vào đầu vào. Các phương pháp mô hình và suy luận bao gồm: các thay đổi trong kiến trúc (điều chỉnh bộ mã hóa, cơ chế chú ý hoặc bộ giải mã theo nhiều cách khác nhau); các thay đổi trong quy trình huấn luyện, chẳng hạn như sử dụng học tăng cường; và các phương pháp hậu xử lý có thể sửa lỗi ảo giác trong kết quả đầu ra.
Các nhà nghiên cứu đã đề xuất nhiều biện pháp giảm thiểu khác nhau, bao gồm việc để các chatbot khác nhau tranh luận với nhau cho đến khi chúng đạt được sự đồng thuận về một câu trả lời[64] và các kiến trúc ký hiệu nơ-ron (neuro-symbolic) có khả năng thực hiện suy luận bằng logic hình thức.[65][66][67] Một phương pháp khác đề xuất việc chủ động xác thực tính chính xác tương ứng với những nội dung có "độ tự tin thấp" mà mô hình tạo ra bằng cách sử dụng kết quả tìm kiếm web. Nghiên cứu đã chỉ ra rằng một câu văn được tạo ra có khả năng bị ảo giác cao hơn nếu mô hình đã bị ảo giác trong các câu trước đó của cùng một đầu vào; từ đó họ hướng dẫn mô hình tự tạo ra các câu hỏi xác thực để kiểm tra tính đúng đắn của thông tin về khái niệm được chọn thông qua API tìm kiếm của Bing.[68]
Tham khảo
[sửa | sửa mã nguồn]- ↑ Maynez, Joshua; Narayan, Shashi; Bohnet, Bernd; McDonald, Ryan (2020). "On Faithfulness and Factuality in Abstractive Summarization". Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (bằng tiếng Anh). tr. 1906–1919. doi:10.18653/v1/2020.acl-main.173.
- 1 2 3 4 5 6 7 Ji, Ziwei; Lee, Nayeon; Frieske, Rita; Yu, Tiezheng; Su, Dan; Xu, Yan; Ishii, Etsuko; Bang, Ye Jin; Madotto, Andrea; Fung, Pascale (ngày 31 tháng 12 năm 2023). "Survey of Hallucination in Natural Language Generation". ACM Computing Surveys. 55 (12): 1–38. arXiv:2202.03629. doi:10.1145/3571730.
- ↑ Ji, Ziwei; Lee, Nayeon; Frieske, Rita; Yu, Tiezheng; Su, Dan; Xu, Yan; Ishii, Etsuko; Bang, Ye Jin; Madotto, Andrea; Fung, Pascale (ngày 31 tháng 12 năm 2023). "Survey of Hallucination in Natural Language Generation". ACM Computing Surveys. 55 (12): 1–38. arXiv:2202.03629. doi:10.1145/3571730.
- ↑ Metz, Cade (ngày 6 tháng 11 năm 2023). "Chatbots May 'Hallucinate' More Often Than Many Realize". The New York Times. Lưu trữ bản gốc ngày 7 tháng 12 năm 2023. Truy cập ngày 6 tháng 11 năm 2023.
- ↑ de Wynter, Adrian; Wang, Xun; Sokolov, Alex; Gu, Qilong; Chen, Si-Qing (tháng 9 năm 2023). "An evaluation on large language model outputs: Discourse and memorization". Natural Language Processing Journal. 4 100024. arXiv:2304.08637. doi:10.1016/j.nlp.2023.100024.
- ↑ Leswing, Kif (ngày 14 tháng 2 năm 2023). "Microsoft's Bing A.I. made several factual errors in last week's launch demo". CNBC. Lưu trữ bản gốc ngày 16 tháng 2 năm 2023. Truy cập ngày 16 tháng 2 năm 2023.
- ↑ Kang, Eunsuk; Shaw, Mary (2024). "tl;dr: Chill, y'all: AI Will Not Devour SE". Proceedings of the 2024 ACM SIGPLAN International Symposium on New Ideas, New Paradigms, and Reflections on Programming and Software. tr. 303–315. arXiv:2409.00764. doi:10.1145/3689492.3689816. ISBN 979-8-4007-1215-9.
- ↑ Desai, Rajiv (ngày 13 tháng 10 năm 2023). "Is artificial intelligence (AI) an existential threat? – Dr Rajiv Desai" (bằng tiếng Anh). Truy cập ngày 25 tháng 11 năm 2025.
- ↑ Barassi, Veronica (2024). "Toward a Theory of AI Errors: Making Sense of Hallucinations, Catastrophic Failures, and the Fallacy of Generative AI". Harvard Data Science Review. 5. Bibcode:2024HDSRv...5ebbd4B. doi:10.1162/99608f92.ad8ebbd4.
- ↑ Aaronson, Susan Ariel (2024). [[suspicious link removed] Introduction: What Hath Generative Artificial Intelligence Wrought?] (Báo cáo). Centre for International Governance Innovation. tr. 1–4.
{{Chú thích báo cáo}}: Kiểm tra giá trị|url=(trợ giúp) - 1 2 Varanasi, Lakshmi. "Why AI chatbots hallucinate, according to OpenAI researchers". Business Insider. Truy cập ngày 28 tháng 9 năm 2025.
- ↑ "Tracing the thoughts of a large language model". Anthropic. ngày 27 tháng 3 năm 2025. Truy cập ngày 29 tháng 3 năm 2025.
- ↑ Amabile, Teresa M.; Pratt, Michael G. (2016). "The dynamic componential model of creativity and innovation in organizations: Making progress, making meaning". Research in Organizational Behavior. 36: 157–183. doi:10.1016/j.riob.2016.10.001.
- ↑ Mukherjee, Anirban; Chang, Hannah H. (2023). "Managing the Creative Frontier of Generative AI: The Novelty-Usefulness Tradeoff". California Management Review. Lưu trữ bản gốc ngày 5 tháng 1 năm 2024. Truy cập ngày 5 tháng 1 năm 2024.
- ↑ Metz, Cade (ngày 10 tháng 12 năm 2022). "The New Chatbots Could Change the World. Can You Trust Them?". The New York Times. Lưu trữ bản gốc ngày 17 tháng 1 năm 2023. Truy cập ngày 30 tháng 12 năm 2022.
- ↑ Kocmi, Tom; Federmann, Christian (ngày 31 tháng 5 năm 2023), Large Language Models Are State-of-the-Art Evaluators of Translation Quality, arXiv:2302.14520
- ↑ Taylor, Ross; Kardas, Marcin; Cucurull, Guillem; Scialom, Thomas; Hartshorn, Anthony; Saravia, Elvis; Poulton, Andrew; Kerkez, Viktor; Stojnic, Robert (ngày 16 tháng 11 năm 2022). "Galactica: A Large Language Model for Science". arXiv:2211.09085 [cs.CL].
- ↑ Edwards, Benj (ngày 18 tháng 11 năm 2022). "New Meta AI demo writes racist and inaccurate scientific literature, gets pulled". Ars Technica. Lưu trữ bản gốc ngày 10 tháng 4 năm 2023. Truy cập ngày 30 tháng 12 năm 2022.
- ↑ Scialom, Thomas (ngày 23 tháng 7 năm 2024). "Llama 2, 3 & 4: Synthetic Data, RLHF, Agents on the path to Open Source AGI". Latent Space (Phỏng vấn). Phỏng vấn viên swyx & Alessio. Bản gốc lưu trữ ngày 24 tháng 7 năm 2024.
- ↑ Bowman, Emma (ngày 19 tháng 12 năm 2022). "A new AI chatbot might do your homework for you. But it's still not an A+ student". NPR. Lưu trữ bản gốc ngày 20 tháng 1 năm 2023. Truy cập ngày 29 tháng 12 năm 2022.
- ↑ Pitt, Sofia (ngày 15 tháng 12 năm 2022). "Google vs. ChatGPT: Here's what happened when I swapped services for a day". CNBC. Lưu trữ bản gốc ngày 16 tháng 1 năm 2023. Truy cập ngày 30 tháng 12 năm 2022.
- ↑ Huizinga, Raechel (ngày 30 tháng 12 năm 2022). "We asked an AI questions about New Brunswick. Some of the answers may surprise you". CBC News. Lưu trữ bản gốc ngày 6 tháng 1 năm 2023. Truy cập ngày 30 tháng 12 năm 2022.
- ↑ Zastrow, Mark (ngày 30 tháng 12 năm 2022). "We Asked ChatGPT Your Questions About Astronomy. It Didn't Go so Well". Discover. Lưu trữ bản gốc ngày 26 tháng 3 năm 2023. Truy cập ngày 31 tháng 12 năm 2022.
- ↑ Lin, Connie (ngày 5 tháng 12 năm 2022). "How to easily trick OpenAI's genius new ChatGPT". Fast Company. Lưu trữ bản gốc ngày 29 tháng 3 năm 2023. Truy cập ngày 6 tháng 1 năm 2023.
- ↑ Edwards, Benj (ngày 1 tháng 12 năm 2022). "OpenAI invites everyone to test ChatGPT, a new AI-powered chatbot—with amusing results". Ars Technica. Lưu trữ bản gốc ngày 15 tháng 3 năm 2023. Truy cập ngày 29 tháng 12 năm 2022.
- ↑ Mollick, Ethan (ngày 14 tháng 12 năm 2022). "ChatGPT Is a Tipping Point for AI". Harvard Business Review. Lưu trữ bản gốc ngày 11 tháng 4 năm 2023. Truy cập ngày 29 tháng 12 năm 2022.
- ↑ Kantrowitz, Alex (ngày 2 tháng 12 năm 2022). "Finally, an A.I. Chatbot That Reliably Passes 'the Nazi Test'". Slate. Lưu trữ bản gốc ngày 17 tháng 1 năm 2023. Truy cập ngày 29 tháng 12 năm 2022.
- ↑ Marcus, Gary (ngày 2 tháng 12 năm 2022). "How come GPT can seem so brilliant one minute and so breathtakingly dumb the next?". The Road to AI We Can Trust. Substack. Lưu trữ bản gốc ngày 30 tháng 12 năm 2022. Truy cập ngày 29 tháng 12 năm 2022.
- 1 2 Leswing, Kif (ngày 14 tháng 2 năm 2023). "Microsoft's Bing A.I. made several factual errors in last week's launch demo". CNBC. Lưu trữ bản gốc ngày 16 tháng 2 năm 2023. Truy cập ngày 16 tháng 2 năm 2023.
- ↑ "Google cautions against 'hallucinating' chatbots, report says". Reuters. ngày 11 tháng 2 năm 2023. Lưu trữ bản gốc ngày 6 tháng 4 năm 2023. Truy cập ngày 16 tháng 2 năm 2023.
- ↑ Maruf, Ramishah (ngày 27 tháng 5 năm 2023). "Lawyer apologizes for fake court citations from ChatGPT". CNN Business.
- ↑ Brodkin, Jon (ngày 31 tháng 5 năm 2023). "Federal judge: No AI in my courtroom unless a human verifies its accuracy". Ars Technica. Lưu trữ bản gốc ngày 26 tháng 6 năm 2023. Truy cập ngày 26 tháng 6 năm 2023.
- ↑ "Judge Brantley Starr". Northern District of Texas | United States District Court. Lưu trữ bản gốc ngày 26 tháng 6 năm 2023. Truy cập ngày 26 tháng 6 năm 2023.
- ↑ Brodkin, Jon (ngày 23 tháng 6 năm 2023). "Lawyers have real bad day in court after citing fake cases made up by ChatGPT". Ars Technica. Lưu trữ bản gốc ngày 26 tháng 1 năm 2024. Truy cập ngày 26 tháng 6 năm 2023.
- ↑ Belanger, Ashley (ngày 9 tháng 6 năm 2023). "OpenAI faces defamation suit after ChatGPT completely fabricated another lawsuit". Ars Technica. Lưu trữ bản gốc ngày 1 tháng 7 năm 2023. Truy cập ngày 1 tháng 7 năm 2023.
- ↑ Scarcella, Mike (ngày 19 tháng 5 năm 2025). "OpenAI defeats radio host's lawsuit over allegations invented by ChatGPT". Reuters. Truy cập ngày 23 tháng 8 năm 2025.
- ↑ Scarcella, Mike (ngày 19 tháng 5 năm 2025). "OpenAI defeats radio host's lawsuit over allegations invented by ChatGPT". Reuters. Truy cập ngày 23 tháng 8 năm 2025.
- ↑ Belanger, Ashley (ngày 16 tháng 2 năm 2024). "Air Canada must honor refund policy invented by airline's chatbot". Ars Technica. Truy cập ngày 22 tháng 4 năm 2025.
- ↑ "Air Canada responsible for errors by website chatbot after B.C. customer denied retroactive discount". vancouversun. Lưu trữ bản gốc ngày 12 tháng 3 năm 2025. Truy cập ngày 22 tháng 4 năm 2025.
- ↑ Tadros, Edmund (ngày 6 tháng 10 năm 2025). "'Full refund': Senator slams Deloitte's 'human intelligence problem'". Australian Financial Review. Truy cập ngày 12 tháng 10 năm 2025.
- ↑ Tadros, Edmund; Karp, Paul (ngày 5 tháng 10 năm 2025). "Deloitte to refund government, admits using AI in $440k report". Australian Financial Review. Truy cập ngày 12 tháng 10 năm 2025.
- ↑ Brake, Justin (ngày 22 tháng 11 năm 2025). "Major N.L. healthcare report contains errors likely generated by A.I." The Independent (bằng tiếng Anh). Truy cập ngày 4 tháng 12 năm 2025.
- ↑ Zhang, Chenshuang; Zhang, Chaoning; Zheng, Sheng; Zhang, Mengchun; Qamar, Maryam; Bae, Sung-Ho; Kweon, In So (ngày 2 tháng 4 năm 2023). "A Survey on Audio Diffusion Models: Text To Speech Synthesis and Enhancement in Generative AI". arXiv:2303.13336 [cs.SD].
- ↑ Robertson, Adi (ngày 21 tháng 2 năm 2024). "Google apologizes for "missing the mark" after Gemini generated racially diverse Nazis". The Verge. Lưu trữ bản gốc ngày 21 tháng 2 năm 2024. Truy cập ngày 14 tháng 8 năm 2024.
- ↑ "Gemini image generation got it wrong. We'll do better". Google. ngày 23 tháng 2 năm 2024. Lưu trữ bản gốc ngày 21 tháng 4 năm 2024. Truy cập ngày 14 tháng 8 năm 2024.
- ↑ Luther, Kurt (2025). "A Guide to Exploring Photo Sleuthing and Generative AI". Military Images. 43 (4 (234)): 8–11. ISSN 1040-4961. JSTOR 27404321.
- ↑ Athaluri, Sai Anirudh; Manthena, Sandeep Varma; Kesapragada, V S R Krishna Manoj; Yarlagadda, Vineel; Dave, Tirth; Duddumpudi, Rama Tulasi Siri (ngày 11 tháng 4 năm 2023). "Exploring the Boundaries of Reality: Investigating the Phenomenon of Artificial Intelligence Hallucination in Scientific Writing Through ChatGPT References". Cureus. 15 (4) e37432. doi:10.7759/cureus.37432. PMC 10173677. PMID 37182055.
- ↑ Snoswell, Aaron J.; Witzenberger, Kevin; Masri, Rayane El (ngày 15 tháng 4 năm 2025). "A weird phrase is plaguing scientific papers – and we traced it back to a glitch in AI training data". The Conversation.
- 1 2 Goddard, Jerome (tháng 11 năm 2023). "Hallucinations in ChatGPT: A Cautionary Tale for Biomedical Researchers". The American Journal of Medicine. 136 (11): 1059–1060. doi:10.1016/j.amjmed.2023.06.012. PMID 37369274.
- ↑ Ji, Ziwei; Yu, Tiezheng; Xu, Yan; Lee, Nayeon; Ishii, Etsuko; Fung, Pascale (2023). "Towards Mitigating LLM Hallucination via Self Reflection". Findings of the Association for Computational Linguistics: EMNLP 2023. tr. 1827–1843. doi:10.18653/v1/2023.findings-emnlp.123.
- ↑ Schick, Nina (2023). "FAKING IT: Navigating the new era of generative AI may be the most critical challenge to democracy yet". RSA Journal. 169 (2(5593)): 40–43. ISSN 0958-0433. JSTOR 48737215.
- ↑ Bhattacharyya, Mehul; Miller, Valerie M; Bhattacharyya, Debjani; Miller, Larry E (ngày 19 tháng 5 năm 2023). "High Rates of Fabricated and Inaccurate References in ChatGPT-Generated Medical Content". Cureus. 15 (5) e39238. doi:10.7759/cureus.39238. PMC 10277170. PMID 37337480.
- ↑ Giray, Louie (ngày 2 tháng 1 năm 2024). "ChatGPT References Unveiled: Distinguishing the Reliable from the Fake". Internet Reference Services Quarterly. 28 (1): 9–18. doi:10.1080/10875301.2023.2265369. ISSN 1087-5301.
- ↑ Teel, Zoë (Abbie); Wang, Ting; Lund, Brady (2023). "ChatGPT conundrums: Probing plagiarism and parroting problems in higher education practices". College & Research Libraries News. 84 (6). doi:10.5860/crln.84.6.205.
- 1 2 3 Broad, William J. (ngày 23 tháng 12 năm 2024). "How Hallucinatory A.I. Helps Science Dream Up Big Breakthroughs". The New York Times.
- ↑ "Are Algorithmically-Generated Term Papers the Next Big Challenge to Academic Integrity?". EdSurge (bằng tiếng Anh). ngày 12 tháng 2 năm 2020. Truy cập ngày 5 tháng 11 năm 2025.
- ↑ Watson, Alex P. (ngày 3 tháng 7 năm 2024). "Hallucinated Citation Analysis: Delving into Student-Submitted AI-Generated Sources at the University of Mississippi". The Serials Librarian (bằng tiếng Anh). 85 (5–6): 172–180. doi:10.1080/0361526X.2024.2433640. ISSN 0361-526X.
- ↑ Jain, Anuj; Nimonkar, Pranali; Jadhav, Pratap (tháng 10 năm 2025). "Citation integrity in the age of AI: evaluating the risks of reference hallucination in maxillofacial literature". Journal of Cranio-Maxillofacial Surgery (bằng tiếng Anh). 53 (10): 1871–1872. doi:10.1016/j.jcms.2025.08.004. PMID 40830000.
- ↑ "AI Detectors Don't Work. Here's What to Do Instead". MIT Sloan Teaching & Learning Technologies (bằng tiếng Anh). Truy cập ngày 5 tháng 11 năm 2025.
- ↑ "New AI classifier for indicating AI-written text". openai.com (bằng tiếng Anh). ngày 13 tháng 3 năm 2024. Truy cập ngày 5 tháng 11 năm 2025.
- ↑ Xu, Ziwei; Jain, Sanjay; Kankanhalli, Mohan (2024). "Hallucination is Inevitable: An Innate Limitation of Large Language Models". arXiv:2401.11817 [cs.CL].
- ↑ Nie, Feng; Yao, Jin-Ge; Wang, Jinpeng; Pan, Rong; Lin, Chin-Yew (2019). "A Simple Recipe towards Reducing Hallucination in Neural Surface Realisation". Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. tr. 2673–2679. doi:10.18653/v1/P19-1256.
- ↑ Dziri, Nouha; Milton, Sivan; Yu, Mo; Zaiane, Osmar; Reddy, Siva (2022). "On the Origin of Hallucinations in Conversational Models: Is it the Datasets or the Models?". Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. tr. 5271–5285. doi:10.18653/v1/2022.naacl-main.387.
- ↑ Vynck, Gerrit De (ngày 30 tháng 5 năm 2023). "ChatGPT 'hallucinates.' Some researchers worry it isn't fixable". The Washington Post. Lưu trữ bản gốc ngày 17 tháng 6 năm 2023. Truy cập ngày 31 tháng 5 năm 2023.
- ↑ Garcez, Artur (ngày 30 tháng 5 năm 2025). Vass, Steven (biên tập). "Neurosymbolic AI is the answer to large language models' inability to stop hallucinating". The Conversation. doi:10.64628/AB.5gpku36ct.
- ↑ Jones, Nicola (2025). "How good old-fashioned AI could spark the field's next revolution". Nature (News feature). 647 (8091): 842–844. Bibcode:2025Natur.647..842J. doi:10.1038/d41586-025-03856-1.
- ↑ Rosenbush, Steven (ngày 12 tháng 8 năm 2025). "Meet Neurosymbolic AI, Amazon's Method for Enhancing Neural Networks". The Wall Street Journal (bằng tiếng Anh). ISSN 0099-9660. Truy cập ngày 16 tháng 8 năm 2025.
- ↑ Varshney, Neeraj; Yao, Wenling; Zhang, Hongming; Chen, Jianshu; Yu, Dong (2023). "A Stitch in Time Saves Nine: Detecting and Mitigating Hallucinations of LLMs by Validating Low-Confidence Generation". arXiv:2307.03987 [cs.CL].
Liên kết ngoài
[sửa | sửa mã nguồn]- Hallucination (artificial intelligence) tại Encyclopædia Britannica (bằng tiếng Anh)