Một công cụ phát hiện nội dung AI (Trí tuệ nhân tạo) của công ty Pangram Labs vừa gây xôn xao khi dán nhãn nhiều bài đăng phổ biến trên mạng — bao gồm cả một số phát biểu được cho là của Giáo hoàng cảnh báo về AI — là do chính AI tạo ra. Pangram tuyên bố công cụ của họ đạt độ chính xác 99,98% và tỷ lệ nhận sai chỉ một trên 10.000. Phiên bản mới nhất của tiện ích mở rộng Chrome của Pangram ra mắt tuần này, quét bài đăng theo thời gian thực trên Reddit, X, LinkedIn, Medium và Substack với mức phí 20 USD mỗi tháng. CEO Pangram, Max Spero, mô tả bản thân là "người dọn rác slop" và muốn giúp làm sạch môi trường nội dung trực tuyến. Một nghiên cứu năm 2025 từ Đại học Stanford và các đối tác ước tính hơn một phần ba trang web mới hiện nay có nội dung do AI tạo ra.
Phân Tích
Một nghịch lý đáng chú ý đang hình thành: các tổ chức tôn giáo và lãnh đạo đạo đức vốn lên tiếng cảnh báo về nguy cơ của AI lại bị chính các công cụ AI phát hiện — nghi ngờ rằng lời cảnh báo đó cũng do AI viết ra. Dù Pangram chưa công bố chi tiết về trường hợp cụ thể liên quan đến Giáo hoàng, sự kiện này phản ánh một vấn đề cấu trúc sâu hơn: khi AI viết ngày càng giống người, ranh giới giữa xác thực và giả mạo tan biến đến mức không còn ai — kể cả các tổ chức uy tín — thoát khỏi nghi ngờ.
Đây là tình huống mà các nhà nghiên cứu truyền thông gọi là "liar's dividend" (lợi thế của kẻ nói dối): khi deepfake và AI-generated text trở nên phổ biến, người thật cũng có thể bị phủ nhận bằng cách viện dẫn khả năng nội dung là giả. Các tổ chức báo chí, tòa án, và thậm chí Tòa Thánh Vatican đều chưa có quy trình xác minh rõ ràng để đối phó với điều này.
Nghiên cứu từ Đại học Chicago xếp Pangram là công cụ phát hiện AI chính xác nhất hiện tại — nhưng "chính xác nhất" vẫn không có nghĩa là hoàn hảo. Trong bối cảnh thông tin sai lệch ngày càng tinh vi, một công cụ với tỷ lệ nhận sai một trên 10.000 vẫn có thể gây thiệt hại lớn khi áp dụng ở quy mô hàng triệu bài đăng mỗi ngày.