BNN Breaking: Một ví dụ của việc tin sai lệch tạo bằng công cụ AI nguy hiểm tới mức nào

Một ví dụ của tiêu đề. Bên Ireland, mở trình duyệt Edge, ở trang mở đầu trước khi truy cập một trang web bất kỳ, có thời điểm một mẩu tin hiện ra với tiêu đề: “Phát thanh viên nổi tiếng người Ireland phải ra hầu tòa vì lạm dụng tình dục.” Tấm hình minh họa cho mẩu tin này là tấm hình của phát thanh viên Dave Fanning. Vấn đề nằm ở chỗ, phát thanh viên trong câu chuyện hoàn toàn không phải DJ radio kiêm MC talkshow nổi tiếng, người đã giúp phát hiện ra nhóm nhạc U2 lừng lẫy.

Ông Fanning sau đó phải khởi kiện BNN Breaking: “Bạn sẽ không tin nổi có bao nhiêu người nhìn thấy mẩu tin đó,” và cho rằng lỗi sai này thực sự vô cùng nghiêm trọng. Mẩu tin với tấm hình sai lệch này hiển thị hàng giờ đồng hồ trên trang khởi động trình duyệt Edge của bất kỳ ai sống ở Ireland, và đó cũng là hậu của của việc lạm dụng AI để sản xuất tin tức.

MSN đã dẫn lại mẩu tin này của một trang tin có tên BNN Breaking. Trang tin này sử dụng chatbot AI để tóm tắt lại những tin tức từ các trang tin và báo điện tử khác, theo lời của một cựu nhân viên của BNN. Để giúp bài viết thêm phần chi tiết, BNN đã vô tình đưa hình ảnh của ông Fanning vào bài viết thông qua cụm từ khóa “phát thanh viên nổi tiếng người Ireland”. Rồi sau đó mẩu tin này được MSN, web portal tổng hợp thông tin của Microsoft đăng lại lên trình duyệt Edge.

Một ngày sau khi đăng tải, mẩu tin này đã bị gỡ, nhưng ảnh hưởng nghiêm trọng đối với hình ảnh và danh tiếng của ông Fanning thì không có cách nào đảo ngược. Ông Fanning khởi kiện cả BNN lẫn Microsoft.

1-Dave-close.webp

Dave Fanning
DJ radio danh tiếng này chỉ là một trong số rất nhiều những người khiếu nại BNN, một trang tin có trụ sở đặt tại Hong Kong, đơn vị đã đăng tải không ít những thông tin sai lệch chỉ trong 2 năm tồn tại, và đó đều là những hậu quả của việc lạm dụng AI tạo sinh trong ngành sản xuất tin tức.

Thàng 4/2024, BNN Breaking dừng hoạt động. Những câu hỏi được phóng viên của tờ New York Times gửi tới BNN Breaking, nhà sáng lập cũng như cho Microsoft đều không nhận được hồi âm. Phía Microsoft chỉ cho biết rằng họ đã hủy thỏa thuận hợp tác với trang tin này.

Trong vòng 2 năm BNN Breaking vận hành, bề ngoài nó giống một trang tin điện tử, khi khẳng định rằng nhân sự của họ đều là những “nhà báo” có tiếng, và có 10 triệu lượt truy cập mỗi tháng, vượt qua cả tờ The Chicago Tribune. Những trang báo nổi tiếng như The Washington Post, Politico hay The Guardian đều dẫn nguồn tin từ BNN. Google News thỉnh thoảng cũng hiển thị tin tức của trang này.

Tuy nhiên nếu nhìn kỹ hơn, có thể phát hiện ra những “nhà báo” ở BNN Breaking thường có xu hướng đăng những bài viết chi tiết và phân tích sâu với tần suất vài lần mỗi phút, và mọi bài viết đều có cách hành văn máy móc, thứ rất dễ nhận ra nếu trước đó độc giả đã từng dùng thử ChatGPT của OpenAI. Mục “về chúng tôi” của BNN có tấm hình 4 đứa trẻ nhìn vào chiếc máy tính, với những ngón tay kỳ dị, “đặc sản” chưa thể khắc phục của công nghệ tạo sinh hình ảnh bằng mô hình AI.

00BNN-web-hvzg-jumbo.jpgĐiều đáng lo ngại nhất ở đây là, một trang tin chỉ dùng công cụ AI để tóm tắt tin tức và viết ra những nội dung mới như BNN tham gia vào hệ sinh thái ngành thông tin điện tử một cách quá đơn giản, giữa lúc vẫn còn rất nhiều lo ngại xoay quanh việc nội dung tạo sinh bằng mô hình AI vừa không chính xác, vừa có khả năng gây hại cho cả ngành.

Nhiều tổ chức và đơn vị tin tức toàn cầu hiện giờ vốn đã đang phải cạnh tranh rất gay gắt với nhau để giành lấy lượng truy cập cũng như doanh thu từ quảng cáo trực tuyến. Trong rất nhiều năm qua những trang báo và trang tin chính thống đã phải cạnh tranh với những trang tin điện tử tổng hợp với nội dung nhảm nhí nhưng rất hút lượt view. Những trang tin tổng hợp ấy, Buzzfeed chẳng hạn, kết hợp cả những cây viết tự do lẫn những thuật toán để viết ra những nội dung tưởng là tin tức nhưng thật ra không phải, ưu tiên tốc độ ra bài mới thay vì ưu tiên độ chính xác của tin tức.

Những chuyên gia trong ngành giờ cho rằng, quy trình sản xuất tin theo kiểu mỳ ăn liền ấy sẽ được AI tăng tốc lên mức chóng mặt, kéo theo đó là nguy cơ đối với báo chí toàn cầu. AI hoàn toàn có thể lấy thành quả lao động của những nhà báo, rồi tạo ra những mẩu tin đầy lỗi sai và biến chúng trở thành những câu chuyện tạo ra xu hướng.

AI-newsroom.webp

Hệ quả là với AI, những trang tin tổng hợp sẽ biến thành những con quái vật có khả năng bóp nghẹt những phóng viên, những nhà báo và những trang báo uy tín, làm việc cẩn trọng. Ngay cả khi những tin tức AI tổng hợp và viết lại không đáng tin cậy, nó vẫn thừa đủ khả năng leo lên những bậc cao hơn trong trang kết quả tìm kiếm trực tuyến và trở nên phổ biến trên các mạng xã hội, vì chính những công cụ này cũng đang dùng AI để hỗ trợ xếp hạng đánh giá nội dung.

Hậu quả về mặt kinh tế đối với các trang tin và trang báo là nguồn doanh thu sẽ dồn về những trang web sản xuất tin bài bằng AI. Chính bản thân quy trình quảng cáo trực tuyến trên các trang tin giờ cũng được vận hành bằng hệ thống tự động, chứ không phải lúc nào cũng là con người kiểm soát.

NewsGuard, công ty theo dõi và kiểm soát thông tin giả mạo trên mạng internet, đã xác định được hơn 800 trang web sử dụng AI để sản xuất thông tin không đáng tin cậy. Những trang web này dường như vận hành mà không có sự kiểm soát của con người, và hầu hết đều có những cái tên như “văn mẫu”: iBusiness Day hay Ireland Top News, rồi giao diện của chúng được thiết kế sao cho giống những trang báo điện tử uy tín.

vf0524-Bilton-AI-1.webp

Những trang web như thế này sản xuất nội dung thông qua hàng chục ngôn ngữ khác nhau, và hầu hết không đề cập cụ thể rằng nội dung được sản xuất nhờ sự trợ giúp của AI tạo sinh, những người không có kinh nghiệm rất dễ nhầm lẫn chúng là những nội dung được con người viết ra.

Theo NewsGuard, những nội dung đăng tải trên những trang tin sản xuất nội dung bằng AI này thường khá tệ, liên tục có những thông tin sai lệch về những chính khách, những tin giả nói người nổi tiếng đã qua đời, hay những sự kiện không có thực.

Quay lại bài viết có tấm hình của Dave Fanning. Ở đầu bài viết là tên tác giả Kasturi Chakraborty. Một độc giả gửi thư cho nhà báo đến từ Ấn Độ này: “Cô nên cảm thấy xấu hổ với bản thân.” Chakraborty làm việc cho BNN trong vòng 6 tháng cùng hơn chục phóng viên và nhà báo khác, hầu hết họ đều là những người không có nhiều kinh nghiệm, sống ở Pakistan, Ai Cập hay Nigeria, những nơi mà đồng lương 1 nghìn Đô 1 tháng là con số cực kỳ hấp dẫn đối với họ. Tất cả họ đều làm việc từ xa chứ không sang Hong Kong làm việc ở trụ sở, muốn liên lạc với nhau thì dùng WhatsApp và Google Hangouts.

Những nhân sự cũ của BNN nói rằng họ tưởng đã tham gia một trang tin vận hành tử tế. Người khác thì nhầm BNN Breaking với BNN Bloomberg, một kênh truyền thông danh tiếng tại Canada. Trang web của BNN thì khẳng định rằng “sự chính xác là không thể đánh đổi”, rồi cho biết thêm “mọi mẩu tin tức đều trải qua quá trình kiểm duyệt nghiêm ngặt, để đảm bảo thông tin của chúng tôi là sự thật không thể bàn cãi.”

Đáng tiếc, đó đều chỉ là những tuyên bố bề ngoài. Những phóng viên nghiệp dư vẫn được phép sản xuất những nội dung mà họ bỏ công sức, thời gian, thậm chí đánh đổi cả sức khỏe để đưa tin, nhưng BNN Breaking lại khuyến khích họ sử dụng công nghệ AI tạo sinh để viết những mẩu tin mới. Đó là chia sẻ của cô Chakraborty và Hemin Bakir, một nhà báo sống ở Iraq, làm việc gần 1 năm cho BNN.

06BNN-pvcm-jumbo.jpg
Hemin Bakir

Họ nói rằng đã copy những bài viết từ những trang khác vào công cụ AI tạo sinh, rồi lấy phiên bản đã được viết lại nhờ chatbot AI để đăng lên BNN.

Anh Bakir giờ làm việc cho kênh truyền hình Rudaw. Anh chia sẻ rằng trước đó đã có những ngờ vực đối với BNN, nhưng nhà sáng lập trang tin này, một nhà khởi nghiệp có tên Gurbaksh Chahal nói rằng, đây là “một cuộc cách mạng trong ngành báo chí.” Những lời của ông Chahal có trọng lượng trong mắt những nhân viên của BNN vì khối tài sản ông sở hữu, và danh sách những startup mà ông khởi nghiệp.

Sinh ra tại Ấn Độ, rồi lớn lên tại phía bắc bang California, ông Chahal kiếm được hàng triệu USD nhờ vào ngành quảng cáo trực tuyến đầu thập niên 2000. Sau đó ông viết một cuốn sách dạy làm giàu, kể lại quá trình từ lúc là một người nghèo khổ tới khi trở thành triệu phú, thậm chí nhờ đó còn được lên truyền hình phỏng vấn với Oprah Winfrey. Thời điểm đại dịch COVID-19 bùng phát, ông chuyển qua tạo một đồng tiền mã hóa rồi “lùa gà”.

Nhưng Chahal cũng có quá khứ không mấy trong sạch. Năm 2013, ông tấn công bạn gái khi ấy, và câu chuyện này trở nên viral trên mạng xã hội vì những hình ảnh bạo hành phụ nữ được camera giấu trong căn phòng ngủ ghi lại. Đoạn ghi hình 30 phút này sau đó bị thẩm phán coi là bằng chứng không có giá trị vì cảnh sát đã thu thập nó mà không có lệnh của tòa án. Chahal sau đó nhận tội hành hung, nhận án lao động công ích, và bị đuổi khỏi vị trí CEO RadiumOne, một công ty marketing trực tuyến. Sau đó đến năm 2016, ông lại bạo hành một cô bạn gái khác, rồi nhận án 6 tháng tù giam.

24-surprising-facts-about-gurbaksh-chahal-1697443256.jpgGurbaksh Chahal

Chahal sau đó chuyển về Hong Kong sống, và mở BNN Breaking vào năm 2022. Trên trang LinkedIn, ông tự mô tả mình là nhà sáng lập ePiphany AI, một LLM mà ông cho rằng có sức mạnh vượt trội so với ChatGPT, là công cụ để BNN tạo ra những mẩu tin mới. Nhưng ePiphany giống GPT và những chatbot AI khác tới mức, có lẽ Chahal đã dùng tiền mua API của đơn vị khác chứ không tự phát triển gì hết.

Ban đầu, nhân viên BNN Breaking được yêu cầu lấy những bài viết của các trang khác bỏ vào ePiphany để nó tổng hợp và viết lại nội dung, rồi sau đó “kiểm tra” lại lỗi sai. Những bài viết không được kiểm tra độ chính xác của thông tin thì có một dòng ghi chú và bút danh cơ bản, BNN Newsroom hoặc BNN Reporter. Nhưng rồi công cụ này “đẻ” ra hàng trăm, thậm chí hàng nghìn tin tức mỗi ngày, không một ai có thể xác thực hết chúng cả.

Vì không ai muốn ghi tên mình vào những mẩu tin AI tóm tắt một cách cẩu thả, nên Chahal quyết định đặt ngẫu nhiên tên nhân viên của BNN vào mỗi mẩu tin. Điều này khiến vài nhân viên phẫn nộ, vì tên họ hiển thị ở những bài viết mà họ hoàn toàn không hay biết.

Chahal có vẻ không quan tâm lắm. Theo vài cựu nhân viên BNN, ông này liên tục văng tục trong group chat với nhân viên. Khi Bakir nói rằng dùng tên bút danh đặt vào những bài viết do AI tạo ra sẽ ảnh hưởng tới cả đạo đức nghề nghiệp lẫn sự nghiệp của họ bị đe dọa, thì Chahal đuổi việc phóng viên này luôn.

Trong vòng 1 năm qua, BNN liên tục đăng tải những thông tin sai lệch, tự tạo ra những tuyên bố từ những chuyên gia trong ngành, ăn cắp nội dung và hình ảnh từ những trang tin và trang báo khác, không xin phép hay trả tiền. Một nhà nghiên cứu về tin giả đã xem hơn 1000 bài viết của BNN, rồi đi đến kết luận rằng ¼ trong số đó chỉ đến từ 5 kênh thông tin chính thống, bao gồm Reuters, The Associated Press và BBC. Một nhà nghiên cứu khác thì cho biết BNN đặt watermark lên những tấm hình họ không có bản quyền.

Tờ The Times xác định được rất nhiều thông tin sai lệch trong những bài viết đăng trên trang BNN. Có lúc nguồn tin không có thật, có lúc sự kiện không có nguồn dẫn, hoặc không xảy ra trong quá khứ, thậm chí có lúc bài viết về lò vi sóng thì lại dùng hình minh họa là những món vũ khí. Một vị luật sư phàn nàn rằng BNN tự tạo ra một câu tuyên bố rồi nói rằng vị luật sư này đã chia sẻ thông tin, thì BNN chọn cách gỡ tên ông này ra khỏi bài viết.

ynews-data-center-ai-workers.webp
Còn với câu chuyện “lạm dụng tình dục” với tấm hình của ông Dave Fanning, cô Chakraborty nói rằng AI đã tạo ra bài viết đó rồi đăng tải dưới tên cô. Nó được đăng tải vì xu hướng trên mạng xã hội khi ấy là phiên tòa xét xử phát thanh viên nổi tiếng người Ireland. Tên của phát thanh viên này không được tiết lộ vì ông này có được lệnh của tòa án nghiêm cấm truyền thông ghi tên lên bài viết. Thế là AI tìm nhanh một tấm hình với từ khóa “phát thanh viên nổi tiếng người Ireland.” Hệ quả là ông Fanning bị đưa lên mặt báo.

Chiến lược dùng tin tức gây phẫn nộ là một chiến lược mà Chahal rất thích dùng. Ông ta dùng trang tin của mình để lôi kéo cảm xúc của người đọc, có lần đăng tải những thông tin sai lệch về một chính trị gia ở San Francisco, người mà Chahal không ưa. Rồi đến lượt Wikipedia cũng bị đưa vào tầm ngắm sau khi có những thông tin tiêu cực mô tả BNN Breaking. Elon Musk cũng vậy, sau khi tài khoản MXH X của Chahal, của vợ ông và của công ty bị khóa.

Sự phổ biến của quảng cáo trực tuyến thông qua thuật toán tự động đã cho phép những trang tin vận hành nhờ công cụ AI tạo ra nguồn doanh thu khổng lồ, vì chẳng cần trả lương cho những phóng viên và nhà báo dày dặn kinh nghiệm, cứ để AI đi tóm tắt lại thông tin của các trang khác về đăng là xong, đã vậy còn nhanh hơn con người làm hàng trăm, hàng nghìn lần. Nhưng những nội dung ấy đều có chất lượng rất thấp, và đều là những nội dung click-bait với tiêu đề thu hút sự chú ý, theo giáo sư tâm lý học kiêm chuyên gia về tin giả ở đại học Cambridge, Sander van der Linden.

Fake-News-Canva-Made-by-SWG.png
Các chuyên gia đều lo ngại cách tin tức tạo bằng AI có thể áp đảo những tin tức chính thống, được đưa tin bằng trách nhiệm và kinh nghiệm. Hệ quả khi ấy, mạng internet sẽ trở thành một bãi rác nội dung không hồi kết, được tạo ra bằng thuật toán máy móc. Một lo ngại khác là báo chí địa phương cũng có thể bị AI đe dọa, rút cạn nguồn doanh thu, ảnh hưởng tới danh tiếng của họ.

Ngay ở thời điểm hiện tại, độc giả đã khó lòng phân biệt được giữa tin tức do con người viết ra và AI tổng hợp.

Những trang tin và báo địa phương cho rằng những trang web như BNN giống những con đỉa, ăn cắp chất xám và sở hữu trí tuệ, rồi kiếm tiền nhờ việc ăn cắp ấy bằng cách lợi dụng thuật toán tìm kiếm trực tuyến, biến trang web của họ trở thành nơi đầy hấp dẫn trong mắt các nhà quảng cáo trực tuyến.

quang-cao-online.jpg
Hồi tháng 3, Google đã phải tung ra một bản cập nhật công cụ tìm kiếm để “giảm thiểu nội dung spam trên trang kết quả tìm kiếm”, nhắm vào những trang web có nội dung “được công cụ tự động tạo ra hoặc con người kết hợp cùng công cụ AI tạo ra.” Ngay sau đó những bài viết của BNN cũng dừng hiện diện trên những trang kết quả tìm kiếm của Google.

Còn về phần Microsoft, CNN cũng đưa tin rằng tập đoàn này đã và đang dần thay thế những người tổng hợp tin tức cho portal MSN bằng công cụ AI. Microsoft xác nhận rằng họ đang sử dụng cả con người lẫn AI để tổng hợp tin tức hiển thị trên MSN.com cũng như trên trang homepage của trình duyệt Edge.

BNN thì dừng đăng tin từ đầu tháng 4, xóa mọi bài viết trên trang web. Những người truy cập vào trang web này được trỏ về BNNGPT, một chatbot tự nhận là “được xây dựng từ mô hình AI mã nguồn mở.”

Screenshot 2024-06-09 144503.jpgNhưng Chahal không từ bỏ. Chỉ trong 1 tuần kể từ khi BNN Breaking dừng hoạt động, tất cả được chuyển sang một trang web mới có tên TrimFeed.