Perplexity AI, công cụ tìm kiếm tự xưng là “công cụ trả lời”, đang vướng phải hàng loạt cáo buộc “đạo văn” từ các trang báo. Liệu công ty được đầu tư bởi Jeff Bezos có thể vượt qua bê bối và cạnh tranh với Google trong tương lai?
Perplexity AI hứa hẹn mang đến trải nghiệm tìm kiếm khác biệt, thay vì liệt kê kết quả tìm kiếm, công cụ này sẽ tự động tổng hợp và cung cấp câu trả lời trực tiếp cho người dùng. Tuy nhiên, tham vọng thay thế Google của Perplexity AI đang bị lu mờ bởi những cáo buộc “đạo văn” từ các trang báo.
Trang Wired đã gọi Perplexity là “cỗ máy nhảm nhí” khi phát hiện công cụ này phớt lờ yêu cầu không được thu thập dữ liệu từ trang web của họ. Tệ hơn, Perplexity AI còn bị cáo buộc “đạo văn” chính bài báo vạch trần hành vi “đạo văn” của mình. Ông Sean Hollister, cây viết của Wired nhận định: “Đây là hoạt động báo chí trả phí, Wired thậm chí đã chặn Perplexity trong tệp robots.txt, vậy mà Perplexity vẫn cố tình thu thập dữ liệu. Có thể họ không phải là đơn vị duy nhất làm điều này, nhưng đó không phải là cái cớ.”
Vụ việc trở nên ồn ào hơn khi CEO Perplexity AI, ông Aravind Srinivas, có những phát ngôn gây tranh cãi. Khi được Fast Company hỏi về việc công cụ của mình lấy cắp nội dung từ các trang báo trả phí như Wired, ông Srinivas đã cố gắng đổ lỗi cho bên thứ ba cung cấp dịch vụ thu thập dữ liệu web. Tuy nhiên, ông từ chối tiết lộ danh tính bên thứ ba này và cho rằng việc dừng hành vi “đạo văn” là quá phức tạp. CEO Perplexity AI thậm chí còn ngụy biện rằng việc phớt lờ tệp robots.txt không phải là bất hợp pháp.
Sự việc Perplexity AI “đạo văn” dấy lên lo ngại về nguy cơ thông tin sai lệch, đặc biệt là trong lĩnh vực y tế. Theo Forbes, Perplexity AI đã sử dụng thông tin từ các bài đăng trên blog được tạo bởi AI, vốn không đáng tin cậy, để cung cấp thông tin y tế cho người dùng.
Vụ bê bối “đạo văn” của Perplexity AI diễn ra trong bối cảnh cuộc chiến chống lại các chương trình tự động (bot) thu thập dữ liệu đang ngày càng nóng. Mới đây, Reddit đã tuyên bố sẽ chặn hầu hết các chương trình tự động truy cập dữ liệu công khai của nền tảng này. Theo đó, các bên muốn sử dụng dữ liệu của Reddit cho mục đích thương mại, bao gồm cả việc huấn luyện mô hình AI, sẽ phải ký kết thỏa thuận cấp phép. Luật sư trưởng của Reddit, ông Ben Lee, cho biết động thái này nhằm ngăn chặn các đối tượng xấu lợi dụng dữ liệu của Reddit và khẳng định việc cho phép truy cập dữ liệu trong tệp robots.txt không đồng nghĩa với việc được sử dụng dữ liệu một cách tùy tiện.
Bất chấp những lùm xùm, Perplexity AI vẫn nhận được sự quan tâm lớn từ giới đầu tư, với vòng gọi vốn mới nhất được cho là lên tới hàng trăm triệu USD. Công ty cũng tích cực phát triển các tính năng mới, chẳng hạn như Pages, cho phép tạo ra các trang web tùy chỉnh dựa trên yêu cầu của người dùng. Tính năng này được kỳ vọng sẽ hỗ trợ giáo dục, nghiên cứu và chia sẻ kiến thức. Liệu Perplexity AI có thể khắc phục những sai lầm trong quá khứ và hiện thực hóa tham vọng trở thành “công cụ trả lời” hàng đầu?