Thứ Ba, ngày 18 tháng 06 năm 2026
Tranh cãi về hạn chế câu trả lời của AI thế hệ mới từ Anthropic

Tranh cãi về hạn chế câu trả lời của AI thế hệ mới từ Anthropic

14:03 11-06-2026
 
Logo Claude Paible 5 từ trang chính thức của Anthropic
Logo Claude Paible 5 [Ảnh=Trang chính thức của Anthropic]
Mô hình trí tuệ nhân tạo (AI) thế hệ mới 'Claude Paible 5' do Anthropic công bố đang gây ra tranh cãi về các hạn chế an toàn. Những hạn chế này nhằm ngăn chặn các hoạt động nguy hiểm đã ảnh hưởng đến các câu hỏi khoa học thông thường cũng như câu trả lời liên quan đến phát triển AI, dẫn đến sự bất mãn từ người dùng và các nhà nghiên cứu.
 
Theo báo Wall Street Journal (WSJ), vào ngày 10 tháng 6, Anthropic đã công bố cách thức hạn chế của Claude Paible 5, gây ra phản ứng từ các nhà phát triển và người dùng AI.
 
Paible 5 là mô hình được điều chỉnh từ dòng mô hình 'Mythos', mà Anthropic cho rằng việc công bố rộng rãi là nguy hiểm, để phục vụ cho người dùng thông thường.
 
Khi người dùng đề cập đến các chủ đề nhạy cảm như vũ khí sinh học hay an ninh mạng, hệ thống sẽ hiển thị thông báo và chuyển đổi cuộc trò chuyện sang mô hình có hiệu suất thấp hơn của thế hệ trước. Các câu hỏi liên quan đến phát triển AI cao cấp cũng bị áp dụng hạn chế làm giảm chất lượng câu trả lời.
 
Một số hạn chế không được hiển thị cho người dùng. Anthropic giải thích rằng họ đã áp dụng "các hạn chế không hiển thị đối với câu trả lời liên quan đến phát triển AI" vì lý do an ninh quốc gia và điều khoản dịch vụ. Điều này đã khiến một số nhà nghiên cứu chỉ trích rằng việc đánh giá hiệu suất của mô hình từ bên ngoài trở nên khó khăn.
 
Có những trường hợp cho thấy các câu hỏi khoa học thông thường đã bị chặn. Một số người dùng cho biết họ đã bị từ chối khi hỏi về toán học, sinh học, hóa học. Một người dùng đã công bố màn hình cho thấy Claude Paible 5 từ chối trả lời câu hỏi cơ bản về tế bào liên quan đến việc giải thích về ti thể.
 
Nhà miễn dịch học Deria Unutmaz, nhà nghiên cứu tại Viện Jackson, cho biết: "Vì lý do có chủ đề sinh học trong các cuộc trò chuyện trước đó, tôi không thể nhập từ 'ung thư' hay thậm chí là lời chào".
 
Anthropic đã xin lỗi về các hạn chế không hiển thị. Công ty cho biết: "Các thiết bị an toàn ẩn làm cho việc xác minh và phát hiện khả năng vượt qua trở nên khó khăn hơn" và "chúng tôi đã thực hiện một sự thỏa hiệp sai lầm và không đạt được sự cân bằng". Họ cũng cho biết sẽ hiển thị các hạn chế này cho người dùng trong tương lai.
 
Về việc chặn các câu hỏi trong lĩnh vực khoa học sự sống, công ty giải thích rằng "cần có phản ứng thận trọng ban đầu để ngăn chặn khả năng lạm dụng". Họ cũng cho biết sẽ giảm thiểu các chặn không cần thiết và cung cấp các mô hình như Paible cho các nhà nghiên cứu sinh học và khoa học sự sống mà không có thiết bị an toàn.



* Bài viết này được dịch tự động bằng AI.