OpenAI ra mắt GPT-5.5, nâng cao khả năng AI

Nâng cao khả năng thực hiện công việc của AI Đẩy nhanh chiến lược 'siêu ứng dụng AI'

OpenAI vừa công bố mô hình AI mới nhất 'GPT-5.5', làm thay đổi cuộc cạnh tranh AI tạo sinh. Mô hình này không chỉ cải thiện hiệu suất mà còn thúc đẩy chiến lược chuyển đổi sang 'AI dạng tác nhân' và 'siêu ứng dụng'.

Theo OpenAI, GPT-5.5 có khả năng suy luận và tự chủ vượt trội so với các mô hình trước. Nó cải thiện khả năng thực hiện các công việc phức tạp như lập trình, nghiên cứu và phân tích dữ liệu, với khả năng tự thiết kế các bước giải quyết vấn đề dựa trên ý định của người dùng.

Mô hình này được coi là động cơ chính trong chiến lược 'siêu ứng dụng AI' của OpenAI. GPT-5.5 có thể nhận diện màn hình và thực hiện các tác vụ như nhấp chuột, nhập liệu, hợp tác với con người qua nhiều công cụ. Điều này giúp ChatGPT tiến hóa thành một nền tảng tích hợp, kết hợp công cụ tìm kiếm và năng suất.

Ví dụ, khi người dùng yêu cầu phân tích xu hướng thị trường và gửi báo cáo qua email, GPT-5.5 có thể mở trình duyệt, thu thập thông tin, soạn thảo tài liệu và gửi email, cho thấy AI đang mở rộng từ việc cung cấp câu trả lời sang thực hiện công việc thực tế.

Về hiệu suất, GPT-5.5 cải thiện đáng kể trong các công việc phát triển như sửa mã đa tệp, thiết kế hệ thống xác thực và triển khai chức năng hợp tác. Các ứng dụng doanh nghiệp như soạn thảo tài liệu và phân tích dữ liệu cũng được tăng cường. Ngành công nghiệp nhận định rằng trọng tâm cạnh tranh AI đang chuyển từ hiệu suất mô hình sang khả năng thay thế công việc thực tế.

OpenAI cũng tăng cường bảo mật cho GPT-5.5, xác định nó thuộc loại 'nguy cơ cao' có thể bị lạm dụng trong các cuộc tấn công mạng, và đã tiến hành các bài kiểm tra mô phỏng tấn công chưa từng có.

Gần đây, Anthropic đã công bố các mô hình thế hệ mới như 'Claude Mythos' và 'Opus 4.7', làm tăng thêm sự cạnh tranh. Theo báo cáo của OpenAI, GPT-5.5 vượt trội hơn Opus 4.7 ở nhiều chỉ số hiệu suất chính.

Trong chỉ số 'GDPval' đo lường khả năng thực hiện công việc, GPT-5.5 đạt 84,9%, vượt Opus 4.7 khoảng 4 điểm phần trăm. Trong 'Terminal-Bench 2.0' đánh giá khả năng kiểm soát hệ thống, GPT-5.5 đạt 82,7%, hơn 13 điểm phần trăm. Trong chỉ số an ninh CyberGym, GPT-5.5 đạt 81,8%, vượt xa mô hình cạnh tranh (73,1%).

Tuy nhiên, trong đánh giá khả năng lập trình SWE-Bench Pro, GPT-5.5 đạt 58,6%, thấp hơn Opus 4.7 (64,3%). OpenAI đã nêu lên khả năng ghi nhớ dữ liệu của mô hình cạnh tranh và bày tỏ quan điểm khác về phương pháp đánh giá.

GPT-5.5 sẽ được tích hợp vào các dịch vụ chính của OpenAI như ChatGPT, thúc đẩy sự phát triển thành 'siêu ứng dụng AI' xử lý đa dạng công việc trên một nền tảng. Khi AI tạo sinh trở thành 'đồng nghiệp kỹ thuật số', dự kiến sẽ có nhiều thay đổi trong cấu trúc năng suất của doanh nghiệp và ngành công nghiệp.

Chủ tịch OpenAI, Greg Brockman, trong buổi họp báo, cho biết: "Đặc điểm nổi bật của mô hình này là khả năng thực hiện nhiều công việc hơn với ít hướng dẫn hơn. Khả năng tự giải thích các vấn đề không hoàn chỉnh hoặc mơ hồ và quyết định bước tiếp theo đã được cải thiện đáng kể." Ông nhấn mạnh: "Đây là bước tiến quan trọng trong việc hình thành cách sử dụng máy tính và tính toán dạng tác nhân quy mô lớn trong tương lai."

* Bài viết này được dịch tự động bằng AI.

LEE JEE WON jeewonlee@ajunews.com