Google Gemini bổ sung tính năng tạo nhạc trong 30 giây

Phiên bản beta trên máy tính, mở rộng sang di động trong vài ngày Mỗi bản nhạc đều có watermark không thể thấy

Google đã bổ sung tính năng tạo nhạc cho ứng dụng trợ lý AI Gemini của mình. Đây là một phần trong chiến lược mở rộng từ AI tạo văn bản sang các công cụ sáng tạo đa phương tiện như hình ảnh, video và âm nhạc.

Vào ngày 18, Google thông báo rằng họ đã giới thiệu tính năng tạo nhạc dựa trên giọng nói dưới dạng beta trên phiên bản máy tính của ứng dụng Gemini. Người dùng có thể nhập văn bản, hình ảnh, video để tạo ra đoạn nhạc dài khoảng 30 giây, kèm theo tính năng tự động tạo lời.

Người dùng chỉ cần nhập mô tả bài hát mong muốn, AI sẽ tạo ra một đoạn nhạc ngắn với giai điệu, nhịp điệu và dòng giọng hát. Kết quả có thể tải xuống hoặc sử dụng trong các nội dung khác.

Tính năng này có thể kết hợp với công cụ tạo hình ảnh AI Nano Banana của Google để tạo bìa nghệ thuật, giúp kết nối quá trình tạo nhạc và nội dung hình ảnh thành một dòng chảy liên tục, hỗ trợ sản xuất video hoặc nội dung trên mạng xã hội. Google dự định mở rộng Gemini thành một nền tảng tạo nội dung toàn diện.

Công nghệ này dựa trên mô hình âm nhạc mới nhất Lyria 3 của Google DeepMind, hỗ trợ 8 ngôn ngữ và có khả năng tạo ra nhiều thể loại và phong cách âm nhạc khác nhau. Tính năng này sẽ sớm được áp dụng cho ứng dụng di động.

Google cho biết họ đã hợp tác với cộng đồng âm nhạc để phát triển công nghệ này từ khi công bố Lyria vào năm 2023. Họ đã thu thập ý kiến từ các nhà sản xuất âm nhạc và tuân thủ nghiêm ngặt quyền tác giả và hợp đồng đối tác trong quá trình học tập của Lyria 3.

Công nghệ tạo nhạc dựa trên AI đang phát triển nhanh chóng. Một số startup và nền tảng đã có khả năng tạo ra các bản nhạc hoàn chỉnh dài vài phút hoặc tự động tạo nhạc theo thể loại cụ thể. Google tích hợp tính năng tạo nhạc vào Gemini để mở rộng ứng dụng AI từ văn bản và hình ảnh sang lĩnh vực sáng tạo nội dung.

Tuy nhiên, sự phát triển của công nghệ này cũng dẫn đến tranh cãi về quyền tác giả. Có lo ngại rằng AI có thể vi phạm quyền của các nhà sáng tạo khi học theo phong cách âm nhạc hiện có.

Google nhấn mạnh rằng việc tạo nhạc bằng Lyria 3 không nhằm mô phỏng nghệ sĩ hiện có mà là để thể hiện sáng tạo độc đáo. Mọi bản nhạc tạo ra từ ứng dụng Gemini đều có watermark 'SynthID' để nhận diện nội dung do AI tạo ra.

Google cũng cho biết nếu có nghệ sĩ cụ thể được đề cập, AI sẽ tạo ra những bản nhạc có phong cách hoặc không khí tương tự, không phải là tái hiện trực tiếp. Họ đã áp dụng bộ lọc so sánh để giảm thiểu khả năng vi phạm bản quyền.

Google thừa nhận rằng các biện pháp này không hoàn hảo và khuyến khích người dùng báo cáo nếu phát hiện nội dung có khả năng vi phạm quyền. Người dùng cần tuân thủ điều khoản dịch vụ và chính sách AI tạo nội dung để không vi phạm quyền sở hữu trí tuệ và quyền bảo vệ thông tin cá nhân của người khác.

Google cho biết, "Chúng tôi nhận thức rằng phương pháp này không hoàn hảo và mục tiêu của bản cập nhật này không phải là tạo ra âm nhạc tuyệt vời mà là giúp bạn thể hiện bản thân một cách thú vị và độc đáo."

* Bài viết này được dịch tự động bằng AI.

Ryu Cheongbit cbryu@economidaily.com