A.I có thể thúc đẩy sự bùng nổ trong sáng tạo âm nhạc

Hoàng Huyền Thứ Ba | 02/04/2024 11:39

Sự bùng nổ công nghệ AI trong sáng tạo âm nhạc. Ảnh: SkyHouse.

Một loạt thế hệ tạo nhạc A.I mới đang dần chiếm ưu thế trong việc hỗ trợ các nhà soạn nhạc tạo ra nhiều bản nhạc mới.

Sự bùng nổ công nghệ AI trong sáng tạo âm nhạc. Ảnh: SkyHouse.

Trong thời đại kỹ thuật số phát triển, nhiều mô hình trí tuệ nhân tạo (A.I) đã được ra đời nhằm phục vụ cho con người trong nhiều lĩnh vực khác nhau, âm nhạc cũng không phải ngoại lệ. Sự xuất hiện này khiến cho nhiều người lo sợ một thế giới tràn ngập những giai điệu chung chung và cằn cỗi về cảm xúc, kể cả nhạc sĩ cũng có khả năng bị "bỏ quên". Tuy nhiên, cũng có nhiều dấu hiệu khả quan hơn cho thấy, A.I có thể thúc đẩy sự bùng nổ trong sáng tạo âm nhạc.

Minh chứng mới nhất cho thấy, vào tháng 8/2023, khi Meta phát hành mã nguồn cho AudioCraft, một bộ mô hình âm nhạc sáng tạo lớn được xây dựng bằng Machine learning (máy học). Các công ty A.I trên toàn thế giới đã bắt đầu sử dụng phần mềm này để đào tạo các trình tạo nhạc mới. MusicGen, 1 trong 3 mô hình của AudioCraft, đã phân tích các mẫu trong khoảng 400.000 bản ghi âm với tổng thời lượng gần 28 tháng để đưa ra 3,3 tỉ thông số, hoặc các biến, cho phép thuật toán tạo ra các mẫu âm thanh để đáp lại lời nhắc.

Ngoài ra, Stability A.I, một công ty có trụ sở tại London, đã phát hành một mô hình, Stable Audio vào tháng 9 được đào tạo trên khoảng 800.000 bản nhạc. Người dùng có thể dễ dàng tải đoạn âm nhạc lên, chẳng hạn như một bản solo guitar và được soạn lại bằng tiếng piano vui nhộn, có thể mang lại cảm giác phát lại bằng đĩa vinyl.

Ứng dụng hữu ích nhất của A.I trong việc giúp đỡ các nhà soạn nhạc. Ảnh: The Economist.

Tuy nhiên, nhiều người có chuyên môn trong ngành vẫn hoài nghi về việc A.I không bao giờ tạo ra được bản âm nhạc đích thực. Những tác động của A.I trong âm nhạc vẫn còn như ngày đầu.

Kỹ sư Yossef Adi, làm việc tại phòng thí nghiệm A.I của Meta ở Tel Aviv cho biết, mặc dù đầu ra khá tốt nhưng mô hình này vẫn chưa “đủ nghệ thuật” để tạo ra các bài hát có cốt truyện hoàn chỉnh và có sự sai lệch về hòa âm. Theo đó, OpenAI, một công ty ở San Francisco, cho biết mô hình MuseNet của họ gặp khó khăn trong việc sử dụng A.I để kết hợp nhiều thể loại khác nhau, chẳng hạn như phong cách Chopin kết hợp giữa âm trầm và trống.

Nhưng một số công ty A.I nhận định rằng, họ đã tìm ra cách lưu giữ và tái tạo “dấu ấn âm nhạc độc đáo” của nhạc sĩ. Như việc, A.I của LifeScore sắp xếp lại các thành phần trong bản ghi gốc của người dùng theo cách duy trì cảm giác âm nhạc, thay vì biến chúng thành một thứ gì đó hoàn toàn mới. Ứng dụng này có thể biến đổi từng đoạn thành nhịp độ, giai điệu hoặc thể loại mới trong vòng vài giây. Các nghệ sĩ công nhận việc phối lại nhạc như A.I đã làm theo cách thủ công thành một bản nhạc ăn khách thì phải mất một hoặc nhiều tuần. Ngay cả người hâm mộ cũng có thể tạo ra các bản phối lại theo các bài của ca sĩ mình yêu thích để phù hợp với sở thích cá nhân chỉ bằng vài cú nhấp chuột.

Điều này có vẻ được xem là một tiến bộ vượt bậc của A.I trong lĩnh vực này nhưng việc đánh giá A.I bằng khả năng tạo ra các bản nhạc bóng bẩy hầu hết sai lầm. Ứng dụng hữu ích nhất của A.I trong hỗ trợ các nhà soạn nhạc các bước cơ bản để tạo ra bản nhạc hoàn chỉnh. Theo các nhà phát triển, việc đưa ra các bộ đào tạo trong âm nhạc tốt hơn sẽ khắc phục được phần lớn những thiếu sót như vậy trong tương lai.

Hiện nay, một số ứng dụng A.I mới với nhiều nhiệm vụ và tính năng khác nhau. Như trợ lý A.I của Native Instruments có nhiệm vụ sửa các lỗi như cao độ và thời gian, cắt bỏ hoặc chèn các đoạn âm thanh có âm sắc phù hợp. Tương tự, Boomy là một nền tảng “tự động hóa âm nhạc” trực tuyến của Alex Mitchell, nó sản xuất bài hát “ít ma sát” với lời nhắc bằng văn bản. Ngoài ra, một ứng dụng khác “style transfer” (chuyển đổi phong cách) được. Một mô hình “Voice-Swap” (hoán đổi giọng nói) sẽ cắt các âm thanh được hát bởi các ca sĩ chuyên nghiệp và sắp xếp lại các đoạn đó thành lời bài hát do người dùng dịch vụ viết và những người trả phí cấp phép để có quyền bán các bản nhạc thu được. Vocaloid, công cụ tổng hợp giọng nói của Yamaha (Nhật), có thể sử dụng bản dịch cho người bản xứ hát làm mẫu để A.I bắt chước, sau đó sắp xếp lại, sửa đổi và ghép các đoạn nhỏ trong giọng hát của ca sĩ gốc lại với nhau.

Có thể bạn quan tâm:

Báo cáo iPOS F&B 2023: Hơn 45% doanh nghiệp không sử dụng ứng dụng giao đồ ăn

f | Chia sẻ bài viết

Theo dõi Nhịp Cầu Đầu Tư