Công Nghệ

"Cuộc đua ngầm" mua dữ liệu đào tạo AI của Big Tech

Khánh Tú Thứ Sáu | 12/04/2024 19:00

Các “gã khổng lồ” ngành công nghệ đã sử dụng miễn phí hàng loạt dữ liệu được thu thập từ Internet để đào tạo các mô hình A.I có tính sáng tạo. Ảnh: Reuters.

Các BigTech đã chi hàng tỉ USD để mua dữ liệu nhằm tạo đạo công cụ trí tuệ nhân tạo (A.I) của mình.
Các “gã khổng lồ” ngành công nghệ đã sử dụng miễn phí hàng loạt dữ liệu được thu thập từ Internet để đào tạo các mô hình A.I có tính sáng tạo. Ảnh: Reuters.

Vào thời kỳ hoàng kim của những năm 2000, Photobucket là công cụ lưu trữ hình ảnh hàng đầu thế giới. Với vai trò là một công cụ truyền thông quan trọng cho các dịch vụ đình đám như Myspace và Friendster, Photobucket tự hào sở hữu 70 triệu người dùng và chiếm lĩnh gần một nửa thị trường ảnh trực tuyến tại Mỹ.

Tuy nhiên, sau hơn hai thập kỷ, hiện chỉ có khoảng 2 triệu người sử dụng Photobucket, theo dữ liệu phân tích của công cụ theo dõi Similarweb. Song, giới chuyên gia đánh giá cuộc cách mạng trí tuệ nhân tạo (A.I) có thể mang lại cho những dịch vụ như Photobucket một cơ hội mới để phục hồi và phát triển.

Ông Ted Leonard, Giám đốc Điều hành Photobucket, cho biết ông đang đàm phán với nhiều công ty công nghệ để cấp phép sử dụng 13 tỉ bức ảnh và video của Photobucket. Kho dữ liệu ảnh này được sử dụng nhằm đào tạo các mô hình trí tuệ nhân tạo có khả năng tạo ra nội dung mới.

Theo ông Leonard, giá cả đang được thảo luận từ 5 cent đến 1 USD cho mỗi bức ảnh và hơn 1 USD cho mỗi video. Mức giá khác nhau tùy theo người mua và loại hình ảnh được tìm kiếm.

Các cuộc đàm phán đang diễn ra và chưa được báo cáo trước đây cho thấy Photobucket có thể nắm giữ một kho lưu trữ ảnh và video trị giá hàng tỉ USD, đồng thời mang đến một góc nhìn sâu sắc về thị trường dữ liệu đang phát triển mạnh mẽ trong thời đại công nghệ A.I thống trị.

Các “gã khổng lồ” ngành công nghệ như Google, Meta và OpenAI (do Microsoft hậu thuẫn) đã sử dụng miễn phí hàng loạt dữ liệu được thu thập từ Internet để đào tạo các mô hình A.I có tính sáng tạo như ChatGPT, có khả năng mô phỏng sự sáng tạo của con người. Các BigTech cho rằng việc làm này không chỉ hợp pháp mà còn có đạo đức, mặc dù họ phải đối mặt với các vụ kiện từ các chủ sở hữu bản quyền liên quan về hành vi này.

Bên cạnh việc sử dụng miễn phí, các “ông lớn” công nghệ cũng đang âm thầm trả tiền cho các nội dung trả phí, dẫn đến hàng loạt những hoạt động giao dịch ngầm, nhằm mua bán mọi thứ, từ nhật ký trò chuyện đến ảnh cá nhân đã bị lãng quên từ lâu trên các ứng dụng mạng xã hội.

“Hiện tại, đang có làn sóng tìm kiếm những chủ nhân có bản quyền của những nội dung riêng tư. Chúng tôi đang tư vấn cho các chủ sở hữu nội dung về các giao dịch có giá trị hàng chục triệu USD để cấp phép lưu trữ ảnh, video và sách cho việc đào tạo A.I”, ông Edward Klaris, chuyên gia từ công ty luật Klaris Law, cho biết.

Nhiều công ty nghiên cứu thị trường lớn cho biết họ thậm chí còn chưa bắt đầu ước tính quy mô của thị trường dữ liệu trí tuệ nhân tạo không rõ ràng, nơi các công ty thường không tiết lộ thông tin về các giao dịch. Một nghiên cứu của Business Research Insights ước tính thị trường hiện ở mức 2,5 tỉ USD, đồng thời dự đoán trong vòng một thập kỷ tới, con số này có thể tăng lên gần 30 tỉ USD.

Việc thu thập dữ liệu diễn ra, khi các nhà sản xuất mô hình A.I đối mặt với áp lực ngày càng gia tăng trong việc xử lý và đào tạo lượng dữ liệu khổng lồ được đưa vào hệ thống. Quá trình này không chỉ đòi hỏi sự tính toán chuyên sâu, mà thường mất nhiều tháng để hoàn thành. 

Các nhà sản xuất mô hình A.I cũng bắt đầu có động thái nhằm đảm bảo chuỗi cung ứng dữ liệu thông qua các thỏa thuận với chủ sở hữu nội dung và thông qua sự xuất hiện của ngành công nghiệp môi giới dữ liệu đang phát triển để đáp ứng nhu cầu.

Điển hình như ChatGPT, vài tháng sau khi ứng dụng chatbot ra mắt vào cuối năm 2022, các công ty như Meta, Google, Amazon và Apple đã đạt được thỏa thuận với nhà cung cấp hình ảnh chứng khoán Shutterstock để sử dụng hàng trăm triệu hình ảnh, video và tệp nhạc trong thư viện của họ cho mục đích đào tạo A.I.

Ông Jarrod Yahes, Giám đốc Tài chính của Shutterstock, cho biết thỏa thuận với các hãng công nghệ lớn ban đầu dao động từ 25 triệu USD đến 50 triệu USD mỗi công ty, dù hầu hết sau đó đã được mở rộng. Ông nói thêm rằng những hãng công nghệ nhỏ hơn đã làm theo, thúc đẩy một "hàng loạt hoạt động" mới trong hai tháng qua.

Đối thủ cạnh của Shutterstock là Freepik cũng cho biết, đã đạt được thỏa thuận với hai công ty công nghệ lớn khác để cấp phép phần lớn kho lưu trữ 200 triệu hình ảnh của họ với mức giá từ 2 đến 4 cent/mỗi ảnh.

Có thể bạn quan tâm:

Thị trường M&A toàn cầu phục hồi mạnh

Nguồn Reuters


Tin cùng chuyên mục

Tin nổi bật trong ngày