Chuyên đề

Khai mỏ vàng dữ liệu

Bảo Trung Thứ Sáu | 16/07/2021 08:31

Cuộc đua số hóa đang tạo ra nguồn dữ liệu khổng lồ để đưa nền kinh tế Việt Nam trở thành nền kinh tế số.

Trong một buổi phỏng vấn từ năm 2016, Giám đốc Tầm nhìn của Microsoft, ông Dave Coplin đã đưa ra một mệnh đề mà sau này được phổ biến rộng khắp bởi báo chí thế giới: “Dữ liệu sẽ là nhiên liệu mới cho tương lai. Khi có đủ dữ liệu, mọi thứ sẽ thay đổi”. Một năm ngay sau đó, tờ The Economist càng nhấn mạnh tầm quan trọng của dữ liệu còn hơn cả dầu mỏ: “Cho dù bạn đang chạy bộ, xem tivi hay tham gia giao thông, mọi hoạt động đều tạo ra dấu vết kỹ thuật số - nhiên liệu cho những nhà máy chưng cất dữ liệu tinh”.

GDP MỚI CỦA QUỐC GIA

5 năm đã trôi qua và viễn cảnh trên đã trở thành hiện thực. Dữ liệu không có gì mới, chúng ta vốn đã sử dụng nó từ hàng ngàn năm nay. Nhưng phải đến gần đây, với sự bùng nổ của những cảm biến thông minh, băng thông internet mạnh mẽ, vi xử lý giá rẻ, điện thoại được phổ cập, những cách xử lý dữ liệu mới, IPv6...  thì mọi hoạt động của con người mới được số hóa gần như trọn vẹn như vậy.

Dữ liệu đã trở thành món hàng giá trị nhất trên thị trường, là động lực chính giúp đưa bộ ngũ công ty lớn nhất thế giới - Facebook, Apple, Microsoft, Amazon và Alphabet (Google) - vượt mốc vốn hóa 1.000 tỉ USD. Dữ liệu mang lại cho họ quyền lực ngang bằng với các quốc gia, buộc chính phủ các nước liên tục tổ chức các phiên điều trần, nhằm hạn chế tầm ảnh hưởng của những gã khổng lồ này.

Nếu phải đưa ra một ví dụ để chứng minh quyền lực của những tập đoàn công nghệ lớn đến thế nào, hãy nhìn vào ngày ra mắt iOS 14.5. Một thay đổi nhỏ trong cách phân phối dữ liệu của Apple đã đủ làm chao đảo toàn bộ thế giới internet, có thể quét sạch gần hết những ứng dụng nhỏ.

Và với tiềm lực khổng lồ của mình, không có gì lạ khi người ta gọi dữ liệu (data) là GDP mới (Gross Data Product) của quốc gia. Nếu tận dụng tốt, các nước có thể mở rộng không ngừng đường biên giới của mình và thu hút được những công dân ưu tú nhất gia nhập.

Việt Nam có mức tăng cao nhất ở Đông Nam Á, khoảng 41%,  về số lượng người tiêu dùng kỹ thuật số mới trong đại dịch.
Việt Nam có mức tăng cao nhất ở Đông Nam Á, khoảng 41%, về số lượng người tiêu dùng kỹ thuật số mới trong đại dịch.

IBM chia dữ liệu ra làm 8 loại: Địa điểm (GPS), Môi trường (nhiệt độ, sức gió), Máy móc (dữ liệu tạo ra khi máy móc tương tác với nhau), Cơ thể (huyết áp, nhịp tim), Sự kiện (một trận bóng), Tính chất (màu sắc, độ sáng), Cử động (chiều và hướng một chiếc xe đạp đang chạy) và Định hướng (chiếc điện thoại đang úp hay đang lật).

Mỗi loại dữ liệu sẽ được sử dụng cho một mục đích khác nhau. Như dữ liệu về màu sắc và độ sáng của một điểm màu sẽ được sử dụng để đồng bộ với màu sắc và độ sáng của điểm màu bên cạnh, tạo nên một đoạn phim quảng cáo ở quảng trường. Hay kết hợp dữ liệu địa điểm và cử động của một chiếc xe để đưa ra các hướng dẫn giao thông trong Google Maps.

“Theo thống kê, trung bình mỗi người tạo ra 1,7 GB dữ liệu một ngày”, ông Lê Hồng Minh, Tổng Giám đốc VNG, cho biết. “Đó là nguồn dữ liệu vô cùng lớn, nhưng cũng như dầu thô, dữ liệu thô không có giá trị. Quan trọng là phải thu thập, phân tích và xử lý dữ liệu như thế nào”, ông nói thêm. Theo ông Minh, 99% dữ liệu hiện ở dạng thô, chỉ 1% được xử lý để tạo ra giá trị. Trong 1% này, phần lớn do các doanh nghiệp đa quốc gia trên thế giới xử lý. Các nguồn dữ liệu tại Việt Nam cũng rời rạc, không liên thông và trùng lặp. Người dùng không biết thông tin của mình đang bị ai thu thập và thu thập để làm gì.

Trên thực tế, IBM cũng đã chỉ ra trong toàn bộ những dữ liệu đó, một dữ liệu được cho là chất lượng khi nó phục vụ tốt cho quá trình ra chiến lược của công ty hay một đất nước. Ngược lại, những dữ liệu không chất lượng là khi nó dư thừa, trùng lặp, sai lệch, hoặc bị nhiễu - trong nhiều trường hợp lỗi nằm ở khâu thu thập, trong nhiều trường hợp khác lỗi nằm ở khâu phân tích.

Đôi khi dù thu thập đúng số liệu, nhưng sử dụng nó không chính xác cũng gây ra thiệt hại lớn. Mội sai lầm thường gặp khi đánh giá hiệu suất của nhân viên là sử dụng KPI thiên về những chỉ số quá khứ, khiến những người thật sự đóng góp vào sự phát triển tương lai của công ty bị đánh giá thấp - như hoạt động tận tình tư vấn khách hàng hay những đóng góp thầm lặng cho công việc chung sẽ khó lòng thể hiện trên KPI.

Theo nghiên cứu của Gartner, thiệt hại trung bình do dữ liệu kém chất lượng gây ra là khoảng 9,7 triệu USD mỗi năm. Nhận biết được điều này, 1/3 chuyên viên phân tích dữ liệu đã báo cáo rằng họ dành 40% thời gian để kiểm chứng dữ liệu thu thập được trước khi làm bất cứ điều gì khác, theo Forrester.

Giả sử bạn đang sử dụng một đồng hồ thông minh chạy hệ điều hành Android để theo dõi tình trạng sức khỏe, bao gồm nhịp tim, nhiệt độ cơ thể, tình trạng giấc ngủ và độ đều đặn của hơi thở. Hằng ngày, chiếc đồng hồ này sẽ thu thập dữ liệu về sức khỏe của bạn, phân tích những bệnh lý tiềm năng để cảnh báo sớm nhất có thể.

Đồng thời, chiếc đồng hồ cũng gửi những thông tin về sức khỏe của bạn cho ngành công nghiệp dược phẩm, để họ xác định tình trạng sức khỏe chung của toàn dân số, qua đó xác định những sản phẩm cần được phát triển trong tương lai. Chiếc đồng hồ cũng liên kết với một sàn thương mại điện tử và cả trang Facebook cá nhân của bạn, từ đó bạn sẽ nhận được những quảng cáo cá nhân hóa, nhắm thẳng vào tình trạng sức khỏe cũng như thói quen sinh hoạt của mình.

Theo một cách như vậy, dòng dữ liệu luôn luân chuyển từ nền tảng này sang nền tảng khác, giúp cỗ máy kinh tế vận hành hiệu quả. Hãy thử tưởng tượng xem liệu thế giới ngày nay sẽ kém tiện nghi như thế nào, nếu bạn không thể liên kết dữ liệu từ chiếc thẻ tín dụng của mình với ứng dụng đặt đồ ăn, hoặc nếu không thể sử dụng dữ liệu từ Facebook để đăng nhập mọi loại ứng dụng khác. Một mẩu dữ liệu được tạo ra ở một ứng dụng, sẽ được lan truyền đến những ứng dụng khác, từ đó vang vọng ra khắp mọi ngóc ngách trên internet.

Phân tích sâu hơn về các bên tham gia trong nền kinh tế dữ liệu, IBM đã chỉ ra 2 người chơi chính: Người sản xuất dữ liệu và Người trình diễn dữ liệu. Người sản xuất dữ liệu là khởi đầu của tất cả, họ là những ứng dụng, nền tảng, phần mềm thu thập dữ liệu từ người dùng, rồi bán cho những doanh nghiệp khác, có thể là để quảng cáo, để phân tích xu hướng, hoặc để cải thiện trải nghiệm người dùng. Theo dữ liệu từ năm 2014, Công ty Nghiên cứu thị trường IDC báo cáo: “50,6% doanh nghiệp châu Á - Thái Bình Dương muốn tạo ra doanh thu từ việc bán dữ liệu của họ”.

Người trình diễn dữ liệu sẽ đảm nhận khâu đầu ra, sử dụng dữ liệu để tương tác với khách hàng. Bloomberg là nhà trình diễn dữ liệu tiên phong của thế giới. Từ những năm 1980, ấn phẩm điện tử của họ đã cung cấp cho độc giả những thông tin thời gian thực về thị trường tài chính, tin tức trong ngày, giá hàng hóa... Họ cũng sử dụng những bảng biểu và màu sắc giúp việc đọc dữ liệu trở nên dễ dàng hơn. Theo các nghiên cứu, chính việc trình bày dữ liệu một cách trực quan đã thúc đẩy lòng trung thành của người tiêu dùng và tăng doanh thu đáng kể cho doanh nghiệp.

Ngoài 2 người chơi chính này, còn các bên trung gian khác cũng tham gia vào nền kinh tế dữ liệu, bao gồm: Người tổng hợp dữ liệu, Người phân tích ý nghĩa và Chủ sở hữu nền tảng. Tất cả tạo nên một chuỗi giá trị mới, nơi dữ liệu khách hàng nằm ở trung tâm, còn mọi hoạt động vận hành kinh doanh sẽ nằm ở vòng ngoài, tương tác với nhau thông qua dữ liệu ở giữa.

Sẽ không còn mô hình nụ cười của Stan Shih - phân chia rõ ràng các khâu từ thiết kế, sản xuất, bán hàng theo một đường tuyến tính. Thay vào đó, các doanh nghiệp sẽ trực tiếp tương tác với khách hàng để biết phải sản xuất cái gì, chuẩn bị những nguyên liệu gì, phân phối và bán lẻ ra sao. Tất cả sẽ trở nên bình đẳng trong chuỗi giá trị nếu biết tận dụng dữ liệu.

VẠCH XUẤT PHÁT CỦA VIỆT NAM

Trong một nền kinh tế xưa cũ, quốc gia nào sở hữu càng nhiều doanh nghiệp lớn mạnh thì sẽ càng hùng mạnh. Nhưng trong một nền kinh tế dữ liệu, quốc gia nào sản sinh ra càng nhiều dữ liệu chất lượng sẽ càng hùng mạnh. 

Theo báo cáo nghiên cứu của McKinsey, 4 yếu tố quan trọng nhất để đánh giá tiềm lực dữ liệu của quốc gia là: (1) Khối lượng dữ liệu, (2) Số lượng người dùng, (3) Khả năng truy cập và (4) Độ phức tạp của dữ liệu. Theo đó, một quốc gia càng có khối lượng dữ liệu lớn, nhiều người dùng, độ mở của dữ liệu cao và chất lượng dữ liệu tinh vi phức tạp thì quốc gia càng có lợi thế trong bức tranh kinh tế dữ liệu toàn cầu.

Nền kinh tế số của Việt Nam được dự báo sẽ tăng lên 52 tỉ USD vào năm 2025.
Nền kinh tế số của Việt Nam được dự báo sẽ tăng lên 52 tỉ USD vào năm 2025.

Không có gì bất ngờ khi McKinsey xếp Mỹ, Anh và Trung Quốc là 3 quốc gia hàng đầu trong nền kinh tế dữ liệu. Trong đó, Trung Quốc có tiềm lực rất lớn. Tuy nhiên, nước này xếp thứ 3 vì khả năng truy cập dữ liệu xếp gần cuối thế giới. Trong bảng xếp hạng này, McKinsey đã bỏ qua Việt Nam. Đây không phải lần đầu, năm 2019, khi Harvard Business Review (HBR) công bố Chỉ số Dễ dàng kinh doanh số (Ease of Doing Digital Business - EDDB), có 5 quốc gia Đông Nam Á được xếp hạng gồm Singapore (hạng 13), Thái Lan (hạng 33), Philippines (hạng 34), Malaysia (hạng 36), Indonesia (hạng 41), nhưng lại không có Việt Nam.

Lý do được đưa ra là Việt Nam không có một bộ dữ liệu nhất quán về các chỉ số và các con số thống kê. Tuy nhiên, không cần đến McKinsey hay HBR, việc nước ta thiếu nền tảng cho một nền kinh tế dữ liệu có thể được thấy rõ trong những lĩnh vực trụ cột như khó khăn trong thống kê GDP, chuyển đổi số quản lý chính phủ chưa toàn diện, thiếu trầm trọng những thống kê khoa học và các chính sách thúc đẩy sự minh bạch dữ liệu chưa phát huy hiệu quả. Đây đều là những vấn đề cấp thiết, cần phải được giải quyết nếu không muốn bị tụt hậu trong một nền kinh tế mới.

Tuy nhiên, Việt Nam đang định hướng trở thành một nền kinh tế số, kéo theo đó là nhiều chính sách để thúc đẩy xu hướng này. Theo nghiên cứu của Google, Temasek và Bain, nền kinh tế số của Việt Nam được dự báo sẽ tăng lên 52 tỉ USD vào năm 2025, tăng 29% hằng năm so với năm 2020. Từ năm 2016 đến nửa đầu năm 2020, các nhà đầu tư đã rót 1,9 tỉ USD vào lĩnh vực trực tuyến của Việt Nam. Ông Ralf Matthaes, Giám đốc Điều hành của Infocus Mekong Research, nhận định: “Việt Nam đang ở giai đoạn đầu trở thành một xã hội số hóa với dân số trẻ yêu thích công nghệ. Vì vậy, các công ty đang hào hứng cung cấp những dịch vụ này”.

Nhóm các nhà đầu tư do Alibaba và Baring Private Equity Asia dẫn đầu đang rót 400 triệu USD cho 5,5% cổ phần trong chi nhánh bán lẻ của Tập đoàn Masan tại Việt Nam. Là một phần của thỏa thuận được công bố ngày 18.5, Masan sẽ hợp tác với Lazada, đơn vị thương mại điện tử Đông Nam Á của Alibaba. M-Service JSC - một công ty khởi nghiệp Việt Nam được Goldman Sachs Group rót vốn, hỗ trợ vận hành ứng dụng thanh toán MoMo - vào tháng 1 đã huy động được hơn 100 triệu USD từ một nhóm các nhà đầu tư, trong đó có Warburg Pincus. Sàn thương mại điện tử Tiki vừa huy động thành công thêm 130 triệu USD trong vòng huy động vốn mới nhất mà dẫn đầu là công ty quản lý quỹ đầu tư tư nhân Northstar Group…

Có thể thấy, khối doanh nghiệp tư nhân Việt Nam lại được đánh giá rất cao trong việc bắt kịp xu thế dữ liệu. Dân số trẻ của Việt Nam cũng đang nắm bắt nhanh chóng xu hướng dữ liệu của thế giới. Với 45 triệu người thuộc thế hệ Millennials (18-38 tuổi) và 70% dân số sử dụng internet, lượng dữ liệu người Việt tạo ra trên các nền tảng lớn của thế giới như Facebook, YouTube, TikTok là vô cùng khổng lồ. Đây là thị trường béo bở thu hút các tập đoàn công nghệ toàn cầu gia nhập.

Các ngành nghề liên quan tới dữ liệu như công nghệ thông tin, phân tích dữ liệu, khoa học dữ liệu, đặc biệt là ứng dụng các mô hình hồi quy trong marketing đang là những ngành nóng nhất ở Việt Nam, thu hút nhiều sinh viên theo học và cả nhân sự trái ngành theo đuổi.

Những startup công nghệ Việt ngày càng được đánh giá cao. Theo báo cáo kinh tế số e-Conomy SEA năm 2020 của Google, VNPay đã tiếp bước VNG trở thành kỳ lân (được định giá từ 1 tỉ USD trở lên) thứ 2 của Việt Nam. MoMo, Tiki và Sendo là những ứng cử viên sáng giá khác cho cuộc đua 1 tỉ USD này. Cả 3 hiện đã huy động thành công trên 100 triệu USD.

Tất cả tạo nên một bức tranh cực kỳ năng động cho nền kinh mới của Việt Nam. Tuy nhiên, để thật sự làm chủ được xu hướng mới này, rất cần sự đồng hành và phối hợp từ khối Nhà nước lẫn tư nhân. Bài toán ngay trước mắt là xây dựng được một hệ thống dữ liệu thống kê chất lượng và dễ truy cập trên toàn quốc.


Tin cùng chuyên mục

Tin nổi bật trong ngày