Bạn có biết: “Big data” có giá 203 tỷ đô la?

(Vietnamtimes) – Theo thống kê của tạp chí Forbes, thị trường “Big data” hay dữ liệu lớn trên thế giới có trị giá là 203 tỷ đô la.

Dữ liệu đang được tạo ra và thu thập một cách chóng mặt. Đi kèm với việc khối dữ liệu khổng lồ được tạo ra thì các doanh nghiệp đang có nhu cầu đầu tư và cơ sở hạ tầng, phần mềm phân tích và dịch vụ lưu trữ, nghiên cứu phân tích cũng như đào tạo các chuyên gia khoa học dữ liệu để tạo ra giá trị từ số liệu sẵn có.

Với khối dữ liệu khổng lồ hiện có, học sâu (Deep Learning) đã trở thành phương pháp đang được các công ty lớn như như Google, Baidu, IBM đặc biệt quan tâm đến.  Tuy nhiên học sâu chỉ là một loại mô hình giám sát phức tạp trong các mô hình máy học đang được quan tâm trong lĩnh vực dữ liệu lớn hay “big data”.

Các mô hình máy học dùng để phân tích dữ liệu lớn có thể chia ra làm ba phạm trù chính: giám sát, không giám sát và học tăng cường. Học giám sát là các thuật toán máy học có khả năng dự đoán đầu ra của một mô hình dựa trên các yếu tố đầu vào. Học không giám sát là các mô hình hóa/phân cụm một tập dữ liệu không có các ví dụ đã được gắn nhãn sẵn. Học tăng cường là các mô hình trong đó thuật toán học một hành động tùy theo quan sát về môi trường xung quanh.

Mỗi hành động có tác động đến môi trường và thông tin phản hồi nhận được từ môi trường sẽ được cung cấp ngược lại để hướng dẫn cho thuật toán trong quá trình học. Học sâu đã được phát triển từ thập niên 60s, tuy nhiên gần đây vì xu hướng phát triển của big data nên học sau gần đây đã có những đột phát mới.

1. Các xu hướng “big data” ứng dụng trên thế giới hiện nay bao gồm:

Sự đa dạng của dữ liệu bao gồm 3 yếu tố:

  • Khối lượng khổng lồ của dữ liệu.
  • Tần suất cao mà dữ liệu được tạo ra hàng giây.
  • Độ đa dạng của các nguồn dữ liệu.

2. Internet vạn vật thúc đẩy dữ liệu lớn:

Internet vạn vật đi song song với dữ liệu lớn vì hàng vạn thiết bị kết nối qua mạng tạo ra một khối lượng dữ liệu khổng lồ. Lưu trữ và phân tích dữ liệu lớn giúp chúng ta mở đường cho những hướng đi mới của nhiều doanh nghiệp khác nhau muốn tạo ra giá trị từ các loại dữ liệu khác nhau. Phân tích các nguồn dữ liệu lớn từ các lĩnh vực khác nhau giúp cải thiện y tế, giao thông, tiết kiệm  tài nguyên và giúp nâng cao chất lượng cuộc sống con người.

3. Bảo mật cơ sở dữ liệu: 

Nếu như dữ liệu ngày càng nhiều và càng đa dạng, thì bảo mật thông tin dữ liệu ngày càng cần thiết hơn để tránh khỏi các mối đe dọa bảo mật đánh cắp thông tin cá nhân. Xã hội sẽ ngày càng đầu tư nhiều hơn vào bảo vê an toàn hệ thống và quản lý thông tin cho các hệ thống doanh nghiệp trong  thời  gian tới.

4. Xu thế điện toán đám mây:

Việc đa dạng hóa của dữ liệu dẫn đến nhu cầu cần thiết trong việc tìm ra giá trị việc phân tích dữ liệu. Các tổ chức doanh nghiệp phải dùng việc phân tích dữ liệu để tìm ra giá trị từ những bộ dữ liệu thô. Chính vì vậy điện toán đám mây sẽ giúp các tổ chức khác nhau lưu trữ dữ liệu dễ dàng hơn, rẻ tiền hơn, và có thể dùng dữ liệu để phân tích và tạo ra giá trị nhanh hơn khi cần.

Hiện tại, Việt Nam đang bước vào cuộc cách mạng công nghệ 4.0, các lĩnh vực tiêu biểu có liên quan bao gồm, đồ thị thông minh, trí tuệ nhân tạo, giáo dục trực tuyến, công nghệ tài chính, và dữ liệu lớn. Tất cả các lĩnh vực này nếu được áp dụng đúng cách sẽ đem lại lợi ích tối đa cho người dân.

Tuy nhiên “big data” hay dữ liệu lớn cần được phát triển đầu tiên để đưa cuộc các mạng công nghiệp 4.0 thành công vì phải hiểu dữ liệu mới hiểu hành vi sử dụng công nghệ của từng nhóm người từ đó mới phát triển các ứng ụng 4.0 phực vụ xã hội tốt hơn.

Thêm vào đó, để cuộc cách mạng big data thành công và phục vụ cho các lĩnh vực khác, điều quan trọng hơn hết không phải là dữ liệu, cơ sở hạ tầng, điện toán đám mây hay thuật toán, mà cần các chuyên gia hàng đầu trong các ngành nghề có liên quan hiểu được các bài toán ứng dụng và có thể phối hợp với nhau một cách hoàn hảo để tạo ra giá trị từ dữ liệu để phục vụ người dân và xã hội.

Vận dụng dữ liệu lớn đối với các doanh nghiệp SMEs là việc vận dụng linh hoạt nhiều nguồn dữ liệu khác nhau và dùng nó để tăng năng suất và lợi nhuận. Dữ liệu được lưu trữ trên đám mây cho phép các doanh nghiệp nhỏ có thể tiếp cận với dữ liệu vốn dĩ trước đây chỉ các doanh nghiệp lớn mới có khả năng tiếp cận.

Khi các doanh nghiệp nhỏ vừa thành lập, có rất nhiều công việc cần phải thực hiện trong đó có một việc quan trọng và cần phải lưu ý ngay từ đầu đó chính là lưu trữ dữ liệu ngày càng nhiều trong một thời gian rất ngắn. Những điều sau rất quan trọng đối với bất kỳ doanh nghiệp SMEs nào trong sự bùng nổ của dữ liệu lớn.

Thứ nhất, khai thác dữ liệu lớn là vấn đề quan trọng của doanh nghiệp SMEs Vận dụng dữ liệu lớn không còn chỉ là đi theo trào lưu mà vai trò của dữ liệu trở nên cực kỳ quan trọng và là tài sản quý giá của doanh nghiệp SMEs. Dữ liệu không còn là những con số đơn giản mà lúc này đã được xác định ở tầm chiến lược. Những nhà sở hữu hay điều hành của các doanh nghiệp SMEs cần phải xác lập chiến lược để dữ liệu được thu thập và phân tích, cần xác định mục tiêu chiến lược và những chỉ số đo lường những dữ liệu đã thu thập được.

Về mặt bản chất thì đây chính là phương pháp tối ưu để các doanh nghiệp SMEs có thể tạo ra khách hàng, tái tạo ra khách hàng và duy trì mức độ gắn bó của công ty với khách hàng thông qua phân tích dữ liệu. Phân tích dữ liệu với các doanh nghiệp SMEs không phức tạp như nhiều người vẫn suy nghĩ, ví dụ những thông số rất giá trị thông qua công cụ phân tích của Google Analytics hiện đang là công cụ miễn phí tích hợp trên các trang mạng. Điều quan trọng là phải biết cách phân tích, khai thác thông tin cụ thể để thông tin đó trở thành chiến lược phục vụ cho công việc phát triển doanh nghiệp SMEs.

Trong thời gian qua, các doanh nghiệp SMEs hiện đang gặp phải một số vấn đề liên quan đến việc vận dụng dữ liệu lớn vào trong công việc của mình và có 5 điều lưu ý như sau:

– Mục tiêu cụ thể cần phải xác định rõ ràng và câu hỏi đầu tiên là doanh nghiệp mong muốn điều gì đối với việc vận dụng nguồn dữ liệu này. Mục tiêu của các doanh nghiệp SMEs luôn khẳng định đó chính là sự hài lòng của khách hàng và mong muốn khách hàng sẽ tiếp tục mua sản phẩm. Sư hài lòng của khách hàng là mục tiêu để việc vận dụng dữ liệu sẽ đem lại hiệu quả về hiệu suất và doanh thu. Việc kinh doanh sẽ tốt hơn nếu như việc vận dụng dữ liệu lớn làm cho khách hàng nhận được dịch vụ nhanh chóng và thuận lợi hơn.

– Xác định nguồn dữ liệu ở đúng vị trí. Hầu hết các doanh nghiệp SMEs đều lưu trữ dữ liệu của mình ở nhiều nơi khác nhau, nhiều bộ phận khác nhau. Điều quan trọng ở đây là làm sao có khả năng kết hợp những thông tin này lại với nhau. Thông tin khách hàng là nơi đầu tiên có thể bắt đầu và có thể vận dụng hệ thống CRM đơn giản để có thể lưu trữ chi tiết khách hàng của các doanh nghiệp  Hệ thống lưu trữ này cũng có thể là hệ thống tổng đài điện thoại để có thể tương tác hai chiều giữa doanh nghiệp và khách hàng.

– Tích hợp các nguồn dữ liệu và đóng gói thành một nguồn thông tin để sử dụng cho doanh nghiệp. Nếu doanh nghiệp còn chưa có khả năng đầu tư hệ thống CRM thì doanh nghiệp có thể cân nhắc lưu trữ dữ liệu trên đám mây và xác lập hệ thống quản lý. Nếu doanh nghiệp đã có khả năng đầu tư hệ thống CRM thì phải xác lập APIs để có thể đáp ứng cho từng nhóm khách hàng cụ thể theo từng tiến trình thực hiện công việc.

– Phân tích dữ liệu và hiểu dữ liệu. Khi đã tổng hợp toàn bộ các dữ liệu thì trên bảng điều khiển cần phải xây dựng cụ thể tiêu chí đánh giá dựa trên các thông số đã thu thập được ví dụ như thông tin cá nhân, thông tin mua hàng gần nhất, những thư từ đã trao đổi qua lại với khách hàng và người phụ trách khách hàng này. Trong quá khứ, lưu trữ được thực hiện riêng biệt thì nay được tích hợp, trở thành một vấn đề chung của doanh nghiệp. Ngay lúc này thì những vấn đề khó khăn có thể giải quyết trước khi những than phiền của khách hàng tăng lên.

– Tối ưu hóa việc dùng dữ liệu để nâng cao lợi ích cho doanh nghiệp. Việc tối ưu hóa dự liệu dựa trên quy trình công việc cụ thể. Từng giai đoạn của quy trình và thông tin của khách hàng đã được lưu trữ và cho dù ít khách hàng nhưng các thông tin và khó khăn sẽ được tiếp cận một cách rất nhanh chóng. Điều này giúp cho các SMEs tiên đoán được hành vi tiêu dùng của khách hàng nhằm nâng cao chất lượng dịch vụ và giải quyết những than phiền.

Nguyễn Văn Hiến – Huỳnh Đinh Thái Linh -Mạc Tư Khoa (*)


(*) Bà Huỳnh Đinh Thái Linh tốt nghiệp Thạc sỹ Quản trị Marketing & Strategic Service Management tại Bỉ và Hà Lan. Hiện bà là cố vấn cao cấp đổi mới sáng tạo cho nhiều doanh nghiệp SME tại Việt Nam đồng thời là quản lý chương trình Thạc sỹ Quản trị Kinh doanh Đại học Việt Đức. Bà hiện đang làm nghiên cứu sinh tại Đại học Bách Khoa TP. Hồ Chí Minh ngành Quản trị kinh doanh. Sắp tới đây bà sẽ là trưởng ban đại diện của Hinrinch Foundation tại Việt Nam.

Ông Nguyễn Văn Hiến tốt nghiệp Thạc sỹ Kinh tế chuyên ngành kinh tế lượng áp dụng, kinh tế hành vi tại đại học Quốc Gia Georgia (Georgia State) Hoa Kỳ. Ông đã và đang làm chuyên gia phân tích dữ liệu cho các startups, NGOs như Hinrich Foundation cũng như chính phủ Phần Lan.

Ông Mạc Tư Khoa tốt nghiệp hệ cử nhân tài năng Khoa Công nghệ thông tin, Đại học Khoa học tự nhiên TP. Hồ Chí Minh. Hiện đang theo học chương trình Thạc sĩ Khoa học máy tính tại Đại học Khoa học tự nhiên. Ông hiện là chuyên gia phần mềm và hệ thống cho các dự án lớn ở Việt Nam và Nhật Bản.