Big Data là gì?

Big Data là gì?

Từ Big Data dịch ra là “Dữ liệu lớn”, nghe đơn giản nhưng 2 từ “dữ liệu” và “lớn” bao hàm nhiều thứ trong đó. Đây là chuyên ngành mới nhưng phát triển rất nhanh trong thời gian gần đây.

Dữ liệu là gì?

Dữ liệu là những thông tin được lưu trữ lại trong các thiết bị lưu trữ. Như vậy sách báo tạp chí cũng là dữ liệu, tuy nhiên nó không áp dụng trong trường hợp này. Dữ liệu ở đây tức là các tập tin trên các thiết bị kỹ thuật số, được lưu trữ nhằm mục đích thu thập & trích xuất thông tin.

7c74Multimedia-Icons

Các loại dữ liệu kỹ thuật số gồm nhiều loại, nhưng trong ngầm hiểu ta hay nói tới dữ liệu được thu thập từ khách hàng, người sử dụng các dịch vụ mà cty chúng ta cung cấp. Từ dữ liệu đó chúng ta khám phá ra các điều mới mẻ như hành vi khách hàng, các yếu tố ảnh hưởng doanh thu,…

Dữ liệu được chia ra thành 2 loại chính:

  1. Dữ liệu có cấu trúc: dữ liệu được chia ra thành các bảng hoặc có nguyên tắc sắp xếp, trật tự rõ ràng. Dữ liệu loại này tương đối dễ phân tích & có nhiều tool hỗ trợ xử lý.
    Các loại database, file “siêu văn bản” (hyper text) như xml, html, json,… là các loại dữ liệu có cấu trúc.
  2. Dữ liệu không có cấu trúc: dữ liệu được thu thập rồi về lưu trữ không theo quy tắc nào, chủ yếu là các cty chưa thấy được lợi ích của dữ liệu nên không chi tiền để sắp xếp gọn gàng. Dữ liệu loại này đòi hỏi phải sắp xếp, sàng lọc trước khi phân tích.

Thế nào là “lớn”?

What_is_BigData

“Lớn” mang tính chất tương đối, vài Petabyte so với Google, Facebook quá nhỏ bé nhưng với các cty nhỏ và vừa thì khá là lớn. Do đó người ta ngầm định là từ 1TB trở lên là lớn. Sự tương đối đó lại khác biệt với loại dữ liệu, 1TB hình ảnh khác hoàn toàn 1TB database text/binary.

Sở dĩ Big Data được tách ra thành 1 chuyên ngành riêng mặc dù bản chất cũng là phân tích dữ liệu bởi vì nó đòi hỏi nhiều tài nguyên để phân tích hơn. Để phân tích cần những chuyên gia hiểu biết sâu về dữ liệu, cần phải có máy móc thiết bị mạnh, chuyên dụng để xử lý.

File Excel kế toán nếu nặng khoảng 1GB sẽ đòi hỏi máy tính có cấu hình mạnh. Nếu không sẽ crash chương trình Excel, nặng hơn là máy tính sẽ tự động khởi động lại.

Do đó các doanh nghiệp chỉ đơn thuần là thống kê, phân tích nhỏ mà chuyển qua ứng dụng Big Data đòi hỏi phải đầu tư về nhân lực cũng như thiết bị để có thể ứng dụng.

Những trường hợp ứng dụng được Big Data

Khi nói về công nghệ thì nhiều người hào hứng, thích thú bởi vì đó là cách đem lại tăng trưởng, lợi nhuận vừa nhiều vừa bền vững. Tuy nhiên công nghệ thì khá kén chọn, không phải ai cũng có thể ứng dụng Big Data lẫn sinh lợi nhiều từ Big Data. Tính không khéo thì ứng dụng công nghệ xong có khi lại lỗ hơn là không làm gì.

Các yếu tố để doanh nghiệp ứng dụng Big Data gồm:

  • Có dữ liệu sẵn và không làm gì
  • Dữ liệu thu thập đều đặn hàng ngày, hàng tuần
  • Dữ liệu phải có quy mô lớn, nếu không lớn thì chỉ là tính toán đơn thuần
  • Việc kinh doanh có tốc độ tăng trưởng chậm

Như vậy, cần phải tính toán cả mặt kỹ thuật lẫn kinh doanh. Nếu việc kinh doanh đang phát triển nhanh về quy mô, lợi nhuận thì chưa cần Big Data.

values-v-cost-1-e1543415034803

Trường hợp điển hình là siêu thị muốn tăng doanh thu bằng cách phân tích hành vi mua sắm dựa trên hóa đơn bán hàng. Số lượng hóa đơn hàng năm là rất lớn, từ dữ liệu đó phân tích được người dùng hay mua hàng hóa liên quan nhau ra sao. Kết hợp với thông tin cơ bản của khách hàng (khi làm thẻ thành viên) sẽ biết được hàng hóa tiêu thụ nhiều nhất đối với lứa tuổi, giới tính,… Từ đó sẽ có các chương trình khuyến mãi phù hợp, sắp xếp hàng hóa trên kệ, mua hàng dự trữ sẵn trước các đợt mua sắm lớn.

Ứng dụng Big Data trong trường hợp siêu thị kể trên là bài toán thành công dựa trên các cơ sở:

  • Dữ liệu nhiều
  • Ngân sách để phân tích, xử lý dữ liệu nằm trong khả năng
  • Dễ dàng ứng dụng kết quả sau khi phân tích

Các vấn đề của Big Data

  • Chi phí đầu tư lớn
  • Dữ liệu tăng liên tục và ngày càng đa dạng
  • Tỉ lệ thông tin có giá trị rất nhỏ so với tổng dung lượng

Kết luận

Việc ứng dụng công nghệ hay là Big Data đòi hỏi phải phù hợp với khả năng của doanh nghiệp lẫn công nghệ. Không nhiều doanh nghiệp ứng dụng công nghệ thành công bởi bài toán kinh doanh, làm được nhưng không có lợi nhuận. Thậm chí tính không khéo có thể lỗ do chi phí rủi ro & tốn công cho nhân viên làm quen.

Nên các doanh nghiệp muốn làm cần có sự hiểu biết nhất định hoặc dựa vào các cty tư vấn về công nghệ. Bởi vì bản chất công nghệ chỉ là tăng tốc phát triển, nếu không có công nghệ con người có thể làm tay.

Leave a Reply