Dữ liệu lớn... là gì?
时间:2025-03-24 08:36:04 出处:Thời sự阅读(143)
"Big data" thời gian gần đây ngày càng được nhắc đến nhiều hơn như một thành phần công nghệ thiết yếu của thành phố thông minh và cuộc cách mạng công nghiệp 4.0. Vậy big data có phải là một khái niệm quá phức tạp?ữliệulớnlàgìlịch thi đấu la liga tây ban nha
Về cơ bản big data đơn giản như tên gọi, là một tập hợp dữ liệu rất lớn và phức tạp đến nỗi những công cụ, ứng dụng xử lý dữ liệu truyền thống không thể nào đảm đương được. Vì khối dữ liệu quá lớn nên việc triển khai big data sẽ gặp những trở ngại bao gồm thu nhận dữ liệu, lưu trữ dữ liệu, tìm kiếm, chia sẻ, chuyển giao, cập nhật…
Tuy nhiên big data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công sẽ giúp rất nhiều cho việc nắm bắt xu thế trong kinh doanh, nghiên cứu khoa học, dự đoán để phòng tránh các dịch bệnh sắp phát sinh, phát hiện sớm tội phạm, hay đo lường điều kiện giao thông theo thời gian thực.
Từ năm 2001, chuyên gia của META Group (bây giờ đã sát nhập vào công ty nghiên cứu Gartner) đã nói rằng những trở ngại và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều là tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về kiểu dữ liệu (variety), trở thành mô hình tiêu chí "3V" cho big data.
Về sau bộ tiêu chí big data này được thêm các tiêu chuẩn ví dụ như độ tin cậy (veracity) bởi độ tin cậy dao dộng mạnh của dữ liệu thu nhận được sẽ ảnh hưởng quan trọng đến thông tin trích xuất.
Big data là gì?
![]() |
Như đã nói ở trên, big data là tập hợp dữ liệu lớn và phức tạp vượt mức đảm đương của những ứng dụng và công cụ truyền thống. Kích cỡ của Big Data đang từng ngày tăng lên, tính đến năm 2012 mỗi ngày có 2,5 exabyte dữ liệu được sinh ra (exabyte bằng 1 tỷ gigabyte), và đến năm 2025 IDC dự đoán số liệu này sẽ là 163 zettabyte (zettabyte bằng 1 nghìn exabyte)...
Ví dụ cho tiềm năng khối dữ liệu lớn có thể kể đến kính thiên văn Sloan Digital Sky Survey đặt tại New Mexico (Mỹ) bắt đầu đi vào hoạt động hồi năm 2000; sau một vài tuần thiết bị này đã thu thập dữ liệu lớn hơn tổng lượng dữ liệu mà ngành thiên văn học từng thu thập trong quá khứ, và sau 10 năm tổng dung lượng đã đạt đến hơn 140 terabyte (terabyte bằng 1 nghìn gigabyte).
Trong khi đó thống kê được công bố thời điểm cuối năm 2017 cho thấy Facebook đang có khoảng 2 tỷ người dùng thường xuyên và chỉ riêng ảnh cũng đã có khoảng 300 triệu bức được tải lên mỗi ngày. YouTube hay Google cũng phải lưu lại hết vô số các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên quan.
Nguồn dữ liệu cho big data tăng trưởng cực nhanh cũng một phần bởi sự gia tăng số lượng và giảm giá của các thiết bị cảm biến, thu nhận thông tin trong môi trường Internet vạn vật như điện thoại, camera, micro, chip bắt sóng…
上一篇: Nhận định, soi kèo Cyprus vs San Marino, 00h00 ngày 22/3: Khởi đầu suôn sẻ
下一篇: Nhận định, soi kèo Iraq vs Kuwait, 1h15 ngày 21/3: Kịch bản dễ đoán
猜你喜欢
- Nhận định, soi kèo Los Angeles II vs FC Arizona, 09h30 ngày 20/3: Khẳng định sức mạnh
- Tiền đạo Indonesia: "Chúng tôi không hề sợ hãi trước Nhật Bản"
- CĐV châu Á ca ngợi chiến thắng của tuyển futsal Việt Nam trước Australia
- Phó chủ tịch VFF Trần Anh Tú: "Bóng đá Việt Nam đang gặp nhiều trở ngại"
- Nhận định, soi kèo Monterey Bay vs Inter San Francisco, 09h00 ngày 20/3: Bắt nạt đội khách
- Man Utd thắng đậm Leicester, Van Nistelrooy rời vị trí "thuyền trưởng"
- Ruud Van Nistelrooy chia tay Man Utd
- Bóng chuyền nữ Việt Nam chiến thắng kịch tính trước đội bóng Hàn Quốc
- Soi kèo góc Hàn Quốc vs Oman, 18h00 ngày 20/3