Ktl-icon-tai-lieu

Big DATa

Được đăng lên bởi Hòa
Số trang: 14 trang   |   Lượt xem: 1076 lần   |   Lượt tải: 5 lần
Mục lục

1. TỔNG QUAN
1.1 Khái niệm
Thuật ngữ Big Data chỉ những tập hợp dữ liệu phát triển nhanh chóng và rộng
khắp dưới nhiều hình thức khác nhau, làm cho chúng vượt quá khả năng xử lý của
những hệ thống cơ sở dữ liệu truyền thống.
1

Kích cỡ của Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có
thể nằm trong khoảng vài chục terabyte cho đến nhiều petabyte chỉ cho một tập
hợp dữ liệu mà thôi.
Dữ liệu mà Big Data lưu trữ có thể có cấu trúc, phi cấu trúc hoặc dữ liệu bán cấu
trúc (80% dữ liệu trên thế giới ở dạng phi cấu trúc). Mảng dữ liệu có cấu trúc của
Big Data là nói tới một số mảng cố định trong cơ sở dữ liệu.
Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành
công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các
dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo
thời gian thực. Chính vì thế, những dữ liệu này phải được thu thập, tổ chức, lưu
trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường.
Ví dụ: Trong các gian hàng của lĩnh vực thương mại điện tử thì dữ liệu có cấu
trúc đó có thể là dữ liệu khách hàng – địa chỉ, mã bưu chính – được lưu giữ trong
các giỏ hàng. Các dữ liệu không có cấu trúc bao gồm có email, video , các đoạn
tweet hay lượt Like trên Facebook. Không có một cơ sở dữ liệu không có cấu trúc
nào lại nằm trong cơ sở dữ liệu cố định mà người bán có thể dễ dàng truy cập và
tổng hợp.

1.2 Đặc điểm của Big Data
Vào năm 2001, nhà phân tích Doug Laney của hãng META Group ( bây giờ
chính là công ty nghiên cứu Gartner) đã nói rằng những thách thức và cơ hội nằm
trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: Tăng về lượng
(Volume), tăng về vận tốc (Velocity) và tăng về chủng loại (Variety). Giờ đây,
Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông
tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Big Data.
Đến năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn
phải “cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào
sự vật,sự việc và tối ưu hóa các quy trình làm việc”. Khi nói tới một tập dữ liệu lớn,
theo định nghĩa của Oracle về Big Data thì đặc điểm thứ 4 là Value và nhấn mạnh
rằng đây là đặc điểm quan trọng nhất trong dữ liệu lớn. Đặc điểm này nói đến giá trị
thực về thông tin, kiến thức nhận được sau quá trình phân tích tập dữ liệu lớn.
2

Năm 2014, Big Data được định nghĩa theo mô hình 5V. Có thêm tính chất mới là
Veracity...
Mục lục
1. TỔNG QUAN
1.1 Khái niệm
Thuật ngữ Big Data chỉ những tập hợp dữ liệu phát triển nhanh chóng rộng
khắp dưới nhiều hình thức khác nhau, làm cho chúng vượt quá khả năng xử lý của
những hệ thống cơ sở dữ liệu truyền thống.
Big DATa - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Big DATa - Người đăng: Hòa
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
14 Vietnamese
Big DATa 9 10 53