Chào các bạn, có nhiều bạn đang muốn tìm hiểu về Big Data nhưng những tài liệu trên mạng nó nặng về học thuật quá. Mình làm video này giải thích về Big Data theo cách đơn giản nhất để những bạn nào không phải dân IT cũng có thể hiểu được.

Fanpage:

Chúc mọi người xem video vui vẻ.

Credits:
Sunshine (version 2) by Kevin MacLeod được under license Creative Commons Attribution (
Source:
Artist: Kevin MacLeod (

#bigdata #dataengineer #bigdatalagi

Nguồn: https://maturegamerpodcast.com/

Xem thêm bài viết khác: https://maturegamerpodcast.com/category/thong-tin-va-truyen-thong

admin

18 thoughts on “Giải thích Big Data theo ngôn ngữ loài người bởi Senior Data Engineer”

  1. cho mình hỏi OLTP có thể dùng big data được không ạ? Vì bạn có đề cập Big Data dùng để lưu dũ liệu để phân tích.

  2. anh ơi. Em dân kinh tế. Giờ muốn làm Data Eng thì phải bắt đầu học từ đâu ạ. Mong anh rep 😀

  3. Bạn có thể giải thích cho mình chính xác cái gọi là "in-memory" processing được không, in-memory processing của Spark so với MapReduce thuần. Mình thấy khái niệm này khá được nói rất nhiều nhưng thực sự lại rất mơ hồ.

    Mình có giải thích khái niệm này của riêng mình nhưng mình muốn biết bên ngoài người ta hiểu cái này chính xác là như thế nào. Team data của mình khá đóng cửa với thế giới bên ngoài do nhiều điều kiện khác nhau nên mình rất muốn giao lưu thêm với bên ngoài để tăng cường hiểu biết. Mà ko biết tìm ở đâu.

    À mà chỗ giải thích về HDFS ấy, mình nghe trong video "sau đó kết quả được trả về master" thì cái mà mình hiểu là "data được lưu trữ phân tán ra node, khi có request thì data phải 'COLLECT' VỀ MASTER rồi mới về requester". Điều này có đúng ko nhỉ? Mình thì mình nghĩ master nó chỉ route đến node chứa data thôi rồi đọc trực tiếp từ máy con chứ ko collect lên master đâu, thắt cổ chai ở master vậy thì còn gì là distributed system nữa.

  4. Cho mình hỏi công ty bạn nói trong video bảo đã trở thành Unicorn là công ty làm về mảng gì thế?

  5. Cảm ơn anh, video CỰC KỲ dễ hiểu ạ, Hồi xưa đọc mấy cái trên mạng toàn nói gì đâu đâu @@

  6. E cũng từng learn để build hệ thống như a nói khi thực tập backend cho e-company kia, đúng là giống hệt tất cả <3

  7. Anh cho em hỏi giữa spark và sqoop nên chọn cái nào ạ. EM đang test sqoop đẩy 500m file csv từ datalake sang warehouse mà mất tận 5 6 phút chưa biết tối ưu ở đâu ạ. A giúp em vói. Anh có thể chia sể ít tài liệu về vấn đề này được không ạ

Leave a Reply

Your email address will not be published. Required fields are marked *