Các khóa học / Khóa học Apache Spark và Xử lý dữ liệu tốc độ cao
Các khóa học / Khóa học Apache Spark và Xử lý dữ liệu tốc độ cao
Apache Spark là nền tảng xử lý dữ liệu phân tán thế hệ mới, được thiết kế để vượt trội hơn Hadoop MapReduce về tốc độ, dễ sử dụng và khả năng tích hợp học máy, streaming và SQL trong cùng một môi trường.
Khóa học này giúp học viên hiểu sâu kiến trúc Spark, thực hành xử lý dữ liệu lớn bằng RDD, DataFrame, Spark SQL và Spark Streaming, đồng thời triển khai các bài toán phân tích, ETL và real-time analytics trên môi trường thực tế (local hoặc cluster).
Sau khi hoàn thành khóa học, học viên sẽ có thể:
Khóa học dành cho:
Học viên nên có:
Module 1: Giới thiệu Apache Spark và kiến trúc hệ thống (4 giờ)
Nội dung:
Kết quả học tập:
Hiểu được cấu trúc và dòng dữ liệu (execution flow) trong Spark.
Module 2: Lập trình RDD – Resilient Distributed Dataset (8 giờ)
Nội dung:
Kết quả học tập:
Làm chủ RDD API, hiểu cách Spark quản lý dữ liệu và thực thi song song.
Module 3: DataFrame, Spark SQL và Data Processing Pipeline (10 giờ)
Nội dung:
Kết quả học tập:
Xây dựng pipeline xử lý dữ liệu lớn và phân tích dữ liệu bằng SQL trong Spark.
Module 4: Xử lý dữ liệu thời gian thực với Spark Streaming và Kafka (8 giờ)
Nội dung:
Kết quả học tập:
Làm chủ xử lý dữ liệu streaming trong Spark và hiểu cách xây dựng pipeline thời gian thực.
Module 5: Tối ưu hóa hiệu năng và quản lý cluster Spark (6 giờ)
Nội dung:
Kết quả học tập:
Biết cách tối ưu hiệu năng, giảm chi phí tài nguyên và cải thiện tốc độ xử lý.
Module 6: Mini Project – Phân tích dữ liệu giao dịch lớn với Spark (4 giờ)
Mục tiêu: Ứng dụng toàn bộ kiến thức đã học vào bài toán thực tế.
Bài toán ví dụ:
Phân tích dữ liệu giao dịch thương mại điện tử để xác định sản phẩm bán chạy, doanh thu theo thời gian, và phát hiện bất thường (anomaly).
Yêu cầu dự án:
Sản phẩm đầu ra:
6. Kết quả đầu ra khóa học
Sau khóa học, học viên có thể:
Bạn vui lòng liên hệ với Tư vấn viên qua mục chat trên website hoặc gọi đến số 024 3771 0668 để được tư vấn chi tiết về lộ trình học tập và chi phí!
(024) 3771 0668