Khóa học Chuyên gia Phân tích dữ liệu theo chương trình Cloudera Certified Data Analyst – CCDA

Chứng chỉ Cloudera Certified Data Analyst (CCDA) xác nhận kỹ năng truy vấn, phân tích trực quan hóa dữ liệu lớn sử dụng Apache Hive, Impala hệ sinh thái Cloudera Data Platform (CDP). 
Khóa học này giúp học viên thành thạo trong việc chuyển đổi dữ liệu lớn thành thông tin phân tích hữu ích. 

Mục tiêu khóa học:

  • Hiểu hệ sinh thái Cloudera CDP (HDFS, Hive, Impala, Hue). 
  • Viết và tối ưu truy vấn SQL trên dữ liệu lớn. 
  • Tích hợp Hive/Impala với công cụ BI. 
  • Chuẩn bị kỹ năng để thi chứng chỉ CCDA chính thức. 

Khóa học phù hợp với các đối tượng:

  • Nhà phân tích dữ liệu (Data Analyst) và kỹ sư dữ liệu (Data Engineer). 
  • Người dùng SQL muốn làm việc trên nền tảng Hadoop/Cloudera. 
  • Doanh nghiệp sử dụng Cloudera CDP để phân tích dữ liệu lớn. 

Học viên nên có:

  • Kỹ năng SQL trung cấp. 
  • Kiến thức cơ bản về Hadoop / HDFS. 
  • Kỹ năng Linux và sử dụng terminal. 

Module 1: Tổng quan về Cloudera và hệ sinh thái Hadoop 

  • Giới thiệu Cloudera Data Platform (CDP). 
  • Cấu trúc HDFS, YARN và vai trò trong hệ thống phân tán. 
  • Công cụ quản lý Hue, Impala, Hive. 
  • Quy trình phân tích dữ liệu trong CDP. 

Module 2: Làm việc với Hive và HiveQL cơ bản 

  • Kiến trúc Hive và vai trò của Metastore. 
  • Tạo cơ sở dữ liệu, bảng và phân vùng dữ liệu. 
  • Truy vấn cơ bản: SELECT, WHERE, JOIN, GROUP BY, ORDER BY. 
  • Lưu trữ dữ liệu dưới các định dạng ORC, Parquet, Avro. 

Module 3: Hive nâng cao và tối ưu truy vấn 

  • Bucketing, Partitioning và Indexing. 
  • Hiểu cơ chế thực thi truy vấn (Execution Plan). 
  • Tối ưu hiệu năng (cost-based optimizer, parallel execution). 
  • Thực hành: tối ưu pipeline phân tích dữ liệu lớn. 

Module 4: Phân tích dữ liệu với Impala 

  • Cấu trúc và hiệu năng của Impala so với Hive. 
  • Tạo bảng, chạy truy vấn song song với Impala Daemon. 
  • Impala Shell và tích hợp với Hue. 
  • Case Study: Phân tích dữ liệu bán hàng với Impala. 

Module 5: Tích hợp và trực quan hóa dữ liệu 

  • Kết nối Cloudera với công cụ BI: Tableau, Power BI. 
  • Hue Dashboard: tạo chart, report và filter dữ liệu. 
  • Quản lý quyền truy cập dữ liệu cho người dùng phân tích. 

Module 6: Dự án & Ôn thi chứng chỉ CCDA 

  • Phân tích dữ liệu khách hàng hoặc log web thực tế. 
  • Tổng kết: tối ưu truy vấn và báo cáo trong hệ thống lớn 

Bạn vui lòng liên hệ với Tư vấn viên qua mục chat trên website hoặc gọi đến số 024 3771 0668 để được tư vấn chi tiết về lộ trình học tập và chi phí! 

Top khoá học

				
					
				
			

Đánh giá của đối tác & học viên

Các chuyên gia và sinh viên công nghệ tiềm năng bước ra từ iPMAC nói gì về khóa học?

Tìm kiếm khóa học

Nhận tư vấn

(024) 3771 0668

ĐĂNG KÝ HỌC