Khoá ARCH-492: Architecting Cloudera Edge to AI

Designing Edge to AI Applications là một khoá học đề cập đến các chủ đề kiến trúc dữ liệu lớn tiên tiến để xây dựng Edge AI cho các ứng dụng bao gồm xử lý dữ liệu liên tục, xử lý dữ liệu vận hành, phân tích và học máy. Khi tham gia khoá học, học viên được phân chia vào một môi trường nhóm để thiết kế và kiến trúc các giải pháp cho một vấn đề được đặt ra. Ngoài ra, khoá học cũng đề cập đến các vấn đề kiến trúc dữ liệu lớn nói chung, và sau đó áp dụng chúng vào việc thiết kế một hệ thống phức tạp. 

Trong suốt khoá học, các thành viên tham gia áp dụng các khái niệm vào các ví dụ thực tế dẫn đến các cuộc thảo luận hợp tác chi tiết. Khoá học cũng tạo điều kiện cho các thành viên học được các kỹ thuật thiết kế hệ thống dữ liệu lớn, không chỉ từ kinh nghiệm của Cloudera mà còn từ kinh nghiệm của các thành viên tham gia khác. Cụ thể hơn, khoá học này đề cập đến các chủ đề kiến trúc dữ liệu lớn tiên tiến, bao gồm định dạng dữ liệu, biến đổi, giao dịch, xử lý thời gian thực, xử lý và học máy, khả năng mở rộng, độ tin cậy, bảo mật và sự riêng tư, giảm thiểu rủi ro của một kiến trúc không ổn định và lựa chọn công nghệ. 

Các thành viên tham gia chủ yếu là kiến trúc sư, trưởng nhóm phát triển, nhà phát triển dữ liệu lớn, kỹ sư dữ liệu, nhà phân tích cấp cao, quản trị viên dev ops và nhà phát triển học máy đang làm việc trên các ứng dụng dữ liệu lớn hoặc xử lý dữ liệu liên tục và quan tâm đến cách thiết kế và phát triển các ứng dụng như vậy trên CDP.  

Để học được nhiều nhất từ khoá học này, các học viên tham gia nên có kiến thức làm việc về các công nghệ dữ liệu lớn và xử lý dữ liệu liên tục phổ biến như HDFS, Spark, Kafka, Hive/Impala, định dạng dữ liệu, và hệ thống quản lý cơ sở dữ liệu quan hệ. 

Kiến thức chi tiết về API không cần thiết, vì không có hoạt động lập trình và thay vào đó khoá học sẽ tập trung vào thiết kế kiến trúc.

Module 1: Giới thiệu 

  • Hoạt động nhóm: Chia nhóm 

Module 2: Đánh giá Công nghệ 

  • HDFS 
  • HBase 
  • Kudu 
  • Map Reduce 
  • Spark, bao gồm SparkSQL và SparkML 
  • Hive 
  • Impala 
  • Hệ thống quản lý cơ sở dữ liệu quan hệ 
  • Spark streaming 
  • Apache Flume 
  • Apache NiFi 
  • Apache Kafka 

Module 3: Các trường hợp sử dụng ứng dụng  

  • Oz Metropolitan 
  • Câu hỏi kiến trúc 
  • Hoạt động nhóm: Xem xét trường hợp sử dụng và kiến trúc logic của Metroz 

Module 4: Lát cắt dọc ứng dụng 

  • Định nghĩa 
  • Tối thiểu hóa rủi ro của một kiến trúc không ổn định 
  • Chọn một lát cắt dọc 
  • Hoạt động nhóm: Lát cắt dọc của Metroz 

Module 5: Xử lý Ứng dụng 

  • Xử lý thời gian thực, xử lý gần thời gian thực 
  • Xử lý đợt 
  • Mẫu truy cập dữ liệu 
  • Đảm bảo giao nhận và xử lý 
  • Tính nhất quán dữ liệu và giao dịch ACID 
  • Garanty xử lý luồng 
  • Đường ống Học máy 
  • Hoạt động nhóm: Xử lý Metroz 

Module 6: Dữ liệu Ứng dụng 

  • Ba V lớn của dữ liệu 
  • Vòng đời dữ liệu 
  • Định dạng dữ liệu 
  • Chuyển đổi dữ liệu 
  • Hoạt động nhóm: Yêu cầu dữ liệu của Metroz 

Module 7: Các ứng dụng có khả năng mở rộng 

  • Mở rộng lên, mở rộng ra, mở rộng đến X 
  • Xác định xem một ứng dụng có thể mở rộng được không 
  • Bình chọn: thiết kế sân bay có khả năng mở rộng 
  • Sự mở rộng và xử lý song song của Spark 
  • Động cơ lưu trữ có khả năng mở rộng: HDFS, Ozone, Kafka và Kudu 
  • Hoạt động nhóm: Mở rộng Metroz 

Module 8: Hệ thống phân tán chịu lỗi 

  • Các nguyên tắc 
  • Tính minh bạch 
  • Độ dự phòng phần cứng so với phần mềm 
  • Chịu được thiên tai 
  • Tính chịu lỗi chức năng không có trạng thái 
  • Tính chịu lỗi có trạng thái 
  • Sao chép và nhất quán nhóm 
  • Ứng dụng chịu lỗi 
  • Hoạt động nhóm: Sự cố trong Metroz 

Module 9: Bảo mật và sự riêng tư 

  • Các nguyên tắc 
  • Kiến trúc bảo mật 
  • Kiến trúc bảo vệ Knox 
  • Kiến trúc bảo mật Ranger 
  • Thiết lập các chính sách bảo mật với Ranger 
  • Phân tích mối đe dọa 
  • Hoạt động nhóm: Bảo mật Metroz 

Module 10: Triển khai 

  • Kích thước và tiến triển cụm 
  • On-premise so với Cloud 
  • Tính kết nối 
  • Hoạt động nhóm: Triển khai Metroz 

Module 11: Kiến trúc phần mềm 

  • Tư liệu kiến trúc 
  • Hoạt động nhóm: Kiến trúc vật lý Metroz 

Module 12: Các giải pháp có khả năng trên CDP 

  • Xem xét các nền tảng dữ liệu lớn của Uber và Lyft 
  • Xem xét các kiến trúc giải pháp CDP của Metroz 

Module 13: Tổng kết 

Bạn vui lòng liên hệ với Tư vấn viên qua mục chat trên website hoặc gọi đến số 024 3771 0668 để được tư vấn chi tiết về lộ trình học tập và chi phí!

Top khoá học

				
					
				
			

Đánh giá của đối tác & học viên

Các chuyên gia và sinh viên công nghệ tiềm năng bước ra từ iPMAC nói gì về khóa học?

Tìm kiếm khóa học

Nhận tư vấn

(024) 3771 0668

ĐĂNG KÝ HỌC