Khóa học cung cấp nền tảng thực hành cần thiết cho việc tham gia ngay lập tức và hiệu quả trong các dự án dữ liệu lớn và phân tích dữ liệu khác. Nó bao gồm sự giới thiệu về dữ liệu lớn và vòng đời Phân tích Dữ liệu để giải quyết thách thức kinh doanh sử dụng dữ liệu lớn. Khóa học cung cấp kiến thức cơ bản và nâng cao về các phương pháp phân tích và một sự giới thiệu về công nghệ và công cụ phân tích dữ liệu lớn, bao gồm MapReduce và Hadoop. Các bài thực hành cung cấp cơ hội cho sinh viên hiểu cách áp dụng những phương pháp và công cụ này vào các thách thức kinh doanh thực tế bởi một nhà khoa học dữ liệu đang thực hành. Khóa học tiếp cận theo hướng “Mở”, hoặc không chủ đạo công nghệ, và bao gồm một bài thực hành cuối cùng giải quyết một thách thức phân tích dữ liệu lớn bằng cách áp dụng các khái niệm được giảng dạy trong khóa học trong ngữ cảnh của Vòng đời Phân tích Dữ liệu. Khóa học chuẩn bị cho sinh viên thi chứng chỉ EMCDSA của Dell Technologies Proven Professional Data Scientist Associate
Mục tiêu của khóa học này là sau khi hoàn thành khóa học, người tham gia sẽ có khả năng:
- Tham gia và đóng góp ngay lập tức như một thành viên nhóm Khoa học Dữ liệu trong các dự án dữ liệu lớn và các dự án phân tích dữ liệu khác.
- Triển khai Vòng đời Phân tích Dữ liệu để giải quyết các dự án phân tích dữ liệu lớn.
- Định lại một thách thức kinh doanh thành một thách thức phân tích.
- Áp dụng các kỹ thuật và công cụ phân tích phù hợp để phân tích dữ liệu lớn, tạo ra các mô hình thống kê và xác định những thông tin có thể dẫn đến kết quả có thể thực hiện được.
- Lựa chọn các biểu đồ dữ liệu phù hợp để truyền thông rõ ràng các thông tin phân tích cho nhà tài trợ kinh doanh và khán giả phân tích.
- Sử dụng các công cụ như: R và RStudio, MapReduce/Hadoop, phân tích trong cơ sở dữ liệu, các chức năng Window và MADlib.
- Giải thích cách sử dụng phân tích nâng cao để tạo ra lợi thế cạnh tranh và cách vai trò và kỹ năng của nhà khoa học dữ liệu khác biệt so với nhà phân tích thông tin kinh doanh truyền thống.
Đối tượng của khóa học này bao gồm:
- Quản lý các nhóm chuyên gia thông tin kinh doanh, phân tích và dữ liệu lớn.
- Các nhà phân tích kinh doanh và dữ liệu hiện tại muốn thêm phân tích dữ liệu lớn vào kỹ năng của họ.
- Các chuyên gia dữ liệu và cơ sở dữ liệu muốn tận dụng kỹ năng phân tích của họ trong môi trường dữ liệu lớn.
- Sinh viên mới tốt nghiệp và sinh viên sau đại học có kinh nghiệm học thuật trong một ngành liên quan muốn chuyển sang lĩnh vực Khoa học Dữ liệu và dữ liệu lớn.
- Các cá nhân muốn tận dụng chứng chỉ EMCDSA của Dell Technologies Proven Professional Data Scientist Associate
Để hoàn thành khóa học này một cách thành công và đạt được lợi ích tối đa từ nó, một sinh viên cần có kiến thức và kỹ năng sau đây:
- Kiến thức vững về toán học định lượng với hiểu biết vững về thống kê cơ bản, như trong một khóa học cấp độ thống kê 101.
- Kinh nghiệm với ngôn ngữ kịch bản, như Java, Perl hoặc Python (hoặc R). Nhiều ví dụ thực hành trong khóa học sử dụng R (với giao diện RStudio), đó là một công cụ thống kê mã nguồn mở và ngôn ngữ lập trình.
- Kinh nghiệm với SQL (một số ví dụ trong khóa học sử dụng PSQL).
Phần nội dung của khóa học:
- Giới thiệu và Chương trình học
- Giới thiệu về Phân tích Dữ liệu Lớn
- Tổng quan về Dữ liệu Lớn
- Tình hình thực tế trong Phân tích
- Nhà khoa học dữ liệu
- Phân tích dữ liệu lớn trong các lĩnh vực ngành công nghiệp
- Vòng đời Phân tích Dữ liệu
- Khám phá
- Chuẩn bị dữ liệu
- Lập kế hoạch mô hình
- Xây dựng mô hình
- Truyền thông kết quả
- Vận hành
- Đánh giá các phương pháp phân tích dữ liệu cơ bản sử dụng R
- Sử dụng R để xem dữ liệu – Giới thiệu về R
- Phân tích và khám phá dữ liệu
- Thống kê cho việc xây dựng và đánh giá mô hình
- Phân tích nâng cao – Lý thuyết và Phương pháp
- Phân cụm K Means
- Quy tắc liên kết
- Hồi quy tuyến tính
- Hồi quy logistic
- Bộ phân loại Naïve Bayesian
- Cây quyết định
- Phân tích chuỗi thời gian
- Phân tích văn bản
- Phân tích nâng cao – Công nghệ và Công cụ
- Phân tích cho Dữ liệu không cấu trúc – MapReduce và Hadoop
- Hệ sinh thái Hadoop
- Phân tích trong cơ sở dữ liệu – Các khái niệm cơ bản của SQL
- SQL nâng cao và MADlib cho Phân tích trong cơ sở dữ liệu
- Cuộc chơi cuối cùng, hoặc Đặt tất cả vào một chỗ
- Vận hành một Dự án Phân tích
- Tạo sản phẩm cuối cùng
- Kỹ thuật Trực quan hóa Dữ liệu
- Bài thực hành cuối cùng về Phân tích Dữ liệu Lớn
Bạn vui lòng liên hệ với Tư vấn viên qua mục chat trên website hoặc gọi đến số 024 3771 0668 để được tư vấn chi tiết về lộ trình học tập và chi phí!