Khóa Đào tạo Trí tuệ nhân tạo – Thị giác máy tính

Thị giác máy tính (Computer Vision, hay CV) là lĩnh vực quan trọng của trí tuệ nhân tạo (AI) với nhiều ứng dụng thực tế có ảnh hưởng lớn đến cuộc sống hàng ngày như tìm kiếm ảnh, camera thông minh, giao thông thông minh, nhận dạng khuôn mặt, máy bay không người lái, xe tự hành… Khóa học này cung cấp cho người học những kiến thức và kỹ năng cơ bản về Thị giác máy tính bao gồm các khái niệm, mô hình, kỹ thuật cơ bản từ việc biểu diễn ảnh và trích rút các đặc trưng cấp thấp (low-level feature extraction) tới việc nhận dạng hình ảnh ở mức cao (high-level visual recognition).

  • Trang bị cho học viên kiến thức nền tảng về ánh sáng, không gian màu, biểu diễn và xử lý ảnh số.

  • Hiểu và vận dụng các kỹ thuật tăng cường chất lượng ảnh, phát hiện cạnh, đối sánh và phân vùng ảnh.

  • Làm quen với các phương pháp nhận dạng đối tượng, nhận dạng hành động, theo dõi chuyển động và ứng dụng trong thực tế (xe tự hành, giám sát thông minh, y tế, du lịch…).

  • Nắm được nguyên lý và thực hành với các mô hình học sâu trong thị giác máy tính như CNN, RNN, LSTM cùng các kiến trúc mạng hiện đại (AlexNet, VGG, ResNet, DenseNet…).

  • Phát triển khả năng xây dựng và triển khai ứng dụng thị giác máy tính giải quyết các bài toán trong giao thông, an ninh, công nghiệp và đời sống.

  • Lãnh đạo, quản lý doanh nghiệp và tổ chức muốn hiểu và định hướng chiến lược chuyển đổi số.

  • Nhân sự phụ trách chuyển đổi số, CNTT, đổi mới sáng tạo trong các doanh nghiệp/tổ chức.

  • Chuyên viên kỹ thuật, chuyên gia công nghệ cần cập nhật kiến thức về các công nghệ cốt lõi của CMCN 4.0 (AI, IoT, Big Data, Cloud, Robotics…).

  • Cá nhân quan tâm đến chuyển đổi số và xu hướng phát triển của CMCN 4.0 để áp dụng trong công việc và sự nghiệp.

Đã biết lập trình (biết Python là một lợi thế).

Nhập môn Xử lý ảnh và Thị giác máy tính

  • Ánh sáng, các không gian màu, cân bằng trắng; Thu nhận ảnh, biểu diễn ảnh, nén ảnh;
  • Ứng dụng: Tổng quan các ứng dụng của Xử lý ảnh và Thị giác máy tính.
  • Xử lý tăng cường chất lượng ảnh (Image Enhancement) Biểu đồ tần suất, Cân bằng biểu đồ tần suất; Lọc ảnh; Tích chập và tương quan chéo; Khử nhiễu, tăng cường chất lượng ảnh.
  • Ứng dụng: Khử nhiễu cộng, nhiễu nhân, nhiễu xung, nhiễu muối tiêu trong ảnh;
    Tăng cường chất lượng ảnh.

Phát hiện cạnh và biên ảnh

  • Đạo hàm ảnh, gradient, đạo hàm của hàm Gauss; Các bộ lọc phát hiện cạnh/biên ảnh; Phương pháp Canny; RANSAC
  • Ứng dụng: Phát hiện làn đường giao thông, vạch qua đường cho người đi bộ;
    Ứng dụng cho xe tự hành.

Đặc trưng ảnh và đối sánh ảnh (Local Features and Image Matching)

  • Phát hiện điểm quan tâm, DoG, phát hiện góc bằng Harris; Đặc trưng ảnh, đặc trưng cục bộ; SIFT, HOG; Đối sánh ảnh, RANSAC
  • Ứng dụng: Ảnh Panorama, Truy hồi/tìm kiếm cơ sở dữ liệu ảnh
    Ứng dụng hỗ trợ người du lịch tham quan các địa danh nổi tiếng.

Phát hiện đối tượng trong ảnh (Object Detection)

  • Phương pháp cửa sổ trượt; Kỹ thuật Boosting; Mô hình phân tầng cascade
  • Ứng dụng: Phát hiện ảnh mặt người; Phát hiện xe cộ, biển số xe;

Nhận dạng ảnh (Object Recognition)

  • Xây dựng hệ thống nhận dạng ảnh; Kỹ thuật láng giềng gần nhất; Mô hình túi từ (Bag of Words), đặc trưng SIFT, bộ phân lớp SVM
  • Ứng dụng: Nhận dạng, phân loại và đếm xe cộ giao thông, ứng dụng trong hệ thống camera giám sát thông minh

Phân vùng ảnh (Image Segmentation)

  • Các kỹ thuật phân vùng, phân theo ngưỡng, phân cụm, các kỹ thuật k-mean, mean-shift, phân theo tập mức, biến đổi khoảng cách, siêu điểm ảnh
  • Ứng dụng: Hiểu ngữ nghĩa khung ảnh ứng dụng cho bài toán xe tự hành, thiết bị bay không người lái; Phân vùng ảnh y tế.

Chuyển động và bám vết đối tượng (Motion and Tracking)

  • Các mô hình trừ nền, Optical flow, Lucas-Kanade method, Kalman Filter, KLT, Data Association
  • Ứng dụng: Phát hiện chuyển động, phát hiện và bám theo đối tượng, phát hiện đột nhập trong giám sát an ninh tòa nhà

Nhận dạng hành động (Activity Recognition)

  • Các kỹ thuật mô tả không – thời gian (Spatial-Temporal Descriptors), IDT, …
  • Ứng dụng: Phát hiện hành vi bất thường trong camera giám sát

Học sâu ứng dụng trong Thị giác máy tính (Deep learning in Computer Vision)

  • Các mô hình mạng nơ-ron; Giải thuật lan truyền ngược; Các mạng nơ-ron tích chập
  • Ứng dụng: Nhận dạng chữ viết tay; Phát hiện trạng thái cảm xúc mặt người (vui, buồn, mệt mỏi,…)

Các mạng học sâu cho nhận dạng ảnh tĩnh (DNNs in static images)

  • Các kiến trúc mạng tiên tiến điển hình: AlexNet, VGG, ResNet, DenseNet
  • Ứng dụng: Nhận dạng và phân loại phương tiện giao thông; Nhận dạng biển báo giao thông

Các mạng học sâu cho nhận dạng đối tượng trong video (DNNs in video sequences)

  • Các mô hình tiêu biểu: RNN, LSTM, C3D
  • Ứng dụng: Định danh người trong hệ thống giám sát thông minh sử dụng nhiều camera

Học viên vui lòng liên hệ với Tư vấn viên qua mục chat trên website hoặc gọi đến số 024 3771 0668 để được tư vấn chi tiết về lộ trình học tập và chi phí! 

Top khoá học

				
					
				
			

Đánh giá của đối tác & học viên

Các chuyên gia và sinh viên công nghệ tiềm năng bước ra từ iPMAC nói gì về khóa học?

Tìm kiếm khóa học

Nhận tư vấn

(024) 3771 0668

ĐĂNG KÝ HỌC