GCPBD - Cơ bản về Big Data và Machine Learning trên Google Cloud Platform
1 ngày
Khóa học 1 ngày này cung cấp tổng quan về năng lực big data & machine learning của GCP. Thông qua bài giảng, demo và lab thực hành, học viên sẽ nắm tổng quan GCP & chi tiết các khả năng xử lý dữ liệu & ML.
Sau khi hoàn thành, học viên sẽ có thể:
- Nhận biết mục đích & giá trị của các sản phẩm Big Data & ML chính trong GCP
- Sử dụng Cloud SQL, Dataproc để di chuyển workload MySQL, Hadoop/Pig/Spark/Hive lên GCP
- Sử dụng BigQuery & Datalab phân tích dữ liệu
- Huấn luyện & dùng neural network với TensorFlow
- Sử dụng các ML APIs
- Lựa chọn giữa các dịch vụ xử lý dữ liệu trên GCP
- Data Analysts, Data Scientists, Business Analysts mới bắt đầu với GCP
- Người thiết kế pipeline, mô hình ML/statistics, truy vấn & trực quan hoá dữ liệu
- Lãnh đạo, IT decision-makers đánh giá GCP cho phân tích dữ liệu & ML
- Thành thạo SQL cơ bản
- Hiểu data modeling, ETL
- Lập trình Python
- Quen thuộc ML/statistics
Sau khi hoàn tất khóa học, học viên sẽ được cấp chứng nhận hoàn tất khóa học theo quy định của Cecomtech.
Module 1: Giới thiệu GCP
- GCP Console, tổng quan Big Data products
Module 2: Compute & Storage
- Compute Engine, Cloud Storage, CloudShell
- Lab: Ingest-Transform-Publish pipeline
Module 3: Data Analytics
- Cloud SQL, Spark on Dataproc
- Lab: Machine Learning Recommendations with Spark
Module 4: Scaling Data Analysis
- Datalab, BigQuery
- Lab: Build ML dataset
Module 5: Machine Learning
- TensorFlow, ML APIs
- Lab: ML với TensorFlow, ML APIs
Module 6: Data Processing Architecture
- Pub/Sub, Dataflow pipelines, batch & real-time architecture
Module 7: Tổng kết
- Vì sao chọn GCP, bước tiếp theo, tài nguyên học thêm
