一、课程简介
Huawei Certified ICT Expert-Big Data-Data Mining培训与认证具备通过华为云MRS平台以及开源技术平台进行大数据端到端建模,解决数据挖掘业务相关实际问题能力的专家华为认证三大体系

二、培训目标
完成该项目培训后,您将能够:
✔ 掌握常用的大数据挖掘流程(包括数据预处理、特征工程、建模、模型评估与优化)。
✔ 熟悉使用PySpark进行大数据挖掘的流程。
✔ 掌握数据湖的基本概念和数据入湖操作技能。
✔ 掌握数据治理方法论,以及华为数据治理中心DataArts Studio的特点。
三、适用人群
1. 希望成为大数据挖掘专家/工程师的人员
2. 希望获得HCIE-Big Data-Data Mining V3.0认证的人员
四、认证收益
掌握常用的大数据挖掘流程(包括数据预处理、特征工程、建模、模型评估与优化);熟悉使用PySpark进行大数据挖掘的流程;掌握数据湖的基本概念和数据入湖操作技能;掌握数据治理方法论,以及华为数据治理中心DataArts Studio的特点。
适合职位:大数据开发工程师、数据治理工程师、售前工程师等。
五、上课内容
上课周期 | 时间 | 课程模块 | 课程内容 | 重点项目案例 |
第1天 | 上午 | 数据挖掘介绍 | 数据挖掘概述 数据挖掘的流程 | 实战案例01:缺失值处理 实战案例02:异常值处理 实战案例03:特征缩放 实战案例04:数值离散化
|
下午 | 数据预处理与特征工程1 | |||
第2天 | 上午 | 数据预处理与特征工程 | 数据预处理与特征工程2 | 实战案例01:特征编码 实战案例02:偏态处理 实战案例03:特征选择 实战案例03:逻辑回归 |
下午 | 分类问题建模 | |||
第3天 | 上午 | 回归与分类问题建模2 | 分类问题建模 回归问题建模 | 实战案例01:决策树算法 实战案例02:支持向量机 实战案例03:线性回归 实战案例04:决策树回归 实战案例05:支持向量回归集成算法
|
下午 | 回归问题建模 | |||
第4天 | 上午 | 聚类与降维 | 回归问题建模 | 实战案例01:Kmeans 实战案例02:Kmedia 实战案例03:GMM 实战案例04:DBSCAN 实战案例05:OPTICS 实战案例06:谱聚类
|
下午 | 聚类算法 | |||
第5天 | 上午 | 关联分析与推荐问题建模 | 关联算法 | 实战案例01:Apriori算法 实战案例02:FP-growth算法 实战案例03:PrefixSpan算法 |
下午 | 推荐算法 | 实战案例01:基于项目推荐算法 实战案例02:基于用户推荐算法 实战案例03:基于内容推荐算法 | ||
第6天 | 上午 | 模型评估与优化 | 最优化模型 | |
下午 | 模型选择 | |||
第7天 | 上午 | Python数据挖掘案例 | 分类综合实验 | 实战案例01:数据挖掘综合实验1 |
下午 | 回归综合实验 | 实战案例01:数据挖掘综合实验2 | ||
第8天 | 上午 | Pyspark mlib | Pyspark mlib基础入门 | 实战案例01:统计分析 实战案例02:数据处理
|
下午 | Pyspark mlib实验 | 实战案例01:房价预测 实战案例02:客户流失预测 实战案例03:降维聚类 | ||
第9天 | 上午 | Pyspark mlib实验 | 实战案例01:购物篮数据分析 实战案例02:协同过滤 | |
下午 | 华为大数据治理 | |||
第10天 | 上午 | 综合大实验 | 综合大实验1 | 实战案例01:鱼的重量回归预测
|
下午 | 综合大实验2 | 实战案例01:森林覆盖类型分类预测 | ||
第11天 | 上午 | 综合大实验3 | 实战案例01:音乐流派聚类分析 实战案例02:在线零售数据关联分析 | |
下午 | 综合大实验4 | 实战案例01:书籍推荐协同过滤 实战案例02:广告推荐系统 | ||
一对一HCIE考前辅导 | ||||
六、认证信息
■ 认证模板

■ 考证信息
考试科目 | 考试代码 | 考试题型 | 考试时间 | 及格分/总成绩 | 考试地点 |
HCIA-Big Data笔试 | H13-731 | 单选、多选、判断、填空、拖拽题 | 90min | 600/1000 | VUE |
考试科目 | 考试代码 | 考试题型 | 考试时间 | 及格分/总成绩 | 考试地点 |
HCIA-Big Data实验 | H13-736 | 操作题、论述题 | 480min | 80/100 | VUE |