【课程简介】
近年来,数据分析师的岗位需求非常大,80%的岗位技能需要掌握Python作为数据分析工具,Python既是一门编程语言,又是一款十分好用的数据处理、统计分析与挖掘的软件框架。Python具有简单,易学性的特点,通过对Python的学习,能够快速开发统计分析程序。Python拥有丰富强大的扩展库和成熟的框架等特性很好地满足了数据分析师的职业技能要求。
本课程以案例驱动的方式讲解如何利用Python完成数据获取、处理、数据分析及可视化方面常用的数据分析方法与技巧。每章节中都会引入Kaggle或工业项目数据集,通过这些实际案例让学员轻松掌握使用Python分析来自不同领域的数据,课程中的案例代码均会提供给学员自行实操,让学员掌握好Python统计分析与挖掘的技能。
【面向人群 】
1. BDA学员
2. 想了解和学习典型的数据分析流程和实践方法的学习者
3. 想接触和学习非结构化数据(比如:文本、图像等)分析的学习者
4. 想学习数据分析中常用建模知识的相关从业人员
5. 尚不会使用Python的数据分析师从业者
6. 从事数据分析师行业的学习者
7. 想使用Python实现机器学习的工程师
【学习收益 】
通过本课程的学习,学员将会收获:
1. 让学员掌握Python编程语言基础知识,熟悉Python的上机部署、编程,以及统计分析库的应用;
2. Python据分析的流程,包括Python数据采集、处理、分析、挖掘可视化等;
3. 掌握Python语言工具进行数据处理,统计分析,挖掘,可视化的应用实践,让学员有能力驾驭不同领域数据分析实践;
4. 掌握Python在非结构化数据的处理与分析中的应用,包括文本数据、时序数据、图像数据等,积累常见的互联网调查业务领域的数据分析项目经验;
5. 掌握使用Python实现基于机器学习的数据分析和预测;
6. 掌握数据分析中常用的建模知识,利用Python实现建模流程,并用于分析预测。
【学习方式】
集中面授+线上答疑方式,集中面授有讲师现场讲解内容,课后讲师安排时间线上答疑。
【课程大纲】
专题1(基础级): Python基础知识、编程环境准备及数据分析建模基础 (2课时)
1. 整个课程介绍
2. Python语言基础
3. Python 3.x新特性
4. 使用Python数值处理库NumPy和科学计算库SciPy进行数据计算
5. Python数据统计分析建模
6. Python数据挖掘与预测建模
7. 实战案例:讲师拟定项目案例讲解与讨论
专题2(基础级):Python数据采集与操作实验 (2课时)
1. 本地数据的采集与操作
a) 常用格式的本地数据读写
b) Python的数据库基本操作
2. 网络数据的获取与表示
a) BeautifulSoup解析网页
b) 爬虫框架Scrapy基础
3. Python回归分析
a) Python线性回归统计分析
b) Python逻辑Logistic回归统计分析
4. 实战案例:讲师拟定实验任务
专题3(进阶级): Python数据统计与分析工具Pandas应用 (2课时)
1. Pandas数据统计分析包介绍
2. Pandas的数据结构
3. Pandas的数据操作
a) 数据的导入、导出
b) 数据的过滤筛选
c) 索引及多重索引
4. Pandas数据处理和统计分析
a) 数据集的统计量描述
b) 数据的分组与聚合
c) 数据清洗、合并、转化和重构
5. Python聚类分析模型
a) K-Means K均值聚类分析
b) 模糊K均值分析
c) 两级K均值分析
6. 实战案例: 讲师拟定实验任务
专题4(进阶级): Python数据可视化 (1课时)
1. Python数据可视化基础
2. Python二维、三维制图技术应用
3. Python Matplotlib可视化库的绘图应用
4. Python Seaborn可视化库的绘图应用
5. Python 交互式数据可视化库Bokeh的绘图应用
6. 实战案例:讲师拟定实验任务
专题5(进阶级):Python时间序列数据分析 (1课时)
1. Python的日期和时间处理及操作
2. 利用Python
Pandas的时间序列数据处理及操作
3. 时间数据重采样
4. 时间序列数据统计 -- 滑动窗口
5. 时序模型 -- ARIMA
6. 实战案例:讲师拟定实验任务,典型的时序数据集如股票数据分析
专题6(高级): Python非结构化数据分析:文本数据分析 (2课时)
1. Python文本分析工具NLTK库的应用
2. Python分词与主题词提取
3. Python文本分类
a) 情感分析
b) 分类与预测模型 -- 朴素贝叶斯
4. 实战案例:讲师拟定实验任务,例如调查统计中的收集的评价数据的情感分析
专题7(高级):Python机器学习基础及机器学习库scikit-learn的应用 (2课时)
1. Python机器学习与建模基础
2. Python机器学习库scikit-learn的应用
3. Python Scikit-learn在调查统计中的分析应用部署
4. Python特征降维、主成分分析应用
5. Python决策树分析的应用
6. Python关联规则分析的应用
7. Python回归分析的应用
8. 实战案例: 讲师拟定实验任务,比如互联网数据集的分析
专题8:笔试模拟、上机操作(9课时)
1. 笔试模拟(3课时)
2. 上机操作(6课时)
3. 课程总结
【统计或数学基础】
有统计学基础
【计算机基础】
有计算机基础
【课时数量】
12个面授课时+9个上机课时
|