播放列表
零基础数据科学训练营
章节1介绍
课时1一个实际的例子:你将在本课程中学到什么
课时2这门课涵盖了哪些内容
章节2数据科学领域的不同准则
课时1数据科学和商业流行语:为什么会有这么多?
课时2Analysis和Analytics之间有什么区别
课时3商业分析,数据分析和数据科学:简介
课时4继续学习商业智能、机器学习与人工智能
课时5我们数据科学课程图表的分解
章节3将这些数据科学学科联系起来
课时1传统数据,大数据,商业智能,传统数据科学和机器学习的应用
章节4学习每门学科的收益
课时1这些学科背后的原因
章节5流行的数据科学技术
课时1使用传统数据的技术
课时2传统数据的真实案例
课时3使用大数据的技术
课时4大数据的真实案例
课时5商业智能(BI)技术
课时6商业智能(BI)的真实案例
课时7使用传统方法的技巧
课时8传统方法的真实案例
课时9机器学习(ML)技术
课时10机器学习的类型
课时11机器学习的真实案例(ML)
章节6流行的数据科学工具
课时1数据科学中使用的必要编程语言和软件
章节7数据科学的职业
课时1寻找工作——我们所期待的以及所寻找的
章节8澄清常见的误解
课时1澄清常见的误解
章节9概率
课时1课程介绍
课时2基本概率公式
课时3计算期望值
课时4频率
课时5事件及其补充
章节10组合
课时1组合基本原理
课时2排列及其使用
课时3简单的阶乘运算
课时4求解重复变分
课时5求解非重复变分
课时6求解组合
课时7组合对称性
课时8用独立样本空间求解组合
课时9现实生活中的组合——彩票
课时10组合学概述
课时112.11_压制版
章节11贝叶斯推理
课时1集合与事件
课时2集合相交的形式
课时3交集
课时4并集
课时5互斥集合
课时6相依集合与独立集合
课时7条件概率公式
课时8全概率法则
课时9加法定律
课时10乘法定律
课时11贝叶斯法则
课时12贝叶斯推断实例
章节12概率分布
课时1概率分布基本原理
课时2概率分布类型
课时3离散分布特点
课时4离散分布:均匀分布
课时5离散分布:伯努利分布
课时6离散分布:二项分布
课时7离散分布:泊松分布
课时8连续分布的特点
课时9连续分布:正态分布
课时10连续分布:标准正态分布
课时11连续分布:学生T分布
课时12连续分布:卡方分布
课时13连续分布:指数分布
课时14连续分布:逻辑斯谛分布
课时15概率分布实例
章节13概率在其他领域中的应用
课时1金融中的概率
课时2统计学中的概率
课时3数据科学中的概率
章节14统计
课时1人口和样本
章节15描述性统计
课时1新数据类型
课时2测量水平
课时3分类变量-可视化技术
课时4数字变量-频率分布表
课时5直方图
课时6交叉表和散点图
课时7平均、中位数、模式
课时8偏度
课时9方差
课时10标准差和变异系数
课时11协方差
课时12相关性
章节16描述性统计实例
课时1实例
章节17推论统计基础
课时1介绍
课时2什么是分布
课时3正态分布
课时4标准正态分布
课时5中心极限定理
课时6标准误差
课时7估计量和估计
章节18置信区间
课时1什么是置信区间
课时2已知总体方差,z-得分
课时3置信区间澄清
课时4学生t分布
课时5未知群体方差,t值
课时6误差幅度
课时7置信区间 两种方法 依赖样本
课时8置信区间 两种方法 独立样本(第1部分)
课时9置信区间 两种方法 独立样本(第2部分)
课时10置信区间 两种方法 独立样本(第3部分)
章节19推论统计实例
课时1实践
章节20假设检验
课时1空值与可选
课时2抑制区的水平及意义
课时3I型和II型误差
课时4测试平均值 已知总体方差
课时5P-值
课时6测试平均值 总体方差未知
课时7测试平均值 依赖样本
课时8测试平均值 独立样本(第1部分)
课时9测试平均值 独立样本(第2部分)
章节21假设检验实例
课时1假设检验
章节22Python介绍
课时15分钟介绍编程
课时2选择Python的原因
课时3选择Jupyter的原因
课时4安装Python和Jupyter
课时5Jupyter的界面介绍
课时6Jupyter中进行编程
课时7Python?2与Python?3的区别
章节23变量和数据类型
课时1变量
课时2数字和布尔值
课时3字符串
章节24基础Python语法
课时1算术运算符
课时2“==”的介绍
课时3重新分配变量
课时4编写注释
课时5续行符
课时6索引元素
课时7使用缩进构造代码
章节25其他Python运算符
课时1比较运算符
课时2逻辑和标识运算符
章节26条件语句
课时1if语句介绍
课时2else语句介绍
课时3esle?if?就是elif
课时4布尔值的介绍
章节27Python函数
课时1在Python中定义函数
课时2创建带有参数的函数
课时3另一种定义函数的方法
课时4在另一个函数中使用函数
课时5组合条件语句和函数
课时6创建包含少量参数的函数
课时7Python中值得注意的内置函数
章节28序列
课时1列表
课时2使用方法
课时3列表切片
课时4元组
课时5字典
章节29迭代
课时1循环
课时2循环与递增
课时3使用range()函数创建列表
课时4同时使用条件语句和循环
课时5所有的条件语句、函数和循环
课时6遍历字典
章节30前沿Python工具
课时1面向对象编程
课时2模块和包
课时3标准库
课时4导入模块
章节31高级统计方法
课时1回归分析概览
章节32使用StatsModels进行线性回归
课时1线性回归模型
课时2相关与回归
课时3线性回归模型的几何表示
课时4Python软件包安装
课时5Python中的第一个回归
课时6使用Seaborn画图
课时7理解回归表格
课时8变异性的分解
课时9什么是普通最小二乘法(OLS)?
课时10R方
章节33使用StatsModels进行多元线回归
课时1多重线性回归
课时2调整的R方
课时3模型显著性测试(F测试)
课时4OLS假设
课时5假设一:线性假设
课时6假设二:无内生性
课时7假设三:正态性和方差齐性
课时8假设四:无自相关性
课时9假设五:无多重共线性
课时10处理分类数据之虚拟变量
课时11用线性回归进行预测
章节34使用sklearn进行线性回归
课时1什么是sklearn,它与其他软件包有何区别?
课时2如何学习本节课
课时3使用sklearn进行简单线性分析
课时4使用sklearn进行简单线性分析之StatsModels汇总表
课时5使用sklearn进行简多元线性分析
课时6在sklearn中计算调整的R方
课时7特征选择(F回归)
课时8使用p值创建一个汇总表
课时9特征缩放(标准化)
课时10通过标准化权重选择特征
课时11利用标准系数预测
课时12低度拟合和过度拟合
课时13训练-测试拆分说明
章节35线性回归实例
课时1线性回归实例之一
课时2线性回归实例之二
课时3线性回归实例之三
课时4线性回归实例之四
课时5线性回归实例之五
章节36逻辑回归
课时1逻辑回归概览
课时2Python中的简单例子
课时3逻辑函数与效用函数
课时4建立逻辑分析
课时5一条宝贵的编码技巧
课时6理解逻辑回归表格
课时7几率到底是什么意思?
课时8逻辑回归中的二元预测因子
课时9计算模型的精度
课时10低度拟合与过度拟合
课时11测试模型
章节37聚类分析
课时1集群分析概览
课时2集群应用实例
课时3分类与集群的区别
课时4数学先决条件
章节38K均值聚类
课时1K均值聚类
课时2聚类的简单范例
课时3分类数据聚类
课时4如何选择聚类的数量
课时5K均值聚类的优缺点
课时6是否进行标准化
课时7聚类与回归的关系
课时8使用聚类分析进行市场细分(第一部分)
课时9使用聚类分析进行市场细分(第二部分)
课时10聚类的效用
章节39其他类型的聚类
课时1聚类类型
课时2系统树图
课时3热点图
章节40数学
课时1什么是矩阵
课时2标量与向量
课时3线性代数与几何
课时4Python中的数组——一种表示矩阵的简便方法
课时5什么是张量
课时6矩阵的加法和减法
课时7添加矩阵时的错误
课时8矩阵的转置
课时9点积
课时10矩阵的点积
课时11为什么线性代数很有用?
章节41深度学习
课时1导师介绍及机器学习概览
课时2课程内容简介
章节42神经网络概览
课时1神经网络概览
课时2训练模型
课时3机器学习类型
课时4线性模型
课时5多输入线性模型
课时6多输入多输出线性模型
课时7简单神经网络的图形表示
课时8什么是目标函数
课时9常用目标函数:二级范数损失
课时10常用目标函数:交叉熵损失函数
课时11优化算法:1参数梯度下降
课时12优化算法:n参数梯度下降
章节43创建环境
课时1创建环境
课时2为什么用Python和Jupyter
课时3安装Anaconda
课时4Jupyter展示板1
课时5Jupyter展示板2
课时6安装TensorFlow包
章节44如何使用Numpy从零开始构建神经网络
课时1概述
课时2生成数据
课时3初始化变量
课时4训练模型
章节45TensorFlow2.0概览
课时1安装TensorFlow
课时2TensorFlow大纲及其与其他程序库的对比
课时3TensorFlow 2.0简介
课时4在TensorFlow中编程的提示
课时5TensorFlow中的文件格式类型和数据处理
课时6使用TensorFlow2概述模型
课时7解释结果并提取权重和偏差
课时8自定义TensorFlow 2模型
章节46深度神经网络概览
课时1什么是层
课时2什么是深度网络
课时3真正理解神经网络
课时4我们为什么需要非线性
课时5激活函数
课时6激活函数:Softmax激活
课时7反向传播算法
课时8反向传播算法——直观理解
章节47过度拟合
课时1什么是过度拟合
课时2低度拟合和过度拟合分类
课时3什么是验证
课时4训练、验证和测试数据集
课时5N重交叉验证
课时6早停及何时停止训练
章节48初始化
课时1什么是初始化
课时2简单初始化类型
课时3最先进的方法——(Xavier)Glorot初始化
章节49挖掘梯度下降和学习率调整
课时1随机梯度下降
课时2梯度下降的问题
课时3动量
课时4如何选择最佳学习率
课时5学习率调整可视化
课时6自适应学习率调整(AdaGrad和RMSprop)
课时7自适应矩估计(Adam)
章节50预处理
课时1预处理概述
课时2基本预处理类型
课时3标准化
课时4预处理分类数据
课时5二进制和独热编码
章节51MNIST数据集分类
课时1MNIST数据集
课时2如何处理MNIST数据集
课时3MNIST:导入相关程序包与加载数据
课时4MNIST:预处理数据之创建验证并设置范围
课时5MNIST:预处理数据之洗牌与分批
课时6MNIST:概述模型
课时7MNIST:选择函数和优化器
课时8MNIST:学习
课时9MNIST:测试模型
章节52深度学习商业案例
课时1商业案例:研究数据集并识别预测因子
课时2商业案例:概述解决方案
课时3商业案例:平衡数据集
课时4商业案例:预处理数据
课时5商业案例:加载预处理数据
课时6商业案例:学习并解释结果
课时7商业案例:设置早停机制
课时8商业案例:测试模型
章节53深度学习结语
课时1学习总结
课时2机器学习后续
课时3卷积神经网络(CNN)概览
课时4循环神经网络(RNN)概览
课时5非神经网络方法概览