大数据机器学习(2019春)

随堂模式

  • 什么是随堂模式?

    随堂模式课程一般为每学期一轮次,课程每周更新,作业、考试有截止时间,由课程提供方老师、助教指导,课程完结,成绩由老师确认后,统一发放证书。

  • 什么是自主模式?

    自主模式课程常年开放加入,课件全部开放,作业、考试无截止时间,有学堂在线招募选拔的助教指导,考核通过即可自动获得证书。

来自于: 清华大学 | 分类: 计算机(651)

课程描述

《大数据机器学习》课程是面向信息学科的高年级本科生或研究生开设的基础理论课,目的是培养学生深入理解大数据机器学习理论基础,牢固掌握大数据机器学习方法,并能够解决实际问题等综合能力。课程的主要内容包括:统计学习基本理论,机器学习基本方法,深度学习理论和方法。

什么是认证证书?
免费学习
认证学习
名师签名
实名认证
权威性
纸质证书
付费购买
免费赠送

课程简介

《大数据机器学习》课程是面向信息学科的高年级本科生或研究生开设的基础理论课,目的是培养学生深入理解大数据机器学习理论基础,牢固掌握大数据机器学习方法,并能够解决实际问题等综合能力。课程的主要内容包括:统计学习基本理论,机器学习基本方法,深度学习理论和方法。

展开

课程章节

第一章 概述
1.机器学习定义和典型应用
2.机器学习和人工智能的关系
3.深度学习方法和其它人工智能方法的共性和差异
4.机器学习和数据挖掘的关系
5.机器学习和统计学习的关系
6.机器学习的发展历程
7.大数据机器学习的主要特点
第二章 机器学习基本概念
1机器学习的基本术语
2.监督学习
3.假设空间
4.学习方法三要素
5.奥卡姆剃刀定理
6.没有免费的午餐定理
7.训练误差和测试误差
8.过拟合与模型选择
9.泛化能力
10.生成模型和判别模型
第三章 模型性能评估
1.留出法
2.交叉验证法
3.自助法
4.性能度量
5.PR曲线
6.ROC和AUC曲线
7.代价敏感错误率
8.假设检验
9.T检验
10.偏差和方差
第四章 感知机
1.感知机模型
2.感知机学习策略
3.感知机学习算法
第五章 聚类
1.原型聚类描述
2.性能度量
3.1原型聚类 k均值算法
3.2 原型聚类 学习向量算法
3.3 原型聚类 密度聚类
3.4原型聚类 层次聚类
第六章 贝叶斯分类器及图模型
1.综述
2.概率图模型
3.贝叶斯网络
4.朴素贝叶斯分类器
5.半朴素贝叶斯分类器
6.贝叶斯网络结构学习推断
7.吉布斯采样
第七章 决策树和随机森林
开头
1.决策树模型与学习基本概念
2.信息量和熵
3.决策树的生成
4.决策树的减枝
5.CART算法
6.随机森林
第八章 逻辑斯谛回归与最大熵模型
简介
1.逻辑斯谛回归模型
2.最大熵模型
3.模型学习的最优化方法
第九章 SVM
1.开头
2.SVM简介
3.线性可分支持向量机
4. 凸优化问题的基本概念
5.支持向量的确切定义
6.线性支持向量机
第十章 核方法与非线性SVM
开头
1.泛函基础知识
2. 核函数和非线性支持向量机
3. 序列最小最优化算法
第十一章 降维与度量学习
开头
1. k近邻学习
2. 降维嵌入
3. 主成分分析
4. 核化线性降维
5. 流型学习和度量学习
第十二章 提升方法
1. 提升方法Adaboost算法
2. Adaboost算法的训练误差分析
3. Adaboost算法的解释
4. Adaboost的实现
第十三章 EM算法及混合高斯模型
开头
1. 问题提出
2. EM算法的引入
3. EM算法的收敛性
4. EM算法在高斯混合模型学习中的应用
5. EM算法的推广
第十四章 计算学习理论
开头
1. 计算学习理论的基础知识
2. 概率近似正确学习理论
3. 有限假设空间
4. VC维
5. 学习稳定性
第十五章 隐马尔可夫模型
开头
1. 隐马尔科夫模型的基本概念
2. 概率计算算法
3. 学习算法
4预测算法
第十六章 条件随机场
开头
1.概率无向图模型
2.条件随机场的定义与形式
3.条件随机场的计算问题
4.条件随机场的学习算法
5.条件随机场的预测算法
第十七章 概率图模型的学习与推断
开头
1.精确推断法:变量消去法和信念传播法
2.近似推断法:MCMC和变分推断
第十八章 神经网络和深度学习
1.神经网络的发展历程
2.神经网络的基本概念以及常见的神经网络(一)
3.神经网络的基本概念以及常见的神经网络(二)
4.玻尔兹曼机
5.深度学习
第十九章 深度学习正则化方法
1. 深度学习简介和架构设计
2. 计算图形式的反向传播算法
3.深度学习的正则化方法(一)
4.深度学习的正则化方法(二)
第二十章 深度学习优化方法
1.深度学习的优化问题
2.神经网络优化的挑战
3.神经网络的优化算法
4.相关策略

授课教师

  • 袁春 清华大学 计算机系 副研究员

    清华大学博士生导师,副研究员,清华大学-香港中文大学媒体科学、技术与系统联合研究中心常委副主任,清华大学深圳研究生院计算机应用技术实验室主任,中国计算机协会高级会员,多媒体专委会委员。长期从事机器学习,计算机视觉,多媒体技术等方面的研究。承担清华大学深圳研究生院的大数据方向的研究生重点课程:“大数据机器学习”,“大数据分析”,以及“计算机视觉”的授课。

精华笔记

精华笔记正在评选中,去看看全部笔记

常见问题

目前还没有常见问题哟!