数据挖掘:理论与算法(自主模式)

自主模式

  • 什么是随堂模式?

    随堂模式课程一般为每学期一轮次,课程每周更新,作业、考试有截止时间,由课程提供方老师、助教指导,课程完结,成绩由老师确认后,统一发放证书。

  • 什么是自主模式?

    自主模式课程常年开放加入,课件全部开放,作业、考试无截止时间,有学堂在线招募选拔的助教指导,考核通过即可自动获得证书。

来自于: 清华大学 | 分类: 计算机(285)

课程描述

最有趣的理论+最有用的算法=不得不学的数据科学

什么是认证证书?
免费学习
认证学习
名师签名
实名认证
权威性
纸质证书
付费购买
免费赠送

课程简介

本课程完整覆盖数据挖掘领域的各项核心技术,包括数据预处理、分类、聚类、回归、关联、推荐、集成学习、进化计算等。强调在知识的广度、深度和趣味性之间寻找最佳平衡点,在生动幽默中讲述数据挖掘的核心思想、关键技术以及一些在其它相关课程和教科书中少有涉及的重要知识点。本课程适合对大数据和数据科学感兴趣的各专业学生以及工程技术人员学习,不追求纯粹的理论推导,而是把理论与实践有机结合,让学生学到活的知识、有用的知识和真正属于自己的知识,特别是数据分析领域的研究方法和思维方式。

展开

课程章节

走进数据科学:博大精深,美不胜收
整装待发
学而不思则罔
知行合一
从数据到知识
分类问题
聚类及其它数据挖掘问题
隐私保护与并行计算
迷雾重重
相关学习资源
数据预处理:抽丝剥茧,去伪存真
数据清洗
异常值与重复数据检测
类型转换与采样
数据描述与可视化
特征选择
主成分分析
线性判别分析
相关学习资源
从贝叶斯到决策树:意料之外,情理之中
贝叶斯奇幻之旅
朴素是一种美德
数据、规则与树
植树造林学问大
相关学习资源
神经网络:巨量并行,智慧无限
智慧之源神经元
会学习的神经元
从一个到一群
层次分明,责任到人
管中窥豹,抛砖引玉
相关学习资源
支持向量机:数学之美,巅峰之作
最大间隔
线性SVM
数学家的把戏
致敬真神
相关学习资源
聚类分析:物以类聚,人以群分
无监督学习
K-Means
期望最大法
密度与层次
相关学习资源
关联规则:营销购物,自有乾坤
项集与规则
支持度与置信度
误区
Apriori 算法
实例分析
序列模式
相关学习资源
推荐算法:察言观色,投其所好
无所不在的推荐
隐含语义分析
PageRank传奇
协同过滤
告诉你一个真实的推荐
集成学习:兼听则明,偏听则暗
民主协商:Ensemble
群策群议:Bagging
环环相扣:Boosting
集成之美:AdaBoost
继往开来:RegionBoost
相关学习资源
进化计算:大道至简,万物之本
人与自然
尽善尽美
走向进化
遗传算法初探
遗传算法进阶
遗传程序设计
万物皆进化
相关学习资源
美丽数据说:阆苑仙葩,美玉无瑕
数据之美
南国紫荆亦芬芳
期末考试练习
单选题
多选题

授课教师

  • 袁博清华大学 深圳研究生院 副研究员

    1998年毕业于南京理工大学获计算机软件学士学位,后赴澳大利亚昆士兰大学留学,于2002年及2006年分获计算机科学硕士和博士学位并被授予澳州政府奖学金。2006年至2007年在昆士兰大学从事智能计算方向研究。2007年7月回国任清华大学深圳研究生院信息学部讲师,2009年12月晋升副研究员,2013年6月获博士生导师资格,2015年1月入选深圳市海外高层次人才。 研究领域为数据挖掘、进化计算和GPU计算,发表论文七十篇,获国内发明专利四项。主持清华NVIDIA GPU教育中心,主讲研究生课程《数据挖掘:理论与算法》、《先进计算技术与应用》、《英文科技论文写作与学术报告》及《大数据科学与应用系列讲座》,曾三次位居清华大学研究生理论课教学评估前5%,荣获清华大学2014年度青年教师教学优秀奖、清华大学第七届青年教师教学大赛一等奖及2016年清华大学教育教学成果二等奖。

精华笔记

精华笔记正在评选中,去看看全部笔记

常见问题

为什么要学习数据挖掘?

数据是人类对客观世界感知的一种具体表现形式。随着信息技术的发展,数据变得无所不在,对数据进行加工和分析已经成为一项核心的技能。如果你喜欢信息技术,又不想做青春易逝的码农,那就当一名能够预测变化、洞察秋毫的数据分析工程师和未来的Chief Data Officer!如果你选择在其它专业领域发展,数据分析也会成为你事业的助推器和催化剂,至少帮助你更加理性地看待世间万物。总而言之,数据分析技术如同二十年前的互联网,正引领着新一轮的技术变革,影响着每一个人的生活。与其视而不见,不如勇于面对,和我一起发现数据之美!

理论与算法,听上去怕怕的......

数据挖掘博大精深,普通老师很容易让你丧失起码的兴趣甚至自信心。在我眼里数据是鲜活的,算法是有生命力的,我的乐趣就在于能够以最形象生动的方式展示强大的数据分析技术,举重若轻、收放自如。更为重要的,让我的每一位学生学有所得、学有所用、学以致用,让你们感到学习原来可以更美的!

相关的在线课程很多,为什么要跟你学?

我承认,在数据挖掘领域,学术水平比我高的中外学者如过江之鲫(当然我也不太差)。但是说到教书育人、传道授业解惑,请参考我的简介。本课程采用英文讲义(国际接轨)+中文讲解(本地化),一边开心学技术,一边轻松学英语,你赚大了! 群众甲:"明明是实力派,却偏要走偶像路线"。 观众乙:"高颜值、高智商、高教学水平"。 路人丙:"银河系的后裔"。

我需要准备什么?

带上一颗充满好奇心和求知欲的心灵!