大数据分析(B)

随堂模式

  • 什么是随堂模式?

    随堂模式课程一般为每学期一轮次,课程每周更新,作业、考试有截止时间,由课程提供方老师、助教指导,课程完结,成绩由老师确认后,统一发放证书。

  • 什么是自主模式?

    自主模式课程常年开放加入,课件全部开放,作业、考试无截止时间,有学堂在线招募选拔的助教指导,考核通过即可自动获得证书。

来自于: 清华大学 | 分类: 计算机(670)

课程描述

本课程将从数据统计分析的数学基础、大数据智能分析与处理方法、大数据的分布式处理与并行计算以及大数据的多领域应用等不同层次,教授大数据分析与处理的基本方法、工具及应用。

什么是认证证书?
免费学习
认证学习
名师签名
实名认证
权威性
纸质证书
付费购买
免费赠送

课程简介

在互联网、政治经济、社会、公共卫生、金融、医疗健康、环境、海洋等等各个领域,都存在着PB量级的数据有待研究,且大数据分析的结果已经产生实际效应。本课程将从数据统计分析的数学基础、大数据智能分析与处理方法、大数据的分布式处理与并行计算以及大数据的多领域应用等不同层次,教授大数据分析与处理的基本方法、工具及应用。具体内容包括:(1)大数据分析与处理基础:数据科学发展情况;大数据的时代背景及其重要性;大数据分析与处理的典型应用。(2)数据统计分析的数学基础:数据统计知识回顾;多维数据分布;数据采样;主成份分析与因子分析;假设检验;线性相关与回归;非线性回归;方差分析;P-Value。(3)大数据的智能处理:时间序列分析;动态贝叶斯网络;矩阵分解理论;机器学习;大规模数据上的模型应用。(4)大数据的分布式处理与并行计算:HDFS与HBASE;Hadoop与Mapreduce,MapReduce并行计算;基于MapReduce的数据分析与智能处理方法的并行化。(5)大数据分析与处理前沿:社交媒体大数据分析与处理;城市交通大数据分析与处理;金融大数据分析与处理;医疗大数据分析与处理等。

展开

课程章节

授课教师

  • 朱文武 清华大学 计算机系 教授

    清华大学计算机系教授,国家“千人计划” 特聘教授、博士生导师、系副主任,国家特聘专家,国家973项目首席科学家。IEEE Fellow、SPIE Fellow、ACM Distinguished Scientist。现主要从事三元空间大数据计算、社会化多媒体计算、多媒体云计算、未来多媒体通信与网络等研究工作。曾5次获ACM及IEEE等国际最佳论文奖, 包括2012年ACM Multimedia(唯一)最佳论文奖, 2001年IEEE Transitions on Circuits and Systems for Video Technology (唯一)最佳论文奖。获2012年度国家自然科学二等奖(排名第2)。

  • 崔鹏 清华大学 计算机系 助理教授

    清华大学计算机系助理教授,主要从事多媒体内容分析,社会媒体挖掘以及大数据分析等领域研究工作,在SIGKDD, ACM MM,IEEE TKDE等国际顶级期刊与会议上发表论文50余篇,曾多次获得国际会议最佳论文奖。

精华笔记

精华笔记正在评选中,去看看全部笔记

常见问题

目前还没有常见问题哟!