• 大数据算法基础

    随堂模式 计算机学科
    赵颖
    • 赵颖副教授 清华大学计算机系
    • $
    • g1.4万人
    • V6小时/周

    简介本课程提出了“知算法、懂算法、遇到问题找算法”的建设目标,旨在培养研究生掌握大数据系统与大数据处理中的基础计算方法,提升用数学理论求解大数据实际问题的能力,为寻求大数据系统与相关应用领域中实际问题的最优求解方法建立基础。课程由大数据基本算法知识、高级大数据算法设计以及相关专题三部分组成。大数据基本算法知识讲述大数据算法概述、算法分析数据基础、概率分析基础、随机算法基础、抽样算法基础等;高级大数据算法设计包括图算法、流计算、链接分析等;相关专题包括多线程计算、近似算法等。

  • 大数据分析(B)

    随堂模式 计算机学科
    朱文武
    • 朱文武教授 清华大学计算机系
    • $
    • g1.3万人
    • V6小时/周

    简介在互联网、政治经济、社会、公共卫生、金融、医疗健康、环境、海洋等等各个领域,都存在着PB量级的数据有待研究,且大数据分析的结果已经产生实际效应。本课程将从数据统计分析的数学基础、大数据智能分析与处理方法、大数据的分布式处理与并行计算以及大数据的多领域应用等不同层次,教授大数据分析与处理的基本方法、工具及应用。具体内容包括:(1)大数据分析与处理基础:数据科学发展情况;大数据的时代背景及其重要性;大数据分析与处理的典型应用。(2)数据统计分析的数学基础:数据统计知识回顾;多维数据分布;数据采样;主成份分析与因子分析;假设检验;线性相关与回归;非线性回归;方差分析;P-Value。(3)大数据的智能处理:时间序列分析;动态贝叶斯网络;矩阵分解理论;机器学习;大规模数据上的模型应用。(4)大数据的分布式处理与并行计算:HDFS与HBASE;Hadoop与Mapreduce,MapReduce并行计算;基于MapReduce的数据分析与智能处理方法的并行化。(5)大数据分析与处理前沿:社交媒体大数据分析与处理;城市交通大数据分析与处理;金融大数据分析与处理;医疗大数据分析与处理等。

  • 大数据分析与内存计算

    随堂模式 计算机学科
    李国良
    • 李国良副教授 清华大学计算机系
    • $
    • g7213人
    • V10小时/周

    简介随着大数据时代的到来,数据分析、处理和挖掘面临了越来越大的挑战。传统的Hadoop技术已经不能满足大数据分析处理的需求,因为本课程主要讲解目前的主流技术-内存计算。课程内容主要包括:大数据内存分析工具spark、大数据流处理工具storm,图数据处理工具Pregel、Graphlab和GraphX,和大数据内存数据库SAP HANA等。

  • 网络存储技术

    随堂模式 计算机学科
    张广艳
    • 张广艳副教授 清华大学计算机系
    • $
    • g6823人
    • V5小时/周

    简介本课程以计算机存储系统在各个历史时期所面临的技术挑战为主线,讲解存储设备的基本工作原理,单机存储、网络存储、云存储等基本存储架构,以及数据布局、数据缓存、数据编码等基本方法,使学生在重温存储系统发展历程的过程中进行学习、领会,有助于同学深入理解大数据存储的体系结构和方法设计。同时,在各个教学环节中注意对学生正确科研方法的培养。在平时教学中注意介绍知识点的发现者当时的心路历程,提高学生分析问题、解决问题的能力,特别是培养学生的创新思维和创新能力。

  • 神经元动力学——单个神经元的计算神经科学(自主模式)

    Wulfram Gerstner
    • Wulfram Gerstner教授 洛桑联邦理工学院计算机科学学院和生命科学学院
    • $可随时加入
    • g3683人
    • 7课件全部开放

    简介 本课程是以单个神经元为模型,对理论神经学以及计算神经学领域进行入门讲解。神经元可对一系列短的电脉冲(尖峰电压)刺激进行编码。学生们将学会使用诸如微分方程,相平面分析,时间尺度分离以及随机动态过程等数学工具来理解神经元的动力学以及神经编码。 第一周:第一个简单的神经元模型 第二周:Hodgkin-Huxley模型与生物物理建模 第三周:二维模型(上)与相平面分析 第四周:二维模型(下)与树突 第五周:多元脉冲序列与神经编码 第六周:噪声模型,噪声神经元与编码 第七周:各神经元模型编码与解码的评估

    章节Week 1 Week 2 Week 3 Week 4 Week 5 Week 6 Week 7 Final Exam

  • 软件理论基础

    随堂模式 计算机学科
    罗贵明
    • 罗贵明教授 清华大学软件学院
    • $
    • g1320人
    • V3小时/周

    简介 本课程介绍形式语言、自动机、文法、可判定性问题及计算复杂性,内容包括:基础知识;确定性有限自动机、非确定性有限自动机;正则表示与语言;正则语言与正则文法;正则语言的性质、Pumping引理及应用;上下文无关文法与语言;下推自动机、确定性下推自动机;上下文无关语言的性质、上下文无关语言的Pumping 引理及应用;图灵机;不可判定问题、NP问题等。

    章节第一章 基础知识 第二章 确定有限自动机 第三章 非确定有限自动机 第四章 正则表示 第五章 正则文法和正则语言 第六章 正则语言的性质 第七章 DFA 的优化,Pumping 引理 第八章 上下文无关文法 第九章 CFG的二义性,CFG的应用 第十章 下推自动机 第十一章 确定下推自动机,CFG的范式 第十二章 上下文无关语言的性质 第十三章 图灵机 第十四章 图灵机的扩展 第十五章 不可判定性问题 第十六章 自动机的扩展及应用

  • 互联网创新与创业

    崔勇
    • 崔勇教授 清华大学计算机系
    • $
    • g14人
    • V3小时/周

    简介 随着互联网技术的高速发展,互联网产业已经成为影响人类日常生活的重要基础。技术创新和互联网思维不断冲击并颠覆着整个世界。本课程将从案例分析为主,帮助学生了解基于信息技术创新的创业思路,激发学生的创新创业热情,理解信息技术创新及商业模式创新的重要性。     课程教学环节包括五个部分:    (1)对互联网领域初创企业进行案例分析,了解信息技术创新的重要性以及实现其潜在社会价值的一般规律;    (2)对互联网领域的典型企业分析,了解新技术及新方向,理解企业经营理念以及信息技术创新趋势的重要性;    (3)分析阐述包括知识产权、用户需求等创业环境对技术创业的影响;    (4)讲述典型的科技创业投融资方式和初创企业的成长路线;    (5)商业计划书撰写能力培养。

    章节第一章 站在互联网门前 第二章 互联网入口 第三章 中国互联网大势 第四章 互联网+ 第五章 迈向未来 第六章 为目标用户做游戏