• 软件工程(自主模式)

    自主模式 计算机学科
    刘强
    • 刘强副教授清华大学软件学院
    • $可随时加入
    • g3.9万人
    • 7课件全部开放

    简介 本课程从软件生命周期的角度讲解软件工程的基本概念、基本原理和基本方法,内容涉及开发管理、需求建模、设计实现和测试维护等四大部分的相关基础知识,强调软件工程的根本性和永久性原则,诸如可测试性、软件体系结构、模块化和可复用性等,关注软件系统的复杂性问题以及迭代式的开发方法,重视分析问题与解决问题的能力以及软件工程实践训练,培养学生良好的工程化开发习惯。经过本课程的学习,学生能够掌握软件工程的基础知识,从工程学角度认识软件在大型复杂系统中的设计和应用,具备作为软件工程师从事软件开发所需的专业能力。 

    章节第1章 初识软件工程 第2章 编写高质量代码 第3章 单元测试 第4章 软件开发过程 第5章 团队开发管理 第6章 敏捷开发与配置管理 第7章 需求获取 第8章 用例建模 第9章 面向对象分析与设计 第10章 行为建模 第11章 软件系统设计 第12章 软件交互设计 第13章 软件系统测试 第14章 软件交付与维护 第15章 期末考试与总结

  • 大数据科学与应用系列讲座(自主模式)

    自主模式 计算机学科
    李军
    • 李军
    • $可随时加入
    • g3.9万人
    • 7课件全部开放

    简介本课程以一系列大数据讲座为主线,突出实战性,激发学生学习兴趣和动力,促进学生理论与实践相结合,启发学生技术创新。 注重结合应用实例融会贯通大数据中的理论方法和系统知识(平台、模块、工具),体会运用大数据技术解决实际问题的思路和效果。本课程兼顾信息类和非信息类学生。

    章节李国杰:面向大数据的数据科学 吴军:数据为王和机器智能的时代 余凯:百度大脑所思考的人机关系 第一部分测试题 吴甘沙:大数据的十个技术前沿 吴甘沙:大数据分析师的卓越之道 董飞:硅谷公司的大数据实战分析 第二部分测试题 艾小缤:大数据评价体系在金融、征信领域的创新 王迪:数字融合下的美国视频广告生态和产品应用创新 王新锐:金融大数据的法律实践 第三部分测试题 屈燕:大数据在社交媒体的应用 刘鹏:互联网变现与计算广告 毛波:阿里全息大数据构建与应用 第四部分测试题 韩定一:在线营销中的竞价机制与数据价值 龚笔宏:大数据在工业界中的经典案例分享 陈辉:数据驱动营销 第五部分测试题 时磊:大数据网络可视化 苏中:从大数据到认知计算 钟义信:“人工智能与大数据”的创新研究 第六部分测试题 课程评价

  • 大数据系统基础(自主模式)

    自主模式
    王建民
    • 王建民教授清华大学软件学院
    • $可随时加入
    • g3.1万人
    • 7课件全部开放

    简介通过本课程学习,了解大数据管理的工具平台、开发环境、基本原理,熟悉典型大数据工具与平台的特性,掌握大数据处理的基本开发方式。在介绍典型系统工具使用的基础上,通过分析其实现原理与设计理论,增强学生大数据工具与平台的应用与开发能力,同时也为有志于继续深入学习大数据专业课程的学生创造基础 。具体课程内容包括:绪论,云计算,文件存储,计算框架,内存计算,NoSQL,流数据处理等。 

    章节1. 绪论 2.云计算 3.文件存储 4. 处理框架 5.内存计算 6. NoSQL 7. 流计算 上课时实验所需平台

  • 微软亚洲研究院大数据系列讲座(自主模式)

    自主模式 计算机学科
    洪小文
    • 洪小文
    • $可随时加入
    • g3万人
    • 7课件全部开放

    简介 计算机科学正在前所未有的影响着我们的生活,它令我们的生活更加简单方便、更为丰富充实。依托于计算机科学的大数据研究,则完美的展现了数量、速度和多样性等概念,也越来越成为计算机学界普遍关注的领域。 2014年秋季,清华大学交叉信息研究院和微软亚洲研究院合作开设了《大数据基础与应用》研究生专业课。微软公司资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士等8名资深研究员和清华大学3位教授共同完成了18周的教学任务。 该联合课程自开设以来受到学术界的关注和好评,纷纷建议微软亚洲研究院将相关内容以在线课程的方式与更多的高校师生分享。有鉴于此,经过长达半年的精心准备,《微软亚洲研究院大数据讲座系列》在线课程终于与大家见面了,课程用英文讲解,配有英文字幕,共6讲,合计约9个小时。 *学习“微软亚洲研究院大数据系列讲座”在线课程,有机会获得参观微软亚洲研究院,与授课研究员面对面交流的机会。优秀学员更有机会成功申请微软亚洲研究院实习生计划。

    章节第一讲:大数据研究现状及未来趋势(洪小文) 第二讲:互联网搜索中的大数据研究(宋睿华) 第三讲:社会计算中的大数据研究(谢幸) 第四讲:城市计算中的大数据研究(上)(郑宇) 第四讲:城市计算中的大数据研究(下)(郑宇) 第五讲:软件分析中的大数据研究(张洪宇) 第六讲:大数据分析可视化研究(刘世霞)

  • 数据挖掘:理论与算法(自主模式)

    自主模式 计算机学科
    袁博
    • 袁博副研究员清华大学深圳研究生院
    • $可随时加入
    • g2.7万人
    • 7课件全部开放

    简介 本课程完整覆盖数据挖掘领域的各项核心技术,包括数据预处理、分类、聚类、回归、关联、推荐、集成学习、进化计算等。强调在知识的广度、深度和趣味性之间寻找最佳平衡点,在生动幽默中讲述数据挖掘的核心思想、关键技术以及一些在其它相关课程和教科书中少有涉及的重要知识点。本课程适合对大数据和数据科学感兴趣的各专业学生以及工程技术人员学习,不追求纯粹的理论推导,而是把理论与实践有机结合,让学生学到活的知识、有用的知识和真正属于自己的知识,特别是数据分析领域的研究方法和思维方式。

    章节走进数据科学:博大精深,美不胜收 数据预处理:抽丝剥茧,去伪存真 从贝叶斯到决策树:意料之外,情理之中 神经网络:巨量并行,智慧无限 支持向量机:数学之美,巅峰之作 聚类分析:物以类聚,人以群分 关联规则:营销购物,自有乾坤 推荐算法:察言观色,投其所好 集成学习:兼听则明,偏听则暗 进化计算:大道至简,万物之本 美丽数据说:阆苑仙葩,美玉无瑕 期末考试练习

  • 大数据平台核心技术(自主模式)

    自主模式 计算机学科
    武永卫
    • 武永卫教授清华大学计算机科学与技术系
    • $可随时加入
    • g2.4万人
    • 7课件全部开放

    简介面向信息科学技术类研究生或高年级本科生,主要由业界一线研发人员讲授大数据平台涉及到的分布式系统构架、分布式编程、分布式流处理、分布式数据存储管理、内存计算支持等内容,通过实践,力图覆盖大数据处理平台的主要核心技术,帮助学生了解分布式大数据平台设计中的关键挑战,提出实际的解决方案,为研究生未来研究方向提供参考。课程重点讲解设计原理,突出技术深度和实战性。【参考资料】李妹芳,《ODPS权威指南》。本书是学习和掌握ODPS的权威指南,作者来自阿里ODPS团队。全书共13章,主要内容包括:ODPS入门、整体架构、数据通道、MapReduce编程、SQL查询分析、安全,以及基于真实数据的各种场景分析实战。本书基于很多范例解析,通过在各种应用场景下的示例来说明如何通过ODPS完成各种需求,以期引导读者从零开始轻松掌握和使用ODPS。同时,本书不局限于示例分析,也致力于提供更多关于大数据处理的编程思想和经验分享。书中所有示例代码都可以在作者提供的网站上免费下载。这本书对平台架构介绍不多,偏应用方面,但对了解阿里的大数据平台能够做什么可能有些帮助。

    章节第一讲 大数据和ODPS 第二讲 分布式存储 第三讲 资源管理与任务调度 第四讲 分布式编程模型的设计与演化 实践1:通过两阶段提交协议完成数据上传 第五讲 离线分布式关系型计算 第六讲 全局数据管理与调度 实践2:编写MR完成Group By+Join操作 第七讲 流式计算的系统设计与实现 第八讲 内存计算 第九讲 大规模数据的分布式机器学习平台 实践3:实现MapReduce编程运行时库

  • 互联网大规模数据分析技术(自主模式)

    李琳
    • 李琳教授武汉理工大学计算机科学与与技术学院
    • $可随时加入
    • g8593人
    • 7课件全部开放

    简介 让我们看看互联网上一分钟发生了什么?全球IP网一分钟传送639TB,发送2亿封邮件,Facebook新增27.7万用户,发生六百万次访问,Google发生2百万次搜索查询,Flicker有2千万次访问照片,Twitter新增10万条信微博,Youtube上载30小时的视频,发生130万次观看,2015年的你要用5年时间才能看完在互联网上一秒中所传的视频。数据正以前所未有的速度在不断的增长和累积,大数据时代已经来到。 如何从数据中发现有趣的知识,并将其应用到具体的领域之中?数据分析与挖掘技术让你通过纷繁复杂的现象,看到背后隐藏的规律和模式,修炼一双在信息时代的慧眼。 《互联网大规模数据分析技术》这门课程从大数据的基础技术入手,首先介绍大数据处理平台Hadoop和Spark、非关系数据库NoSQL、MapReduce分布式并行编程模型等;然后重点讲解数据挖掘中的经典算法。接下来解剖信息检索和推荐系统两大Web主流应用的原理和模型,并通过例子加深对这些问题的理解。同时推荐Lucene和Mahout两个开源工具包,可以快速搭建属于自己的全文搜索引擎和商品推荐应用系统。最后给出了信息过滤系统的评价体系,便于从学术的角度对系统性能进行分析。

    章节第一章 大数据与数据挖掘概述 第二章 关联规则 第三章 分类算法 第四章 聚类算法 第五章 大数据平台与技术 第六章 信息检索 第七章 Web链接分析 第八章 推荐系统 自我提升练习

  • 数字信号分析理论与实践(自主模式)

    何岭松
    • 何岭松教授华中科技大学机械科学与工程学院
    • $可随时加入
    • g7503人
    • 7课件全部开放

    简介《数字信号分析理论与实践》是工科研究生的一门专业基础课,其内容包括计算机化测量仪器基本结构和工作原理,典型信号的数字生成算法,信号的波形分析、频谱分析、相关分析、幅值域分析和数字滤波方法,以及信号的时—频域谱阵分析和小波分析理论等。对工科研究生来说,凡是涉及到传感器测量、控制等的实验研究和设备开发等工作,都需要用到本课程的知识与技能。为便于学生更好的理解和掌握信号分析理论和锻炼学生的知识应用能力,课程采用基于项目的教学方法,用“数字信号发生器和简易电子琴”、“傅里叶变换和声音信号频谱分析仪”、“数字滤波器和音乐信号数字均衡器”等趣味项目将课程知识点串起来。同时,课程用MATLAB语言作为辅助学习工具,将学生的书面作业转变为MATLAB应用程序,要求学生用MATLAB语言自己编程实现课程知识点的应用;在学习信号分析理论的同时,锻炼学生的知识应用能力。学生可以用数学公式产生白噪声、正弦波等信号,并试听其效果;可以对采集到的声音信号进行傅里叶变换,显示出声音信号的波形和频谱;可以用数字滤波器对音乐信号进行处理,实现MP3播放器中均衡器的调音效果;可以用概率密度和分布曲线对图片进行处理,提高图片的清晰度。通过《数字信号分析理论与实践》课程学习,学生可以掌握常用的信号分析理论与MATLAB编程应用方法,并看到、听到信号分析理论在声音、图像等信号上的处理效果,使课程的信号分析理论学习“看的到、听的到、做的到”。

    章节课程导学 一 计算机化测量系统 二 信号函数与标准信号 三 信号的时域分析 四 信号的频谱分析 五 信号的时差域相关分析 六 信号的幅值域分析 七 信号的数字滤波技术 八 信号的时—频分析技术简介 项目5 计算机测控系统实践 课程内容回顾

  • 高级数据库系统(自主模式)

    自主模式 计算机学科
    杜金莲
    • 杜金莲副教授北京工业大学计算机学院
    • $可随时加入
    • g6752人
    • 7课件全部开放

    简介 “高级数据库技术”是计算机科学与技术专业研究生专业选修课,本课程的目的是向研究生介绍数据库管理系统(DBMS)在实现时采用的基础理论和基本技术,包括数据的组织与存储方法,数据的检索方法,数据的并发控制,数据库系统的恢复技术以及分布式数据库系统的相关技术。通过课堂教学与实践,让学生理解传统关系型数据库管理数据的技术本质,并培养其面对数据库领域的新发展而进行分析问题和解决问题的能力,从而为其进行数据库管理领域的深入研究、或从事数据领域的高级管理工作奠定基础。

    章节第一讲 数据文件的组织与索引技术 第二讲 查询处理及优化 第三讲 数据管理与恢复技术 第四讲 事务并发调度的相关概念 第五讲 基于封锁的并发控制机制 第六讲 并发控制的其它机制 第七讲 分布式数据库基本概念 第八讲 分布式数据库的设计 第九讲 分布式数据库查询机制 第十讲 分布式数据库的事务管理及恢复机制 高级数据库技术期末试题

  • 高级大数据系统

    随堂模式 计算机学科
    王智
    • 王智讲师清华大学深圳研究生院
    • $
    • g6274人
    • 7已更新至第9章

    简介高级大数据系统的实现、优化和应用,包括分布式文件系统、MapReduce/Spark、Storm/Spark streaming、Mahout等系统的原理、实现、策略优化。

    章节Introduction to Big Data Systems Basics of Linux Data Processing Distributed File System MapReduce In-memory Processing Streaming Data Processing NoSQL Graph Processing Machine Learning System