《大数据系统基础》课程实践项目中期答辩顺利举行,清华持续探索大数据人才教育创新之路

简介:

2017年11月15日,清华大学大数据能力提升项目之《大数据系统基础》课程实践项目中期答辩在清华大学六号教学楼顺利举行。160余名同学分为21组,向任课老师和企业导师汇报了各组实践项目的进展情况,任课老师和企业导师根据同学们的汇报表现逐一进行了点评和指导。据悉,本次答辩项目来自于国家发改委、百度、国美等政府机构和知名大数据企业等。项目需求和数据涉及多个行业领域,如“建设工程造价指数”、“餐饮行业白皮书周报”、“基于语义分析的泛娱乐改编研究”等,学生们经过近2个月的实战锻炼,在今天给学校和企业交上了一份令人满意的答卷。

9026a75251e48e36ab91cbc130fc798a1d55c2c2

各小组代表答辩中

 

本次中期答辩主要从文献调研、需求沟通、数据获取及了解、技术路线、预期目标等多方面进行评估,形成任课老师、企业导师评价和学生互评相结合的机制。答辩由任课老师徐葳主持,10位企业导师、助教团队和现场160余位学生作为评委,参与提问和评分。针对学生在开展项目过程中遇到的困难,以及所选择的大数据工具是否恰当等问题,授课老师和企业导师给出了引导和建设性的意见。徐葳表示:“同学们都为此次答辩做了认真的准备,我非常高兴。对于做项目过程中尚未实现和有困难的部分,希望同学们找出问题所在,努力把它实现!”

数据科学研究院始终致力于突破传统的教学方式,在《大数据系统基础》课中引入来自业界的真实数据和项目正是成功探索之一。本课程将信息类和非信息类学科的同学组队,以团队的形式做项目,使得跨学科的学生在组内进行充分交流、互相学习、各自发挥专长。课程引入20多个丰富又真实的数据并让学生和用户进行交流,使学生在进入职场之前就有机会了解社会和企业对大数据技术解决问题的需求。其项目数量之多、社会力量支持力度之大,是全国乃至世界少见的教学模式探索,收效颇丰。

来自医学院的韩旭同学表示:“我所在的‘基于手机通讯录的欺诈检验’项目组,组内六位同学分别来自医学院、美术学院、软件学院和信息学院。这种院系跨度交叉的组合是同学们在之前的学习经历中从未体验过的,同学们表示来自不同学院和专业领域的组合打破了学科间的壁垒,在一起做项目锻炼了我们的沟通协作能力和团队凝聚力。” 来自工业工程系的王明哲同学说:“数据院为我们学生组织了这么多真实的项目,同学们都非常珍惜,因为这样的锻炼机会很难得,为数据院点赞!”

c664ef66b4dd3c667b58bd926beebb8bb87ee53c

企业导师和任课老师认证听取汇报

从之前的主动向企业要项目,到今年企业纷纷“毛遂自荐”甚至需要在开课伊始组织“企业答辩”,请企业导师向学生们介绍提供的项目来供学生挑选。这种转变折射出创新性大数据人才培养模式逐渐受到了企业的认可和支持。来自百度的企业导师表示:“学生能够非常积极有效地与我们沟通,针对我们多维度探究移动互联网下的用户形态的需求,同学们给出了自己解决问题的思路和技术方案,我们很期待最终同学们的研究报告。”

11a75a5a6fb193f83fe3416b1b7775f36ea49704

答辩现场

《大数据系统基础A/B》课程简介:

本门课程重点介绍大数据管理的工具平台、开发环境、基本原理。使得学生熟悉典型大数据工具与平台的特性,掌握大数据处理的基本开发方式,巩固和加深大数据分析的基础知识。本课程的主要内容包括:大数据软件栈、虚拟化、系统管理、数据清洗、数据存储、处理框架、内存计算、文档数据、NoSQL/NewSQL数据库、图数据、流数据、分析框架、数据分割、以及一致性。

本门课程主要希望通过对一系列与大数据相关的计算机系统知识的学习和动手实践,让学生理解大数据分析系统的软硬件架构,了解目前可用的工具和技术上存在的挑战。考虑到A班学生群体中有相当多的经管、社科及公共管理专业学生,A课程注重讲授大数据系统工具的概念、应用场景以及商业价值。B班学生群体以信息类专业学生为主,注重讲授大数据系统的原理、开发及实现。在介绍典型系统工具使用的基础上,通过分析其实现原理与设计理论,增强学生大数据平台与工具的应用与开发能力。培养学生在工作中应用与选择适合大数据工具的能力,同时也为有志于继续深入学习大数据专业课程的学生创造基础。


原文发布时间为:2017-11-16

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
9月前
|
存储 数据采集 搜索推荐
Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践(226)
本篇文章探讨了 Java 大数据在智慧文旅景区中的创新应用,重点分析了如何通过数据采集、情感分析与可视化等技术,挖掘游客情感需求,进而优化景区服务。文章结合实际案例,展示了 Java 在数据处理与智能推荐等方面的强大能力,为文旅行业的智慧化升级提供了可行路径。
Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践(226)
|
9月前
|
数据采集 SQL 搜索推荐
大数据之路:阿里巴巴大数据实践——OneData数据中台体系
OneData是阿里巴巴内部实现数据整合与管理的方法体系与工具,旨在解决指标混乱、数据孤岛等问题。通过规范定义、模型设计与工具平台三层架构,实现数据标准化与高效开发,提升数据质量与应用效率。
2950 0
大数据之路:阿里巴巴大数据实践——OneData数据中台体系
|
10月前
|
数据采集 存储 大数据
大数据之路:阿里巴巴大数据实践——日志采集与数据同步
本资料全面介绍大数据处理技术架构,涵盖数据采集、同步、计算与服务全流程。内容包括Web/App端日志采集方案、数据同步工具DataX与TimeTunnel、离线与实时数仓架构、OneData方法论及元数据管理等核心内容,适用于构建企业级数据平台体系。
1034 1
|
10月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
367 4
|
10月前
|
分布式计算 监控 大数据
大数据之路:阿里巴巴大数据实践——离线数据开发
该平台提供一站式大数据开发与治理服务,涵盖数据存储计算、任务调度、质量监控及安全管控。基于MaxCompute实现海量数据处理,结合D2与DataWorks进行任务开发与运维,通过SQLSCAN与DQC保障代码质量与数据准确性。任务调度系统支持定时、周期、手动运行等多种模式,确保高效稳定的数据生产流程。
463 0
大数据之路:阿里巴巴大数据实践——离线数据开发
|
10月前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
459 3
|
10月前
|
机器学习/深度学习 存储 分布式计算
ODPS驱动电商仓储革命:动态需求预测系统的落地实践
本方案基于ODPS构建“预测-仿真-决策”闭环系统,解决传统仓储中滞销积压与爆款缺货问题。通过动态特征工程、时空融合模型与库存仿真引擎,实现库存周转天数下降42%,缺货率下降65%,年损减少5000万以上,显著提升运营效率与GMV。
978 1
|
9月前
|
存储 SQL 分布式计算
大数据之路:阿里巴巴大数据实践——元数据与计算管理
本内容系统讲解了大数据体系中的元数据管理与计算优化。元数据部分涵盖技术、业务与管理元数据的分类及平台工具,并介绍血缘捕获、智能推荐与冷热分级等技术创新。元数据应用于数据标签、门户管理与建模分析。计算管理方面,深入探讨资源调度失衡、数据倾斜、小文件及长尾任务等问题,提出HBO与CBO优化策略及任务治理方案,全面提升资源利用率与任务执行效率。
692 0
|
7月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
497 7
|
10月前
|
JSON 分布式计算 大数据
springboot项目集成大数据第三方dolphinscheduler调度器
springboot项目集成大数据第三方dolphinscheduler调度器
690 3