报告题目:What is the Next Trend of Big Data Systems Research?
报告人: Da Yan University of Alabama at Birmingham, Birmingham, AL
主持人: 王晓玲 教授
报告时间:2019年5月23日 周四10:00-11:00
报告地点:中北校区数学馆201
报告摘要:
大数据时代强调几个V,其中包括: volume (容量), velocity (速度) 以及 value (价值). 大数据计算系统的研究热潮已经持续有十几年了,并且在这波浪潮中也踊现了一批家喻户晓的系统,包括Hadoop, Spark, Pregel等。然而近年来大数据系统已经呈现创新不足的趋势,加之深度学习的突飞猛进导致业界向AI一面倒的趋势(volume/velocity -> value),面对大数据计算系统研究者的一个重要议题就是what‘s next for Big Data systems? 事实上,该领域已经从通用的模型例如MapReduce和Spark,向更细分化的系统领域拓展,比如Pregel和GraphLab这类的图计算系统,Storm和Flink这类流数据系统,Parameter Server和SystemML这类机器学习系统,以及TensorFlow和Pytorch这类深度学习系统。但是这类系统从根本上讲还是IO-bound为主的,导致目前主流的业界应用算法都是计算复杂很低的算法。本报告将从演讲者本人在图数据系统的研究方向出发,阐述该方向的研究现状以及出现的创新颓势,以及现有系统IO-bound的特性,并简要展望未来设计CPU-bound系统解决复杂度较高的大数据问题的动机以及巨大潜力。
报告人简介:
严达,阿拉巴马大学伯明翰分校计算机系助理教授。因他在大数据系统方向的贡献,于2015年度被授予香港青年科学家称号,是该奖项2015年在Physical/Mathematical Science方向的唯一获奖者。他的研究被同行广泛引用并给予很高的评价,例如他开发的Blogel系统在VLDB 2018的一篇图系统实验比较论文中被评价为overall winner。这些系统也被大家广泛使用,他们的工作目前已经发表在诸如SIGMOD, VLDB, ICDE等顶级会议上。他的论文发表在包括SIGMOD, PVLDB, SIGKDD, ICDE, WWW, TKDE, TPDS, ICPP, SoCC, EuroSys等顶级计算机会议和期刊上;他在Foundations and Trends in Databases上有一本涵盖图计算系统领域各个方面的书。担任过SIGMOD 2020,SIGMOD 2019, VLDB 2018, ICPP 2018, IJCAI 2017等会议的论文评委,TODS, VLDBJ, TKDE, TPDS等期刊的论文评委,ACM/IEEE TCBB和BMC Bioinformatics的客座主编,若干workshop的组织者(包括与SIGKDD一起开的BIOKDD 2018和BIOKDD 2019), 以及美国国家科学基金会(NSF)的项目评委。
中山北路3663号理科大楼 200062
沪ICP备05003394
Copyright 2019凤凰彩票平台-手机买彩票