会议主席

章文嵩

滴滴出行高级副总裁,兼任滴滴技术委员会主席。同时章文嵩也是CCF TF技术前线委员会主席,LVS开源项目创始人。曾任阿里副总裁和阿里云CTO。

会议执行主席

来炜

来炜,滴滴出行运维总监。2015年加入滴滴,担任运维总监。国内最流行的开源企业级监控系统Open-Falcon的创始人和社区负责人。2008年毕业于中国科大,曾任职百度运维部和小米。

特邀讲者

姚睿尧

主题报告一:百度智能运维实践之异常检测

主题简介:在百度设计和实现智能监控系统,面临着巨大挑战:业务种类、特性繁多,流量、收入规模大、影响面广,稳定性、时效性要求高。本报告基于监控系统中的一个重要特性——异常检测介绍百度如何准确、高效地进行10亿级的运维时序数据分析:

1、异常检测的算法介绍和百度的调优实践;

2、大规模时序数据的采集-存储-计算架构。

个人简介:姚睿尧,百度高级研发工程师,2015年硕士毕业于北京大学并加入百度,负责百度运维大数据存储平台的设计和研发,致力于追求大规模存储系统的高性能和高可用。

潘成龙

主题报告一:百度智能运维实践之异常检测

主题简介:在百度设计和实现智能监控系统,面临着巨大挑战:业务种类、特性繁多,流量、收入规模大、影响面广,稳定性、时效性要求高。本报告基于监控系统中的一个重要特性——异常检测介绍百度如何准确、高效地进行10亿级的运维时序数据分析:

1、异常检测的算法介绍和百度的调优实践;

2、大规模时序数据的采集-存储-计算架构。

个人简介:潘成龙,百度高级研发工程师,2015年硕士毕业于中科院计算所,当年加入百度,负责监控系统的数据采集和汇聚计算系统的设计和研发。

吉青

主题报告二:大型数据中心运维实践和趋势分析

主题简介:近年来随着互联网行业的发展,数据中心数量激增,数据的规模和模式不断刷新纪录。这个后期的运营和维护工作带来了极大的挑战。当前比较流行的做法是人工运维与智能运维相结合。把一些常见、耗时的值守类工作交给智能运维。而人工运维更多的集中在突发事件和新问题的处理以及新技术的应用等方面。本次分享,主要探讨以下方面:

1、数据中心的发展历程与挑战;

2、ITIL 、ITSM与IT运维;

3、自动化运维的实现与趋势;

4、银行、电信、高校等特定领域数据中心运维案例分析。

个人简介:吉青,曙光高性能产品事业部副总经理,中国科学院化学研究所博士,先后在法国国家科学研究中心和美国麻省理工学院担任博士后研究员。2015年加入曙光,任高性能产品事业部副总经理,并主持在线运维EasyOP的运营和研发等相关工作。截止2017年7月,EasyOP已经接入100+个数据中心,服务近万个节点。


李培龙

主题报告三:海量数据场景下的智能监控与定位

主题简介:探讨海量数据场景下,故障的实时发现和精准定位体系建设。该报告由三位资深讲师分别发表演讲,内容主要包括:

1、海量特征指标采集;

2、高效的时间序列化存储;

3、实时报警;

4、基于机器学习的故障检测;

5、基于trace的精准定位等能力的建设经验。

个人简介:李培龙,滴滴出行高级专家工程师,2015年加入滴滴出行,组建质量架构团队,负责滴滴的Trace调用链追踪与问题定位系统、基于机器学习的异常检测系统和全链路压测平台。

聂安安

主题报告三:海量数据场景下的智能监控与定位

主题简介:探讨海量数据场景下,故障的实时发现和精准定位体系建设。该报告由三位资深讲师分别发表演讲,内容主要包括:

1、海量特征指标采集;

2、高效的时间序列化存储;

3、实时报警;

4、基于机器学习的故障检测;

5、基于trace的精准定位等能力的建设经验。

个人简介聂安安,滴滴出行资深软件开发工程师,主要从事运维平台开发、监控体系建设等相关工作,Open-Falcon开源社区核心Committer之一。

贺百灵

主题报告三:海量数据场景下的智能监控与定位

主题简介:探讨海量数据场景下,故障的实时发现和精准定位体系建设。该报告由三位资深讲师分别发表演讲,内容主要包括:

1、海量特征指标采集;

2、高效的时间序列化存储;

3、实时报警;

4、基于机器学习的故障检测;

5、基于trace的精准定位等能力的建设经验。

个人简介:贺百灵,滴滴出行高级软件开发工程师,2015年加入滴滴,先后负责LBS、分抢单策略、出租车反作弊系统的测试工作,现阶段主要负责智能运维方向异常检测相关算法的研究与实现。

谢文辉

主题报告五:大规模流量接入系统的设计和实践

主题简介:随着京东业务规模的快速增长和全站https落地实施,6.18/11.11 用户流量峰值给流量接入体系的性能和高可用性建设带来了更多挑战。在这个过程中,我们逐步构建和完善了智能DNS系统,高性能反向代理和负载均衡,数据分析展现,公网流量调度等配套系统平台,协同支撑大规模流量接入和调度。本次主题将介绍这套流量接入平台构建实践以及相关问题和解决方案。

个人简介:谢文辉,京东技术保障部架构师,2016年加入京东,负责技术保障部流量接入平台设计研发,构建支撑京东6.18极端峰值流量的接入架构。