特邀讲者
况琨
浙江大学计算机学院副教授,博士生导师,人工智能系副主任
主题:《大数据因果推断、决策与可泛化学习》
主题简介:现阶段机器学习尤其是深度学习的主要特点在于数据驱动、关联学习、和概率输出,导致模型普遍存在预测不稳定和不可解释等问题。我们认为这些问题的主要根源在于因果机制尚未融入机器学习。因此,我们需要从关联分析跨越到因果推理,将因果引入机器学习,从而实现模型的可解释性和稳定性。大数据因果推断是实现从关联分析跨越到因果推理的核心一环。当因果推断遇上大数据,会面临高维连续变量,混淆变量观测不全等诸多挑战,导致传统因果推断方法在大数据环境下失效。如何利用机器学习和深度学习的技术,发挥数据优势、激发算法潜能,是实现大数据因果推断的核心。这次报告,我们主要从工具变量视角,给大家介绍如何利用机器学习赋能大数据因果推断。另一方面,因果关系的可解释性和稳定性也给机器学习的可泛化性带来了可能。我们训练机器学习模型的数据往往是有偏的,如混淆偏差和选择偏差等,导致变量之间存在不稳定且不可解释的虚假关联。消除虚假关联,恢复因果关联是实现可解释可泛化机器学习的关键。这次报告,我们主要从因果推断中的工具变量视角出发,探讨领域泛化问题中存在的偏差问题,并提出因果可泛化学习机制。
个人简介:浙江大学计算机学院副教授,博士生导师,人工智能系副主任。主要研究方向包括因果推理、数据挖掘、因果可信机器学习。在数据挖掘和机器学习领域已发表近60余篇顶级会议和期刊文章,包括TKDE, TPAMI, ICML, NeurIPS,KDD, ICDE, WWW, MM, DMKD, Engineering等。曾获2022年ACM SIGAI China 新星奖(Rising Star Award),2021年度中国科协青年人才托举工程项目支持,2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖,2021年度中国电子学会科技进步一等奖,2020年度中国人工智能学会优秀博士学位论文提名奖。
李勇军
中国科学技术大学管理学院副教授
主题:《基于免费增值模式下数字内容产品定价研究》
主题简介:价值8070亿美元的数字内容行业(例如电子书、音乐、游戏)大多采用了“免费增值”的定价策略,即免费提供初始内容,并通过对后续内容收费实现盈利。而确定免费内容的最佳数量,对各平台而言是一项普遍的痛点问题。提供太少的免费内容会增加客户流失的风险,而提供过多的免费内容会减少利润。基于这一痛点,我们采用田野实验、文本挖掘、计量分析等手段,从心理学、消费者行为学、经济学等理论角度对此进行分析,并最后提出了一个预测模型,该模型的准确率可以超过90%,为平台提供了将近30%的收益提升。
个人简介:中科大管理学院副教授,博导,研究兴趣是大数据运营和营销,已发表100余篇论文,获国家自然科学基金等项目10余项,并获得美国营销学会最佳论文奖,中科院青促会会员等奖励。
王冰青
前波士顿咨询数字化专家
主题:《数据科学赋能市场营销的“气、道、术”》
主题简介:数字时代,数据科学正迅速成为改进营销策略的必备工具,但仅仅使用数据科学方法,只是在“术”的层面帮助市场营销。结合对用户以及业务本身的理解,利用数据科学工具去解决正确的问题,此为“道”。而利用数据科学工具,引领时代潮流,指引用户发展,则是未来数据科学结合市场营销领域需要思考的“气”。只有当气道术均修炼得当,数据科学家们才能真正将数据科学的力量发挥到内容营销和市场拓展领域,达到“人剑合一”的境界。
个人简介:清华大学物理学学士,加州大学戴维斯分校传播学博士、统计学硕士,曾任波士顿咨询公司高级数据分析师,腾讯高级数据科学家,上海鲸岚科技用户研究总监。共发表传播学领域论文顶级期刊5篇,最高论文被引用数达80次。主要研究方向涵盖新媒介研究、媒介效果研究,游戏与娱乐,以及计算(大数据)社会科学方法等。同时也是SSCI 一区 New Media & Society 的审稿人。发现了内容消费的第三动机维度以及游戏在家庭传播中的场景作用。搭建数据与人之间的桥梁,不断加深对用户和业务的理解,是需要不断探求的终极命题。
张娟娟
麻省理工斯隆管理学院John D.C. Little讲席教授
主题:《全景式推荐系统》
主题简介:我们团队最新研发了一套“全景式推荐系统”的理论和算法。该系统的特征是以流量激励有价值的创作者,从而优化创作生态和长期消费者体验。理论上,我们利用经济学模型证明了该系统的最优性。算法上,我们创新性地使用计算机视觉的方法,以识别平台生态内最有价值的创作者。利用某大型内容平台数据,我们验证了全景式推荐系统的有效性。该算法可应用于其他营销问题,如识别重要KOL、优化预算配置等。
个人简介:清华大学经济学学士、加州大学伯克利分校工商管理学博士。现任麻省理工市场学终身教授、市场及运筹学鼻祖John D.C. Little特设讲席教授、麻省理工斯隆管理学院全球项目教务主席。曾任管理类顶刊Management Science的市场学领域主编。张娟娟教授主攻量化市场战略。其当前研究结合前沿的经济管理理论和计算科学,实现大规模的企业决策全景优化和自动化。研究成果屡见顶级学术期刊,并屡获行业最佳论文奖。与业界深度合作,成果应用于营销自动化、媒体优化、企业绩效管理、数字智能化转型等领域。张娟娟教授曾获麻省理工斯隆管理学院最高教学奖,并被商学院排名机构Poets & Quants评选为全美最受欢迎的商学教授之一。
SIG主席&会议主席
巴川
CCF TF数据科学SIG主席,竞技世界首席数据科学家
个人简介:曾就职于中国搜索、搜狐畅游等互联网公司。主要研究领域包括数据挖掘、知识图谱、人工智能、社交网络、风控体系、推荐系统、数据可视化等。中国教育创新校企联盟专家委员会副主任,国家技术标准创新基地(贵州大数据)数字经济专业委员会专家,北航兼职硕导,西安交大研究生院授课专家,多所高校兼职教师及创新创业导师,多个技术峰会演讲嘉宾及出品人。
孙子荀
CCF TF数据科学SIG委员,腾讯总监/专家
个人简介:腾讯数据科学专家/总监。一直从事AI和数据科学技术在业务上的研究、落地工作。当前在腾讯负责游戏发行与内容生态相关的数据科学以及产品化的工作。2011年在百度从事HPC并行化算法研究。2012年加入腾讯从无到有带领团队构建了信息流的内容平台、腾讯游戏的内容技术体系。个人在内容AI、数据科学上有较好的落地经验。连续多年腾讯优秀讲师、算法书籍主编和团队一起在顶级学术会议上有多篇论文发表并作口头报告;在内容场景也有几十篇国内外授权专利。