CCF广东工业大学学生分会举办“Causal effect estimation under Rubin causal Model”学术讲座
CCF广东工业大学学生分会于2024年10月30日(星期三)成功举办了主题为“Causal effect estimation under Rubin causal Model”的学术讲座。这场精彩讲座的报告人是广东工业大学计算机学院的博士李宗禹。李宗禹在数据挖掘与信息检索实验室(DMIR)进行科研工作,主要研究方向是因果关系发现、因果机器学习等。
在讲座的开始,李宗禹提出了相关性和可解释性这两个关键概念,相关性指两个变量之间的统计关系,可解释性在因果发现中指的是对因果关系的合理解释和理解,接着引出一个令人意外的对比图,当数据量足够的情况下,离婚率和肯塔基州的渔船死亡率有相似性,而我们对因果关系进行研究,就是要找出事情发展之间的关系。紧接着李宗禹阐述因果发现中的依赖性和因果性以及辛普森悖论,点明因果发现中会遇到的问题。
李宗禹接着对一些因果发现的核心任务进行介绍。Causal Effect(因果效应)的估计需要满足一些重要的假设条件,其中包括Stable Unit Treatment Value Assumption (SUTVA)、Unconfoundedness和Overlap。这些条件是确保因果效应估计有效性的基础,尤其是在非实验数据中,能够帮助我们识别因果关系和进行合理的反事实推断。在Binary Treatment(二元处理)场景下,介绍了几种常用的因果效应指标:ATE(平均处理效应)、PEHE(个体治疗效果预测误差)、ITE(个体治疗效应)和ATT(对处理组的平均处理效应)。这些指标帮助量化处理对结果的影响,并用于评估模型的预测效果。同时也介绍了在Multiple and Continuous Treatment(多重和连续处理)因果推断中,需要特殊的评估指标来衡量模型的性能和因果效应的质量,包括RMSE(均方根误差)、AMSE(平均均方误差)和ADRF(平均剂量响应函数)。
同时,李宗禹介绍了因果推断中的经典算法。包括Matching、Reweighting Methods和Representation Balance Methods等等。在Covariate Confounder Methods 算法中,提到了一种数据驱动的协变量分解方法,减少了因果效应估计中的偏差和计算复杂度。而在GANs-based Methods中,介绍了一种使用生成对抗网络(GANs)来估计个体化处理效应(ITE)的方法,这是因果推断领域中的一个重要创新。
最后,介绍了他以及DMIR实验室的一些科研工作。李宗禹介绍了他撰写的一篇深层因果模型及其工业应用综述,在综述中将深层因果模型分为5类,分别是Representation balance、Covariate confounder、GAN、Time series和Multi continuous。另外,还有深层因果模型及其工业应用综述,在工业中因果推断在许多企业的业务中发挥了重要作用,比如腾讯、阿里、快手和蚂蚁等企业。
至此,讲座圆满结束,感谢李宗禹分享的精彩学术讲座!