CCF广东工业大学学生分会举办“Causal effect estimation under Rubin causal Model”学术讲座

阅读量:0 2024-11-14 收藏本文

CCF广东工业大学学生分会于2024年10月30日（星期三）成功举办了主题为“Causal effect estimation under Rubin causal Model”的学术讲座。这场精彩讲座的报告人是广东工业大学计算机学院的博士李宗禹。李宗禹在数据挖掘与信息检索实验室（DMIR）进行科研工作，主要研究方向是因果关系发现、因果机器学习等。

在讲座的开始，李宗禹提出了相关性和可解释性这两个关键概念，相关性指两个变量之间的统计关系，可解释性在因果发现中指的是对因果关系的合理解释和理解，接着引出一个令人意外的对比图，当数据量足够的情况下，离婚率和肯塔基州的渔船死亡率有相似性，而我们对因果关系进行研究，就是要找出事情发展之间的关系。紧接着李宗禹阐述因果发现中的依赖性和因果性以及辛普森悖论，点明因果发现中会遇到的问题。

李宗禹接着对一些因果发现的核心任务进行介绍。Causal Effect（因果效应）的估计需要满足一些重要的假设条件，其中包括Stable Unit Treatment Value Assumption (SUTVA)、Unconfoundedness和Overlap。这些条件是确保因果效应估计有效性的基础，尤其是在非实验数据中，能够帮助我们识别因果关系和进行合理的反事实推断。在Binary Treatment（二元处理）场景下，介绍了几种常用的因果效应指标：ATE（平均处理效应）、PEHE（个体治疗效果预测误差）、ITE（个体治疗效应）和ATT（对处理组的平均处理效应）。这些指标帮助量化处理对结果的影响，并用于评估模型的预测效果。同时也介绍了在Multiple and Continuous Treatment（多重和连续处理）因果推断中，需要特殊的评估指标来衡量模型的性能和因果效应的质量，包括RMSE（均方根误差）、AMSE（平均均方误差）和ADRF（平均剂量响应函数）。

同时，李宗禹介绍了因果推断中的经典算法。包括Matching、Reweighting Methods和Representation Balance Methods等等。在Covariate Confounder Methods 算法中，提到了一种数据驱动的协变量分解方法，减少了因果效应估计中的偏差和计算复杂度。而在GANs-based Methods中，介绍了一种使用生成对抗网络（GANs）来估计个体化处理效应（ITE）的方法，这是因果推断领域中的一个重要创新。

最后，介绍了他以及DMIR实验室的一些科研工作。李宗禹介绍了他撰写的一篇深层因果模型及其工业应用综述，在综述中将深层因果模型分为5类，分别是Representation balance、Covariate confounder、GAN、Time series和Multi continuous。另外，还有深层因果模型及其工业应用综述，在工业中因果推断在许多企业的业务中发挥了重要作用，比如腾讯、阿里、快手和蚂蚁等企业。

至此，讲座圆满结束，感谢李宗禹分享的精彩学术讲座！

CCF学生分会

CCF广东工业大学学生分会举办“Causal effect estimation under Rubin causal Model”学术讲座