本帖最後由 mamun4258 於 2024-5-15 12:37 編輯
那么如何借助于因果推断的一些方法,在已有数据的基础上构建准实验, 一、因果关系与归因偏误 首先,我们需要了解因果关系。因果关系是当其他控制变量不变,因某个特定解释变量的变化而引起被解释变量变化的关系。倘若我们要对去探究我们所关注的变量的因果关系,其实可以拆解为两个子问题:其一,界定因果关系:X和Y谁是因、谁是果?;其二,衡量因果效应大小:这种影响有多大? 跳槽做B端产品经理准备大干一场,发现把问题想简单了 近年来,B端业务大力发展,也让很多相关岗位的人C端产品经理、交互、测试、研发、运营、项目经理等纷纷转型做B端产品。
但是大多数人刚开始会对B端 ... 查看详情 > 在正式论述如何去界定因果并估 格鲁吉亚电话号码列表 计因果效应之前,我们现来看一个例子认识归因过程中的常见偏误并基于此去理解该如何去做因果推断。假设我们为了研究某服务对GMV的贡献,数据里活跃用户和非活跃用户,各组里都有使用过该服务或没有使用过该服务的用户,详细数据如下所示: 由上表可知,活跃用户使用过该服务的用户累计GMV平均比未使用过该服务的用户高元,非活跃用户使用过该服务的用户累计GMV平均比未使用过该服务的用户高元,但从整体来看,使用过该服务的用户累计GMV反而比未使用过该服务的用户低元。

细分人群构成来看,在现有数据中未使用过该服务的用户主要是活跃用户,而使用过该服务的用户主要是非活跃用户,两组间人群构成存在差异。也就是说总体数据的比较结果并未对个体活跃程度进行控制,因而造成服务使用效果的评价中混入了活跃程度的影响。 从上例中,我们不能根据直观数据简单通过正负相关去推导因果关系:因为会存在可观测或不可观测的混淆变量对因果解释造成偏差。因此,因果推断最主要的思路就是需要控制混淆变量。
|