详细的估计器比较

估计器

处理
类型
需要
工具变量
提供置信
区间
线性
处理
线性
异质性
多个
结果
多个
处理
高维
特征

SieveTSLS

任何

假定

DeepIV

任何

SparseLinearDML

任何

假定

SparseLinearDRLearner

分类

投影

LinearDML

任何

假定

LinearDRLearner

分类

投影

CausalForestDML

任何

ForestDRLearner

分类

DMLOrthoForest

任何

DROrthoForest

分类

metalearners

分类

DRLearner

分类

DML

任何

假定

NonParamDML

1维/二元

OrthoIV

任何

假定

DMLIV

任何

假定

NonParamDMLIV

1维/二元

DRIV

1维/二元

LinearDRIV

1维/二元

投影

SparseLinearDRIV

1维/二元

投影

ForestDRIV

1维/二元

IntentToTreatDRIV

二元

LinearIntentToTreatDRIV

二元

投影

处理类型

一些估计器只能估计特定类型处理的影响。离散处理可以通过有限数量的综合类别来描述(例如,A 组获得产品 1 的 10% 折扣,B 组获得产品 2 的 10% 折扣,C 组没有获得任何折扣)。二元处理是只有两个类别的离散处理的特例。连续处理可以沿数轴取任何值(例如,每周锻炼的分钟数)。

需要工具变量

一些估计器通过仅考虑处理强度变化的一个子集来识别处理的因果效应,该子集在给定其他数据特征的情况下是条件随机的。这种变化的子集由一个工具变量驱动,工具变量通常是某种随机化(即早期的实验或抽奖)。有关如何选择好的工具变量的更多信息,请参阅工具变量回归部分。

提供置信区间

许多估计器可以为最终处理效应提供解析置信区间。这些置信区间正确地调整了跨多个估计阶段的数据重用。在多阶段估计过于复杂或对于 MetaLearners 等为了模型选择和正则化而牺牲诚实置信区间的估计器,EconML 无法提供解析置信区间。在这些情况下,仍然可以获得自助法置信区间,但这个过程很慢,并且可能在统计上无效。

线性处理

一些估计器假定结果是处理的线性函数。如果关系的结构已知且可加分离(例如,对于连续处理,线性函数可以包括处理和处理的平方),这些估计器也可以估计处理与结果之间的非线性关系。这些线性函数还可以包括指定处理之间的交互作用。然而,这些估计器不能估计处理与结果之间完全灵活的非参数关系(例如,这种关系不能用森林模型来建模)。

线性异质性

CATE 函数确定用户对处理的响应大小如何随用户特征变化。一些估计器*假定*效应大小是用户特征的线性函数。少数模型估计效应大小和用户特征之间更灵活的关系,然后将该灵活函数*投影*到线性模型上。第二种方法提供了非线性关系的更好拟合的线性近似,但在您确信真实关系是线性的情况下效率较低。最后,一些估计模型允许效应大小和用户特征之间存在完全灵活的关系,而无需线性结构。

多个结果

一些估计模型允许联合估计处理对多个结果的影响。其他模型仅能处理单个结果。

多个处理

一些估计模型允许联合估计多个处理对结果的影响。其他模型仅能处理单个处理。

高维特征

许多估计器仅在使用少量指定特征 X 时表现良好,这些特征影响用户对处理的响应大小。如果您尚不确定哪些少数特征可能合理地影响用户的响应,请使用我们的稀疏估计器之一,它们可以处理大型特征集,并通过惩罚来发现与处理效应异质性最相关的特征。