公共模块参考
CATE 估计器
双重机器学习 (DML)
|
参数化双重 ML 估计器的基类。 |
|
双重 ML 估计器,最终阶段使用低维线性模型,实现为 statsmodel 回归。 |
|
双重 ML 估计器用于稀疏线性情况的专门版本。 |
|
一个因果森林 [cfdml1],结合基于双重机器学习对处理和结果变量进行残差化。 |
|
非参数双重 ML 估计器的基类,最终阶段可以使用任意基于 ML 的 CATE 模型。 |
|
线性双重 ML 估计器的专门版本,使用随机傅立叶特征。 |
双重稳健 (DR)
|
使用双重稳健校正技术来解释不同处理组之间协变量偏移(选择偏差)的 CATE 估计器。 |
|
|
|
|
|
DRLearner 的实例,其最终模型为 |
元学习器
|
Kunzel 等人提出的元算法,在特定设置下表现最佳 |
|
条件均值回归估计器。 |
|
条件均值回归估计器,其中处理分配作为 ML 模型的一个特征。 |
使用领域适应技术来解释 |
正交随机森林 (ORF)
|
使用 DML 残差对残差矩函数,用于连续或离散处理的 OrthoForest。 |
|
使用双重稳健矩函数,用于离散处理的 OrthoForest。 |
工具变量 CATE 估计器
双重机器学习 (DML) IV
|
使用 IV 进行 CATE 估计的正交/双重 ml 方法的实现,如第 4.2 节所述 |
|
参数化 DMLIV 估计器的基类,用于估计 CATE。 |
|
非参数 DMLIV 的基类,允许在 DMLIV 算法的最终阶段使用任意基于平方损失的 ML 方法。 |
双重稳健 (DR) IV
|
用于使用 IV 估计 CATE 的 DRIV 算法。 |
|
|
|
|
|
DRIV 的实例,其最终模型为 |
|
实现了用于意向治疗 A/B 测试设置的 DRIV 算法 |
|
实现了用于线性意向治疗 A/B 测试设置的 DRIV 算法 |
DeepIV
|
Deep IV 估计器 (参见 http://proceedings.mlr.press/v70/hartford17a/hartford17a.pdf)。 |
筛法
|
非参数工具变量估计器。 |
|
返回(未缩放的)Hermite 函数评估的特征提取器。 |
返回 |
面板数据估计器
动态双重机器学习
|
用于动态处理效应估计的 CATE 估计器。 |
策略学习
|
使用双重稳健校正技术来解释不同处理组之间协变量偏移(选择偏差)的策略学习器。 |
|
使用双重稳健校正技术来解释不同处理组之间协变量偏移(选择偏差)的策略学习器。 |
|
福利最大化策略森林。 |
|
福利最大化策略树。 |
CATE 解释器
用于解释 CATE 估计器估计的效果的解释器 |
|
用于解释基于 CATE 估计的策略的解释器 |
CATE 验证
|
CATE 模型的验证测试。 |
|
BLP 测试的结果类。 |
校准测试的结果类。 |
|
基于提升曲线的测试的结果类。 |
|
|
所有测试组合的结果类。 |
CATE 评分器
|
基于 RLearner 损失的评分器。在拟合时拟合残差模型,并以交叉拟合的方式计算评估数据的残差:。 |
一个表示多个 CATE 估计器的加权集成的 CATE 估计器。 |
广义随机森林
|
一个因果森林 [cf1]。 |
|
一个因果 IV 森林 [cfiv1]。 |
|
基于 sklearn 回归树的子采样诚实随机森林回归器实现。 |
|
一个简单的包装器估计器,使得所有只接受单一结果的 grf 估计器能够处理多个结果标签。 |
一个准则类,用于估计通过以下形式的线性矩方程定义的局部参数。 |
|
|
广义随机森林的基类,用于解决以下形式的线性矩方程。 |
|
广义随机森林 [grftree1] 的一棵树。该方法应主要通过 BaseGRF 森林类及其派生类使用,而非作为独立估计器。它拟合一棵树来解决局部矩方程问题:。 |
Scikit-Learn 扩展
线性模型扩展
无偏 Lasso 模型。 |
|
|
无偏 MultiOutputLasso 模型。 |
|
一种线性模型的估计器,其中正则化仅应用于系数的子集。 |
|
模拟 statsmodels 包中加权线性回归的类。 |
|
模拟 statsmodels 包中稳健线性回归的类。 |
接受权重的 sklearn Lasso 版本。 |
|
|
接受权重的 sklearn LassoCV 版本。 |
|
接受权重的 sklearn MultiTaskLassoCV 版本。 |
|
根据目标的形状包装 WeightedLassoCV 或 WeightedMultiTaskLassoCV 的辅助类。 |
模型选择扩展
|
GridSearchCV 的扩展,允许传递一个估计器列表,每个估计器都有自己的参数网格,并返回列表中所有估计器及其对应网格中的最佳超参数组合。 |
|
用于加权数据的 K 折交叉验证器。 |
|
用于加权数据的分层 K 折交叉验证器。 |
推断
推断结果
|
假设正态分布的推断结果类。 |
使用经验样本集的推断结果类。 |
|
推断的人口摘要结果类。 |
推断方法
用于执行 bootstrapping 的推断实例。 |
|
基于 model_final 模型的 predict_interval 的推断。 |
|
|
基于 model_final 模型的 predict_interval 的推断。 |
基于 model_final 模型的 predict_interval 的推断。 |
|
|
存储 statsmodels 协方差选项。 |
假设估计器拟合于分类处理,并使用单独的通用 model_final 来拟合与每个处理相关的 CATE。 |
|
带有分类处理的估计器的推断方法,其中使用 X 线性模型来拟合与每个处理相关的 CATE。 |
|
最终模型为 StatsModelsLinearRegression 的特例 |
联邦估计
使用 LinearDML、LinearDRIV 和 LinearDRLearner 估计器进行联邦学习的类。 |
解决方案
因果分析
注意:这个类是实验性的,并且 API 在接下来的几个版本中可能会发生变化。 |
与 DoWhy 集成
|
一个包装类,允许用户通过 EconML 调用 dowhy 包中的其他方法。 |
工具方法
工具方法。 |
私有模块参考
正交机器学习是估计因果模型的一种通用方法,通过将它们表述为某个损失函数的最小化器,该损失函数依赖于也需要从数据中估计的辅助回归模型。 |
|
所有 CATE 估计器的基类。 |
|
R Learner 是一种在没有未观测到的混淆因素的设置下,估计条件平均处理效应的灵活非参数模型的方法。 |
|
Bootstrap 抽样。 |