公共模块参考

CATE 估计器

双重机器学习 (DML)

econml.dml.DML(*, model_y, model_t, model_final)

参数化双重 ML 估计器的基类。

econml.dml.LinearDML(*[, model_y, model_t, ...])

双重 ML 估计器,最终阶段使用低维线性模型,实现为 statsmodel 回归。

econml.dml.SparseLinearDML(*[, model_y, ...])

双重 ML 估计器用于稀疏线性情况的专门版本。

econml.dml.CausalForestDML(*[, model_y, ...])

一个因果森林 [cfdml1],结合基于双重机器学习对处理和结果变量进行残差化。

econml.dml.NonParamDML(*, model_y, model_t, ...)

非参数双重 ML 估计器的基类,最终阶段可以使用任意基于 ML 的 CATE 模型。

econml.dml.KernelDML([model_y, model_t, ...])

线性双重 ML 估计器的专门版本,使用随机傅立叶特征。

双重稳健 (DR)

econml.dr.DRLearner(*[, model_propensity, ...])

使用双重稳健校正技术来解释不同处理组之间协变量偏移(选择偏差)的 CATE 估计器。

econml.dr.LinearDRLearner(*[, ...])

DRLearner 的特例,其最终阶段是在低维特征集上的线性回归。

econml.dr.SparseLinearDRLearner(*[, ...])

DRLearner 的特例,其最终阶段是 Debiased Lasso 回归。

econml.dr.ForestDRLearner(*[, ...])

DRLearner 的实例,其最终模型为 RegressionForest,以实现非参数推断。

元学习器

econml.metalearners.XLearner(*, models[, ...])

Kunzel 等人提出的元算法,在特定设置下表现最佳

econml.metalearners.TLearner(*, models[, ...])

条件均值回归估计器。

econml.metalearners.SLearner(*, overall_model)

条件均值回归估计器,其中处理分配作为 ML 模型的一个特征。

econml.metalearners.DomainAdaptationLearner(*, ...)

使用领域适应技术来解释

正交随机森林 (ORF)

econml.orf.DMLOrthoForest(*[, n_trees, ...])

使用 DML 残差对残差矩函数,用于连续或离散处理的 OrthoForest。

econml.orf.DROrthoForest(*[, n_trees, ...])

使用双重稳健矩函数,用于离散处理的 OrthoForest。

工具变量 CATE 估计器

双重机器学习 (DML) IV

econml.iv.dml.OrthoIV(*[, model_y_xw, ...])

使用 IV 进行 CATE 估计的正交/双重 ml 方法的实现,如第 4.2 节所述

econml.iv.dml.DMLIV(*[, model_y_xw, ...])

参数化 DMLIV 估计器的基类,用于估计 CATE。

econml.iv.dml.NonParamDMLIV(*[, model_y_xw, ...])

非参数 DMLIV 的基类,允许在 DMLIV 算法的最终阶段使用任意基于平方损失的 ML 方法。

双重稳健 (DR) IV

econml.iv.dr.DRIV(*[, model_y_xw, ...])

用于使用 IV 估计 CATE 的 DRIV 算法。

econml.iv.dr.LinearDRIV(*[, model_y_xw, ...])

DRIV 的特例,其最终阶段是线性回归。

econml.iv.dr.SparseLinearDRIV(*[, ...])

DRIV 的特例,其最终阶段是 Debiased Lasso 回归。

econml.iv.dr.ForestDRIV(*[, model_y_xw, ...])

DRIV 的实例,其最终模型为 RegressionForest,以实现非参数推断。

econml.iv.dr.IntentToTreatDRIV(*[, ...])

实现了用于意向治疗 A/B 测试设置的 DRIV 算法

econml.iv.dr.LinearIntentToTreatDRIV(*[, ...])

实现了用于线性意向治疗 A/B 测试设置的 DRIV 算法

DeepIV

econml.iv.nnet.DeepIV(*, n_components, m, h, ...)

Deep IV 估计器 (参见 http://proceedings.mlr.press/v70/hartford17a/hartford17a.pdf)。

筛法

econml.iv.sieve.SieveTSLS(*, t_featurizer, ...)

非参数工具变量估计器。

econml.iv.sieve.HermiteFeatures(degree[, ...])

返回(未缩放的)Hermite 函数评估的特征提取器。

econml.iv.sieve.DPolynomialFeatures([...])

返回 PolynomialFeatures 特征导数的特征提取器,其方式与 SieveTSLSdt_featurizer 参数的预期兼容。

面板数据估计器

动态双重机器学习

econml.panel.dml.DynamicDML(*[, model_y, ...])

用于动态处理效应估计的 CATE 估计器。

策略学习

econml.policy.DRPolicyForest(*[, ...])

使用双重稳健校正技术来解释不同处理组之间协变量偏移(选择偏差)的策略学习器。

econml.policy.DRPolicyTree(*[, ...])

使用双重稳健校正技术来解释不同处理组之间协变量偏移(选择偏差)的策略学习器。

econml.policy.PolicyForest([n_estimators, ...])

福利最大化策略森林。

econml.policy.PolicyTree(*[, criterion, ...])

福利最大化策略树。

CATE 解释器

econml.cate_interpreter.SingleTreeCateInterpreter(*)

用于解释 CATE 估计器估计的效果的解释器

econml.cate_interpreter.SingleTreePolicyInterpreter(*)

用于解释基于 CATE 估计的策略的解释器

CATE 验证

econml.validate.DRTester(*, ...[, cv])

CATE 模型的验证测试。

econml.validate.BLPEvaluationResults(params, ...)

BLP 测试的结果类。

econml.validate.CalibrationEvaluationResults(...)

校准测试的结果类。

econml.validate.UpliftEvaluationResults(...)

基于提升曲线的测试的结果类。

econml.validate.EvaluationResults(cal_res, ...)

所有测试组合的结果类。

CATE 评分器

econml.score.RScorer(*, model_y, model_t[, ...])

基于 RLearner 损失的评分器。在拟合时拟合残差模型,并以交叉拟合的方式计算评估数据的残差:。

econml.score.EnsembleCateEstimator(*, ...)

一个表示多个 CATE 估计器的加权集成的 CATE 估计器。

广义随机森林

econml.grf.CausalForest([n_estimators, ...])

一个因果森林 [cf1]

econml.grf.CausalIVForest([n_estimators, ...])

一个因果 IV 森林 [cfiv1]

econml.grf.RegressionForest([n_estimators, ...])

基于 sklearn 回归树的子采样诚实随机森林回归器实现。

econml.grf.MultiOutputGRF(estimator)

一个简单的包装器估计器,使得所有只接受单一结果的 grf 估计器能够处理多个结果标签。

econml.grf.LinearMomentGRFCriterion

一个准则类,用于估计通过以下形式的线性矩方程定义的局部参数。

econml.grf.LinearMomentGRFCriterionMSE

econml.grf._base_grf.BaseGRF([n_estimators, ...])

广义随机森林的基类,用于解决以下形式的线性矩方程。

econml.grf._base_grftree.GRFTree(*[, ...])

广义随机森林 [grftree1] 的一棵树。该方法应主要通过 BaseGRF 森林类及其派生类使用,而非作为独立估计器。它拟合一棵树来解决局部矩方程问题:。

Scikit-Learn 扩展

线性模型扩展

econml.sklearn_extensions.linear_model.DebiasedLasso([...])

无偏 Lasso 模型。

econml.sklearn_extensions.linear_model.MultiOutputDebiasedLasso([...])

无偏 MultiOutputLasso 模型。

econml.sklearn_extensions.linear_model.SelectiveRegularization(...)

一种线性模型的估计器,其中正则化仅应用于系数的子集。

econml.sklearn_extensions.linear_model.StatsModelsLinearRegression([...])

模拟 statsmodels 包中加权线性回归的类。

econml.sklearn_extensions.linear_model.StatsModelsRLM([...])

模拟 statsmodels 包中稳健线性回归的类。

econml.sklearn_extensions.linear_model.WeightedLasso([...])

接受权重的 sklearn Lasso 版本。

econml.sklearn_extensions.linear_model.WeightedLassoCV([...])

接受权重的 sklearn LassoCV 版本。

econml.sklearn_extensions.linear_model.WeightedMultiTaskLassoCV([...])

接受权重的 sklearn MultiTaskLassoCV 版本。

econml.sklearn_extensions.linear_model.WeightedLassoCVWrapper(...)

根据目标的形状包装 WeightedLassoCV 或 WeightedMultiTaskLassoCV 的辅助类。

模型选择扩展

econml.sklearn_extensions.model_selection.GridSearchCVList(...)

GridSearchCV 的扩展,允许传递一个估计器列表,每个估计器都有自己的参数网格,并返回列表中所有估计器及其对应网格中的最佳超参数组合。

econml.sklearn_extensions.model_selection.WeightedKFold([...])

用于加权数据的 K 折交叉验证器。

econml.sklearn_extensions.model_selection.WeightedStratifiedKFold([...])

用于加权数据的分层 K 折交叉验证器。

推断

推断结果

econml.inference.NormalInferenceResults(d_t, ...)

假设正态分布的推断结果类。

econml.inference.EmpiricalInferenceResults(...)

使用经验样本集的推断结果类。

econml.inference.PopulationSummaryResults(...)

推断的人口摘要结果类。

推断方法

econml.inference.BootstrapInference([...])

用于执行 bootstrapping 的推断实例。

econml.inference.GenericModelFinalInference()

基于 model_final 模型的 predict_interval 的推断。

econml.inference.GenericSingleTreatmentModelFinalInference()

基于 model_final 模型的 predict_interval 的推断。

econml.inference.LinearModelFinalInference()

基于 model_final 模型的 predict_interval 的推断。

econml.inference.StatsModelsInference([cov_type])

存储 statsmodels 协方差选项。

econml.inference.GenericModelFinalInferenceDiscrete()

假设估计器拟合于分类处理,并使用单独的通用 model_final 来拟合与每个处理相关的 CATE。

econml.inference.LinearModelFinalInferenceDiscrete()

带有分类处理的估计器的推断方法,其中使用 X 线性模型来拟合与每个处理相关的 CATE。

econml.inference.StatsModelsInferenceDiscrete([...])

最终模型为 StatsModelsLinearRegression 的特例

联邦估计

econml.federated_learning.FederatedEstimator(...)

使用 LinearDML、LinearDRIV 和 LinearDRLearner 估计器进行联邦学习的类。

解决方案

因果分析

econml.solutions.causal_analysis.CausalAnalysis(...)

注意:这个类是实验性的,并且 API 在接下来的几个版本中可能会发生变化。

与 DoWhy 集成

econml.dowhy.DoWhyWrapper(cate_estimator)

一个包装类,允许用户通过 EconML 调用 dowhy 包中的其他方法。

工具方法

econml.utilities

工具方法。

私有模块参考

econml._ortho_learner

正交机器学习是估计因果模型的一种通用方法,通过将它们表述为某个损失函数的最小化器,该损失函数依赖于也需要从数据中估计的辅助回归模型。

econml._cate_estimator

所有 CATE 估计器的基类。

econml.dml._rlearner

R Learner 是一种在没有未观测到的混淆因素的设置下,估计条件平均处理效应的灵活非参数模型的方法。

econml.inference._bootstrap

Bootstrap 抽样。