econml.inference.EmpiricalInferenceResults

class econml.inference.EmpiricalInferenceResults(d_t, d_y, pred, pred_dist, inf_type, fname_transformer=None, feature_names=None, output_names=None, treatment_names=None)[源代码]

基类: econml.inference._inference.InferenceResults

使用经验样本集进行推断的结果类。

参数
  • pred (array_like, shape (m, d_y, d_t) 或 (m, d_y)) – 使用完整样本得到的指标的点估计

  • pred_dist (array_like, shape (b, m, d_y, d_t) 或 (b, m, d_y)) – 采样 b 次得到的指标的原始预测。注意,当 Y 或 T 是向量而不是二维数组时,相应的单例维度应折叠

  • d_t (int or None) – 处理数

  • d_y (int) – 输出数

  • inf_type (str) – 推断结果的类型。可以是 'effect', 'coefficient' 或 'intercept'。

  • fname_transformer (None 或 predefined function) – 从 featurizer 获取相应特征名称的转换函数

__init__(d_t, d_y, pred, pred_dist, inf_type, fname_transformer=None, feature_names=None, output_names=None, treatment_names=None)[源代码]

方法

__init__(d_t, d_y, pred, pred_dist, inf_type)

conf_int([alpha])

获取每个样本 X[i] 的每个处理对每个结果的指标的置信区间。

population_summary([alpha, value, decimals, ...])

输出总体汇总结果的对象。

pvalue([value])

获取每个样本 X[i] 的每个处理对每个结果的 p 值。

scale(factor)

通过乘以一个因子来更新结果。

summary_frame([alpha, value, decimals, ...])

输出包含上述所有推断结果的 DataFrame。

translate(other)

通过加上一个偏移量来更新结果。

zstat([value])

获取每个样本 X[i] 的每个处理对每个结果的指标的 z 统计量。

属性

point_estimate

获取每个样本 X[i] 的每个处理对每个结果的点估计。

stderr

获取每个样本 X[i] 的每个处理对每个结果的指标的标准误差。

var

获取每个样本 X[i] 的每个处理对每个结果的指标的方差。

conf_int(alpha=0.05)[源代码]

获取每个样本 X[i] 的每个处理对每个结果的指标的置信区间。

参数

alpha (float in [0, 1], default 0.05) – 所报告区间的总体置信水平。报告 alpha/2, 1-alpha/2 的置信区间。

返回值

lower, upper – 每个数量的置信区间的下限和上限。注意,当 Y 或 T 是向量而不是二维数组时,输出中相应的单例维度将被折叠(例如,如果两者都是向量,则此方法的输出也将是向量)

返回类型

tuple of array, shape (m, d_y, d_t) 或 (m, d_y)

population_summary(alpha=0.05, value=0, decimals=3, tol=0.001, output_names=None, treatment_names=None)

输出总体汇总结果的对象。

参数
  • alpha (float in [0, 1], default 0.05) – 所报告区间的总体置信水平。报告 alpha/2, 1-alpha/2 的置信区间。

  • value (float, default 0) – 在原假设下您想测试的指标的平均值。

  • decimals (int, default 3) – 每列四舍五入到的小数位数。

  • tol (float, default 0.001) – 停止准则。当结果小于 tol 时停止迭代

  • output_names (list of str, optional) – 输出的名称

  • treatment_names (list of str, optional) – 处理的名称

返回值

PopulationSummaryResults – 总体汇总结果实例包含样本 X 上每个处理和结果的点估计的不同汇总分析。

返回类型

对象

pvalue(value=0)[源代码]

获取每个样本 X[i] 的每个处理对每个结果的 p 值。

参数

value (float, default 0) – 在原假设下您想测试的指标的平均值。

返回值

pvalue – 每个样本 X[i] 的每个处理对每个结果的 p 值。注意,当 Y 或 T 是向量而不是二维数组时,输出中相应的单例维度将被折叠(例如,如果两者都是向量,则此方法的输出也将是向量)

返回类型

array_like, shape (m, d_y, d_t) 或 (m, d_y)

scale(factor)[源代码]

通过乘以一个因子来更新结果。

参数

factor (array_like) – 用于缩放这些结果的因子

summary_frame(alpha=0.05, value=0, decimals=3, feature_names=None, output_names=None, treatment_names=None)

输出包含上述所有推断结果的 DataFrame。

参数
  • alpha (float in [0, 1], default 0.05) – 所报告区间的总体置信水平。报告 alpha/2, 1-alpha/2 的置信区间。

  • value (float, default 0) – 在原假设下您想测试的指标的平均值。

  • decimals (int, default 3) – 每列四舍五入到的小数位数。

  • feature_names (list of str, optional) – 特征 X 的名称

  • output_names (list of str, optional) – 输出的名称

  • treatment_names (list of str, optional) – 处理的名称

返回值

output – 输出 DataFrame 包括每个样本 X[i] 的每个处理对每个结果的估计指标的点估计、标准误差、z 分数、p 值和置信区间。

返回类型

DataFrame

translate(other)[源代码]

通过加上一个偏移量来更新结果。

参数

offset (array_like) – 用于平移这些结果的偏移量

zstat(value=0)

获取每个样本 X[i] 的每个处理对每个结果的指标的 z 统计量。

参数

value (float, default 0) – 在原假设下您想测试的指标的平均值。

返回值

zstat – 每个样本 X[i] 的每个处理对每个结果的指标的 z 统计量。注意,当 Y 或 T 是向量而不是二维数组时,输出中相应的单例维度将被折叠(例如,如果两者都是向量,则此方法的输出也将是向量)

返回类型

array_like, shape (m, d_y, d_t) 或 (m, d_y)

property point_estimate

获取每个样本 X[i] 的每个处理对每个结果的点估计。

返回值

prediction – 每个样本 X[i] 的每个处理对每个结果的点估计。注意,当 Y 或 T 是向量而不是二维数组时,输出中相应的单例维度将被折叠(例如,如果两者都是向量,则此方法的输出也将是向量)

返回类型

array_like, shape (m, d_y, d_t) 或 (m, d_y)

property stderr

获取每个样本 X[i] 的每个处理对每个结果的指标的标准误差。

返回值

stderr – 每个样本 X[i] 的每个处理对每个结果的指标的标准误差。注意,当 Y 或 T 是向量而不是二维数组时,输出中相应的单例维度将被折叠(例如,如果两者都是向量,则此方法的输出也将是向量)

返回类型

array_like, shape (m, d_y, d_t) 或 (m, d_y)

property var

获取每个样本 X[i] 的每个处理对每个结果的指标的方差。

返回值

var – 每个样本 X[i] 的每个处理对每个结果的指标的方差。注意,当 Y 或 T 是向量而不是二维数组时,输出中相应的单例维度将被折叠(例如,如果两者都是向量,则此方法的输出也将是向量)

返回类型

array_like, shape (m, d_y, d_t) 或 (m, d_y)