econml.sklearn_extensions.linear_model.StatsModelsLinearRegression
- class econml.sklearn_extensions.linear_model.StatsModelsLinearRegression(fit_intercept=True, cov_type='HC0', *, enable_federation=False)[source]
基类:
econml.sklearn_extensions.linear_model._StatsModelsWrapper
模拟 statsmodels 包中加权线性回归的类。
然而,与 statsmodels WLS 不同,此类除了支持样本权重外,还支持样本方差,这使得处理汇总数据时能进行更准确的推断。
- 参数
fit_intercept (bool, 默认 True) – 是否在此模型中拟合截距
cov_type (string, 默认 “HC0”) – 要使用的协方差方法。支持的值包括 “HCO”、“HC1” 和 “nonrobust”。
enable_federation (bool, 默认 False) – 是否启用联邦(在分布式设置中将此模型的结果与其他模型聚合)。这需要额外的内存,其大小与 X 中列数的四次方成正比。
方法
__init__
([fit_intercept, cov_type, ...])aggregate
(models)将多个模型聚合成一个。
coef__interval
([alpha])获取拟合系数的置信区间。
fit
(X, y[, sample_weight, freq_weight, ...])拟合模型。
get_params
([deep])获取此估计器的参数。
intercept__interval
([alpha])获取截距的置信区间(如果未拟合截距则为 0)。
predict
(X)给定实例数组,预测输出。
predict_interval
(X[, alpha])获取预测的置信区间。
获取预测的标准误差。
set_params
(**params)设置此估计器的参数。
属性
获取模型在协变量上的系数。
获取拟合系数的标准误差。
获取截距(如果未拟合截距则为 0)。
获取截距的标准误差(如果未拟合截距则为 0)。
- static aggregate(models: List[econml.sklearn_extensions.linear_model.StatsModelsLinearRegression])[source]
将多个模型聚合成一个。
- 参数
models (StatsModelsLinearRegression 列表) – 要聚合的模型
- 返回
agg_model – 聚合后的模型
- 返回类型
- coef__interval(alpha=0.05)
获取拟合系数的置信区间。
- 参数
alpha (float, 默认 0.05) – 置信水平。将计算参数分布的 alpha/2 分位数和 (1-alpha/2) 分位数作为置信区间
- 返回
coef__interval – 系数的置信区间下限和上限
- 返回类型
{tuple ((p, d) array, (p,d) array), tuple ((d,) array, (d,) array)}
- fit(X, y, sample_weight=None, freq_weight=None, sample_var=None)[source]
拟合模型。
- 参数
X ((N, d) nd array_like) – 协变量
y ({(N,), (N, p)} nd array_like) – 输出变量
sample_weight ((N,) array_like 或 None) – 每个样本的个体权重。如果为 None,则假定权重相等。
freq_weight ((N, ) int 类型的 array_like 或 None) – 观测的权重。观测 i 被视为 freq_weight[i] 个独立观测的平均结果。当
sample_var
不为 None 时,应提供此参数。sample_var ({(N,), (N, p)} nd array_like 或 None) – 用于计算观测 i 所代表的平均结果的原始 freq_weight[i] 个观测结果的方差。
- 返回
self
- 返回类型
- get_params(deep=True)
获取此估计器的参数。
- 参数
deep (bool, 默认=True) – 如果为 True,将返回此估计器以及包含的作为估计器的子对象的参数。
- 返回
params – 参数名与其值的映射。
- 返回类型
- intercept__interval(alpha=0.05)
获取截距的置信区间(如果未拟合截距则为 0)。
- predict(X)
给定实例数组,预测输出。
- 参数
X ((n, d) array_like) – 用于预测的协变量
- 返回
predictions – 预测的平均结果
- 返回类型
{(n,) array, (n,p) array}
- predict_interval(X, alpha=0.05)
获取预测的置信区间。
- 参数
X ((n, d) array_like) – 用于预测的协变量
alpha (float, 默认 0.05) – 置信水平。将计算参数分布的 alpha/2 分位数和 (1-alpha/2) 分位数作为置信区间
- 返回
prediction_intervals – 预测平均结果的置信区间下限和上限
- 返回类型
{tuple ((n,) array, (n,) array), tuple ((n,p) array, (n,p) array)}
- prediction_stderr(X)
获取预测的标准误差。
- 参数
X ((n, d) array_like) – 用于预测的协变量
- 返回
prediction_stderr – 在每个预测点上,输出的每个坐标的标准误差
- 返回类型
(n, p) array_like
- set_params(**params)
设置此估计器的参数。
此方法适用于简单估计器以及嵌套对象(例如
Pipeline
)。后者具有<component>__<parameter>
形式的参数,因此可以更新嵌套对象的每个组件。- 参数
**params (dict) – 估计器参数。
- 返回
self – 估计器实例。
- 返回类型
估计器实例
- property coef_
获取模型在协变量上的系数。
- 返回
coef_ – 线性回归中变量的系数。如果标签 y 是 p 维的,则结果是系数矩阵,其第 p 行包含与标签的第 p 个坐标对应的系数。
- 返回类型
{(d,), (p, d)} nd array_like
- property coef_stderr_
获取拟合系数的标准误差。
- 返回
coef_stderr_ – 系数的标准误差
- 返回类型
{(d,), (p, d)} nd array_like