econml.grf.LinearMomentGRFCriterion

class econml.grf.LinearMomentGRFCriterion

基类: econml.tree._criterion.RegressionCriterion

一个准则类,用于估计通过以下形式的线性矩方程定义的局部参数

E[ m(J, A; theta(x)) | X=x] = E[ J * theta(x) - A | X=x] = 0

根据泛化随机森林论文中定义的代理得分,计算基于估计参数引起的异质性的不纯度

Athey, Susan, Julie Tibshirani, and Stefan Wager.
"Generalized random forests." The Annals of Statistics
47.2 (2019): 1148-1178 https://arxiv.org/pdf/1610.01271.pdf.

为每个样本计算代理标签

rho[i] := - J(Node)^{-1} (J[i] * theta(Node) - A[i])
J(Node) := E[J[i] | X[i] in Node]
theta(Node) := J(Node)^{-1} E[A[i] | X[i] in Node]

然后对于一个分割(左,右),使用以下量作为代理不纯度改善

sum_{k=1}^{n_relevant_outputs} E[rho[i, k] | X[i] in Left]^2 + E[rho[i, k] | X[i] in Right]^2

将以下量存储为节点不纯度

sum_{k=1}^{n_relevant_outputs} Var(rho[i, k] | X[i] in Node)
 = sum_{k=1}^{n_relevant_outputs} E[rho[i, k]^2 | X[i] in Node] - E[rho[i, k] | X[i] in Node]^2
__init__()

方法

__init__()