econml.grf.LinearMomentGRFCriterion
- class econml.grf.LinearMomentGRFCriterion
基类:
econml.tree._criterion.RegressionCriterion
一个准则类,用于估计通过以下形式的线性矩方程定义的局部参数
E[ m(J, A; theta(x)) | X=x] = E[ J * theta(x) - A | X=x] = 0
根据泛化随机森林论文中定义的代理得分,计算基于估计参数引起的异质性的不纯度
Athey, Susan, Julie Tibshirani, and Stefan Wager. "Generalized random forests." The Annals of Statistics 47.2 (2019): 1148-1178 https://arxiv.org/pdf/1610.01271.pdf.
为每个样本计算代理标签
rho[i] := - J(Node)^{-1} (J[i] * theta(Node) - A[i]) J(Node) := E[J[i] | X[i] in Node] theta(Node) := J(Node)^{-1} E[A[i] | X[i] in Node]
然后对于一个分割(左,右),使用以下量作为代理不纯度改善
sum_{k=1}^{n_relevant_outputs} E[rho[i, k] | X[i] in Left]^2 + E[rho[i, k] | X[i] in Right]^2
将以下量存储为节点不纯度
sum_{k=1}^{n_relevant_outputs} Var(rho[i, k] | X[i] in Node) = sum_{k=1}^{n_relevant_outputs} E[rho[i, k]^2 | X[i] in Node] - E[rho[i, k] | X[i] in Node]^2
- __init__()
方法
__init__
()