找回密码
 注册
查看: 1104|回复: 0

R语言 RRF包 importance()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-9-28 21:07:16 | 显示全部楼层 |阅读模式
importance(RRF)
importance()所属R语言包:RRF

                                        Extract variable importance measure
                                         提取变量的重要性措施

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

This is the extractor function for variable importance measures as produced by RRF.
这是的提取函数变量重要性措施产生的RRF。


用法----------Usage----------


## S3 method for class 'RRF'
importance(x, type=NULL, class=NULL, scale=TRUE, ...)



参数----------Arguments----------

参数:x
an object of class RRF </table>
一个对象的类RRF</ TABLE>


参数:type
either 1 or 2, specifying the type of importance measure (1=mean decrease in accuracy, 2=mean decrease in node impurity).
为1或2,指定重要性度量的类型(1 =平均精度下降,2 =意味着减少在节点杂质)。


参数:class
for classification problem, which class-specific measure to return.
对于分类问题,返回类的具体措施。


参数:scale
For permutation based measures, should the measures be divided their &ldquo;standard errors&rdquo;?
排列为基础的措施,这些措施应被划分为“标准错误”?


参数:...
not used.
不被使用。


Details

详细信息----------Details----------

Here are the definitions of the variable importance measures.  The first measure is computed from permuting OOB data:  For each tree, the prediction error on the out-of-bag portion of the data is recorded (error rate for classification, MSE for regression). Then the same is done after permuting each predictor variable.  The difference between the two are then averaged over all trees, and normalized by the standard deviation of the differences.  If the standard deviation of the differences is equal to 0 for a variable, the division is not done (but the average is almost always equal to 0 in that case).
这里定义的变量重要性措施。第一项措施是从置换的OOB数据计算:对于每个树,被记录的数据部分上的袋的预测误差(误差率进行分类,对于回归的MSE)。然后同样是完成后置换预测变量的。两者之间的差异,然后平均超过所有的树木,以及归一化的标准偏差的差异。如果标准偏差的差异是为一个变量等于0,该部还没有完成(但平均是在这种情况下,几乎总是等于0)。

The second measure is the total decrease in node impurities from splitting on the variable, averaged over all trees.  For classification, the node impurity is measured by the Gini index. For regression, it is measured by residual sum of squares.
第二项措施是减少总额在分裂的变量节点的杂质,平均超过所有的树木。分类,节点杂质的基尼系数是衡量。回归,它测量由残差平方和。


值----------Value----------

A matrix of importance measure, one row for each predictor variable. The column(s) are different importance measures.
矩阵的重要措施,为每个预测变量的一列。列(s)是不同的重要措施。


参见----------See Also----------

RRF, varImpPlot
RRF,varImpPlot


实例----------Examples----------


set.seed(4543)
data(mtcars)
mtcars.rf <- RRF(mpg ~ ., data=mtcars, ntree=1000,
                          keep.forest=FALSE, importance=TRUE)
importance(mtcars.rf)
importance(mtcars.rf, type=1)

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-27 03:56 , Processed in 0.023601 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表