找回密码
 注册
查看: 2304|回复: 0

R语言 rpart包 rpart.control()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-9-27 23:49:46 | 显示全部楼层 |阅读模式
rpart.control(rpart)
rpart.control()所属R语言包:rpart

                                         Control for Rpart Models
                                         控制软件rpart模型

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Various parameters that control aspects of the rpart fit.
各种参数,控制方面的rpart适合。


用法----------Usage----------


rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01,
              maxcompete = 4, maxsurrogate = 5, usesurrogate = 2, xval = 10,
              surrogatestyle = 0, maxdepth = 30, ...)



参数----------Arguments----------

参数:minsplit
the minimum number of observations that must exist in a node in order for  a split to be attempted.   
观测中必须存在为了以尝试分割中的一个节点的最小数目。


参数:minbucket
the minimum number of observations in any terminal <leaf> node. If only one of minbucket or minsplit is specified, the code either sets minsplit to minbucket*3 or minbucket to minsplit/3, as appropriate.  
的任何终端<leaf>节点中的观测值的最小数目。如果只有一个minbucket或minsplit指定的代码minsplit到minbucket*3或minbucket到minsplit/3,适当设置。


参数:cp
complexity parameter.  Any split that does not decrease the overall lack of fit by a factor of cp is not attempted.  For instance, with anova splitting, this means that the overall Rsquare must increase by cp at each step. The main role of this parameter is to save computing time by pruning off splits that are obviously not worthwhile. Essentially,the user informs the program that any split which does not improve the fit by cp will likely be pruned off by cross-validation, and that hence the program need not pursue it.  
复杂的参数。任何分裂不减少,整体上缺乏适合的一个因素cp未尝试。比如,用anova分裂,这意味着整体Rsquare必须增加cp的每一步。此参数的主要作用是节省计算时间,通过修剪,关闭分割,显然是不值得的。本质上,用户通知程序的任何分割不提高拟合cp可能会被修剪由交叉验证,并因此程序不需要追求它。


参数:maxcompete
the number of competitor splits retained in the output.  It is useful to know not just which split was chosen, but which variable came in second, third, etc.  
许多竞争对手拆分保留在输出中。知道不只是分裂是选择它是有用的,但变量排在第二,第三等


参数:maxsurrogate
the number of surrogate splits retained in the output.  If this is set to zero the compute time will be reduced, since approximately half of the computational time (other than setup) is used in the search for surrogate splits.  
的替代的数量分割保留在输出中。如果这被设置为零的计算时间将减少,由于约一半的计算时间(设置以外)中使用的搜索代理拆分。


参数:usesurrogate
how to use surrogates in the splitting process.  0 means display only; an observation with a missing value for the primary split rule is not sent further down the tree.  1 means use surrogates, in order, to split subjects missing the primary variable; if all surrogates are missing the observation is not split.  For value 2 ,if all surrogates are missing, then send the observation in the majority direction.  A value of 0 corresponds to the action of tree, and 2 to the recommendations of Breiman et.al.  
如何使用代理人在分裂过程中。 0是指只显示主要分割规则缺失值的观察与进一步下跌的树不会被发送。 1是指使用替代物,以分裂的主题缺少的主要变量,如果所有的代理人缺少的观察也不会被分割。值2,如果所有的代理人失踪,然后把观察在大多数方向。 0值对应的作用tree,2给布雷曼博士的建议,et.al.


参数:xval
number of cross-validations.  
一些交叉验证。


参数:surrogatestyle
controls the selection of a best surrogate. If set to 0 (default) the program uses the total number of correct classification for a potential surrogate variable, if set to 1 it uses the percent correct, calculated over the non-missing values of the surrogate. The first option more severely penalizes covariates with a large number of missing values.  
控制的最佳替代选择。如果设置为0(默认),计划使用的正确分类的总数为潜在的替代变量,如果设置为1使用正确,计算的非缺失值的替代。第一个选项更严厉的惩罚大量缺失值的协变量。


参数:maxdepth
Set the maximum depth of any node of the final tree, with the root node counted as depth 0.  Values greater than  30 rpart will give nonsense results on 32-bit machines.  
设置最终树的任一节点的最大深度,深度为0算作与根节点。值大于30 rpart,会给废话结果在32位机器上。


参数:...
mop up other arguments.  
拖把等参数。


值----------Value----------

A list containing the options.
一个列表,其中包含的选项。


参见----------See Also----------

rpart
rpart

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-26 03:55 , Processed in 0.023064 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表