找回密码
 注册
查看: 279|回复: 0

R语言 rrcovHD包 OutlierMahdist()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-9-28 20:36:11 | 显示全部楼层 |阅读模式
OutlierMahdist(rrcovHD)
OutlierMahdist()所属R语言包:rrcovHD

                                         Outlier identification using robust (mahalanobis) distances based on robust multivariate location and covariance matrix
                                         离群点识别使用强大的强大的多元分布的位置和协方差矩阵的基础上的距离(马氏)

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

This function uses the Mahalanobis distance as a basis for  multivariate outlier detection. The standard method for multivariate  outlier detection is robust estimation of the parameters in the  Mahalanobis distance and the comparison with a critical value  of the Chi2 distribution (Rousseeuw and Van Zomeren, 1990).
此功能使用马氏距离为基础,多元的孤立点检测。多元离群点检测的标准方法是稳健估计的马氏距离和比较χ^ 2分布的临界值(Rousseeuw凡Zomeren,1990)中的参数。


用法----------Usage----------


    OutlierMahdist(x, ...)
    ## Default S3 method:
OutlierMahdist(x, grouping, control, trace=FALSE, ...)
    ## S3 method for class 'formula'
OutlierMahdist(formula, data, ..., subset, na.action)



参数----------Arguments----------

参数:formula
a formula with no response variable, referring only to numeric variables.
没有响应变量的公式,只给数值变量。


参数:data
an optional data frame (or similar: see model.frame) containing the variables in the formula formula.
一个可选的数据框(或相似:model.frame),其中包含公式formula中的变量。


参数:subset
an optional vector used to select rows (observations) of the data matrix x.
的可选的向量选择行(观察)的数据矩阵x。


参数:na.action
a function which indicates what should happen when the data contain NAs.  The default is set by the na.action setting of options, and is na.fail if that is unset. The default is na.omit.
一个函数,它表示当数据包含NA的,应该发生什么。默认设置是由na.action的options,是na.fail,如果是没有设置的。默认的na.omit。


参数:...
arguments passed to or from other methods.
传递的参数或其他方法。


参数:x
a matrix or data frame.  
一个矩阵或数据框。


参数:grouping
grouping variable:  a factor specifying the class for each observation.
分组变量:指定一个类为每个观测的一个因素。


参数:control
a control object (S4) for one of the available control classes, e.g. CovControlMcd-class, CovControlOgk-class, CovControlSest-class, etc., containing estimation options. The class of this object defines which estimator will be used. Alternatively a character string can be specified which names the estimator - one of auto, sde, mcd, ogk, m, mve, sfast, surreal, bisquare, rocke. If 'auto' is specified or the argument is missing, the function will select the estimator (see below for details)
一个可用的控件类,例如一个控制对象(S4) CovControlMcd-class,CovControlOgk-class,的CovControlSest-class等,估计选项。这个对象的类定义了将被用于的估计。另外一个字符串,可以指定命名的估计 - 之一:汽车,SDE,MCD,OGK,M,MVE,sfast,超现实主义,bisquare,rocke。如果“自动”指定的参数丢失时,该功能将选择的估计(详情见下文)


参数:trace
whether to print intermediate results. Default is trace = FALSE
是否要打印的中间结果。默认是trace = FALSE


Details

详细信息----------Details----------

If the data set consists of two or more classes  (specified by the grouping variable grouping) the proposed method iterates through the classes present in the data, separates each class from the rest and identifies the outliers relative to this class, thus treating both types of outliers, the mislabeled and the abnormal samples in a homogenous way.
如果数据集是由两个或多个类(指定分组变量grouping)所提出的方法遍历数据中存在的类,其余分隔每个类,并确定相对于这一类的离群值,在一个同质的方式对待这两种类型的异常值,标示错误和异常样本。

The estimation method is selected by the control object control.  If a character string naming an estimator is specified, a new control object will be created and used (with default estimation options). If this argument is missing or a character string 'auto' is specified, the function will select the robust estimator according to the size of the dataset - for details see CovRobust.
选择控制对象control估计方法。指定,如果字符串命名的估计是,一个新的控制对象被创建,(默认估计选项)。如果此参数丢失或指定一个字符串“自动”,该功能将根据数据集的大小选择可靠的估计 - 有关详细信息,请参阅CovRobust。


值----------Value----------

An S4 object of class OutlierMahdist which  is a subclass of the virtual class Outlier.
S4对象的类OutlierMahdist这是虚拟类Outlier的一个子类。


(作者)----------Author(s)----------


Valentin Todorov <a href="mailto:valentin.todorov@chello.at">valentin.todorov@chello.at</a>




参考文献----------References----------

Unmasking multivariate outliers and leverage points.  Journal of the American Statistical Association.  Vol. 85(411), pp. 633-651.
Robust Regression and Outlier Detection. Wiley.
A fast algorithm for the minimum covariance determinant estimator. Technometrics 41, 212&ndash;223.
An Object Oriented Framework for Robust Multivariate Analysis. Journal of Statistical Software, 32(3), 1&ndash;47. URL http://www.jstatsoft.org/v32/i03/.
Robust tools for the imperfect world,  To appear.

实例----------Examples----------



data(hemophilia)
obj <- OutlierMahdist(gr~.,data=hemophilia)
obj

getDistance(obj)            # returns an array of distances[返回一个数组的距离]
getClassLabels(obj, 1)      # returns an array of indices for a given class[对于一个给定的类,返回一个数组的索引]
getCutoff(obj)              # returns an array of cutoff values (for each class, usually equal)[返回一个数组的临界值(每类,通常等于)]
getFlag(obj)                #  returns an 0/1 array of flags[返回一个0/1阵列的标志]
plot(obj, class=2)          # standard plot function[标准的绘图功能]

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-26 20:26 , Processed in 0.023231 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表