impKNNa(robCompositions)
impKNNa()所属R语言包:robCompositions
Imputation of missing values in compositional data using knn methods
归责成分数据的缺失值使用KNN方法
译者:生物统计家园网 机器人LoveR
描述----------Description----------
This function offers several k-nearest neighbor methods for the imputation of missing values in compositional data.
此功能提供了几种k-近邻成分数据的缺失值的插补方法。
用法----------Usage----------
impKNNa(x, method = "knn", k = 3, metric = "Aitchison", agg = "median",
primitive = FALSE, normknn = TRUE, das = FALSE, adj="median")
参数----------Arguments----------
参数:x
data frame or matrix
数据框或矩阵
参数:method
method (at the moment, only “knn” can be used)
方法(目前,只有“KNN”可以使用)
参数:k
number of nearest neighbors chosen for imputation
选择最近的邻居的数量归集
参数:metric
“Aichison” or “Euclidean”
的“Aichison”或“欧几里德”
参数:agg
“median” or “mean”, for the aggregation of the nearest neighbors
“中间”或“的意思是”,为聚合的近邻
参数:primitive
if TRUE, a more enhanced search for the $k$-nearest neighbors is obtained (see details)
如果为true,更增强了搜索的$ k $近邻(见详情)
参数:normknn
An adjustment of the imputed values is performed if TRUE
调整的估算值,如果TRUE
参数:das
depricated. if TRUE, the definition of the Aitchison distance, based on simple logratios of the compositional part, is used (Aitchison, 2000) to calculate distances between observations. if FALSE, a version using the clr transformation is used.
DEPRICATED。如果为true,定义的的艾奇逊距离,简单的对数比的组成部分,用于(艾吉森,2000年)来计算观测值之间的距离。如果为FALSE,使用CLR转型的一个版本。
参数:adj
either "median" (default) or "sum" can be chosen for the adjustment of the nearest neighbors, see Hron et al., 2010.
无论是“中位数”(默认)或和可以选择的调整,最近的邻居,看到HRON等人,2010年。
Details
详细信息----------Details----------
The Aitchison metric should be chosen when dealing with compositional data, the Euclidean metric otherwise.
处理时,应选择成分数据,欧氏metric否则的艾奇逊metric。
If primitive == FALSE, a sequential search for the k-nearest neighbors is applied for every missing value where all information corresponding to the non-missing cells plus the information in the variable to be imputed plus some additional information is available. If primitive == TRUE, a search of the k-nearest neighbors among observations is applied where in addition to the variable to be imputed any further cells are non-missing.
如果primitive==FALSE,k近邻顺序搜索是适用于每一个遗失值对应的所有信息不可缺失的单元,再加上变量中的信息是归咎于再加上一些额外的信息是可用的。如果primitive==TRUEk最近邻居之间的意见的搜索应用,除了必须估算的变量,任何进一步的单元是不可缺失的。
If normknn is TRUE (prefered option) the imputed cells from a nearest neighbor method are adjusted with special adjustment factors (more details can be found online (see the references)).
如果normknn是TRUE(首选方案)的估算单元的最近邻方法进行调整与特殊调整因子(更多详细信息,可以在网上找到(请参阅参考资料))。
值----------Value----------
参数:xOrig
Original data frame or matrix
原始数据框或矩阵
参数:xImp
Imputed data
估算数据
参数:w
Amount of imputed values
额的估算值
参数:wind
Index of the missing values in the data
在数据中的缺失值指数
参数:metric
Metric used
使用的度量单位
(作者)----------Author(s)----------
Matthias Templ
参考文献----------References----------
Logratio analysis and compositional distance, Mathematical Geology 32(3):271-275.
Computational Statistics and Data Analysis, vol 54 (12), pages 3095-3107.
参见----------See Also----------
impCoda
impCoda
实例----------Examples----------
data(expenditures)
x <- expenditures
x[1,3]
x[1,3] <- NA
xi <- impKNNa(x)$xImp
xi[1,3]
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|