kNN(VIM)
kNN()所属R语言包:VIM
k-Nearest Neighbour Imputation
k-最近邻插补
译者:生物统计家园网 机器人LoveR
描述----------Description----------
k-Nearest Neighbour Imputation based on a variation of the Gower Distance for numerical, categorical, ordered and semi-continous variables.
k-最近邻插补根据高尔距离的数值,分类,有序和半连续变量的变化。
用法----------Usage----------
kNN(data, variable = colnames(data), metric = NULL, k = 5,
dist_var = colnames(data), weights = NULL, numFun = median,
catFun = maxCat, makeNA = NULL, NAcond = NULL, impNA = TRUE,
donorcond = NULL, mixed = vector(), trace = FALSE, imp_var = TRUE,
imp_suffix = "imp", addRandom = FALSE)
sampleCat(x)
maxCat(x)
gowerD(data.x, data.y = data.x, weights = NULL, numerical, factors,
orders, mixed, levOrders)
which.minN(x, n)
参数----------Arguments----------
参数:data
data.frame or matrix
数据框或矩阵
参数:variable
variables where missing values should be imputed
变量的缺失值应归咎于
参数:metric
metric to be used for calculating the distances between
度量可用于计算之间的距离
参数:k
number of Nearest Neighbours used
最近的邻居使用数
参数:dist_var
names or variables to be used for distance calculation
用于距离计算中要使用的变量名称或
参数:weights
weights for the variables for distance calculation
用于距离计算的变量的权重
参数:numFun
function for aggregating the k Nearest Neighbours in the case of a numerical variable
在箱子数值变量k最近邻居聚合函数
参数:catFun
function for aggregating the k Nearest Neighbours in the case of a categorical variable
功能聚集k最近邻居分类变量的情况下,
参数:makeNA
vector of values, that should be converted to NA
向量的值,应转换为NA
参数:NAcond
a condition for imputing a NA
归咎于一个NA的条件
参数:impNA
TRUE/FALSE whether NA should be imputed
TRUE / FALSE是否适用应归咎于
参数:donorcond
condition for the donors e.g. ">5"
捐助者如条件“> 5”
参数:trace
TRUE/FALSE if additional information about the imputation process should be printed
TRUE / FALSE如果额外信息的归集过程中应印
参数:imp_var
TRUE/FALSE if a TRUE/FALSE variables for each imputed variable should be created show the imputation status
TRUE / FALSE如果一个TRUE / FALSE变量的每一个估算变量应建立归集状态
参数:imp_suffix
suffix for the TRUE/FALSE variables showing the imputation status
后缀的归集状态TRUE / FALSE变量的
参数:addRandom
TRUE/FALSE if an additional random variable should be added for distance calculation
TRUE / FALSE,如果距离计算应增加额外的随机变量
参数:x
factor or character vector / numerical vector for which.minN
因素或字符向量/数字矢量which.minN
参数:data.x
data frame or matrix
数据框或矩阵
参数:data.y
data frame or matrix
数据框或矩阵
参数:numerical
names of numerical variables
数值变量的名称
参数:factors
names of factors
名的因素
参数:orders
names of ordered variables
有序变量的名字
参数:mixed
names of mixed variables
混合变量的名称
参数:levOrders
list of the ordered levels for each factor
每个因子的排列的水平列表
参数:n
number of ordered smallest values
数有序的最小值
Details
详细信息----------Details----------
The function sampleCat samples with probabilites corresponding to the occurrence of the level in the NNs. The function maxCat chooses the level with the most occurrences and random if the maximum is not unique. The function gowerD is used by kNN to compute the distances for numerical, factor ordered and semi-continous variables. The function which.minN is used by kNN.
的的功能sampleCat样品发生竞争人工神经网络的水平在相应于与probabilites。的的功能maxCat选择的事件和随机如果不是唯一的,最大的是。因子的功能所使用的kNN gowerD进行数值计算的距离,有序和半连续变量。的功能所使用的kNN which.minN。
值----------Value----------
the imputed data set.
的估算数据。
(作者)----------Author(s)----------
Alexander Kowarik
实例----------Examples----------
data(sleep)
kNN(sleep)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|