imputation(rminer)
imputation()所属R语言包:rminer
Missing data imputation (e.g. substitution by value or hotdeck method).
缺失数据插补(例如替代由值或hotdeck方法)。
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Missing data imputation (e.g. substitution by value or hotdeck method).
缺失数据插补(例如替代由值或hotdeck方法)。
用法----------Usage----------
imputation(imethod = "value", D, Attribute = NULL, Missing = NA, Value = 1)
参数----------Arguments----------
参数:imethod
imputation method type:
算方法类型:
value – substitutes missing data by Value (with single element or several elements);
value - 替代丢失的数据Value(与单个元素或多个元素);
hotdeck – searches first the most similar example (i.e. using a k-nearest neighbor method – knn) in the dataset and replaces the missing data by the value found in such example;
hotdeck - 查找第一个最相似的例子(即使用k-近邻方法 - knn)的数据集,并取代丢失的数据的价值发现这样的例子;
参数:D
dataset with missing data (data.frame)
丢失的数据的数据集(数据框)
参数:Attribute
if NULL then all attributes (data columns) with missing data are replaced. Else, Attribute is the attribute number (numeric) or name (character).
如果NULL然后所有的属性(数据列)丢失的数据被替换。否则,Attribute是属性编号(数字)或名称(字符)。
参数:Missing
missing data symbol
丢失的数据符号
参数:Value
the substitution value (if imethod=value) or number of neighbors (k of knn).
替换值(如果imethod=value)或数字的邻居(K的knn)。
Details
详细信息----------Details----------
Check the references.
检查的参考。
值----------Value----------
A data.frame without missing data.
数据框不丢失数据。
(作者)----------Author(s)----------
Paulo Cortez <a href="http://www3.dsi.uminho.pt/pcortez">http://www3.dsi.uminho.pt/pcortez</a>
参考文献----------References----------
M. Brown and J. Kros.<br> Data mining and the impact of missing data.<br> In Industrial Management & Data Systems, 103(8):611-621, 2003.<br>
参见----------See Also----------
fit, factorize and delevels.
fit,factorize和delevels。
实例----------Examples----------
d=matrix(ncol=5,nrow=5)
d[1,]=c(5,4,3,2,1)
d[2,]=c(4,3,4,3,4)
d[3,]=c(1,1,1,1,1)
d[4,]=c(4,NA,3,4,4)
d[5,]=c(5,NA,NA,2,1)
d=data.frame(d); d[,3]=factor(d[,3])
print(d)
print(imputation("value",d,3,Value="3"))
print(imputation("value",d,2,Value=median(na.omit(d[,2]))))
print(imputation("value",d,2,Value=c(1,2)))
print(imputation("hotdeck",d,"X2",Value=1))
print(imputation("hotdeck",d,Value=1))
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|