model(BioSeqClass)
model()所属R语言包:BioSeqClass
Classification Models
分类模型
译者:生物统计家园网 机器人LoveR
描述----------Description----------
These functions build various classification models.
这些功能建立不同的分类模型。
用法----------Usage----------
classifyModelLIBSVM(train,svm.kernel="linear",svm.scale=FALSE)
classifyModelSVMLIGHT(train,svm.path,svm.options="-t 0")
classifyModelNB(train)
classifyModelRF(train)
classifyModelKNN(train, test, knn.k=1)
classifyModelTree(train)
classifyModelNNET(train, nnet.size=2, nnet.rang=0.7, nnet.decay=0, nnet.maxit=100)
classifyModelRPART(train)
classifyModelCTREE(train)
classifyModelCTREELIBSVM(train, test, svm.kernel="linear",svm.scale=FALSE)
classifyModelBAG(train)
参数----------Arguments----------
参数:train
a data frame including the feature matrix and class label. The last column is a vector of class label comprising of "-1" or "+1"; Other columns are features.
一个数据框,包括特征矩阵和类标号。最后一列是一个阶级标签的向量,“-1”或“+1”的组成;其他列的功能。
参数:svm.kernel
a string for kernel function of SVM.
内核SVM的函数的字符串。
参数:svm.scale
a logical vector indicating the variables to be scaled.
逻辑向量表示要缩放的变量。
参数:svm.path
a character for path to SVMlight binaries (required, if path is unknown by the OS).
的SVMlight二进制文件的路径(需要,如果路径是未知的操作系统)的特点。
参数:svm.options
Optional parameters to SVMlight. For further details see: "How to use" on http://svmlight.joachims.org/. (e.g.: "-t 2 -g 0.1"))
SVMlight可选参数。为进一步的详细信息,请参阅:“如何使用”上http://svmlight.joachims.org/~~V。 (例如:“-T-G 0.1”))
参数:nnet.size
number of units in the hidden layer. Can be zero if there are skip-layer units.
在隐藏层单位数目。如果有跳层单位,可以是零。
参数:nnet.rang
Initial random weights on [-rang, rang]. Value about 0.5 unless the inputs are large, in which case it should be chosen so that rang * max(|x|) is about 1.
初始随机权[响了,响了]。 *最大(价值约0.5除非投入大,在这种情况下,应选择使响| X |)1。
参数:nnet.decay
parameter for weight decay.
参数重量衰变。
参数:nnet.maxit
maximum number of iterations.
最大迭代次数。
参数:knn.k
number of neighbours considered in function classifyModelKNN.
在功能classifyModelKNN考虑的邻居数。
参数:test
a data frame including the feature matrix and class label. The last column is a vector of class label comprising of "-1" or "+1"; Other columns are features.
一个数据框,包括特征矩阵和类标号。最后一列是一个阶级标签的向量,“-1”或“+1”的组成;其他列的功能。
Details
详情----------Details----------
classifyModelLIBSVM builds support vector machine model by LibSVM. R package "e1071" is needed.
classifyModelLIBSVM LIBSVM支持向量机模型的基础上。 R包“e1071”是必要的。
classifyModelSVMLIGHT builds support vector machine model by SVMlight. R package "klaR" is needed.
classifyModelSVMLIGHT建立的SVMlight支持向量机模型。 R包“克拉尔”是必要的。
classifyModelNB builds naive bayes model. R package "klaR" is needed.
classifyModelNB建立Naive Bayes模型。 R包“克拉尔”是必要的。
classifyModelRF builds random forest model. R package "randomForest" is needed.
classifyModelRF建立随机森林模型。 R包“randomForest”是必要的。
classifyModelKNN builds k-nearest neighbor model. R package "class" is needed.
classifyModelKNN建立k-近邻模型。 R包“类”是必要的。
classifyModelTree builds tree model. R package "class" is needed.
classifyModelTree建立树模型。 R包“类”是必要的。
classifyModelRPART builds recursive partitioning trees model. R package "rpart" is needed.
classifyModelRPART建立递归分割的树木模型。 R包“软件rpart”的需要。
classifyModelCTREE builds conditional inference trees model. R package "party" is needed.
classifyModelCTREE建立有条件的推理树模型。 R包“党”是必要的。
classifyModelCTREELIBSVM combines conditional inference trees and support vecotr machine. R package "party" and "e1071" is needed.
classifyModelCTREELIBSVM结合有条件的推理树和支持vecotr机。 R包“党”和“e1071”是必要的。
classifyModelBAG uses bagging method. R package "ipred" is needed.
classifyModelBAG采用套袋方法。 R包“ipred”是必要的。
作者(S)----------Author(s)----------
Hong Li
举例----------Examples----------
## read positive/negative sequence from files.[#从文件中读取正/负序列。]
tmpfile1 = file.path(.path.package("BioSeqClass"), "example", "acetylation_K.pos40.pep")
tmpfile2 = file.path(.path.package("BioSeqClass"), "example", "acetylation_K.neg40.pep")
posSeq = as.matrix(read.csv(tmpfile1,header=FALSE,sep="\t",row.names=1))[,1]
negSeq = as.matrix(read.csv(tmpfile2,header=FALSE,sep="\t",row.names=1))[,1]
data = data.frame(rbind(featureBinary(posSeq,elements("aminoacid")),
featureBinary(negSeq,elements("aminoacid")) ),
class=c(rep("+1",length(posSeq)),
rep("-1",length(negSeq))) )
## sample train and test data[#样品的训练和测试数据]
tmp = c(sample(1:length(posSeq),length(posSeq)*0.8),
sample(length(posSeq)+(1:length(negSeq)),length(negSeq)*0.8))
train = data[tmp,]
test = data[-tmp,]
## Build classification model using training data[#建立分类模型,利用训练数据]
model1 = classifyModelLIBSVM(train,svm.kernel="linear",svm.scale=FALSE)
## Predict test data by classification model[#测试数据分类模型预测]
testClass = predict(model1, test[,-ncol(test)])
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|