create_container(RTextTools)
create_container()所属R语言包:RTextTools
creates a container for training, classifying, and analyzing documents.
创建一个容器进行训练,分类,和分析文件。
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Given a DocumentTermMatrix from the tm package and corresponding document labels, creates a container of class matrix_container-class that can be used for training and classification (i.e. train_model, train_models, classify_model, classify_models)
鉴于一个DocumentTermMatrix从tm的包和相应的文档标签,创建一个容器类matrix_container-class,可以用来进行训练和分类(即train_model,train_models ,classify_model,classify_models)
用法----------Usage----------
create_container(matrix, labels, trainSize=NULL, testSize=NULL, virgin)
参数----------Arguments----------
参数:matrix
A document-term matrix of class DocumentTermMatrix or TermDocumentMatrix from the tm package, or generated by create_matrix.
类的文件,术语矩阵DocumentTermMatrix或TermDocumentMatrix从tm包,或所产生的create_matrix。
参数:labels
A factor or vector of labels corresponding to each document in the matrix.
Afactor或vector的标签对应的矩阵中的每个文档。
参数:trainSize
A range (e.g. 1:1000) specifying the number of documents to use for training the models. Can be left blank for classifying corpora using saved models that don't need to be trained.
一个范围(如:1:1000)指定用于训练模型的文档的数量。可以留空分类语料库使用保存的模型,不需要进行培训。
参数:testSize
A range (e.g. 1:1000) specifying the number of documents to use for classification. Can be left blank for training on all data in the matrix.
一个范围(如:1:1000)指定的文件,以用于分类的。可以留空培训的矩阵中的所有数据。
参数:virgin
A logical (TRUE or FALSE) specifying whether to treat the classification data as virgin data or not.
逻辑(TRUE或FALSE)指定是否将作为原生数据或数据的分类。
值----------Value----------
A container of class matrix_container-class that can be passed into other functions such as train_model, train_models, classify_model, classify_models, and create_analytics.
一个容器类matrix_container-class可以传递到其他功能,如train_model,train_models,classify_model,classify_models和create_analytics。
(作者)----------Author(s)----------
Timothy P. Jurka <tpjurka@ucdavis.edu>, Loren Collingwood <lorenc2@uw.edu>
实例----------Examples----------
library(RTextTools)
data(NYTimes)
data <- NYTimes[sample(1:3100,size=100,replace=FALSE),]
matrix <- create_matrix(cbind(data["Title"],data["Subject"]), language="english",
removeNumbers=TRUE, stemWords=FALSE, weighting=weightTfIdf)
container <- create_container(matrix,data$Topic.Code,trainSize=1:75, testSize=76:100,
virgin=FALSE)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|