找回密码
 注册
查看: 476|回复: 0

R语言 RTextTools包 create_container()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-9-28 22:41:03 | 显示全部楼层 |阅读模式
create_container(RTextTools)
create_container()所属R语言包:RTextTools

                                         creates a container for training, classifying, and analyzing documents.
                                         创建一个容器进行训练,分类,和分析文件。

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Given a DocumentTermMatrix from the tm package and corresponding document labels, creates a container of class matrix_container-class that can be used for training and classification (i.e. train_model, train_models, classify_model, classify_models)
鉴于一个DocumentTermMatrix从tm的包和相应的文档标签,创建一个容器类matrix_container-class,可以用来进行训练和分类(即train_model,train_models ,classify_model,classify_models)


用法----------Usage----------


create_container(matrix, labels, trainSize=NULL, testSize=NULL, virgin)



参数----------Arguments----------

参数:matrix
A document-term matrix of class DocumentTermMatrix or TermDocumentMatrix from the tm package, or generated by create_matrix.  
类的文件,术语矩阵DocumentTermMatrix或TermDocumentMatrix从tm包,或所产生的create_matrix。


参数:labels
A factor or vector of labels corresponding to each document in the matrix.  
Afactor或vector的标签对应的矩阵中的每个文档。


参数:trainSize
A range (e.g. 1:1000) specifying the number of documents to use for training the models. Can be left blank for classifying corpora using saved models that don't need to be trained.  
一个范围(如:1:1000)指定用于训练模型的文档的数量。可以留空分类语料库使用保存的模型,不需要进行培训。


参数:testSize
A range (e.g. 1:1000) specifying the number of documents to use for classification. Can be left blank for training on all data in the matrix.  
一个范围(如:1:1000)指定的文件,以用于分类的。可以留空培训的矩阵中的所有数据。


参数:virgin
A logical (TRUE or FALSE) specifying whether to treat the classification data as virgin data or not.  
逻辑(TRUE或FALSE)指定是否将作为原生数据或数据的分类。


值----------Value----------

A container of class matrix_container-class that can be passed into other functions such as train_model, train_models, classify_model, classify_models, and create_analytics.
一个容器类matrix_container-class可以传递到其他功能,如train_model,train_models,classify_model,classify_models和create_analytics。


(作者)----------Author(s)----------



Timothy P. Jurka <tpjurka@ucdavis.edu>, Loren Collingwood <lorenc2@uw.edu>




实例----------Examples----------


library(RTextTools)
data(NYTimes)
data <- NYTimes[sample(1:3100,size=100,replace=FALSE),]
matrix <- create_matrix(cbind(data["Title"],data["Subject"]), language="english",
removeNumbers=TRUE, stemWords=FALSE, weighting=weightTfIdf)
container <- create_container(matrix,data$Topic.Code,trainSize=1:75, testSize=76:100,
virgin=FALSE)

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-28 01:43 , Processed in 0.028267 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表