threads(tm.plugin.mail)
threads()所属R语言包:tm.plugin.mail
E-Mail Threads
电子邮件主题
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Extract threads (i.e., chains of messages on a single subject) from e-mail documents.
从e-mail文件中提取线程(例如,一个单一的主题链上的消息)。
用法----------Usage----------
threads(x)
参数----------Arguments----------
参数:x
A corpus consisting of e-mails (MailDocuments).
的语料库的e-mail(MailDocument)。
Details
详细信息----------Details----------
This function uses a one-pass algorithm for extracting the thread information. I.e., reply mails appearing before their corresponding base mails are not detected, and are tagged with thread id NA and depth 2.
这个函数的线程信息提取算法使用了一通。即出现之前其相应的基本邮件,回复邮件未检测到,并且与线程idNA和深度2的标签。
值----------Value----------
A list with the two named components ThreadID and ThreadDepth, listing a thread and the level of replies for each mail in the corpus x.
两个命名的部分列表ThreadID和ThreadDepth,列出一个线程,并在语料库中x回复每封邮件。
(作者)----------Author(s)----------
Ingo Feinerer
实例----------Examples----------
require("tm")
newsgroup <- system.file("mails", package = "tm.plugin.mail")
news <- Corpus(DirSource(newsgroup), readerControl = list(reader = readMail))
sapply(news, ID)
lapply(news, function(x) grep("In-Reply-To", attr(x, "Header"), value = TRUE))
threads(news)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|