SnowballStemmer(Snowball)
SnowballStemmer()所属R语言包:Snowball
R/Weka Snowball Stemmer
R / Weka中雪球施特默
译者:生物统计家园网 机器人LoveR
描述----------Description----------
R interface to Weka's Snowball stemmers.
R接口WEKA的雪球词干。
用法----------Usage----------
SnowballStemmer(x, control = NULL)
参数----------Arguments----------
参数:x
a character vector with words to be stemmed.
字符向量的话被遏制。
参数:control
an object of class Weka_control, or a character vector of control options, or NULL (default). Available options can be obtained on-line using the Weka Option Wizard WOW, or the Weka documentation.
对象的类Weka_control,或一个字符矢量控制选项,或NULL(默认)。可用的选项可以使用在WEKA选项向导WOW,或在WEKA文档上线。
Details
详细信息----------Details----------
The Snowball stemmers contain the Porter stemmer and several other stemmers for different languages. See http://snowball.tartarus.org/ for more information.
雪球词干包含的波特词干分析器和其他几个不同语言的词干。请参见http://snowball.tartarus.org/的详细信息。
SnowballStemmer is an interface to Weka's wrapper classes for the Java version of the Snowball stemmers. The corresponding jar cannot be included in package RWeka due to license restrictions, and hence is made available via the separate package Snowball.
SnowballStemmer WEKA的包装类Java版本的雪球词干是一个接口。不能包含在相应的jar包RWeka由于牌照的限制,因此可以通过单独的套件“Snowball。
The Omegahat package Rstem provides an R interface to a C version of Porter's word stemming algorithm.
Omegahat包Rstem提供了一个R接口波特的词干算法的C版本。
值----------Value----------
A character vector with the stemmed words.
字符向量与词根的单词。
参见----------See Also----------
Other R interfaces to Weka stemmers (RWeka\_stemmers)
R接口Weka中的词干(RWeka \ _stemmers)
实例----------Examples----------
## Test the supplied vocabulary for the default stemmer ('porter'):[#测试的默认词干提取器(“搬运工”)所提供的词汇表:]
source <- readLines(system.file("words", "porter","voc.txt",
package = "Snowball"))
result <- SnowballStemmer(source)
target <- readLines(system.file("words", "porter", "output.txt",
package = "Snowball"))
## Any differences?[#什么不同吗?]
any(result != target)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|