mmseg4j(rmmseg4j)
mmseg4j()所属R语言包:rmmseg4j
Chinese Word Segmentation
中文分词
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Chinese word segmentation based on mmseg4j
中文分词的基础上mmseg4j
用法----------Usage----------
mmseg4j(text, method = c("complex", "maxword", "simple"), dicDir = NULL)
参数----------Arguments----------
参数:text
A string vector
一个字符串向量
参数:method
Method of segmentation
分割方法
参数:dicDir
Directory of user provided dictionary. If NULL, it sets to userDic in the root besides the default dictionaries.
目录用户提供字典。如果为NULL,它集userDic的根目录中除了默认的字典。
Details
详细信息----------Details----------
It is a wrapper function to a Java Chinese analyser mmseg4j-1.8.4 http://code.google.com/p/mmseg4j/, which works for simplified Chinese only.
它是一个Java中文仪mmseg4j-1.8.4 http://code.google.com/p/mmseg4j/的,简化中国唯一的一个包装函数。
值----------Value----------
A string vector similar to text, with space between Chinese words.
一个字符串,矢量文字,与中国话之间的空间。
(作者)----------Author(s)----------
Ronggui HUANG
实例----------Examples----------
## Use the following command to open the example file[#使用下面的命令来打开示例文件]
## then you can copy and paste the commands into R[#然后你可以复制和粘贴命令到R]
## file.show(file.path(path.package("rmmseg4j"),"mmseg4jExample.R"))[:#file.show(file.path(path.package(“rmmseg4j),的”mmseg4jExample.R“))]
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|