complexity.dust(R453Plus1Toolbox)
complexity.dust()所属R语言包:R453Plus1Toolbox
Sequence Complexity Using The DUST Algorithm
序列的复杂性,使用防尘算法
译者:生物统计家园网 机器人LoveR
描述----------Description----------
This function evaluates the sequence complexity using the DUST algorithm.
此函数计算序列的复杂性,使用防尘算法。
用法----------Usage----------
complexity.dust(object, xlab="Complexity score (0=high, 100=low)", ylab="Number of sequences",
xlim=c(0, 100), col="firebrick1", breaks=100, ...)
参数----------Arguments----------
参数:object
An object of class DNAStringSet, ShortRead or SFFContainer.
对象类DNAStringSet,ShortRead或SFFContainer。
参数:xlab
The X axis label.
X轴的标签。
参数:ylab
The Y axis label.
Y轴的标签。
参数:xlim
The limits of the X axis.
X轴的限制。
参数:col
The plotting color.
绘制的颜色。
参数:breaks
The number of breaks in the histogram (see "hist").
的在直方图截断数(见“历史”)。
参数:...
Arguments to be passed to methods, such as graphical parameters (see "par").
参数被传递到方法,如图形参数(见“面值”)。
Details
详情----------Details----------
The complexity score is based on how often different trinucleotides occur and is scaled between 0 and 100. A sequence of homopolymer repeats (e.g. TTTTTTTTTT) has a score of 100, of dinucleotide repeats (e.g. TATATATATA) has a score around 49, and of trinucleotide repeats (e.g. TAGTAGTAG) has a score around 32. Scores above seven can be considered low-complexity.
往往是不同的三核苷酸发生的复杂性得分是基于0和100之间缩放。均聚物重复序列(如TTTTTTTTTT)的核苷酸重复的得分为100,(如TATATATATA)大约有49的比分,三核苷酸重复(如TAGTAGTAG)大约有32得分。上述七个分数可以考虑低复杂度。
值----------Value----------
A numeric vector containing the complexity score for each sequence.
一个数字的向量,为每个序列的复杂性得分。
作者(S)----------Author(s)----------
Christian Ruckert
参考文献----------References----------
Bioinformatics, 2011 Mar 15;27(6):863-4.
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|