intPhred(girafe)
intPhred()所属R语言包:girafe
Extract integer Phred score values from FastQ data
从FastQ数据提取整数PHRED得分值
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Function to extract integer Phred score values from FastQ data.
从FastQ数据提取的的整数PHRED得分值的函数。
用法----------Usage----------
intPhred(x, method="Sanger", returnType="list")
参数----------Arguments----------
参数:x
object of class ShortReadQ; which contains read sequences and quality scores; usually read in from a Fastq files.
类对象ShortReadQ;其中包含读取的序列和质量分值;通常在从Fastq文件阅读。
参数:method
string; one of 'Sanger', 'Solexa' or 'previousSolexa'. See details below.
字符串;“桑格”,“公司Solexa或previousSolexa。详见下文。
参数:returnType
string; in which format should the result be returned, either as a 'list' or as a 'matrix'.
字符串中的格式返回结果,无论是作为一个列表,或矩阵。
Details
详情----------Details----------
There are different standards for encoding read qualities in Fastq files. The 'Sanger' format encodes a Phred quality score from 0 to 93 using ASCII 33 to 126. The current 'Solexa'/llumina format (1.3 and higher) encodes a Phred quality score from 0 to 40 using ASCII 64 to 104. The 'previous Solexa'/Illumina format (1.0) encodes a custom Solexa/Illumina quality score from -5 to 40 using ASCII 59 to 104. This custom Solexa quality score is approximately equal to the Phred scores for high qualities, but differs in the low quality range.
编码Fastq文件的只读素质有不同的标准。 “桑格”格式编码使用ASCII 33到126 PHRED质量得分从0到93。目前,公司Solexa“/ llumina的格式(1.3和更高版本)编码使用ASCII 64到104从0至40 PHRED质量得分。 “以前公司Solexa / Illumina的格式(1.0)编码自定义公司Solexa / Illumina公司从-5到40使用ASCII 59到104的质量得分。这个自定义的公司Solexa质量得分是约等于高品质PHRED的成绩,但在低质量的范围有所不同。
值----------Value----------
If returnType is equal to "list": A list of integer Phred quality values of the same length as the number of reads in the object x.
returnType如果是平等的“列表”:数量相同长度的整数PHRED质量值列表对象x读取。
If returnType is equal to "matrix": A matrix of integer Phred quality values. The number of rows is the number of reads in the object x. The number of columns is the maximum length (width) over all reads in object x. The last entries for reads that are shorter than this maximum width are 'NA'.
如果returnType是平等的“矩阵”:一个的整数PHRED的质量值矩阵。行数是读取对象x的数量。列数是对所有对象x读取的最大长度(宽度)。读取最后一个条目是短于这个最大宽度是不适用。
作者(S)----------Author(s)----------
Joern Toedling
参考文献----------References----------
参见----------See Also----------
ShortReadQ-class,
ShortReadQ-class
举例----------Examples----------
exDir <- system.file("extdata", package="girafe")
ra <- readFastq(dirPath=exDir, pattern=
"aravinSRNA_23_plus_adapter_excerpt.fastq")
ra.quals <- intPhred(ra, method="Sanger",
returnType="matrix")
ra.qmed <- apply(ra.quals, 2, median)
plot(ra.qmed, type="h", ylim=c(0,42), xlab="Base postion",
ylab="Median Phred Quality Score", lwd=2, col="steelblue")
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|