找回密码
 注册
查看: 895|回复: 0

R语言 qrqc包 readSeqFile()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-26 11:42:39 | 显示全部楼层 |阅读模式
readSeqFile(qrqc)
readSeqFile()所属R语言包:qrqc

                                        Read and Summarize a Sequence (FASTA or FASTQ) File
                                         阅读和总结序列(FASTA或FASTQ)的文件

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

readSeqFile reads a FASTQ or FASTA file, summarizing the nucleotide distribution across position (cycles) and the sequence length distributions. If type is "fastq", the distribution of qualities across position will also be recorded. If hash is TRUE, the unique sequences will be hashed with counts of their frequency.
readSeqFile读取FASTQ或FASTA文件,总结了各地核苷酸分布的位置(周期)和序列长度分布。如果type是fastq“,跨位置分布素质也将被记录。 hash如果是TRUE,独特的序列将其频率计数哈希。


用法----------Usage----------


  readSeqFile(filename, type='fastq', max.length=1000,
              quality='illumina', hash=TRUE, verbose=FALSE)



参数----------Arguments----------

参数:filename
the name of the file which the sequences are to be read from.
文件被读出序列的名称。


参数:type
either "fastq" or "fasta", representing the type of the file. FASTQ files will have the quality distribution by position summarized.
无论是“fastq或FASTA”,代表文件类型。 FASTQ文件将总结由质量分布位置。


参数:max.length
the largest sequence length likely to be encountered. For efficiency, a matrix larger than the largest sequence is allocated to *this* size in C, populated, and then trimmed in R. Specifying a value too small will lead to an error and the function will need to be re-run.
可能遇到的最大的序列长度。为了提高效率,大于最大序列矩阵分配给*在C *大小,填充,然后在R指定一个值太小修剪会导致错误和功能,将需要重新运行。


参数:quality
either "illumina", "phred", or "solexa", this determines the quality offsets and range. See the values of QUALITY.CONSTANTS for more information.
要么“Illumina公司”,“PHRED”,或“公司Solexa”,这个决定的质量偏移和范围。看到的更多信息QUALITY.CONSTANTS的值。


参数:hash
a logical value indicating whether to hash sequences
一个逻辑值表明是否哈希序列


参数:verbose
a logical value indicating whether be verbose (in the C backend).
一个逻辑值,该值指示是否详细(在C后端)。


值----------Value----------

An S4 object of FASTQSummary or FASTASummary containing the summary statistics.
一个S4对象FASTQSummary或FASTASummary包含汇总统计。


作者(S)----------Author(s)----------


Vince Buffalo <vsbuffalo@ucdavis.edu>



参见----------See Also----------

FASTQSummary and FASTASummary are the classes of the objects returned by readSeqFile.
FASTQSummary和FASTASummary由readSeqFile返回的对象的类。

plotBases is a function that plots the distribution of bases over sequence length for a particular FASTASummary or FASTQSummary object. plotGC combines and plots the GC proportion.
plotBases是一个功能的碱基序列的长度超过一个特定的FASTASummary或FASTQSummary对象的分布图。 plotGC结合和图的GC比例。

plotQuals is a function that plots the distribution of qualities over sequence length for a particular FASTASummary or FASTQSummary object.
plotQuals是一个函数,素质特定FASTASummary或FASTQSummary对象序列的长度分布图。

plotSeqLengths is a function that plots a histogram of sequence lengths for a particular FASTASummary or FASTQSummary object.
plotSeqLengths是一个函数,绘制直方图序列的长度为特定FASTASummary或FASTQSummary对象。


举例----------Examples----------


  ## Load a FASTQ file, with sequence hashing.[#装入FASTQ的文件,序列的哈希。]
  s.fastq <- readSeqFile(system.file('extdata', 'test.fastq', package='qrqc'))

  ## Load a FASTA file, without sequence hashing.[#装入一个FASTA文件,没有序列散列。]
  s.fasta <- readSeqFile(system.file('extdata', 'test.fasta', package='qrqc'),
                         type='fasta', hash=FALSE)


转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-1-31 21:03 , Processed in 0.024819 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表