summarizeByAnnotation(Genominator)
summarizeByAnnotation()所属R语言包:Genominator
Summarize data based on genome annotation.
基于基因组注释的汇总数据。
译者:生物统计家园网 机器人LoveR
描述----------Description----------
This function creates a summarization of columns of the data using specified SQLite functions, applying these summarization function to regions defined in an annotation data frame.
这个函数创建一个使用指定的SQLite功能的数据的列的总结,运用这些总结功能注释数据框中定义的区域。
用法----------Usage----------
summarizeByAnnotation(expData, annoData,
what = getColnames(expData, all = FALSE), fxs = c("TOTAL"),
groupBy = NULL, splitBy = NULL, ignoreStrand = FALSE, bindAnno = FALSE,
preserveColnames = TRUE, verbose = getOption("verbose"))
参数----------Arguments----------
参数:expData
An object of class ExpData.
对象类ExpData。
参数:annoData
A data frame which must contain the columns chr, start, end and strand which specifies annotation regions of interest.
一个数据框,其中必须包含列chr,start,end和strand指定利益注释区域。
参数:what
Vector of names of data columns to be summarized.
矢量数据列的名称来概括。
参数:fxs
Vector of strings giving the names of SQLite functions to call on the data column(s).
矢量给SQLite的功能调用的数据列(S)的名称的字符串。
参数:groupBy
Character vector refering to a column in annoData. Regions will be aggregated over distinct values of this column. Setting this argument will set bindAnno to TRUE. If splitBy is set, meta.id will override.
参考列在annoData特征向量。区域将聚集超过此列的不同值。设置此参数将设置bindAnnoTRUE。如果splitBy,meta.id将覆盖。
参数:splitBy
String indicating column of annoData object on which to split results.
annoData对象的字符串,表示列上分裂的结果。
参数:ignoreStrand
Logical indicating whether strand should be taken into account in aggregation. If TRUE strand will be ignored.
逻辑说明是否应考虑在聚合链。如果TRUE链将被忽略。
参数:bindAnno
Logical indicating whether annotation information should be included in the output.
逻辑表示注释信息是否应包括在输出。
参数:preserveColnames
Logical indicating whether column names should be preserved. Only possible when a single function is being applied.
逻辑表明是否列名应予以保留。唯一可能的,当一个函数被应用。
参数:verbose
Logical indicating whether details should be printed.
逻辑说明是否应印有细节。
Details
详情----------Details----------
Most of the computation is done using SQLite. Depending on the use case, this approach may be significantly faster and use much less memory than the alternative: use splitByAnnotation to retrieve a list with all the data and then use R to summarize over each element of the list. It is (naturally) constrained to the use of operations expressible in (SQLite) SQL.
最重要的是计算使用SQLite。根据使用的情况下,这种方法可能是速度明显加快,并用远低于替代的记忆:使用splitByAnnotation检索所有数据的列表,然后使用R总结列表中的每个元素。它是(自然)约束的使用操作(SQLite的)SQL表达。
If meta.id is set to a column in annoData, all regions with the same value of the meta.id will be joined together; a standard use case is labelleing exons of a gene.
如果meta.id设置到annoData列,相同的值与meta.id的所有区域将联手一种标准的使用案例labelleing的一个基因外显子。
值----------Value----------
If splitBy is not specified, returns a data frame containing results of aggregation functions performed on each region defined in annoData. If splitBy is specified, returns a list of data frames with one entry for each unique value of the column which was split on.
如果splitBy没有被指定,返回含有annoData定义每个区域进行聚合函数的结果的一个数据框。如果splitBy指定每个唯一值的列分裂的一个条目,返回一个数据框的列表。
作者(S)----------Author(s)----------
James Bullard <a href="mailto:bullard@berkeley.edu">bullard@berkeley.edu</a>, Kasper Daniel
Hansen <a href="mailto:khansen@jhsph.edu">khansen@jhsph.edu</a>
参考文献----------References----------
http://www.sqlite.org/lang_aggfunc.html has details on what
参见----------See Also----------
See Genominator vignette for more information, as well as the ExpData-class.
见更多信息Genominator小插曲,以及ExpData-class。
举例----------Examples----------
ed <- ExpData(system.file(package = "Genominator", "sample.db"),
tablename = "raw")
data("yeastAnno")
summarizeByAnnotation(ed, yeastAnno[1:50,])
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|