CSAR-package(CSAR)
CSAR-package()所属R语言包:CSAR
Statistical tools for the analysis of ChIP-seq data
统计的SEQ芯片的数据分析工具
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Statistical tools for ChIP-seq data analysis.<br> The package is oriented to plant organisms, and compatible with standard file formats in the plant research field.
芯片的SEQ数据分析的统计工具。参考的封装为导向,以植物的生物体,并与在植物研究领域中的标准文件格式兼容。
Details
详情----------Details----------
作者(S)----------Author(s)----------
Jose M Muino
Maintainer: Jose M Muino <jose.muino@wur.nl>
参考文献----------References----------
举例----------Examples----------
##For this example we will use the a subset of the SEP3 ChIP-seq data (Kaufmann, 2009)[#在这个例子中,我们将使用的SEP3的ChIP-seq的数据的一个子集(考夫曼,2009)]
data("CSAR-dataset");
##We calculate the number of hits for each nucleotide posotion for the control and sample. We do that just for chromosome chr1, and for positions 1 to 10kb[#我们计算每个核苷酸posotion为控制和样品的点击次数。我们只是做染色体chr1的职位1到10KB]
nhitsS<-mappedReads2Nhits(sampleSEP3_test,file="sampleSEP3_test",chr=c("CHR1v01212004"),chrL=c(10000))
nhitsC<-mappedReads2Nhits(controlSEP3_test,file="controlSEP3_test",chr=c("CHR1v01212004"),chrL=c(10000))
##We calculate a score for each nucleotide position[#我们计算每个核苷酸的位置得分]
test<-ChIPseqScore(control=nhitsC,sample=nhitsS)
##We calculate the candidate read-enriched regions[我们计算候选人读富集区域的#]
win<-sigWin(test)
##We generate a wig file of the results to visualize tehm in a genome browser[#我们生成的结果的的假发文件,可视化在基因组浏览器的tehm]
score2wig(test,file="test.wig")
##We calculate relative positions of read-enriched regions regarding gene position[#我们计算的阅读富集区域的相对位置有关的基因的位置]
d<-distance2Genes(win=win,gff=TAIR8_genes_test)
##We calculate table of genes with read-enriched regions, and their location[#我们计算表只读丰富的区域,基因和它们的位置]
genes<-genesWithPeaks(d)
##We calculate two sets of read-enrichment scores through permutation[#我们计算通过置换两种套读富集分数]
permutatedWinScores(nn=1,sample=sampleSEP3_test,control=controlSEP3_test,fileOutput="test",chr=c("CHR1v01212004"),chrL=c(100000))
permutatedWinScores(nn=2,sample=sampleSEP3_test,control=controlSEP3_test,fileOutput="test",chr=c("CHR1v01212004"),chrL=c(100000))
###Next function will get all permutated score values generated by permutatedWinScores function. [#下一步的功能将得到所有permutated得分由permutatedWinScores功能产生价值。]
##This represent the score distribution under the null hypotesis and therefore it can be use to control the error of our test.[#这代表得分空hypotesis下的分布,因此可以用它来控制我们的测试错误。]
nulldist<-getPermutatedWinScores(file="test",nn=1:2)
##From this distribution, several cut-off values can be calculated to control the error of our test. [#从这个分布,几个临界值,可以计算来控制我们的测试错误。]
##Several functions in R can be used for this purpose.[#R中的几个功能,可用于这一目的。]
##In this package we had implemented a simple method for the control of the error based on FDR"[#在这个包中,我们已实施了FDR基于错误控制的简单方法“]
getThreshold(winscores=win$score,permutatedScores=nulldist,FDR=.01)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|