找回密码
 注册
查看: 563|回复: 0

R语言 crlmm包 crlmmIlluminaV2()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-25 16:03:05 | 显示全部楼层 |阅读模式
crlmmIlluminaV2(crlmm)
crlmmIlluminaV2()所属R语言包:crlmm

                                        Read and Genotype Illumina Infinium II BeadChip data with CRLMM
                                         阅读和基因型Illumina的Infinium二BeadChip数据CRLMM

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Implementation of the CRLMM algorithm for data from Illumina's Infinium II BeadChips.
数据从Illumina公司的Infinium二BeadChips CRLMM算法的实现。


用法----------Usage----------



crlmmIlluminaV2(sampleSheet=NULL, arrayNames=NULL, ids=NULL, path=".",
      arrayInfoColNames=list(barcode="SentrixBarcode_A", position="SentrixPosition_A"),
      highDensity=FALSE, sep="_", fileExt=list(green="Grn.idat", red="Red.idat"),
      saveDate=FALSE, stripNorm=TRUE, useTarget=TRUE,
      row.names=TRUE, col.names=TRUE, probs=c(1/3, 1/3, 1/3),
      DF=6, SNRMin=5, gender=NULL, seed=1, mixtureSampleSize=10^5,
      eps=0.1, verbose=TRUE, cdfName, sns, recallMin=10,
      recallRegMin=1000, returnParams=FALSE, badSNP=.7)



参数----------Arguments----------

参数:sampleSheet
data.frame containing Illumina sample sheet information (for required columns, refer to BeadStudio Genotyping guide - Appendix A).
data.frame含有Illumina的样品表信息(所需的列,请参阅BeadStudio基因分型指南 - 附录A)。


参数:arrayNames
character vector containing names of arrays to be read in.  If NULL, all arrays that can be found in the specified working directory will be read in.
包含数组的名字被读入。如果NULL,可以在指定的工作目录中找到的所有阵列将读入的字符向量


参数:ids
vector containing ids of probes to be read in.  If NULL all probes found on the first array are read in.
向量的探针被读入,如果NULL上发现的第一个数组的所有探针都读入的ID


参数:path
character string specifying the location of files to be read by the function
字符串功能读取指定文件的位置


参数:arrayInfoColNames
(used when sampleSheet is specified) list containing elements 'barcode' which indicates column names in the sampleSheet which contains the arrayNumber/barcode number and 'position' which indicates the strip number.  In older style sample sheets, this information is combined (usually in a column named 'SentrixPosition') and this should be specified as list(barcode=NULL, position="SentrixPosition")
(用时sampleSheet指定)包含元素的条码“表示sampleSheet其中包含的arrayNumber /条码号和”立场“表示条数列名的列表。在旧式的样品表,此信息相结合(通常在一列名为“SentrixPosition”),这应作为list(barcode=NULL, position="SentrixPosition")指定


参数:highDensity
logical (used when sampleSheet is specified). If TRUE, array extensions '\_A', '\_B' in sampleSheet are replaced with 'R01C01', 'R01C02' etc.
逻辑(当sampleSheet指定使用)。如果TRUE,阵列扩展\ _A,\ _B“在sampleSheet取代R01C01,R01C02”等。


参数:sep
character string specifying separator used in .idat file names.
字符串指定分隔符使用。IDAT文件名。


参数:fileExt
list containing elements 'Green' and 'Red' which specify the .idat file extension for the Cy3 and Cy5 channels.
列表,其中包含元素的绿色和红指定文件扩展名。IDAT Cy3和Cy5通道。


参数:saveDate
'logical'.  Should the dates from each .idat be saved with sample information?
“逻辑”。应该从每个。IDAT日期与样品信息被保存?


参数:stripNorm
'logical'.  Should the data be strip-level normalized?
“逻辑”。应的数据带,规范化水平?


参数:useTarget
'logical' (only used when stripNorm=TRUE). Should the reference HapMap intensities be used in strip-level normalization?
“逻辑”(只用时stripNorm=TRUE)。应参考HapMap的强度,可用于带钢水平标准化?


参数:row.names
'logical'. Use rownames - SNP names?
“逻辑”。使用rownames  - 单核苷酸多态性的名字吗?


参数:col.names
'logical'. Use colnames - Sample names?
“逻辑”。使用colnames  - 样品的名字吗?


参数:probs
'numeric' vector with priors for AA, AB and BB.
“数字”的向量为AA,AB和BB的前科。


参数:DF
'integer' with number of degrees of freedom to use with t-distribution.
“整数”数度自由使用t分布。


参数:SNRMin
'numeric' scalar defining the minimum SNR used to filter out samples.
“数字”标定义的最小SNR用筛选出的样本。


参数:gender
'integer' vector, with same length as 'filenames', defining sex. (1 - male; 2 - female)
“整数”的向量,为“文件名”定义性别,相同长度的。 (1  - 男 - 女2)


参数:seed
'integer' scalar for random number generator (used to sample mixtureSampleSize SNPs for mixture model.
“整数”标量随机数发生器(用于采样mixtureSampleSize混合模型的SNPs。


参数:mixtureSampleSize
'integer'. The number of SNP's to be used when fitting the mixture model.
“整数”。装修时要使用的混合模型SNP的数量。


参数:eps
Minimum change for mixture model.
混合模型的最小变化。


参数:verbose
'logical'.
“逻辑”。


参数:cdfName
'character' defining the chip annotation (manifest) to use ('human370v1c', human550v3b', 'human650v3a', 'human1mv1c', 'human370quadv3c', 'human610quadv1b', 'human660quadv1a', 'human1mduov3b', 'humanomni1quadv1b', 'humanomniexpress12v1b', 'humancytosnp12v2p1h')
字符定义芯片的注解(列表)使用(human370v1c,human550v3b,human650v3a“,”human1mv1c,human370quadv3c,human610quadv1b“,”human660quadv1a,human1mduov3b“,”humanomni1quadv1b,humanomniexpress12v1b ,humancytosnp12v2p1h“)


参数:sns
'character' vector with sample names to be used.
样品名称要使用“字符”向量。


参数:recallMin
'integer'. Minimum number of samples for recalibration.
“整数”。校准样品的最低数量。


参数:recallRegMin
'integer'. Minimum number of SNP's for regression.
“整数”。最低数量的SNP的回归。


参数:returnParams
'logical'. Return recalibrated parameters.
“逻辑”。返回重新调整参数。


参数:badSNP
'numeric'. Threshold to flag as bad SNP (affects batchQC)
“数字”。阈值,不好的SNP标志(影响batchQC)


Details

详情----------Details----------

This function combines the reading of data from idat files using readIdatFiles and genotyping to reduce memory usage.
此功能结合使用readIdatFiles和基因分型,以减少内存使用数据IDAT文件阅读。


值----------Value----------

A SnpSet object which contains
一个SnpSet对象,其中包含


参数:calls
Genotype calls (1 - AA, 2 - AB, 3 - BB)
的基因型分型(1  -  AA,2  -  AB公司,3  -  BB的)


参数:callProbability
confidence scores 'round(-1000*log2(1-p))'
信心分数“轮(-1000 *为log2(1-P))”

in the assayData slot and
assayData插槽和


参数:SNPQC
SNP Quality Scores
SNP的质量得分


参数:batchQC
Batch Quality Scores
批次的质量得分

along with center and scale parameters when returnParams=TRUE in the featureData slot.
随着中心和尺度参数时returnParams=TRUEfeatureData插槽。


作者(S)----------Author(s)----------


Matt Ritchie



参考文献----------References----------

R/Bioconductor software for Illumina's Infinium whole-genome genotyping BeadChips. Bioinformatics. 2009 Oct 1;25(19):2621-3.
normalization, and genotype calls of high-density oligonucleotide SNP array data. Biostatistics. 2007 Apr;8(2):485-99. Epub 2006 Dec 22. PMID: 17189563.
Quantifying uncertainty in genotype calls. Bioinformatics. 2010 Jan 15;26(2):242-9.

参见----------See Also----------

crlmmIllumina
crlmmIllumina


举例----------Examples----------


## crlmmOut = crlmmIlluminaV2(samples,path=path,arrayInfoColNames=list(barcode="Chip",position="Section"),[#crlmmOut = crlmmIlluminaV2(样品,路径=路径,arrayInfoColNames =列表(条码=“芯片”,位置=“节”),]
##                             saveDate=TRUE,cdfName="human370v1c",returnParams=TRUE)[#saveDate = TRUE时,cdfName =“human370v1c”,returnParams = TRUE)]


转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-2-12 12:12 , Processed in 0.056234 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表