找回密码
 注册
查看: 886|回复: 0

R语言 crlmm包 genotype.Illumina()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-25 16:03:14 | 显示全部楼层 |阅读模式
genotype.Illumina(crlmm)
genotype.Illumina()所属R语言包:crlmm

                                         Preprocessing and genotyping of Illumina Infinium II arrays.
                                         Illumina的Infinium II阵列的预处理和基因型。

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Preprocessing and genotyping of Illumina Infinium II arrays.
Illumina的Infinium II阵列的预处理和基因型。


用法----------Usage----------


genotype.Illumina(sampleSheet=NULL, arrayNames=NULL, ids=NULL, path=".",
      arrayInfoColNames=list(barcode="SentrixBarcode_A", position="SentrixPosition_A"),
      highDensity=FALSE, sep="_", fileExt=list(green="Grn.idat", red="Red.idat"),
      cdfName, copynumber=TRUE, batch, saveDate=TRUE, stripNorm=TRUE, useTarget=TRUE,
      mixtureSampleSize=10^5, fitMixture=TRUE, eps =0.1, verbose = TRUE, seed = 1,
      sns, probs = rep(1/3, 3), DF = 6, SNRMin = 5, recallMin = 10, recallRegMin = 1000,
      gender = NULL, returnParams = TRUE, badSNP = 0.7)



参数----------Arguments----------

参数:sampleSheet
data.frame containing Illumina sample sheet information (for required columns, refer to BeadStudio Genotyping guide - Appendix A).
data.frame含有Illumina的样品表信息(所需的列,请参阅BeadStudio基因分型指南 - 附录A)。


参数:arrayNames
character vector containing names of arrays to be read in.  If NULL, all arrays that can be found in the specified working directory will be read in.
包含数组的名字被读入。如果NULL,可以在指定的工作目录中找到的所有阵列将读入的字符向量


参数:ids
vector containing ids of probes to be read in.  If NULL all probes found on the first array are read in.
向量的探针被读入,如果NULL上发现的第一个数组的所有探针都读入的ID


参数:path
character string specifying the location of files to be read by the function
字符串功能读取指定文件的位置


参数:arrayInfoColNames
(used when sampleSheet is specified) list containing elements 'barcode' which indicates column names in the sampleSheet which contains the arrayNumber/barcode number and 'position' which indicates the strip number.  In older style sample sheets, this information is combined (usually in a column named 'SentrixPosition') and this should be specified as list(barcode=NULL, position="SentrixPosition")
(用时sampleSheet指定)包含元素的条码“表示sampleSheet其中包含的arrayNumber /条码号和”立场“表示条数列名的列表。在旧式的样品表,此信息相结合(通常在一列名为“SentrixPosition”),这应作为list(barcode=NULL, position="SentrixPosition")指定


参数:highDensity
logical (used when sampleSheet is specified). If TRUE, array extensions '\_A', '\_B' in sampleSheet are replaced with 'R01C01', 'R01C02' etc.
逻辑(当sampleSheet指定使用)。如果TRUE,阵列扩展\ _A,\ _B“在sampleSheet取代R01C01,R01C02”等。


参数:sep
character string specifying separator used in .idat file names.
字符串指定分隔符使用。IDAT文件名。


参数:fileExt
list containing elements 'Green' and 'Red' which specify the .idat file extension for the Cy3 and Cy5 channels.
列表,其中包含元素的绿色和红指定文件扩展名。IDAT Cy3和Cy5通道。


参数:cdfName
annotation package  (see also validCdfNames)
注释包(又见validCdfNames)


参数:copynumber
'logical.' Whether to store copy number intensities with SNP output.  
“逻辑。”是否存储拷贝数与SNP输出强度。


参数:batch
batch variable. See details.
批处理中的变量。查看详情。


参数:saveDate
'logical'.  Should the dates from each .idat be saved with sample information?
“逻辑”。应该从每个。IDAT日期与样品信息被保存?


参数:stripNorm
'logical'.  Should the data be strip-level normalized?
“逻辑”。应的数据带,规范化水平?


参数:useTarget
'logical' (only used when stripNorm=TRUE). Should the reference HapMap intensities be used in strip-level normalization?
“逻辑”(只用时stripNorm=TRUE)。应参考HapMap的强度,可用于带钢水平标准化?


参数:mixtureSampleSize
Sample size to be use when fitting the mixture model.
样本大小必须使用混合模型拟合时。


参数:fitMixture
'logical.' Whether to fit per-array mixture model.
“逻辑。”是否适合每个阵列的混合模型。


参数:eps
   Stop criteria.
停止条件。


参数:verbose
  'logical.'  Whether to print descriptive messages during processing.
“逻辑。”是否打印在加工过程中的描述信息。


参数:seed
Seed to be used when sampling. Useful for reproducibility
种子取样时要使用。有用的重复性


参数:sns
The sample identifiers.  If missing, the default sample names are basename(filenames)
样品标识。如果缺少,默认样品名称basename(filenames)


参数:probs
'numeric' vector with priors for AA, AB and BB.
“数字”的向量为AA,AB和BB的前科。


参数:DF
'integer' with number of degrees of freedom to use with t-distribution.
“整数”数度自由使用t分布。


参数:SNRMin
'numeric' scalar defining the minimum SNR used to filter out samples.
“数字”标定义的最小SNR用筛选出的样本。


参数:recallMin
Minimum number of samples for recalibration.  
校准样品的最低数量。


参数:recallRegMin
Minimum number of SNP's for regression.
最低数量的SNP的回归。


参数:gender
  integer vector (  male = 1, female =2 ) or missing, with same length as filenames.  If missing, the gender is predicted.
整数向量(男= 1女= 2)或失踪作为文件名的长度相同。如果丢失,性别进行了预测。


参数:returnParams
'logical'. Return recalibrated parameters from crlmm.
“逻辑”。返回从crlmm重新调整参数。


参数:badSNP
'numeric'. Threshold to flag as bad SNP (affects batchQC)
“数字”。阈值,不好的SNP标志(影响batchQC)


Details

详情----------Details----------

For large datasets it is important to utilize the large data support by installing and loading the ff package before calling the genotype function. In previous versions of the crlmm package, we used different functions for genotyping depending on whether the ff package is loaded, namely genotype and genotype2.  The genotype function now handles both instances.
对于大型数据集,重要的是利用大量的数据支持,通过安装genotype函数之前调用加载FF包。在以前版本的crlmm包,我们使用不同功能的基因分型,取决于是否FF加载包,即genotype和genotype2。现在的genotype函数处理的两个实例。

genotype.Illumina is a wrapper of the crlmm function for genotyping.  Differences include (1) that the copy number probes (if present) are also quantile-normalized and (2) the class of object returned by this function, CNSet, is needed for subsequent copy number estimation.  Note that the batch variable that must be passed to this function has no effect on the normalization or genotyping steps.  Rather, batch is required in order to initialize a CNSet container with the appropriate dimensions.
genotype.Illumina是crlmm功能基因分型的包装。差异包括:(1)拷贝数探针(如果存在)也位数标准化和(2)类的对象,由这个函数返回,CNSet,为随后的拷贝数估计需要。需要注意的是,必须传递给这个函数批处理变量标准化或基因型步骤没有影响。相反,batch需要以CNSet容器初始化适当的尺寸,。


值----------Value----------

A SnpSuperSet instance.
一个SnpSuperSet实例。


注意----------Note----------

For large datasets, load the 'ff' package prior to genotyping – this will greatly reduce the RAM required for big jobs.  See
对于大型数据集,加载FF包之前,基因分型 - 这将大大减少大的工作所需的RAM。见


作者(S)----------Author(s)----------


Matt Ritchie



参考文献----------References----------

R/Bioconductor software for Illumina's Infinium whole-genome  genotyping BeadChips. Bioinformatics. 2009 Oct 1;25(19):2621-3.
normalization, and genotype calls of high-density oligonucleotide SNP array data. Biostatistics. 2007 Apr;8(2):485-99. Epub 2006 Dec 22. PMID: 17189563.
Quantifying uncertainty in genotype calls. Bioinformatics. 2010 Jan 15;26(2):242-9.

参见----------See Also----------

crlmmIlluminaV2,  ocSamples, ldOpts
crlmmIlluminaV2,ocSamples,ldOpts


举例----------Examples----------


  ##[#]

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-2-12 15:21 , Processed in 0.026591 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表