generateData(RDRToolbox)
generateData()所属R语言包:RDRToolbox
Simulator for gene expression data
基因表达数据的模拟器
译者:生物统计家园网 机器人LoveR
描述----------Description----------
A simulator for gene expression data, whose values are normally distributed values with zero mean. The covariances are given by a configurable block-diagonal matrix. By default, half of the samples contain differential gene expression values (see parameter diffsamples).
基因表达数据,其值是正态分布的均值为零值的模拟器。协方差给出了一个可配置的块对角矩阵。默认情况下,一半的样本含有基因差异表达值(见参数diffsamples)。
用法----------Usage----------
generateData(samples=50, genes=10000, diffgenes=200, blocksize=50, cov1=0.2, cov2=0, diff=0.6, diffsamples)
参数----------Arguments----------
参数:samples
number of samples
样本数
参数:genes
number of gene expression values per sample
每个样品基因表达的数字值
参数:diffgenes
number of differential genes for class 1
差异表达基因的数目为1级
参数:blocksize
size of each block in the blockdiagonal correlation matrix
每个块的大小在的blockdiagonal相关矩阵
参数:cov1
covariance within the blocks in the correlation matrix
协内的相关矩阵块
参数:cov2
covariance between the blocks in the correlation matrix
协之间的相关矩阵块
参数:diff
difference between the random gene expression values and the differential gene expression values
随机基因表达的价值和差异表达基因值的差异
参数:diffsamples
number of samples containing differential gene expression values compared to the rest (if missing, this parameter is set to half of the total number of samples)
样本含有基因差异表达的数字值相比,其余的(如果缺少此参数设置为样本总数的一半)
Details
详情----------Details----------
The simulator generates two labeled classes:<br> label 1: samples with differentially expressed genes. <br> label -1: samples without differentially expressed genes.
模拟器会生成两个标记的类:参考标签1:差异表达的基因样本。参考-1标签:无差异表达的基因样本。
值----------Value----------
'generateData' returns a list containing:
“generateData返回一个列表,其中包含:
参数:data
a (samples x features)-matrix with the simulated gene expression values
(标本x的函数)基因的表达与模拟值矩阵
参数:labels
a vector with labels (1,-1) for the two classes
两个班为向量标签(1,-1)
作者(S)----------Author(s)----------
Christoph Bartenhagen
举例----------Examples----------
## generate a dataset with 20 samples and 1.000 gene expression values[#生成一个有20个样品和1.000基因表达值的数据集。]
d = generateData(samples=20, genes=1000, diffgenes=100, blocksize=10)
data = d[[1]]
labels = d[[2]]
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|