khan2001(sda)
khan2001()所属R语言包:sda
Childhood Cancer Study of Khan et al. (2001)
儿童癌症研究汗等。 (2001)
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Gene expression data (2308 genes for 88 samples) from the microarray study of Khan et al. (2001).
Khan等人的研究从微阵列的基因表达数据(2308基因的88个样本)。 (2001)。
用法----------Usage----------
data(khan2001)
格式----------Format----------
khan2001$x is a 88 x 2308 matrix containing the expression levels. Note that rows correspond to samples, and columns to genes. The row names are the original image IDs, and the column names the orginal probe labels.
khan2001$x是一个88×2308矩阵中的表达水平。请注意,行对应于样品,和列的基因。该行的名称是原始图像的ID,列名的原价探针标签。
khan2001$y is a factor containing the diagnosis for each sample ("BL", "EWS", "NB", "non-SRBCT", "RMS").
khan2001$y是含有对每个样品的诊断(“BL”,“EWS”,“NB”,“非SRBCT”,“RMS”)的一个因素。
khan2001$descr provides some annotation for each gene.
khan2001$descr每个基因提供了一些注解。
Details
详细信息----------Details----------
This data set contains measurements of the gene expression of 2308 genes for 88 observations: 29 cases of Ewing sarcoma (EWS), 11 cases of Burkitt lymphoma (BL), 18 cases of neuroblastoma (NB), 25 cases of rhabdomyosarcoma (RMS), and 5 other (non-SRBCT) samples.
该数据集包含2308个基因的88次观测的基因表达:29例尤文氏肉瘤(EWS),11例为Burkitt淋巴瘤(BL),18例神经母单元瘤(NB),25例横纹肌肉瘤(RMS)的测量,和其他(非SRBCT)样本。
源----------Source----------
The data are described in Khan et al. (2001) and can be obtained from http://cbbp.thep.lu.se/pub/Preprints/01/lu_tp_01_06_supp.html. Note that the values in khan.data$x are additionally logarithmized (using natural log) for normalization.
Khan等人描述的数据。 (2001)和,可以从http://cbbp.thep.lu.se/pub/Preprints/01/lu_tp_01_06_supp.html。注意,这个值在khan.data$x附加logarithmized的()标准化使用天然log。
参考文献----------References----------
Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks. Nature Medicine 7:673–679.
实例----------Examples----------
# load sda library[加载SDA库]
library("sda")
# load full Khan et al (2001) data set[加载满汗等人(2001)的数据集]
data(khan2001)
dim(khan2001$x) # 88 2308[88 2308]
hist(khan2001$x)
khan2001$y # 5 levels[5级]
# data set containing the SRBCT samples[数据集包含SRBCT样本]
get.srbct = function()
{
data(khan2001)
idx = which( khan2001$y == "non-SRBCT" )
x = khan2001$x[-idx,]
y = factor(khan2001$y[-idx])
descr = khan2001$descr[-idx]
list(x=x, y=y, descr=descr)
}
srbct = get.srbct()
dim(srbct$x) # 83 2308[83 2308]
hist(srbct$x)
srbct$y # 4 levels[4级]
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|