找回密码
 注册
查看: 603|回复: 0

R语言 gage包 gse16873()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-25 18:23:40 | 显示全部楼层 |阅读模式
gse16873(gage)
gse16873()所属R语言包:gage

                                         GSE16873: a breast cancer microarray dataset
                                         GSE16873:乳腺癌基因芯片数据集

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

GSE16873 is a breast cancer study (Emery et al, 2009) downloaded from Gene Expression Omnibus (GEO). GSE16873 covers twelve patient cases, each with HN (histologically normal), ADH (ductal hyperplasia), and DCIS (ductal carcinoma in situ) RMA samples. Due to the size limit of this package, we split this GSE16873 into two halves, each including 6 patients with their HN and DCIS but not ADH tissue types. This gage package only includes the first half dataset for 6 patients as this example dataset gse16873. Most of our demo analyses are done on the first half dataset, except for the advanced analysis where we use both halves datasets with all 12 patients. Details section below gives more information.
GSE16873是乳腺癌研究(金刚砂等,2009),从基因表达的综合(GEO)的下载。 GSE16873涵盖了12个病人的情况下,每个HN(组织学正常),乙醇脱氢酶(导管增生),原位癌(导管原位癌)的RMA样品。由于这个包的大小的限制,我们分成两部分,每个包括他们的HN和原位癌6例,但不ADH的组织类型GSE16873。此规包只包括6例如集gse16873患者为上半年的数据集。我们的演示分析上半年数据,除了先进的分析,我们所有12例患者使用两个半集。细节部分给出了更多的信息。


用法----------Usage----------


data(gse16873)



Details

详情----------Details----------

Raw data for these two half datasets were processed separately using two different methods, FARMS and RMA, respectively to generate the non-biological data heterogeneity. The first half dataset is named as gse16873, the second half dataset named gse16873.2. We also have the full dataset, gse16873.full, which includes all HN, ADH and DCIS samples of all 12 patients, processed together using FARMS. The second half dataset plus the full dataset and the original BMP6 dataset used in GAGE paper and earlier versions of gage is supplied with another package, gageData.
这两个半集的原始数据进行处理,分别使用两种不同的方法,农场和RMA,分别产生的非生物数据异质性。上半年数据集被命名为gse16873,下半年集名为gse16873.2。我们也有完整的数据集,gse16873.full,其中包括所有12个病人,处理一起使用农场的所有HN,ADH和DCIS样本。下半年的数据集,加上完整的数据集和原BMP6量具纸和早期版本的规使用的数据集提供了另一个包,gageData。


源----------Source----------

GEO Dataset GSE16873: <URL: http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE16873>
GEO数据集GSE16873:<URL: http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE16873>


参考文献----------References----------

Morenas A, Sebastiani P, Rosenberg CL: Early dysregulation of cell adhesion and extracellular matrix pathways in breast cancer progression. Am J Pathol 2009, 175:1292-302.

举例----------Examples----------


data(gse16873)
#check the heterogenity of the two half datasets[检查两个半集的异质性]
boxplot(data.frame(gse16873))

#column/smaple names[列/ smaple名称]
cn=colnames(gse16873)
hn=grep('HN',cn, ignore.case =TRUE)
adh=grep('ADH',cn, ignore.case =TRUE)
dcis=grep('DCIS',cn, ignore.case =TRUE)
print(hn)
print(dcis)

data(kegg.gs)
lapply(kegg.gs[1:3],head)
head(rownames(gse16873))
gse16873.kegg.p <- gage(gse16873, gsets = kegg.gs,
    ref = hn, samp = dcis)

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-2-8 09:54 , Processed in 0.028529 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表