找回密码
 注册
查看: 715|回复: 0

R语言 maanova包 macluster()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-25 23:55:43 | 显示全部楼层 |阅读模式
macluster(maanova)
macluster()所属R语言包:maanova

                                        Clustering analysis for Microarray experiment
                                         微阵列实验的聚类分析

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

This function bootstraps K-means or hierarchical clusters and builds a  consensus tree (consensus group for K-means) from the bootstrap result.
此功能白手起家的K-means或层次聚类,并建立了一个共识,从引导的结果树(共识的K-means组)。


用法----------Usage----------


macluster(anovaobj, term, idx.gene, what = c("gene", "sample"),
    method = c("hc", "kmean"), dist.method = "correlation",
    hc.method = "ward", kmean.ngroups, n.perm = 100)



参数----------Arguments----------

参数:anovaobj
The result object for fitting ANOVA model.
拟合方差分析模型的结果对象。


参数:term
The factor (in formula) used in clustering. The expression level for this term will be used in clustering. This term has to  correspond to the gene list, e.g, idx.gene in this function. The gene list should be the significant hits in testing this term.
聚类因子(公式)。对这个词的表达水平,将用于聚类。这个词有对应的基因列表,例如,在此功能idx.gene。基因名单应该在测试这个术语的重大命中。


参数:idx.gene
A vector indicating the list of differentially expressed genes. The expression level of these genes will be used to construct the cluster.
一个向量表示的差异表达基因的列表。这些基因的表达水平,将用于兴建聚类。


参数:what
What to be clustered, either gene or sample.
什么聚类,无论是基因或样本。


参数:method
The clustering method. Right now hierarchical clustering ("hc") and K-means ("kmean") are available.
聚类分析方法。眼下层次聚类(“HC”)和K-means(“kmean”)提供。


参数:dist.method
Distance measure to be used in hierarchical clustering. Besides the methods listed in dist, there is a new method "correlation" (default). The "correlation" distance equals to (1 - $r^2$), where r is the sample correlation between observations.  
层次聚类距离度量。方法除了dist上市,是一种新的方法“相关性”(默认)。 “相关性”的距离等于(1  -  $ R ^ 2美元),其中r是观测之间的样本相关。


参数:hc.method
The agglomeration method to be used in hierarchical clustering. See hclust for detail.
结块的方法要使用层次聚类。看到hclust细节。


参数:kmean.ngroups
The number of groups for K-means cluster.
的K-means聚类的群体数量。


参数:n.perm
Number of bootstraps. If it is 1, this function will cluster the observed data. If it is bigger than 1, a bootstrap will be performed.
对白手起家的数目。如果是1,这个函数将聚类中的观测数据。如果是大于1,将执行一个引导。


Details

详情----------Details----------

Normally after the F test, user can select a list of differentially expressed genes. The next step is to investigate the relationship among these genes. Using the expression levels of these genes, the user can cluster the genes or the samples using either hierarchical or K-means clustering algorithm. In order to evaluate the stability of the relationship, this function bootstraps the data, re-fits the model and recluster the genes/samples. Then for a certain number of bootstrap iterations, say, 1000, we have 1000 cluster results. We can use consensus to  build the consensus tree from these 1000 trees.
一般F检验后,用户可以选择的差异表达基因的列表。下一步就是要研究这些基因之间的关系。用户可以使用这些基因的表达水平,聚类的基因样本,使用或分层或K-means聚类算法。以评估稳定的关系,此功能引导数据,重新适合的模型和重新聚类基因/样本。然后,我们的引导迭代一定数量,说,1000有1000个聚类结果。我们可以使用consensus建立共识树1000株。

Note that if you have a large number (say, more than 100) of genes/samples to cluster, hierarchical clustering could be very unstable. A slight change in the data can result in a big change in the tree structure. In that case, K-means will give better results.
请注意,如果你有大量的基因/样品(例如,超过100个)聚类,层次聚类可能是非常不稳定的。数据中的微小变化可能会导致在一个树结构中的大的变化。在这种情况下,K-均值将得到更好的结果。


值----------Value----------

An object of class macluster.
对象类macluster。


作者(S)----------Author(s)----------


Hao Wu



参见----------See Also----------

hclust, kmeans, consensus
hclust,kmeans,consensus


举例----------Examples----------


# load in data[数据加载]
data(abf1)
# fit the anova model[符合方差分析模型]
## Not run: [#无法运行:]
fit.fix = fitmaanova(abf1,formula = ~Strain)
# test Strain effect [测试应变效应]
test.fix = matest(abf1, fit.fix, term="Strain",n.perm= 1000)
# pick significant genes - pick the genes selected by Fs test[挑显着的基因 - 接由呋喃试验选定的基因]
idx <- volcano(test.fix)$idx.Fs
# do k-means cluster on genes[不&#311;是指在基因簇]
gene.cluster <- macluster(fit.fix, term="Strain", idx, what="gene",
   method="kmean", kmean.ngroups=5, n.perm=100)
# get the consensus group[获得共识组]
consensus(gene.cluster, 0.5)

# HC cluster on samples[慧聪聚类样本]
sample.cluster <- macluster(fit.fix, term="Strain", idx, what="sample",method="hc")
# get the consensus group[获得共识组]
consensus(sample.cluster, 0.5)
## End(Not run)[#结束(不运行)]

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-2-4 14:53 , Processed in 0.023522 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表