pumaClust(puma)
pumaClust()所属R语言包:puma
Propagate probe-level uncertainty in model-based clustering on gene expression data
基因表达数据传播探针在基于模型的聚类水平的不确定性
译者:生物统计家园网 机器人LoveR
描述----------Description----------
This function clusters gene expression using a Gaussian mixture model including probe-level measurement error. The inputs are gene expression levels and the probe-level standard deviation associated with expression measurement for each gene on each chip. The outputs is the clustering results.
此功能聚类基因的表达,使用高斯混合模型包括探针级测量误差。输入基因表达水平,并为每个芯片上的每个基因表达测量探针级标准偏差。输出聚类结果。
用法----------Usage----------
pumaClust(e=NULL, se=NULL, efile=NULL, sefile=NULL,
subset=NULL, gsnorm=FALSE, clusters,
iter.max=100, nstart=10, eps=1.0e-6, del0=0.01)
参数----------Arguments----------
参数:e
either a valid ExpressionSet object, or a data frame containing the expression level for each gene on each chip.
一个有效的ExpressionSet对象,或一个数据框包含每个芯片上的每个基因的表达水平。
参数:se
data frame containing the standard deviation of gene expression levels.
数据框包含的基因表达水平的标准偏差。
参数:efile
character, the name of the file which contains gene expression measurements.
字符,名称的文件,其中包含基因表达测量。
参数:sefile
character, the name of the file which contains the standard deviation of gene expression measurements.
字符,名称的文件,其中包含的基因表达测量标准偏差。
参数:subset
vector specifying the row number of genes which are clustered on.
指定行数的基因聚集的向量。
参数:gsnorm
logical specifying whether do global scaling normalisation or not.
逻辑指定是否做全球或不缩放标准化。
参数:clusters
integer, the number of clusters.
整数,数字聚类。
参数:iter.max
integer, the maximum number of iterations allowed in the parameter initialisation.
整数,允许在参数初始化的迭代的最大数量。
参数:nstart
integer, the number of random sets chosen in the parameter initialisation.
整数,选择在参数初始化随机集的数量。
参数:eps
numeric, optimisation parameter.
数字,优化参数。
参数:del0
numeric, optimisation parameter.
数字,优化参数。
Details
详情----------Details----------
The input data is specified either as an ExpressionSet object (in which case se, efile and sefile will be ignored), or by e and se, or by efile and sefile.
输入数据被指定为ExpressionSet对象(在这种情况下,SE,电子文件和sefile将被忽略),或通过E和硒,或通过电子文件和sefile。
值----------Value----------
The result is a list with components
结果是一个组件列表
cluster: vector, containing the membership of clusters for each gene; centers: matrix, the center of each cluster; centersigs: matrix, the center variance of each cluster; likelipergene: matrix, the likelihood of belonging to each cluster for each gene; bic: numeric, the Bayesian Information Criterion score.
聚类:向量,含有每个基因簇成员;中心:矩阵,每个聚类的中心; centersigs,每个聚类的中心方差矩阵; likelipergene:矩阵,属于每个聚类的每个基因的可能性; BIC :数字,贝叶斯信息准则的得分。
作者(S)----------Author(s)----------
Xuejun Liu, Magnus Rattray
参考文献----------References----------
Propagating probe-level uncertainty in model-based gene expression clustering, BMC Bioinformatics, 8(98).
Affymetrix probe-level analysis across multiple chips, Bioinformatics, 21(18):3637-3644.
参见----------See Also----------
Related method mmgmos and pumaClustii
相关方法mmgmos和pumaClustii
举例----------Examples----------
data(Clust.exampleE)
data(Clust.exampleStd)
pumaClust.example<-pumaClust(Clust.exampleE,Clust.exampleStd,clusters=7)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|