找回密码
 注册
查看: 365|回复: 0

R语言 sparcl包 HierarchicalSparseCluster()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-9-30 12:25:11 | 显示全部楼层 |阅读模式
HierarchicalSparseCluster(sparcl)
HierarchicalSparseCluster()所属R语言包:sparcl

                                        Hierarchical sparse clustering
                                         分层疏聚类

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Performs sparse hierarchical  clustering. If $d_ii'j$ is the dissimilarity between observations i and i' for feature j, seek a sparse weight vector w and then use $(sum_j (d_ii'j w_j))_ii'$ as a nxn dissimilarity matrix for hierarchical clustering.
执行稀疏的层次聚类。如果是观测值之间的差异性d_iij $ i和i为特征j,寻求一个稀疏的权重向量w,然后使用$(sum_j(d_iij w_j))_ii一个NxN相异度矩阵的层次聚类。


用法----------Usage----------


HierarchicalSparseCluster(x=NULL, dists=NULL,method=c("average","complete", "single","centroid"),
wbound=NULL,niter=15,dissimilarity=c("squared.distance","absolute.value"), uorth=NULL,silent=FALSE,
cluster.features=FALSE,method.features=c("average", "complete",
"single","centroid"),output.cluster.files=FALSE,
outputfile.prefix="output",genenames=NULL,genedesc=NULL,standardize.arrays=FALSE)



参数----------Arguments----------

参数:x
A nxp data matrix; n is the number of observations and p the number of features. If NULL, then specify dists instead.
恩智浦的数据矩阵,n为观测值的数量和P的功能。如果为NULL,然后指定dists目录下。


参数:dists
For advanced users, can be entered instead of x. If HierarchicalSparseCluster has already been run on this data, then the dists value of the previous output can be entered here. Under normal circumstances, leave this argument NULL and pass in x instead.
对于高级用户,可以输入,而不是x。如果HierarchicalSparseCluster已运行这个数据,然后于dists的输出值可以在这里输入。在正常情况下,离开这个参数为NULL,而不是通过在x。


参数:method
The type of linkage to use in the hierarchical clustering - "single", "complete", "centroid", or "average".
在层次聚类联动使用的类型 - “单”,“完成”,“质心”,或“平均”。


参数:wbound
The L1 bound on w to use; this is the tuning parameter for sparse hierarchical clustering. Should be greater than 1.
约束的L1 w才能使用,这是稀疏的层次聚类的优化参数。应该是大于1。


参数:niter
The number of iterations to perform in the sparse hierarchical clustering algorithm.
在稀疏的层次聚类算法的迭代次数来执行。


参数:dissimilarity
The type of dissimilarity measure to use. One of "squared.distance" or "absolute.value". Only use this if x was passed in (rather than dists).
相异度度量的类型使用。之一“squared.distance”或“absolute.value。仅使用如果x通过了(而不是dists目录下)。


参数:uorth
If complementary sparse clustering is desired, then this is the nxn dissimilarity matrix obtained in the original sparse clustering.
互补稀疏聚类如果需要的话,那么这是nxn的相异矩阵中得到的原始稀疏聚类。


参数:standardize.arrays
Should the arrays be standardized? Default is FALSE.
如果阵列是标准化?默认值是false。


参数:silent
Print out progress?
打印出的进展如何?


参数:cluster.features
Not for use.
不使用。


参数:method.features
Not for use.
不使用。


参数:output.cluster.files
Not for use.
不使用。


参数:outputfile.prefix
Not for use.
不使用。


参数:genenames
Not for use.
不使用。


参数:genedesc
Not for use.
不使用。


Details

详细信息----------Details----------

We seek a p-vector of weights w (one per feature) and a nxn matrix U that optimize
我们寻求一个P-向量的权重w(每一个功能)和一个n×n的矩阵U,优化

$maximize_U,w sum_j w_j sum_ii' d_ii'j U_ii'$ subject to $||w||_2 <= 1, ||w||_1 <= wbound, w_j >= 0, sum_ii' U_ii'^2 <= 1$.
$ maximize_U,瓦特sum_j w_j sum_ii干部d_iij U_ii$ $ | |瓦特| | _2 <= 1,| |瓦特| | _1 <= wbound,w_j> = 0,sum_iiU_ii的^ 2 <= 1 $。

Here, $d_ii'j$ is the dissimilarity between observations i and i' with along feature j. The resulting matrix U is used as a dissimilarity matrix for hierarchical clustering. "wbound" is a tuning parameter for this method, which controls the L1 bound on w, and as a result the number of features with non-zero $w_j$ weights. The non-zero elements of w indicate features that are used in the sparse clustering.
在这里,d_iij $ i和i沿特征j之间的相异意见。由此产生的矩阵U作为一个相异度矩阵的层次聚类。 “wbound”是此方法,该方法控制瓦特界的L1,以及作为结果的数目与非零$ w_j $权重功能的调谐参数。为w的非零元素表示稀疏聚类中所使用的功能。

We optimize the above criterion with an iterative approach: hold U fixed and optimize with respect to w. Then, hold w fixed and optimize with respect to U.
上述标准优化迭代的方法:按住U固定和优化对w。然后,按住W固定和优化方面为U

Note that the arguments described as "Not for use" are included for the sparcl package to function with GenePattern but should be ignored by the R user.
请注意,描述的参数为“未使用”的SPARCL包功能的GenePattern,但应该被忽略的R用户。


值----------Value----------


参数:hc
The output of a call to "hclust", giving the results of hierarchical sparse clustering.
的输出的呼叫“hclust”,给分层稀疏聚类的结果。


参数:ws
The p-vector of feature weights.
的p-的特征权重向量。


参数:u
The nxn dissimilarity matrix passed into hclust, of the form $(sum_j w_j d_ii'j)_ii'$.
通过到hclust,nxn的相异度矩阵的形式$(sum_j w_j d_iij)的_ii $。


参数:dists
The (n*n)xp dissimilarity matrix for the data matrix x. This is useful if additional calls to HierarchicalSparseCluster will be made.
(N * N)XP相异度矩阵的数据矩阵X。这是有用的,,如果附加的调用HierarchicalSparseCluster将。


----------Author(s)----------


Daniela M. Witten and Robert Tibshirani



参考文献----------References----------



参见----------See Also----------

HierarchicalSparseCluster.permute,KMeansSparseCluster,KMeansSparseCluster.permute
HierarchicalSparseCluster.permute,KMeansSparseCluster,KMeansSparseCluster.permute


实例----------Examples----------


  # Generate 2-class data[生成2级数据]
  set.seed(1)
  x <- matrix(rnorm(100*200),ncol=200)
  y <- c(rep(1,50),rep(2,50))
  x[y==1,1:25] <- x[y==1,1:25]+2
  # Do tuning parameter selection for sparse hierarchical clustering[调整参数的选择稀疏的层次聚类]
  perm.out <- HierarchicalSparseCluster.permute(x, wbounds=c(1.5,2:9),
nperms=5)
  print(perm.out)
  plot(perm.out)
  # Perform sparse hierarchical clustering[执行稀疏的层次聚类]
  sparsehc <- HierarchicalSparseCluster(dists=perm.out$dists,
wbound=perm.out$bestw, method="complete")
  # faster than   sparsehc &lt;- HierarchicalSparseCluster(x=x,wbound=perm.out$bestw, method="complete")[速度比sparsehc < -  HierarchicalSparseCluster(X = X,wbound = perm.out bestw,方法=“完成”)]
  par(mfrow=c(1,2))
  plot(sparsehc)
  plot(sparsehc$hc, labels=rep("", length(y)))
  print(sparsehc)
  # Plot using knowledge of class labels in order to compare true class[图类标签的使用知识,以比较真实的类]
  #   labels to clustering obtained[标签得到的聚类]
  par(mfrow=c(1,1))
  ColorDendrogram(sparsehc$hc,y=y,main="My Simulated Data",branchlength=.007)
  # Now, what if we want to see if out data contains a *secondary*[现在,如果我们想要看出来的数据中包含*二次*]
  #   clustering after accounting for the first one obtained. We[聚类后得到的第一个会计。我们]
  #   look for a complementary sparse clustering:[找一个互补的稀疏数据聚类:]
  sparsehc.comp <- HierarchicalSparseCluster(x,wbound=perm.out$bestw,
     method="complete",uorth=sparsehc$u)
  # Redo the analysis, but this time use "absolute value" dissimilarity:[重新进行分析,但这次使用“绝对值”相异:]
  perm.out <- HierarchicalSparseCluster.permute(x, wbounds=c(1.5,2:9),
    nperms=5, dissimilarity="absolute.value")
  print(perm.out)
  plot(perm.out)
  # Perform sparse hierarchical clustering[执行稀疏的层次聚类]
  sparsehc <- HierarchicalSparseCluster(dists=perm.out$dists, wbound=perm.out$bestw, method="complete", dissimilarity="absolute.value")
  par(mfrow=c(1,2))
  plot(sparsehc)

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-6-9 20:37 , Processed in 0.020496 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表