getPROBESET(annotationTools)
getPROBESET()所属R语言包:annotationTools
Find probe set IDs
查找探针集ID
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Takes a vector of gene IDs (or identifiers of other types) and an annotation table and looks up the gene IDs in the table to retrieve the corresponding probe set identifiers. Each gene ID can occur multiple times (i.e. on mulitple lines) in the annotation table.
需要一个向量的基因身份证(或其他类型的标识符)和注释表和查找表中的基因ID来获取相应的探针集标识符。每个基因ID可以多次出现在注释表(即多张线)。
用法----------Usage----------
getPROBESET(geneid, annot, uniqueID = FALSE, diagnose = FALSE, idCol = 19, noPSsymbol = NA, noPSprovidedSymbol = "---")
参数----------Arguments----------
参数:geneid
character vector containing the gene IDs.
特征向量包含的基因标识。
参数:annot
annotation table (data frame) where each row is a record and each column is an annotation field.
注释表(数据框),每一行是一个记录和每一列是一个注释字段。
参数:uniqueID
logical. If TRUE, only probe set IDs annotated with a single gene ID are returned. If FALSE, probe set IDs annotated with multiple gene IDs are returned too.
逻辑。如果为TRUE,只探针集ID与一个单一的基因标识标注返回。如果为FALSE,返回探针集ID与多个基因标识标注。
参数:diagnose
logical. If TRUE, 3 (logical) vectors used for diagnostic purpose are returned in addition to the annotation. If FALSE (default) only the annotation is returned.
逻辑。如果是TRUE,返回3(逻辑)用于诊断目的的向量在另外的注解。如果为FALSE(默认)的注释,则返回。
参数:idCol
column in annotation table containing the gene identifiers.
注释包含基因标识的表列。
参数:noPSsymbol
character string to be used in output list 'ps' if no probe set ID is found or provided in the annotation table.
在输出列表“PS”的字符串用于探针组ID,如果没有被发现或注释表中提供的。
参数:noPSprovidedSymbol
character string used in annotation table and indicating missing probe set ID.
字符串用于注释表,并说明失踪探针组ID。
Details
详情----------Details----------
This function can be used with Affymetrix annotation files (e.g. 'HG-U133\_Plus\_2\_annot.csv'). It retrieves probe set IDs corresponding to particular gene identifiers. By default, the function takes gene IDs but any type of identifier (e.g. gene symbol) can be used (set 'idCol' accordingly).
此功能可用于与Affymetrix的注释文件(例如,“HG-U133 \ _Plus \ _2的\ _annot.csv”)。它检索相应的特定基因标识的探针组ID。默认情况下,功能基因标识,但任何类型的标识符(如基因符号)可以用来设置idCol“相应。
Probe set IDs are returned as elements of list 'ps'. If multiple probe set IDs are found for 'geneid[i]', a vector containing all probe set IDs is returned as the 'i-th' element of list 'ps'.
探针组ID是返回列表“PS”的元素。如果多个探针集ID“geneid [I],一个向量,所有探针集ID返回”第i个“ps的元素的列表。
The default values for 'idCol', 'noPSsymbol', and 'noPSprovidedSymbol' are chosen to suit the format of Affymetrix annotation files. However, options can be set to look up any annotation table, provided the probe set identifiers are in the first column.
“idCol,noPSsymbol”,“noPSprovidedSymbol”的默认值是选择适合Affymetrix的注释文件的格式。然而,期权可以看任何注释表,提供的探针集标识符是在第一列。
值----------Value----------
参数:ps
list of length 'length(geneid)' the 'i'-th element of which contains the probe set IDs for 'geneid[i]'.
长度长度(geneid,)“列表δ-th元素,其中包含的探针组ID”geneid [I]。
参数:empty
logical vector of length 'length(geneid)'. 'empty[i]' is TRUE if 'geneid[i]' is empty or NA.
逻辑矢量长度的长度(geneid)。 “空[I]”,如果“geneid [I]为空或不适用。
参数:noentry
locial vector of length 'length(geneid)'. 'noentry[i]' is TRUE if 'geneid[i]' cannot be found in column 'idCol' (default is column 19) of the annotation table.
locial向量长度的长度(geneid)。 NOENTRY [I]是TRUE如果geneid我不能被发现在列idCol“的注释表(默认是19列)。
参数:noid
locial vector of length 'length(geneid)'. 'noid[i]' is TRUE if 'ps[i]==noIDprovidedSymbol' is TRUE.
locial向量长度的长度(geneid)。 “电磁铁[I]”为TRUE,如果“PS我] == noIDprovidedSymbol”为TRUE。
注意----------Note----------
getMULTIANNOTATION provides a more flexible solution that can be used with arbitrary annotation tables.
getMULTIANNOTATION提供了更加灵活的解决方案,可用于任意注释表。
作者(S)----------Author(s)----------
Alexandre Kuhn
参见----------See Also----------
getMULTIANNOTATION
getMULTIANNOTATION
举例----------Examples----------
##example Affymetrix annotation file and its location[#例如Affymetrix的注释文件和它的位置]
annotationFile<-system.file('extdata','HG-U133_Plus_2_annot_part.csv',package='annotationTools')
##load annotation file[#加载注释文件]
annotation<-read.csv(annotationFile,colClasses='character',comment.char='#')[)]
##genes of interest[#基因的兴趣]
myGenes<-c('DDR1','GUCA1A','HSPA6',NA,'XYZ')
##column 15 in annotation contains gene symbols[#注释15列包含的基因符号]
colnames(annotation)
##find probe sets probing for particular genes [#找到特定基因探测的探针集]
getPROBESET(myGenes,annotation,idCol=15)
##find probe sets probing only for the genes of interest (i.e. with unique annotation)[#找到探针只对感兴趣的基因组探测(即独特的注解)]
getPROBESET(myGenes,annotation,idCol=15,uniqueID=TRUE)
##track origin of annotation failure for the 2 last probe set IDs[#2最后的探针组ID跟踪注解失败的起源]
getPROBESET(myGenes,annotation,idCol=15,diagnose=TRUE)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|