找回密码
 注册
查看: 500|回复: 0

R语言 ChemmineR包 cmp.parse()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-25 14:42:18 | 显示全部楼层 |阅读模式
cmp.parse(ChemmineR)
cmp.parse()所属R语言包:ChemmineR

                                        Parse an SDF file and compute descriptors for all compounds
                                         解析SDF文件,并计算所有化合物的描述

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

'cmp.parse' will take a SDF file, parse all the compounds encoded, compute their atom-pair descriptors, and return the descriptors as a list. The list contains two names, 'descdb' and 'cids'. 'descdb' is a vector of descriptors, and 'cids' is a list of names of compounds found in the SDF file. The returned list is usually used to a database, against which similarity search can be performed using the 'search' function. These two functions will parse all compounds in the SDF file. To parse a single compound, use 'cmp.parse1' instead.
“cmp.parse”将采取SDF文件,解析所有编码的化合物,计算它们的原子对描述符,并返回描述符列表。列表中包含了两个名字,“descdb和CIDS。 “descdb是一个描述符的向量,CIDS”是一个SDF文件中发现的化合物的名称列表。返回列表通常用于数据库,对其中的相似性搜索,可以使用“搜索”功能。这两个函数将解析SDF文件中的所有化合物。解析一个单一的化合物,使用cmp.parse1“代替。


用法----------Usage----------


cmp.parse(filename, quiet=FALSE, type="normal", dbname="")



参数----------Arguments----------

参数:filename
The file name of the SDF file
SDF文件的文件名


参数:quiet
Whether to silent the output of progress information
是否沉默的进度信息输出


参数:type
Database type. Use the default value, or set to 'file-backed' when the library is large. See below.
数据库类型。使用默认值,或设置“文件支持库时大。见下文。


参数:dbname
Datbase name. Only used when the type is set to 'file-backed'.
Datbase名称。只用时类型设置为“支持文件”。


Details

详情----------Details----------

The 'filename' can be a local file or an URL. It is interactive, and will display the parsing progress. Since the parsing will also compute of atom-pair descriptors, it is time consuming. You will be reminded to save the parsing result for future use at the end of parsing.
文件名可以是本地文件或URL。它是互动的,并会显示解析进度。由于解析也将计算对原子的描述,它是费时。会提醒你保存在解析年底将来使用的解析结果。

'type' is either set to the default value 'normal' or 'file-backed'. When set to 'file-backed', the parsing work will be delegated to a separate package called 'ChemmineRpp', and the database will be stored in a file instead of in the primary memory. Therefore, 'file-backed' mode can handle larger compound libraries. In 'file-backed' mode, 'dbname' will be used to name the database file. A suffix '.cdb' will be appended to the given name.
“类型”设置为默认值“正常”或“备份文件”。当设置为“支持文件”,分析工作将被委派到一个单独的包称为“ChemmineRpp”,将在一个文件中,而不是存储在主内存中的数据库。因此,文件支持“的模式,可以处理较大的化合物库。 DBNAME在文件支持“的模式,将被用于命名数据库文件。后缀“CDB”。将被追加到给定的名称。

The type of the database is transparent to other part of the package. For example, calling 'cmp.search' against a database in 'file-backed' mode will cause the package to load the descriptors from the database file progressively.
数据库的类型是透明的,其他部分的包。例如,在“文件支持”的模式“cmp.search对数据库调用会导致包逐步加载从数据库文件中的描述。


值----------Value----------

Return a list that can be used as the database against which similarity search can be performed. The 'search' and 'cmp.cluster' functions both expect a database returned by 'cmp.parse'.
返回一个可以用来作为对可以进行相似搜索的数据库列表。 “搜索”和cmp.cluster职能都期望由cmp.parse返回一个数据库。


参数:descdb
A vector containing the descriptors for all the compounds.
一个向量,包含所有化合物的描述。


参数:cids
Compound ID information found in the SDF file. It is the first line of SDF of a compound.
在SDF文件中发现的化合物ID信息。它是一个复合的第一线的自卫队。


作者(S)----------Author(s)----------


Y. Eddie Cao, Li-Chang Cheng



参考文献----------References----------

in 2D fragment-based similarity searching: comparison of structural descriptors

参见----------See Also----------

cmp.parse1, cmp.search, cmp.cluster,
cmp.parse1,cmp.search,cmp.cluster


举例----------Examples----------


## Load sample SD file[#负载样品的SD文件]
# data(sdfsample); sdfset &lt;- sdfsample[数据(sdfsample); sdfset < -  sdfsample]

## Generate atom pair descriptor database for searching[#生成原子对数据库搜索描述]
# apset &lt;- sdf2ap(sdfset) [< -  sdf2ap apset(sdfset)]

## Loads same atom pair sample data set provided by library[#加载相同的原子对样本数据集,由图书馆提供]
data(apset)
db <- apset
# (optinally) save the db for future use[(optinally)保存供日后使用的DB]
save(db, file="db.rda", compress=TRUE)
# ...[...]
# later, in a separate session, you can load it back:[以后,在一个单独的会话,你可以加载它:]
load("db.rda")

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-1-28 09:56 , Processed in 0.021619 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表