get.sid(rpubchem)
get.sid()所属R语言包:rpubchem
Get PubChem Substance Information
获取PubChem数据库物质信息
译者:生物统计家园网 机器人LoveR
描述----------Description----------
The PubChem substance collection stores a variety of information for each molecule. These include canonical SMILES, molecular properties, substance associations, synonyms etc.
的的PubChem数据库物质收集每个分子的信息存储有各种。这些措施包括规范的笑容,分子的性质,物质协会,同义词等。
This function will extract a subset of the molecular property information for one or more compound ID's
这个函数将提取的分子的属性信息中的一个或多个化合物的ID的一个子集
用法----------Usage----------
get.sid(sid, quiet=TRUE, from.file=FALSE)
参数----------Arguments----------
参数:sid
A vector of one or more compound ID's
的向量中的一个或多个化合物,ID的
参数:quiet
If FALSE, output is verbose
如果FALSE,输出是详细
参数:from.file
If TRUE then the first argument is considered to be the name of a file containing the XML data. If FALSE the first argument must be a sequence of compound ID's and the data will be downloaded from the PubChem FTP site
如果TRUE然后第一个参数被认为是一个包含XML数据的文件的名称。如果FALSE的第一个参数必须是一个复合的ID和数据将被下载从PubChem数据库FTP站点的序列
Details
详细信息----------Details----------
Processing a large number of substance ID's can take a long time. For large numbers of SID's the resultant XML file can be many megabytes. This may take a long time to download. After download it takes approximate 20 sec to process a 23MB data file.
处理大量的物质ID的,可能需要很长的时间。对于大量的SID生成的XML文件可以是数兆字节。这可能需要很长的时间来下载。下载后,它需要约20秒处理一个23MB的数据文件。
It should also be noted that the data files are downloaded using the R interface to Curl. In addition, the PubChem servers do not allow very large query URL's. This limits the number of substance ID's that can be directly pulled of the PubChem servers to about 1000
还应当注意的是,数据的文件被下载使用的R接口卷曲。此外,的PubChem数据库服务器不容许非常大的查询网址。这限制物质ID的,可以直接拉出的PubChem数据库服务器的数目至约1000
值----------Value----------
A data.frame with 9 columns: <table summary="R valueblock"> <tr valign="top"><td>SID</td> <td> The substance ID</td></tr> <tr valign="top"><td>IUPACName</td> <td> The IUPAC name of the compound</td></tr> <tr valign="top"><td>CanonicalSmiles</td> <td> The canonical SMILES for the compound</td></tr> <tr valign="top"><td>MolecularWeight</td> <td> Molecular weight</td></tr> <tr valign="top"><td>TotalFormalCharge</td> <td> The formal charge</td></tr> <tr valign="top"><td>MolecularFormula</td> <td> The molecular formula</td></tr> <tr valign="top"><td>TPSA</td> <td> Topological polar surface area</td></tr> <tr valign="top"><td>HeavyAtomCount</td> <td> Heavy atom count</td></tr> <tr valign="top"><td>FormalCharge</td> <td> Total formal charge</td></tr> <tr valign="top"><td>HydrogenBondDonor</td> <td> Hydrogen bond donor count</td></tr> <tr valign="top"><td>HydrogenBondAcceptor</td> <td> Hydrogen bond acceptor count</td></tr> </table>
Adata.frame9列:表summary="R valueblock"> <tr valign="top"> <TD> SID</ TD> <TD>物质ID </ TD> < / TR> <tr valign="top"> <TD> IUPACName </ TD> <TD>化合物的IUPAC名称</ TD> </ TR> <tr valign="top"> <TD >CanonicalSmiles</ TD> <TD>典型的化合物的微笑</ TD> </ TR> <tr valign="top"> <TD>MolecularWeight</ TD> <TD>分子量</ TD> </ TR> <tr valign="top"> <TD> TotalFormalCharge</ TD> <TD>正式起诉</ TD> </ TR> <TR VALIGN =“顶部“> <TD>MolecularFormula</ TD> <TD>分子式</ TD> </ TR> <tr valign="top"> <TD> TPSA</ TD> <TD >拓扑极表面积</ TD> </ TR> <tr valign="top"> <TD>HeavyAtomCount</ TD> <TD>重原子数</ TD> </ TR> <TR VALIGN =“”> <TD>FormalCharge</ TD> <TD>正式征收总额</ TD> </ TR> <tr valign="top"> <TD>HydrogenBondDonor</ TD > <TD>氢键供体数量</ TD> </ TR> <tr valign="top"> <TD>HydrogenBondAcceptor </ TD> <TD>氢键受体数量</ TD> </ TR > </ TABLE>
(作者)----------Author(s)----------
Rajarshi Guha <a href="mailto:rajarshi.guha@gmail.com">rajarshi.guha@gmail.com</a>
参见----------See Also----------
get.assay, get.cid, get.sid.list
get.assay,get.cid,get.sid.list
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|