找回密码
 注册
查看: 573|回复: 0

R语言 clippda包 liverdata()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-2-25 15:06:22 | 显示全部楼层 |阅读模式
liverdata(clippda)
liverdata()所属R语言包:clippda

                                        A dataframe of the protein expression data, peak information, and
                                         的蛋白表达数据dataframe,峰值信息,

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

A dataframe of the duplicate protein expression data, peak information, sample information (e.g. sample ID, stage, gender, etc.).  This is a pre-processed version of “raw .csv” file from the  Biomarker wizard. The pre-processing involves filtering out samples with conflicting peak information, and detecting and discarding samples with no replicates.
一个重复的蛋白表达数据dataframe,峰值信息,样品信息(例如,样品编号,阶段,性别等)。这是一个从生物标志物向导“预加工原材料.csv”文件的版本。前处理涉及与冲突的高峰信息过滤掉样品,检测和丢弃不重复样品。


用法----------Usage----------


data(liverdata)



格式----------Format----------

A data frame with 13886 observations on the following 6 variables.
与13886在以下6个变量的观测数据框。




SampleTag a numeric vector of sample ID.
SampleTag的样品编号的数字向量。




CancerType a factor, with levels c and n, indicating
CancerType的一个因素,与各级c和n,说明




Spectrum a numeric vector, indicating the experimental run.
Spectrum一个数值向量,表明实验运行。




Peak a numeric vector identifying the peak.
Peak一个数值向量确定的高峰。




Intensity a numeric vector of expression values.
Intensity的数字矢量表达式的值。




Substance.Mass a numeric vector contaning the m/z (mass-to-charge ratio) value.
Substance.Mass数字矢量contaning的m / z(质荷比)值。


源----------Source----------

Ward DG, Cheng Y, N'Kontchou G, Thar TT, Barget N, Wei W, Billingham LJ, Martin A, Beaugrand M, Johnson PJ:  Changes in the serum proteome associated with the development of hepatocellular carcinoma in hepatitis C-related  cirrhosis. Br J Cancer. 2006, 94(2):287-92.
ĞNKontchou,塔尔测控病房狄刚,郑Ÿ,Barget列印,魏伟,白金汉LJ,一个马丁,Beaugrand男,约翰逊PJ:丙型肝炎相关性肝硬化与肝癌的发展相关的血清蛋白质组的变化。 BR J癌症。 2006年,94(2):287-92。


参考文献----------References----------

Changes in the serum proteome associated with the development of hepatocellular carcinoma in hepatitis C-related  cirrhosis. Br J Cancer. 2006, 94(2):287-92.

举例----------Examples----------


#######################################################[################################################## ####]
#######################################################[################################################## ####]
## a pre-proceesed version of the raw .csv file from the[#从原料。csv文件的预proceesed版本]
## Biomarker wizard.[#生物标志物的向导。]
#######################################################[################################################## ####]
#######################################################[################################################## ####]

data(liverdata)
data(liverRawData)
############################################################################################[################################################## #########################################]
############################################################################################[################################################## #########################################]
# liverdata is obtained by pre-processing of the raw .csv file from the Biomarker wizard [liverdata获得通过预加工的原料。csv文件,从生物标志物向导]
# as follows. These samples pre-processed to:[如下。这些预先处理样本:]
#  (i) discard the information on samples which have no replicate data, and[(一)丢弃没有复制数据的样本信息,]
# (ii) for samples with more than 2 replicate expression data, only duplicates with most [(二)超过2复制的基因表达数据的样品,只有重复与大多数]
#      similar peak information are retained for use in subsequent analyses. [类似的高峰信息被保留在随后的分析中使用。]
# A wrapper function for executing these two pre-processing steps is preProcRepeatedPeakData[一个包装函数执行这两个前处理步骤是preProcRepeatedPeakData]
#############################################################################################[################################################## ##########################################]
#############################################################################################[################################################## ##########################################]

threshold <- 0.80
no.replicates <- 2
no.peaks <- 53
Data <- preProcRepeatedPeakData(liverRawData, no.peaks, no.replicates, threshold)

###########################################################################################[################################################## ########################################]
###########################################################################################[################################################## ########################################]
# Only sample with ID 250 has no replicates and has been omitted from the data to be used [ID为250只样品有没有重复,并已省略从数据要使用]
# in subsequent analyses. This fact may varified by  using:[在随后的分析。这一事实可能会通过使用varified:]
###########################################################################################[################################################## ########################################]
###########################################################################################[################################################## ########################################]

setdiff(unique(liverRawData$SampleTag),unique(liverdata$SampleTag))
setdiff(unique(Data$SampleTag),unique(liverdata$SampleTag))

#########################################################################[################################################## ######################]
# Now filter out the samples with conflicting replicate peak information[现在筛选出的样品与冲突的重复峰值信息]
# using the spectrumFilter function:[使用spectrumFilter功能:]
#########################################################################[################################################## ######################]

TAGS <- spectrumFilter(Data,threshold,no.peaks)$SampleTag

NewRawData2 <- spectrumFilter(Data,threshold,no.peaks)
dim(Data)

dim(liverdata)

dim(NewRawData2)

#########################################################################################[################################################## ######################################]
#########################################################################################[################################################## ######################################]
# In the case of this data (the liver data), all technical replicates have coherent peak [在这个数据(肝)的情况下,所有的技术复制有连贯的峰值]
# information, since no sample information has been discarded by spectra filter.[信息,光谱过滤器,因为没有样本资料已被丢弃。]
#########################################################################################[################################################## ######################################]
#########################################################################################[################################################## ######################################]

##########################################################################################[################################################## #######################################]
##########################################################################################[################################################## #######################################]
# Let us have a look at what the pre-processing does to samples with more than 2 replicate[让我们有2个以上的复制在样品前处理]
# spectra. Both samples with IDs 25 and 40 have more than 2 replicates.[光谱。 ID为25和40两个样本有超过2个重复。]
##########################################################################################[################################################## #######################################]
##########################################################################################[################################################## #######################################]

length(liverRawData[liverRawData$SampleTag == 25,]$Intensity)/no.peaks
length(liverRawData[liverRawData$SampleTag == 40,]$Intensity)/no.peaks

######################################################################################[################################################## ###################################]
######################################################################################[################################################## ###################################]
# Take correlations of the log-intensities to find which of the 2 replicates have the [采取相关的log强度,以找到2复制有]
# most coherent peak information.[最连贯的峰值信息。]
########################################################################################[################################################## #####################################]
########################################################################################[################################################## #####################################]

Mat1 <- matrix(liverRawData[liverRawData$SampleTag == 25,]$Intensity,53,3)
Mat2 <-matrix(liverRawData[liverRawData$SampleTag == 40,]$Intensity,53,4)
cor(log2(Mat1))
cor(log2(Mat2))

#use mostSimilarTwo function to get duplicate spectra with most coherent peak information[使用mostSimilarTwo功能得到最连贯的峰值信息的重复光谱]

Mat1 <- matrix(liverRawData[liverRawData$SampleTag == 25,]$Intensity,53,3)
Mat2 <-matrix(liverRawData[liverRawData$SampleTag == 40,]$Intensity,53,4)
sort(mostSimilarTwo(cor(log2(Mat1))))
sort(mostSimilarTwo(cor(log2(Mat2))))

#######################################################################################[################################################## ####################################]
#######################################################################################[################################################## ####################################]
#Next, check that the pre-processed data, \Robject{NewRawData2}, contains similar [下一步,检查,预加工数据,\ Robject {NewRawData2},包含类似]
# information to liverdata (the allready pre-processed data, included in the clippda).[信息liverdata(媒体链接前处理的数据,在列入clippda)。]
#######################################################################################[################################################## ####################################]
#######################################################################################[################################################## ####################################]
names(NewRawData2)
dim(NewRawData2)
names(liverdata)
dim(liverdata)
setdiff(NewRawData2$SampleTag,liverdata$SampleTag)
setdiff(liverdata$SampleTag,NewRawData2$SampleTag)
summary(NewRawData2$Intensity)
summary(liverdata$Intensity)

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-2-13 15:18 , Processed in 0.031300 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表