liverdata(clippda)
liverdata()所属R语言包:clippda
A dataframe of the protein expression data, peak information, and
的蛋白表达数据dataframe,峰值信息,
译者:生物统计家园网 机器人LoveR
描述----------Description----------
A dataframe of the duplicate protein expression data, peak information, sample information (e.g. sample ID, stage, gender, etc.). This is a pre-processed version of “raw .csv” file from the Biomarker wizard. The pre-processing involves filtering out samples with conflicting peak information, and detecting and discarding samples with no replicates.
一个重复的蛋白表达数据dataframe,峰值信息,样品信息(例如,样品编号,阶段,性别等)。这是一个从生物标志物向导“预加工原材料.csv”文件的版本。前处理涉及与冲突的高峰信息过滤掉样品,检测和丢弃不重复样品。
用法----------Usage----------
data(liverdata)
格式----------Format----------
A data frame with 13886 observations on the following 6 variables.
与13886在以下6个变量的观测数据框。
SampleTag a numeric vector of sample ID.
SampleTag的样品编号的数字向量。
CancerType a factor, with levels c and n, indicating
CancerType的一个因素,与各级c和n,说明
Spectrum a numeric vector, indicating the experimental run.
Spectrum一个数值向量,表明实验运行。
Peak a numeric vector identifying the peak.
Peak一个数值向量确定的高峰。
Intensity a numeric vector of expression values.
Intensity的数字矢量表达式的值。
Substance.Mass a numeric vector contaning the m/z (mass-to-charge ratio) value.
Substance.Mass数字矢量contaning的m / z(质荷比)值。
源----------Source----------
Ward DG, Cheng Y, N'Kontchou G, Thar TT, Barget N, Wei W, Billingham LJ, Martin A, Beaugrand M, Johnson PJ: Changes in the serum proteome associated with the development of hepatocellular carcinoma in hepatitis C-related cirrhosis. Br J Cancer. 2006, 94(2):287-92.
ĞNKontchou,塔尔测控病房狄刚,郑Ÿ,Barget列印,魏伟,白金汉LJ,一个马丁,Beaugrand男,约翰逊PJ:丙型肝炎相关性肝硬化与肝癌的发展相关的血清蛋白质组的变化。 BR J癌症。 2006年,94(2):287-92。
参考文献----------References----------
Changes in the serum proteome associated with the development of hepatocellular carcinoma in hepatitis C-related cirrhosis. Br J Cancer. 2006, 94(2):287-92.
举例----------Examples----------
#######################################################[################################################## ####]
#######################################################[################################################## ####]
## a pre-proceesed version of the raw .csv file from the[#从原料。csv文件的预proceesed版本]
## Biomarker wizard.[#生物标志物的向导。]
#######################################################[################################################## ####]
#######################################################[################################################## ####]
data(liverdata)
data(liverRawData)
############################################################################################[################################################## #########################################]
############################################################################################[################################################## #########################################]
# liverdata is obtained by pre-processing of the raw .csv file from the Biomarker wizard [liverdata获得通过预加工的原料。csv文件,从生物标志物向导]
# as follows. These samples pre-processed to:[如下。这些预先处理样本:]
# (i) discard the information on samples which have no replicate data, and[(一)丢弃没有复制数据的样本信息,]
# (ii) for samples with more than 2 replicate expression data, only duplicates with most [(二)超过2复制的基因表达数据的样品,只有重复与大多数]
# similar peak information are retained for use in subsequent analyses. [类似的高峰信息被保留在随后的分析中使用。]
# A wrapper function for executing these two pre-processing steps is preProcRepeatedPeakData[一个包装函数执行这两个前处理步骤是preProcRepeatedPeakData]
#############################################################################################[################################################## ##########################################]
#############################################################################################[################################################## ##########################################]
threshold <- 0.80
no.replicates <- 2
no.peaks <- 53
Data <- preProcRepeatedPeakData(liverRawData, no.peaks, no.replicates, threshold)
###########################################################################################[################################################## ########################################]
###########################################################################################[################################################## ########################################]
# Only sample with ID 250 has no replicates and has been omitted from the data to be used [ID为250只样品有没有重复,并已省略从数据要使用]
# in subsequent analyses. This fact may varified by using:[在随后的分析。这一事实可能会通过使用varified:]
###########################################################################################[################################################## ########################################]
###########################################################################################[################################################## ########################################]
setdiff(unique(liverRawData$SampleTag),unique(liverdata$SampleTag))
setdiff(unique(Data$SampleTag),unique(liverdata$SampleTag))
#########################################################################[################################################## ######################]
# Now filter out the samples with conflicting replicate peak information[现在筛选出的样品与冲突的重复峰值信息]
# using the spectrumFilter function:[使用spectrumFilter功能:]
#########################################################################[################################################## ######################]
TAGS <- spectrumFilter(Data,threshold,no.peaks)$SampleTag
NewRawData2 <- spectrumFilter(Data,threshold,no.peaks)
dim(Data)
dim(liverdata)
dim(NewRawData2)
#########################################################################################[################################################## ######################################]
#########################################################################################[################################################## ######################################]
# In the case of this data (the liver data), all technical replicates have coherent peak [在这个数据(肝)的情况下,所有的技术复制有连贯的峰值]
# information, since no sample information has been discarded by spectra filter.[信息,光谱过滤器,因为没有样本资料已被丢弃。]
#########################################################################################[################################################## ######################################]
#########################################################################################[################################################## ######################################]
##########################################################################################[################################################## #######################################]
##########################################################################################[################################################## #######################################]
# Let us have a look at what the pre-processing does to samples with more than 2 replicate[让我们有2个以上的复制在样品前处理]
# spectra. Both samples with IDs 25 and 40 have more than 2 replicates.[光谱。 ID为25和40两个样本有超过2个重复。]
##########################################################################################[################################################## #######################################]
##########################################################################################[################################################## #######################################]
length(liverRawData[liverRawData$SampleTag == 25,]$Intensity)/no.peaks
length(liverRawData[liverRawData$SampleTag == 40,]$Intensity)/no.peaks
######################################################################################[################################################## ###################################]
######################################################################################[################################################## ###################################]
# Take correlations of the log-intensities to find which of the 2 replicates have the [采取相关的log强度,以找到2复制有]
# most coherent peak information.[最连贯的峰值信息。]
########################################################################################[################################################## #####################################]
########################################################################################[################################################## #####################################]
Mat1 <- matrix(liverRawData[liverRawData$SampleTag == 25,]$Intensity,53,3)
Mat2 <-matrix(liverRawData[liverRawData$SampleTag == 40,]$Intensity,53,4)
cor(log2(Mat1))
cor(log2(Mat2))
#use mostSimilarTwo function to get duplicate spectra with most coherent peak information[使用mostSimilarTwo功能得到最连贯的峰值信息的重复光谱]
Mat1 <- matrix(liverRawData[liverRawData$SampleTag == 25,]$Intensity,53,3)
Mat2 <-matrix(liverRawData[liverRawData$SampleTag == 40,]$Intensity,53,4)
sort(mostSimilarTwo(cor(log2(Mat1))))
sort(mostSimilarTwo(cor(log2(Mat2))))
#######################################################################################[################################################## ####################################]
#######################################################################################[################################################## ####################################]
#Next, check that the pre-processed data, \Robject{NewRawData2}, contains similar [下一步,检查,预加工数据,\ Robject {NewRawData2},包含类似]
# information to liverdata (the allready pre-processed data, included in the clippda).[信息liverdata(媒体链接前处理的数据,在列入clippda)。]
#######################################################################################[################################################## ####################################]
#######################################################################################[################################################## ####################################]
names(NewRawData2)
dim(NewRawData2)
names(liverdata)
dim(liverdata)
setdiff(NewRawData2$SampleTag,liverdata$SampleTag)
setdiff(liverdata$SampleTag,NewRawData2$SampleTag)
summary(NewRawData2$Intensity)
summary(liverdata$Intensity)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|