找回密码
 注册
查看: 384|回复: 0

R语言 VarEff包 VarEff()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-10-1 14:24:38 | 显示全部楼层 |阅读模式
VarEff(VarEff)
VarEff()所属R语言包:VarEff

                                         Function VarEff from the package called also VarEff
                                         从包的功能VarEff也称为VarEff

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

VarEff (Variation of effective size) is a model to estimate the evolution of effective population size with coalescent approach. The estimation is done on simulated demographies modelled by steps of constant size for which the posterior probabilities are derived using an approximation of likelihood.
VarEff(有效尺寸变化)是一个模型估算的有效群体大小的演变与成膜助剂的方法。该估计模型的后验概率的大小固定的步骤推导出一个近似的可能性模拟demographies。

The user is asked the number of different steps he wishes to use to model the variation of effective size in the past.
用户被询问他希望使用在过去的变化模型的有效大小不同的步骤的数目。

Here, the function VarEff is given with all parameters to solve the model VarEff.
这里,函数VarEff给出的所有参数的求解该模型VarEff。

It produces 2 output files: summary statistics (.Theta) and the list of detailed states simulated by the MCMC chain (.Batch).
它产生的输出文件汇总统计数据(西塔)和模拟MCMC链(批)的详细状态列表。

Further, files are produced by the additional functions that allows results to be visualized.<br>
另外,所产生的额外的功能,它允许被可视化的结果的文件被<br>物理化学学报

For an overview of the package, see VarEff-package. <br>
的包的概述,请参阅包VarEff。参考

Caution: Source the MCMC package of C.J. Geyer (2009): version 0.7-3.
注意:源代码的MCMC包的CJ盖尔(2009):版本0.7-3。


用法----------Usage----------


VarEff(infile = NULL, parafile =NULL, NBLOC = NULL, JMAX = NULL,
MODEL = NULL, MUTAT = NULL, NBAR = NULL, VARP1 = NULL, RHOCORN = NULL,
GBAR = NULL, VARP2 = NULL, DMAXPLUS = NULL, Diagonale = NULL,
NumberBatch = NULL, LengthBatch = NULL, SpaceBatch = NULL)



参数----------Arguments----------

参数:parafile
[matrix]:Output data.  
[矩阵]:输出数据。


参数:infile
[matrix]:Input data.  
[矩阵]:输入数据。


参数:NBLOC
[integer]:Number of markers.  
[整数]的标记。


参数:JMAX
[integer]:Number of times when the effective size has changed.  
[整数]:次数时,有效的大小发生了变化。


参数:MODEL
[numeric]:Mutation model.  
[数字]:突变模型。


参数:MUTAT
[numeric]:Mutation rate.  
[数字]:突变率。


参数:NBAR
[integer]:Global prior mean of effective size.  
[整数]:全球前平均有效尺寸。


参数:VARP1
[integer]ogarithmic variance of effective size.  
[整数]:对数方差的有效尺寸。


参数:RHOCORN
[numeric]:Coefficient of correlation between effective sizes in successive steps.  
[数字]:在连续的步骤中的有效体积之间的相关性系数。


参数:GBAR
[integer]:Number of generations since the origin of the population.  
[整数]:几代人以来,原产地的人口数量。


参数:VARP2
[integer]ogarithmic variance of time interval.  
[整数]:对数方差的时间间隔。


参数:Diagonale
[numeric]:Smoothing parameter.   
[数字]:平滑参数。


参数:DMAXPLUS
[integer]:Range of allele distances to be analysed.  
[整数]:的等位基因的距离范围进行分析。


参数:NumberBatch
[integer]:Number of batch.  
[整数]:批量数。


参数:LengthBatch
[integer]ength of batch.  
[整数]:批量的长度。


参数:SpaceBatch
[integer]:Space of batch  
[整数]:批量空间


Details

详细信息----------Details----------

The package named VarEff works with the main function called VarEff.
包名为VarEff的作品的主要功能VarEff的。

This function is the corpus of coalescent estimation of effective sizes from the time of sampling to ancestor population size.
此功能是的时间采样祖先人口规模的有效尺寸从语料库的的成膜助剂估计的。

The user can get the posterior distribution of effective population size at any time in the past, as asked in further functions.
用户可以得到后验分布的有效群体大小在过去的任何时间,要求更多的功能。


值----------Value----------


参数:job.Theta
Summary statistics
摘要统计


参数:job.Batch
Core of program to produce all files .Nstat, Ndist, etc.
核心程序产生的所有文件。Nstat,Ndist等。


总结----------Summary----------

To summarize the main part of this package go thought these four section:
总结的主要部分,这个包去想过这四个部分:

INFILE
INFILE

INPUT
INPUT

BATCH FILE
批处理文件

OUTPUTS
输出

PLOT
PLOT


1。 INFILE----------1. INFILE----------

The infile is the microsatellite data of a population. It is near of MSVAR (Beaumont 1999) infile. Go to https://qgp.jouy.inra.fr to convert a MSVAR file in VarEff file.
infile是微的人口数据。这是附近的MSVAR(博蒙特1999年)INFILE。进入到https://qgp.jouy.inra.fr转换MSVAR档案在VarEff文件。

In this package an exemple can be found in the directory data called InputTest.
在这个包为例,可以称为InputTest目录中的数据。


2。 INPUT----------2. INPUT----------

- parafile (Name that you give to the job and to the output files created by the model).
-  parafile(姓名,你给的工作和创建的输出文件的模型)。

- infile (Name of the data file).
-  infile中(数据文件名称)。

- NBLOC (Number of Loci).
-  NBLOC(位点)。

- JMAX (Number of times when the effective size has changed, used to generate step functions simulating the past demography.  Ex: JMAX=2, if you think that the population took 3 different effective sizes in the past).
-  JMAX(次时的有效尺寸发生了变化,产生阶梯函数的模拟过去的人口。例如:JMAX = 2,如果你认为在过去的人口了3种不同的有效尺寸)。

- MODEL (choose one mutation model in: S = Single Step Model, T = Two Phase Model, G = Geometric Model, and provide an additional coefficient (C) for T and G models).
-  MODEL(选择一个突变模型:S =单步模式,T = G =几何模型,两阶段模型,并提供额外的系数(C),T和G型号)。

- MUTAT (Mutation rate, assumed the same for all loci).
-  MUTAT(突变率,假定所有位点相同)。

- NBAR (Prior value for the effective size).
-  NBAR(前值的有效尺寸)。

- VARP1 (Variance of the prior log-distribution of effective sizes. Ex: VARP1=3 allows for searches with 20- to 40-fold relative variations of effective size).
-  VARP1(方差现有log有效体积分布例:VARP1 = 3允许检索数据,与20  -  40倍的相对变化的有效尺寸)。

- RHOCORN (Coefficient of correlation between effective sizes in successive intervals).
-  RHOCORN(在连续的时间间隔的有效大小之间的相关性系数)。

- GBAR (Number of generations since the assumed origin of the population).
-  GBAR(假设起源的人口数代以来)。

- VARP2 (Variance of the prior log-distribution of time intervals during which the population is assumed of constant size).
-  VARP2(事先log的时间间隔,在此期间,人口分布大小不变的假设的差异)。

- DMAXPLUS = DMAX+1 (DMAX is the maximal distance between alleles (number of microsatellite motifs) that is used in the estimation algorithm).
-  DMAXPLUS = DMAX +1(DMAX是等位基因(微图案的数量)之间的最大距离的估计算法中使用的)。

- Diagonale (A smoothing parameter to balance the observed covariance structure with a theoretical diagonal variance matrix and avoid numerical instability. Diagonale = 0.5 is a robust choice).
-  Diagonale(A平滑参数,以平衡所观察到的协方差结构的理论对角线协方差矩阵,避免数值不稳定。Diagonale = 0.5是一个强大的选择)。

- NumberBatch (number of batch (nbatch) for metrop in MCMC).
-  NumberBatch(数量批量(nbatch)的为metrop在MCMC)。

- LengthBatch (length of batch (blen) for metrop in MCMC).
-  LengthBatch(长度的批次(BLEN在MCMC)metrop)。

- SpaceBatch (space of batch (nspac) for metrop in MCMC).
-  SpaceBatch(空间在MCMC批次(nspac)metrop,)。


3。批处理文件----------3. BATCH FILE----------

Two files are produced by the model VarEff:
两个文件的模型VarEff:

-job.Theta provides summary statistics (see below).
-job.Theta提供的统计摘要(见下文)。

-job.Batch which is the core of the estimate. <br>
-job.Batch,它的核心是估计的。参考

It reports a list of demographic evolutions described by step functions. Each line includes:
报告阶跃函数所描述的人口演变的列表。每行包括:

Column 1: the number  i of the simulated state (from 1 to Numberbatch).
塔1:的数量i的模拟状态(从1至Numberbatch的)。

Column 2: quadratic deviation of data from the  i-th  simulated state.
第2列:从第i个模拟状态下的数据的二次偏差。

Column 3: natural logarithm of the prior probability the i-th state.
第3栏:自然对数的先验概率的第i状态。

Columns 4 to JMAX+4: the JMAX+1 population sizes in the i-th state.
4 JMAX列+4:JMAX +1的人口规模在第i个状态。

Columns JMAX+5 to 2 JMAX+4: the JMAX times when the size changed in the i-th state.
色谱柱JMAX 5至2 JMAX 4:JMAX次时,变化的大小,在第i个状态。

Columns 2 JMAX + 5: value of the C parameter of the mutation model. <br>
2 JMAX + 5列:C参数的突变模型的价值。参考

Results are kept in the job.Batch file in reduced scales:
结果保存降低尺度的job.Batch文件:

Theta's for population sizes, products of generation numbers times mutation rate for times of size changes.
西塔的人口规模,产品的代数字时代的突变率大小的变化的时候。

The additional C parameter is a constant set to 0 for the Single Step Mutation Model, to a positive value for geometrical model or a negative value for the Two Phase Model.
额外的C参数是一个常数设置为0,单步突变模型,几何模型为正值或为负值的两阶段模型。


4。输出----------4. OUTPUTS----------

Firstly, the VarEff() function produces summary statistics in a file job.Theta.<br>
首先,VarEff的()函数生成汇总统计在参考的文件job.Theta。

The first 3 lines are the same as produces by the Theta() function:
第3行是相同的Theta()函数产生的:

Line 1: global Theta0, Theta1 and Theta2 estimates.
线路1:全球Theta0,THETA1和Theta2的估计。

Line 2: imbalance indices ln(Theta1/Theta0) and ln(Theta2/Theta0).
2号线:失衡指标的LN(Theta1/Theta0)和LN(Theta2/Theta0)。

Line 3: expected range of Ne values, from the minimum and maximum global Theta estimates.
第3行:氖(Ne)的值的预期范围内,从极小值和最大值的全球的Theta估计。

An the 4th line provides means and standard deviations over simulations of the quadratic deviations of data from simulated state and of natural logarithm of the prior probabilities of the simulated states. <br>
一个4号线提供了模拟的数据从模拟状态下的模拟状态的先验概率的自然对数的二次偏差的均值和标准差。参考

To obtain the distributions of effective size at a number of generations in the past,  from the time of sampling to an ancestral time, use the function called NatSizeDist(). <br>
要获得有效的规模在过去一个世代数的分布,从时间采样的祖先,使用调用的函数NatSizeDist()。参考

This function provides 2 files with the results in the Ne scale:
此功能提供了2个文件在NE规模的结果:

-job.Nstat
-  job.Nstat

-job.Ndist <br>
-  job.Ndist <BR>

To obtain the distributions of logarithm of effective size at a number of generations in the past,  from the time of sampling to an ancestral time, use the function called LogSizeDist(). <br>
在过去一个世代数,从时间采样的祖先为了获得对数的有效尺寸分布,可以使用函数称为LogSizeDist()。参考

This function provide 2 files with the results given in the Log(Ne) scale:
该功能提供2个文件中的log(NE)的规模给出的结果:

-job.Lstat
-  job.Lstat

-job.Ldist <br>
-  job.Ldist <BR>

Format of Nstat or Lstat file:
Nstat或lstat文件格式:

Column  1: Time in generations (if MUTAT is not 0) or the corresponding reduced time.
塔1:时间在世代(如果MUTAT不是0)或相应的减少的时间。

Columns 2: Arithmetic Mean of Ne or Log(Ne).
第2列:的Ne或登录(NE)的算术平均数。

Columns 3: Harmonic means of Ne (not provided for Log(Ne)).
列3:NE(不提供log(NE))的调和平均值。

Columns 4: Mode of Ne or Log(Ne).
列4:的Ne或登录(NE)的模式。

Columns 5: Median of Ne or Log(Ne).
列5位数的Ne或登录(NE)。

Columns 6: Quantile 5 percent of Ne or Log(Ne).
第6列:位数5%的Ne或登录(NE)。

Columns 7: Quantile 95 percent of Ne or Log(Ne. <br>
列7位数的95%的Ne或登录(Ne.参考

Format of Ndist or Ldist file:
Ndist或Ldist文件格式:

Posterior densities of Ne or Log(Ne) at past times (fitted distribution using the density R function).
Ne或登录(NE)在过去的时间后密度(拟合分布的密度R的功能)。

File with (Nbinstants+1) lines and 514 (Ndist) or 1025 (Ldist) columns.
文件线(Nbinstants +1)和514(Ndist)或1025(Ldist)条列。

Lines: Instants when the distribution of N(T(i-1)) was calculated.<br>
路线:时点“时,计算出的N(T第(i-1))的分布。<br>物理化学学报

File Ndist:
文件Ndist:

Columns in line i :
中的列线:

Column  1 : Values of  T(i-1).
专栏1:T(I-1)的值。

Columns 2 : Size of each of the intervals (=TMAX/511) in the abcsissa (Ne scale).
第2列:每个在abcsissa(氖规模)的间隔(= TMAX/511)的大小。

Columns 3 to 514 : Ordinates (densities of Ne at 512 points). <br>
列3到514:坐标(东北密度512点)。参考

File Ldist:
文件Ldist:

Columns in line i :
中的列线:

Column  1 : Values of  T(i-1).
专栏1:T(I-1)的值。

Columns 2 to 513 : Abscissa ( Log(Ne) values).
列2到513:横坐标(log(NE)值)。

Columns 514 to 1025 : Ordinates (densities of these Log(Ne)). <br>
514到1025列:纵坐标的这些log(密度(Ne)等)。参考


5。 PLOT----------5. PLOT----------

- Two functions are provided to plot posterior distributions: <br>
- 两个函数绘制后验分布:参考

1) NTdist():        Graphical summary of the posterior distribution of estimates of Log(Ne) in the past (a 2D plot),  using the job.Batch file and the length of time during which distributions are retrieved. <br>
1)NTdist():在过去(2D绘图),使用的job.Batch的文件,并长的时间,在此期间,分布在检索log(NE)估计的后验分布的图形摘要。参考

2) plotNdistrib():        Plots the posterior distributions of the estimates of Ne (or Log(Ne)) at a number of times in the past,  using a job.Ndist or job.Ldist file as previously calculated with NatSizeDist() or LogSizeDist(). <br>
2)plotNdistrib():图解氖(Ne)的估计(或登陆(Ne)等)的后验分布在若干倍,在过去,,使用job.Ndist或job.Ldist文件预先计算用NatSizeDist()或LogSizeDist ()。参考

- Plot Harmonic Mean from the .Nstat file. In addition to the proposed functions, we illustrate how to plot specific results from a file produced by NatSizeDist():
- 图调和平均从。Nstat文件。除了建议的职能,我们说明了如何绘制产生的文件由NatSizeDist()的具体结果:

dat2=read.table("job.Nstat")
DAT2 = read.table(“job.Nstat”)

x2=dat2[,1]
X2 =,DAT2 [1]

y2=dat2[,3]
Y2 =,DAT2 [3]

x2=as.numeric(x2)
χ2= as.numeric(x2)的

y2=as.numeric(y2)
:Y2 = as.numeric体(y2)

maxX2=max(x2)
maxX2 = MAX(X2)

maxY2=max(y2)
maxY2 = MAX(Y2)

plot(x2,y2,type='l', lwd="2",ylim=c(0,maxY2),xlab="Time T in the past (generations)",ylab="Ne(T)")
图(X2,Y2,类型=“L”,随钻测井=“2”,ylim = C(0,maxY2),xlab =“时间T在过去(代)”,ylab“讷(&#354; )“)


注意----------Note----------

More details on the model can be found on the website: https://qgp.jouy.inra.fr This package needs mcmc package. The example is done with few batches to test the model. The minimum is NumberBatch =10000, LengthBatch=10, SpaceBatch=10.
更多细节的模型可以在网站上找到:https://qgp.jouy.inra.fr这个包需要MCMC包。的例子是与几批测试模型。最小值是NumberBatch = 10000,LengthBatch = 10,SpaceBatch = 10。


(作者)----------Author(s)----------



Natacha Nikolic &lt;documents_57@hotmail.com&gt; and Claude Chevalet &lt;claude.chevalet@toulouse.inra.fr&gt;




参考文献----------References----------




参见----------See Also----------

Overview: VarEff-package <br> Exemple: InputTest <br> HelpData: HelpData
概述:VarEff-package的<BR>为例:“InputTest的<BR> HelpData:HelpData


实例----------Examples----------



VarEff(infile=system.file("data/InputTest.txt", package = "VarEff"),
                          parafile = 'job',
                          NBLOC=20,
                          JMAX=3,
                          MODEL = 'S',
                          MUTAT=0.01,
                          NBAR=1000,
                          VARP1=3,
                          RHOCORN=0,
                          GBAR=5000,
                          VARP2=3,
                          DMAXPLUS=12,
                          Diagonale=0.5,
                          NumberBatch = 100,
                          LengthBatch = 10,
                          SpaceBatch = 10)


转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-27 16:42 , Processed in 0.021366 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表