找回密码
 注册
查看: 4378|回复: 1

求助: 统计方法求解

[复制链接]
发表于 2012-5-9 14:00:20 | 显示全部楼层 |阅读模式
本帖最后由 jackyma1981 于 2012-5-9 14:09 编辑

大家好,我有一批数据不知到该如何分析,特来请教,希望高人指点!
先致谢!

简单举例描述一下我的数据(实际数据内容不方便公开):
比如有一批球状物体表面会有红,白,蓝,绿等颜色的一种或多种构成。现在测得所有球的体积(V),表面积(A),半径(R)。
所有球的数据的最大值,最小值及数据总量。
max(V)=63000     max(R)= 13.4407
min(V)=3.0080    min(R)= 0.7232
数据总量N=950000

含有红色的球的数据
max(hongV)= 63000    max(hongR)=13.44
min(hongV)=3.0080     min(hongR)=0.74
红N=353368

其他颜色的就不列举了。

现在想知道各种颜色出现的特征。该如何统计?

我用R语言做了整体的频数分布分析

分组    频数    相对频数   累积频数   累积相对频数
0~        945606        100.0        945606        100.0
5000~        81        0.0        945687        100.0
10000~        6        0.0        945693        100.0
15000~        1        0.0        945694        100.0
20000~        1        0.0        945695        100.0
25000~        0        0.0        945695        100.0
30000~        0        0.0        945695        100.0
35000~        0        0.0        945695        100.0
40000~        0        0.0        945695        100.0
45000~        0        0.0        945695        100.0
50000~        10        0.0        945705        100.0
55000~        0        0.0        945705        100.0
60000~        4        0.0        945709        100.0
合計        945709        100.0
应为数据跨度很大作出的频数分布直方图只有第一组的可以显示出来。
把组距变为小为1,或者5画出的图也觉得看不出分布特征,下面贴出两张图。

右朋友建议我把各个颜色的频数除以总体的频数,重新画图右可能看出各个颜色之间的不同。
不太清楚这么做,统计学上怎么解释?是什么处理?是正态化处理么?

用R语言该怎么写命令?

由于本人统计学知识缺乏,可能问题描述的不够清楚,请大家指正.
Leu .jpeg
Ala .jpeg
回复

使用道具 举报

发表于 2012-5-9 20:29:18 | 显示全部楼层
直接hist画不出来吗,
要不你就标准化一下,不是正正态因为从你的两个数据图来看就不是正态

可以每个数据都用这个 (x-min)/(max-min)标准化一下,校正到0-1
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-22 06:38 , Processed in 0.027128 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表