找回密码
 注册
查看: 3181|回复: 1

关于数据的无量纲化处理

[复制链接]
发表于 2013-4-4 16:54:52 | 显示全部楼层 |阅读模式
最近遇到一个小问题。
基础资料是:一些学生的数学、科学、英语成绩,任务是 把这几个学生按照成绩划分为ABCD级

处理问题的第一步便是如何建立这三门成绩的综合评分标准:

Student <- c("John Davis", "Angela Williams",
    "Bullwinkle Moose", "David Jones",
    "Janice Markhammer", "Cheryl Cushing",
    "Reuven Ytzrhak", "Greg Knox", "Joel England",
    "Mary Rayburn")
Math <- c(502, 600, 412, 358, 495, 512, 410, 625, 573, 522)
Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86)
English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18)

老师给的处理方式是直接把 三项成绩用scale 直接标准化后求平均,然后再划分等级排名;
但我认为这样 抹杀了数据间的方差,不是很合适;
我尝试用 规格化变化方法:(Math=Math-min(Math)/max(Math)-min(Math)) *100 来处理数据
但发现这样会使的Math 和English  的成绩必有一个100,必有一个0;这貌似也不合理。

所以想请教高手如何处理这个数据更合理?
谢谢指导!!
回复

使用道具 举报

发表于 2013-9-23 17:17:17 | 显示全部楼层
一般无量纲化成绩用标准分形式,标准分的计算函数:function(x){(x-mean(x))/sqrt(var(x))}。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-24 12:45 , Processed in 0.022223 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表