找回密码
 注册
查看: 7539|回复: 9

Data Mining with R—R数据挖掘电子书

  [复制链接]
发表于 2010-12-5 22:20:05 | 显示全部楼层 |阅读模式
Contents
Preface iii
1 Introduction 1
1.1 How to read this book? . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 A short introduction to R . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Starting with R . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 R objects . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Vectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.4 Vectorization . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.5 Factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.6 Generating sequences . . . . . . . . . . . . . . . . . . . . 11
1.2.7 Indexing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.8 Matrices and arrays . . . . . . . . . . . . . . . . . . . . . 14
1.2.9 Lists . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2.10 Data frames . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.11 Some useful functions . . . . . . . . . . . . . . . . . . . . 23
1.2.12 Creating new functions . . . . . . . . . . . . . . . . . . . 25
1.2.13 Managing your sessions . . . . . . . . . . . . . . . . . . . 28
1.3 A short introduction to MySQL . . . . . . . . . . . . . . . . . . . 29
2 Predicting Algae Blooms 33
2.1 Problem description and objectives . . . . . . . . . . . . . . . . . 33
2.2 Data Description . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3 Loading the data into R . . . . . . . . . . . . . . . . . . . . . . . 34
2.4 Data Visualization and Summarization . . . . . . . . . . . . . . . 35
2.5 Unknown values . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5.1 Removing the observations with unknown values . . . . . 43
2.5.2 Filling in the unknowns with the most frequent values . . 44
2.5.3 Filling in the unknown values by exploring correlations . 45
2.5.4 Filling in the unknown values by exploring similarities
between cases . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.6 Obtaining prediction models . . . . . . . . . . . . . . . . . . . . . 52
2.6.1 Multiple linear regression . . . . . . . . . . . . . . . . . . 52
2.6.2 Regression trees . . . . . . . . . . . . . . . . . . . . . . . 58
2.7 Model evaluation and selection . . . . . . . . . . . . . . . . . . . 64
2.8 Predictions for the 7 algae . . . . . . . . . . . . . . . . . . . . . . 70
2.8.1 Preparing the test data . . . . . . . . . . . . . . . . . . . 71
2.8.2 Comparing the alternative models . . . . . . . . . . . . . 71
v
vi CONTENTS
2.8.3 Obtaining the prediction for the test samples . . . . . . . 74
2.9 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3 Predicting Stock Market Returns 79
3.1 Problem description and objectives . . . . . . . . . . . . . . . . . 79
3.2 The available data . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.2.1 Reading the data from the CSV file . . . . . . . . . . . . 81
3.2.2 Reading the data from a MySQL database . . . . . . . . . 82
3.2.3 Getting the data from the Web . . . . . . . . . . . . . . . 85
3.3 Time series predictions . . . . . . . . . . . . . . . . . . . . . . . . 87
3.3.1 Obtaining time series prediction models . . . . . . . . . . 90
3.3.2 Evaluating time series models . . . . . . . . . . . . . . . . 96
3.3.3 Model selection . . . . . . . . . . . . . . . . . . . . . . . . 100
3.4 From predictions into trading actions . . . . . . . . . . . . . . . . 103
3.4.1 Evaluating trading signals . . . . . . . . . . . . . . . . . . 104
3.4.2 A simulated trader . . . . . . . . . . . . . . . . . . . . . . 106
3.5 Going back to data selection . . . . . . . . . . . . . . . . . . . . . 110
3.5.1 Enriching the set of predictor variables . . . . . . . . . . . 110
Bibliography 119

下载: Data Mining with R.pdf (1.68 MB, 下载次数: 175, 售价: 5 金钱)

为长期从事生物统计行业的各位提供下载资料。
为了避免恶意下载和滥用,本贴设置了下载积分限制。
生物统计家园提醒您:您在生物统计家园的活动都可能会增加您的积分,使您获得更多权限。
多发些资料供别人下载也可以赚取积分!
如何获得积分(详细): http://www.biostatistic.net/home.php?mod=spacecp&ac=credit&op=rule


回复

使用道具 举报

发表于 2011-5-14 22:14:55 | 显示全部楼层
我的积分不够,能不能给我传一份啊?我的邮箱是:gouweichaoyan@163.com
谢谢啊!
回复 支持 反对

使用道具 举报

发表于 2011-7-15 13:16:35 | 显示全部楼层
这是啥版本呀?!
回复 支持 反对

使用道具 举报

发表于 2011-7-27 20:30:45 | 显示全部楼层
也跟着问一下,是哪个版本的?
回复 支持 反对

使用道具 举报

发表于 2011-8-22 19:27:22 | 显示全部楼层
我的积分不够
回复 支持 反对

使用道具 举报

发表于 2012-4-30 18:43:41 | 显示全部楼层
也跟着问一下,是哪个版本的?
回复 支持 反对

使用道具 举报

发表于 2012-5-31 09:51:49 | 显示全部楼层
还真是03年的那版~~我讨厌都是英语啊~~哎
回复 支持 反对

使用道具 举报

发表于 2012-6-2 10:11:18 | 显示全部楼层
感谢分享 thank you
回复 支持 反对

使用道具 举报

发表于 2012-6-5 16:58:47 | 显示全部楼层
感谢分享,thank you
回复 支持 反对

使用道具 举报

发表于 2014-1-6 20:43:29 | 显示全部楼层
哪位大神有中文版的啊.....
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-21 21:06 , Processed in 0.027487 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表