博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《机器学习与数据科学(基于R的统计学习方法)》——1.9 数据集
阅读量:7046 次
发布时间:2019-06-28

本文共 601 字,大约阅读时间需要 2 分钟。

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.9节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.9 数据集

本书尽力教大家机器学习的方法,因为机器学习是关于数据的,所以我们需要大量的样本数据集以供在例子中使用。为了让事情简单一点(并且不需要你花费大量时间去寻找数据集),书中使用的大多数数据集都是R软件在安装时自带的。使用如下命令,查看可用的数据集列表:

> data()```你所能看到的列出的数据集,取决于你安装了什么包和你在内存中加载了什么包。R包中通常包含可以用来检验函数功能的数据集。可以使用如下命令,查看特定R包中包含的数据集:

data(package="plyr")`

要查看某个数据集中的更多内容,你可以使用在数据集名称前面加?的命令,就像下面展示的这样。R会给出数据集的简短介绍、观测(例子)的数目、变量名(特征)列表、代码示例和在很多情况下都有的每个变量的描述。图1-5展示了R给出的关于airquality数据集的帮助信息。本书会使用许多著名数据集,强烈建议你熟悉每个数据集中的每个变量。

> ? airquality```你可以使用以下命令来将某个数据集加载到内存中:

data(iris)`

你将在RStudio的Workspace标签页看到数据集的名称。

df3569153bccdba082a347135a3cc32526c4637a

转载地址:http://pbuol.baihongyu.com/

你可能感兴趣的文章
Linux信号(signal) 机制分析
查看>>
cisco asa5505 transparent v8.4&v7.2
查看>>
NAT技术基础解析
查看>>
求完数
查看>>
快速高效地开发和调试基于gradle管理的web应用
查看>>
500 OOPS: vsftpd: refusing to run with writable root inside chroot()
查看>>
SolrCloud+tomcat7+zookeeper集群配置
查看>>
Dubbo之服务暴露
查看>>
一点感叹
查看>>
使用Feign实现Form表单提交
查看>>
linux 压缩及归档
查看>>
Linux下的DNS
查看>>
floor和ceil函数的返回自是double型的
查看>>
14.3继承
查看>>
死锁预防和死锁防止
查看>>
leetcode--合并两个有序的链表
查看>>
企业运维—玩转 windows server 2016 DNS服务
查看>>
Scala flatMap的变体
查看>>
rpm,yum程序包管理器
查看>>
Hadoop常见错误及处理方式
查看>>