R语言如何探索数据集的变量情况

 时间:2024-10-14 04:07:14

1、获取数据集。这里以MASS软件包中的Insurance数据集为例。data(Insurance) #获取数据集。如果没有则需要先安装MASS。dim(Insurance) #查看数据集维度head(Insurance) #查看数据前若干行

R语言如何探索数据集的变量情况

3、探索数据集的内部结构。str(Insurance)从结果中可以看出Insurance数据集共有64个观测值、5个变量,其中Distric为定性数据,Group、Age为定序数据,Holders和Claims为整数形定量数据。

R语言如何探索数据集的变量情况

5、利用Hmisc软件包中的describe函数查看变量详情。install.packages("Hmisc")library(Hmisc) #安装并加载Hmisc软件包describe(Insurance) #变量的描述统计结果中可以看到各个定性变量的总观测值个数、缺失个数、水平个数,以及每个水平下的频数和频率;定量变量则显示了0.05到0.95的一系列分位数取值,以及频率最高和最低的5个水平值。

R语言如何探索数据集的变量情况
  • r语言读取excel数据
  • 如何调用R语言自带的数据集
  • R语言怎么做相关性分析
  • 如何使用R语言中的MASS第三方包获取数据
  • R语言怎么读取CSV文件
  • 热门搜索
    红豆沙怎么做 生育保险怎么报销 精索静脉曲张是怎么样引起的 囧怎么读 京豆怎么获得 怎么学英语 医保卡丢了怎么挂失 记忆力差怎么办 幼师资格证怎么考 商业计划书怎么写