★上一篇基本介绍了如何产生向量以及对向量的一些基本操作,这一篇文章主要介绍如何绘制以下图线:

(1)直方图+点图;

(2)密度估计曲线;

(3)经验分布图;

(4)Q-Q 图;

(5)茎叶图;

(6)箱线图;

(7)正态分布图(包括常用的画出曲线的函数curve())

★其中会再介绍:


如何使用R语言已知的四类有关统计分布的函数(密度函数d,累计分布函数p,分位函数q,随机数函数r)来快速做出相应的图线。(这四个函数在以后也会有很经常的运用,适当理解记忆)

 

 


****************************************************************************************************************************************

*数据使用的是上一篇中的数据

 

 

一:四类有关统计分布的函数以及其使用

R语言中提供了四类有关统计分布的函数:密度函数、累计分布函数、分位函数和随机数函数,

使用时分别在代表该分布的R函数前加上相应前缀(d,p,q,r)即可获得相应的函数。

★下面来举个栗子--->>>:



d: 正态分布的函数是norm,命令dnorm(0)就可以获得正态分布的密度函数在0处的值(0.3989)(默认情况下为标准正态分布->均     
 值为0,标准差为1);

p: pnorm(0)是0.5就是正态分布的累计密度函数在0处的值;

q: qnorm(0.5)则得到的是0,即标准正态分布在0.5处的分位数是0;

r: rnorm(n)则是按正态分布随机产生n个数据(不同函数所要使用的参数也会有所不同。

 

 

 

二:常用图线的绘制(每一点后面会附上相应的图形)

★1:直方图(Histogram)
> hist(Student) #图线属性均取默认值 > hist(Student,freq=F,col="blue",lty=3)
    *该图线部分属性的解释 :

    Frequency 频率
    freq=T:频数分布直方图
    freq=F:频率分布直方图

    colour 颜色
    col = "blue" :柱形的颜色
    line style 线条样式
    lty = 3 :线条的样式(1,2,3,4分别为直线,长虚线,短虚线和点虚线)
    line width 线条宽度
    lwd = 2 :线条的粗细程度

* 下面补充一下相对比较简单的点图:

   plot(Student)    #直接使用这个语句就可以产生相应的点图(plot:点)

  --->>>图形:与下一个放在了一起,不单独画了(〃'▽'〃)

 

★2:密度估计曲线
> hist(x,freq=F) > lines(density(x),lty=1) #配合频率分布直方图使用,相应的属性参数在上面已经提到
  --->>>图形: 



*如果想不依靠直方图,单独画概率密度曲线图,使用plot(density(x))即可。(后方的随机产生50个标准正态分布随机数中就会体现到)

 

 

★3:经验分布图
plot(ecdf(x),verticals=TRUE,do.p=TRUE)
  *该图线部分属性的解释 :

   verticals = T/TRUE:点与点之间通过竖线连接;

   do.p :标出每一个点的位置,不加的话只是画线;

  --->>>图形: 



 

★4:Q-Q图:判断数据是否服从某种分布的图
#判断数据是否来自正态分布 > par(mfrow=c(1,2)) #让两幅图位于同一页面 >
plot(ecdf(Student),verticals=TRUE,do.p=FALSE) #经验分布图 >
lines(0:100,pnorm(0:100,mean(Student),sd(Student)))
#相应数据范围内的正态分布曲线,注意这种方法绘制的正态分布图需要基于已绘制的图 #简单来说就是单独执行这一个语句并不会做出一张正态分布的曲线
#后面会介绍如何绘制正态分布曲线 > qqnorm(Student);qqline(x) #将两个图线进行对比产生新图
  --->>>图形:



 

★5:茎叶图
> stem(Student) The decimal point is 1 digit(s) to the right of the | 0 | 112
2 | 3 4 | 566 6 | 8
 

 

★6:箱型图
> boxplot(Student)
 * 有关箱型图:

        箱型图有什么作用?
        箱型图不受一场值得影响。可以以一种相对稳定的方式描述数据的离散分布情况。
        箱型图最重要的作用就是识别异常值,在数据清洗中起到很大的作用。
       *IQR:四分位距(interquartile range, IQR),又称四分差--->>>画箱型图的边界会用得到1.5IQR与3IQR。
        是描述统计学中的一种方法,以确定第三四分位数和第一二分位数的区别,
        与方差、标准差一样,表示统计资料中各变量分散情形。

  --->>>图形:



 

★7:正态分布(norm)曲线

说到正态分布曲线就必须再次谈到上面提到的四类有关统计分布的函数和正态分布函数的组合:

dnorm() :正态分布的概率密度函数

pnorm() :正态分布的分布函数 (密度函数在一定长度区域的积分,分布函数又叫做累计概率密度函数)

qnorm() :正态分布的分位计算函数,某处的确切数据

rnorm(n,mean(),sd()) :产生n个指定均值与方差的符合正态分布的随机数

---->>>

使用curve()函数进行绘图:
> x = 0 #这一步仅仅起到为x赋初值的作用 > curve(dnorm(x,0,1),xlim=c(-5,5),col="red",lwd=2)
---->>>图像:



 

 

 

三:例题分析(图形已省略)

1:(1)绘制均值分别是-2和2,方差是1的正态曲线;

      (2)绘制均值都是0,方差分别是0.5,1,2的正态曲线。

解答:
> x = 0 > curve(dnorm(x,-2,1),xlim=c(-10,10),col="blue",lwd=3) > x = 0 >
curve(dnorm(x,2,1),xlim=c(-10,10),col="blue",lwd=3) > x = 0 >
curve(dnorm(x,0,0.5),xlim=c(-3,3),col="blue",lwd=3) > x = 0 >
curve(dnorm(x,0,1),xlim=c(-5,5),col="blue",lwd=3) > x = 0 >
curve(dnorm(x,0,2),xlim=c(-10,10),col="blue",lwd=3)
2:产生50个标准正态分布的随机数并画图

解答:
> rnorm(50,0,1) [1] 0.153511698 -0.598874538 1.444824480 0.113338992
0.195543906 -0.167031452 -0.720985541 0.036072191 [9] 0.184643424 0.823415004
-0.585216839 -1.337102916 -0.859287571 -2.623733157 -0.092221933 -1.097398448
[17] -1.126488539 -0.701888908 0.273297120 0.170948008 1.504047012 -0.230236291
-1.181785710 0.694720301 [25] 0.803350717 -0.549813009 -0.380067832
-1.576796227 -0.710676744 -0.541308125 0.154828153 0.893860231 [33]
-0.047622902 1.497209582 2.684456744 0.091321547 0.712776814 0.405061117
-0.663331765 0.205133084 [41] 1.521656646 0.548676735 0.563675433 0.008166417
-0.419129354 -0.763316744 -0.411424094 0.446961904 [49] 0.317453368
-0.177881678 > x = rnorm(50,0,1) > plot(x)


*当然这个图可能会与本来预想的图像不太一样,预想的应该是曲线呀~

这里也可以产生相应的概率密度曲线:

plot(density(rnorm(50,0,1)))



 

 

3: 若 X 服从 N(5,11),试求P( X < 0),P(11 < X < 18)

解答:

  第一个参数的含义是x<=n(x<n) 

  注意pnorm()中的参数以及其的实际意义!
> pnorm(5,sqrt(11))-pnorm(0,5,sqrt(11)) [1] 0.8880148 >
pnorm(18,5,sqrt(11))-pnorm(11,5,sqrt(11)) [1] 0.03517588
 

 


****************************************************************************************************************************************

 

<> <> <> <> <> <>             最快的脚步不是跨越,而是继续,最慢的步伐不是小步,而是徘徊。

 


****************************************************************************************************************************************