当前位置:论文写作 > 毕业论文范文 > 文章内容

R软件在多元统计教学中的应用

主题:主成分分析 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2024-03-07

简介:大学硕士与本科成分等于毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写成分等于方面论文范文。

成分等于论文范文

主成分分析论文

目录

  1. 1.在聚类分析教学中的应用
  2. 2.在主成分分析教学中的应用
  3. 1.)Standard deviation:表示主成分的标准差,即主成分的方差平方根,即相应特征值的开方,
  4. 2.)Proportion of Variance:表示方差的贡献率,
  5. 3.)Cumulative Proportion:表示方差的累计贡献率.
  6. 4.)函数summary()中loadings等于TRUE选项列出了主成分对应原始变量的系数.
  7. 3.在对应分析教学中的应用
  8. 主成分分析:中成药毒性饮片成分公开:“有毒”不等于“有害”[北京您早]

(广东金融学院 广州 510520)

摘 要:本文结合实例介绍了R软件在多元统计分析中的应用,具体内容包括R软件在聚类分析、主成分分析、典型相关分析等方面的应用.

关键词:R软件 聚类分析 主成分分析 典型相关分析

中图分类号:G43 文献标识码:A 文章编号:1674-098X(2011)01(a)-0157-02

在统计软件方面,常用的统计软件有SPSS、SAS、STAT、R、S-PLUS等.R软件是一个自由、免费、开源的软件,是一个具有强大统计分析功能和优秀统计制图功能的统计软件,现已是国内外众多统计学者喜爱的数据分析工具.本文结合实例介绍了R软件在多元统计分析中的应用,具体内容包括R软件在聚类分析、主成分分析、对应分析等方面的应用.

1.在聚类分析教学中的应用

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合.在社会经济领域中存在着大量分类问题,比如若对某些大城市的物价指数进行考察,而物价指数很多,有农用生产物价指数、服务项目价指数、食品消费物价指数、建材零售论文范文指数等等.由于要考察的物价指数很多,通常先对这些物价指数进行分类.总之,需要分类的问题很多,因此聚类分析这个有用的工具越来越受到人们的重视,它在许多领域中都得到了广泛的应用.

聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等.

R软件及其相关包提供了各种聚类方法,主要是系统聚类方法、快速聚类方法、模糊聚类方法,常用的是系统聚类方法.

R软件实现系统聚类的程序如下:

Hclust(d,method等于“complete”)

其中d是由“dist”构成的距离结构,具体包括绝对值距离、欧氏距离、切比雪夫距离、马氏距离、兰氏距离等,默认为欧氏距离,method包括类平均法、重心法、中间距离法最长距离法最短距离法、离差平方和法等,默认是最长距离法.

例1:表1是广东省2008年各市居民家庭平均每人全年消费性支出,利用所给数据对各市进行系统聚类.

R语言程序如下:

>, X<,-read.delim("clipboard",header等于T)

>, row.names(X)<,-c(“广州”,“深圳”,“佛山”,“东莞”,“顺德”,“中山”,“江门”,“茂名”,“湛江”,“珠海”,“汕头”,“惠州”,“肇庆”,“揭阳”,“韶关”,“梅州”,“阳江”)

>, d<,-dist(scale(X))

>, hc1<,-hclust(d,"single")#最短距离法

>, hc2<,-hclust(d,"complete")#最长距离法

>, hc3<,-hclust(d,"median")#中间距离法

>, h论文范文<,-hclust(d,"ward")#Ward法

>, opar<,-par(mfrow等于c(2,2))

>, plot(hc1,hang等于-1),plot(hc2,hang等于-1)

>, plot(hc3,hang等于-1),plot(h论文范文,hang等于-1)

2.在主成分分析教学中的应用

在实际经济生活中,有时需要处理的是多变量(多指标)问题.由于变量较多,增加了分析问题的复杂性,但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠.人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,是一种“降维”的思想.

R软件实现主成分分析的程序如下:

Princomp(x,cor等于FALSE,scores等于TRUE,等)

X为数据矩阵或数据框,cor为是否用相关阵,默认为协差阵,scores为是否输出成分得分.

例2:对例1中的数据进行主成分分析.

主成分分析:中成药毒性饮片成分公开:“有毒”不等于“有害”[北京您早]

R语言程序如下:

>,X<,-read.delim("clipboard",header等于T)

>,cs.pr<,-princomp(X,cor等于TRUE)

>,summary(cs.pr,loadings等于TRUE)(表2、表3)

说明:

1.)Standard deviation:表示主成分的标准差,即主成分的方差平方根,即相应特征值的开方,

2.)Proportion of Variance:表示方差的贡献率,

3.)Cumulative Proportion:表示方差的累计贡献率.

4.)函数summary()中loadings等于TRUE选项列出了主成分对应原始变量的系数.

由于前3个主成分的累计贡献率已经达到82.4%,所以取前3个主成分来降维.

碎石图是一种可以帮助我们确定主成分合适个数的有用的视觉工具,将特征值从大到小排列.

>,biplot(cs.pr)(图1)

>,screeplot(cs.pr,type等于c("barplot"))

由图2可以看出,取前3个主成分来降维是比较合理的.

3.在对应分析教学中的应用

对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系.可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系.主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中.原因在于,它是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来.

本文结合实例,介绍了R软件在多元统计分析教学中的具体应用,通过R软件的具体操作来实现多元数据分析,一方面可以加深学生对多元统计方法的理解,更好的掌握多元统计理论方法,同时还可以使学生摆脱繁琐的计算,使学生能处理实际的多元数据分析.

参考文献

[1]王斌会.多元统计分析及R语言建模[M].广州:暨南大学出版社,2010.

[2]汤银才.R语言与统计分析[M].北京:高等教育出版社,2005.

总结:此文是一篇成分等于论文范文,为你的毕业论文写作提供有价值的参考。

主成分分析引用文献:

[1] 主成分分析论文范文 主成分分析方面专升本论文范文2500字
[2] 主成分分析论文范文 关于主成分分析电大毕业论文范文2万字
[3] 综合评价和主成分分析本科论文开题报告范文 综合评价和主成分分析类学术论文怎么写2万字
《R软件在多元统计教学中的应用》word下载【免费】
主成分分析相关论文范文资料