当前位置:论文写作 > 毕业论文范文 > 文章内容

支持向量机毕业论文的格式范文 支持向量机相关函授毕业论文范文2万字有关写作资料

主题:支持向量机 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2024-02-11

支持向量机论文范文

《单分类支持向量机用于样本不平衡数据集建模》

该文是支持向量机类论文范文资料跟支持向量机相关毕业论文的格式范文.

摘 要:主要研究应用单分类支持向量机(One-class Support Vector Machine,OneSVM)在不平衡样本数据集的建模问题.首先从UCI 获得Abalon数据集,随机挑选400正样本和400负样本构建训练集,交叉验证方法用于OneSVM 分类器训练,模型对数据集的预测精度达到98.00%,与标准SVM分类器对此数据集83.10%的预测正确率相比具有明显的竞争力.然后在样本数据不平衡数据机上训练加权SVM对负样本的预测精度为76.70%,模型对负样本不具有稳定性.实验结果表明单分类支持向量机在样本数目失衡的学习问题中具有良好的泛化能力,同时单分类支持向量机只用一类样本训练分类器,在算法的复杂度上也具有优势.

关键词: 支持向量机; 单分类支持向量机; 预测偏置

中图分类号: TP 311

文献标志码: A

Abstract: The purpose of this http://127.1.1.1:801/xdl.php?url等于http://gzslib.vip.qikan.com/Text/article is to study the performance ofone-class support vector machine (OneSVM) used in unbalanced dataset prediction. Firstly, the Abalon dataset was obtained for UCI, in which 400 positive and negative samples were selected to construct training datasets, cross-validation method was employed to train OneSVM classifiers, 98.00% accuracy was obtained and the results indicates more promisingcompared with the accuracy 83.10% obtained by using SVM methods. Secondly, an unbalanced dataset was constructed to train right-SVM; the specificity accuracy 76.70% showed the model was lack of stability. The results indicate OneSVM has great generalization in unbalanced dataset learning problems, where, OneSVM is only trained on single class samples that intend to more superior in the complexity.

Key words: support vector machine; OneSVM; prediction bias

0 引言

支持向量機是基于统计学习理论实现的小样本学习算法,核心思想是实现最大间隔分类从而降低模型的置信范围,引入核函数对数据空间进行升维从而解决线性不可分问题在超平面上变得线性可分.支持向量机设计应用与二分类问题,在许多领域的应用取得巨大的成功.很多研究者针对不同的问题提出了多种改进算法,如最小二乘支持向量机(Least Square SVM,LSSVM),它遵循结构风险最小化的原则[1].张学工教授提出了中心支持向量机(Central SVM,CSVM)用于回归分析[2].此后,林智仁教授设计并开发了较为完善的Libsvm软件工具包[3].

然而在实际应用中,很多的机器学习问题都是小样本学习问题,无法获得大量的样本数据,或者存在某类样本无法获得的情况,诸如入侵检测、敌我识别往往只能获得一类样本.因此可以应用于单分类问题的支持向量机算法就显得尤为重要,Schlkopf设计出了单类样本学习的支持向量机算法(OneSVM)[4],在很多应用中取得巨大的成功.

1 材料与方法

1.1 支持向量机(SVM)

SVM的数据描述就是找到一个最优分类面,要求能把两类样本没有错误地分开并且分类间隔保证最大.前者是逼近经验风险最小(模型对训练集样本能正确分类);使分类间隔最大实现置信范围最小,从而逼近真实风险最小.SVM可以描述为求解的一个优化问题,如式(1).

1.2 单分类支持向量机(OneSVM)

OneSVM只在一类样本集上训练分类器[5].在二类问题中常常出现这样的情况,正样本容易收集而负样本很少或者收集需要付出更多的成本,标准SVM算法根本无法有效解决这样的问题[6].OneSVM可以看作是解决两类样本分类问题的特例,只有正样本而负样本很少,或者几乎没有负样本的情况下,单分类支持向量机要求找到这样一个超平面,这个超平面可以把正样本完全分开并使得最优分类面距离坐标原点的间隔最大,OneSVM可以描述为求解的一个优化问题[7],如式(2).

1.3 数据

在本文中,所用数据来源于机器学习标准数据库(UCI Machine Learning Repository),名称为Abalone(鲍鱼数据库)由塔斯马尼亚大学的计算机科学部门在1995年捐赠.鲍鱼标准数据集[5]共收有1 528条雄性鲍鱼数据和1 342条幼年体鲍鱼数据.每条数据由8个属性组成分别为Length、Diam、Height、Whole、Shucked、Viscera、Shell和Rings.我们将雄性鲍鱼作为正样本(Positive samples),幼年体鲍鱼作为负样本(Negative samples).随机在正样本和负样本中各选取400条数据作为训练集,验证模型对雄性、幼年体鲍鱼的预报能力.列出鲍鱼数据特征统计信息,如表1所示.

此文总结,上文是关于支持向量机方面的大学硕士和本科毕业论文以及支持向量机相关支持向量机论文开题报告范文和职称论文写作参考文献资料.

支持向量机引用文献:

[1] 支持向量机论文范文 关于支持向量机方面毕业论文格式模板范文2500字
[2] 支持向量机论文范文 支持向量机方面毕业论文范文2万字
[3] 支持向量机论文范文 关于支持向量机相关论文范例2万字
《支持向量机毕业论文的格式范文 支持向量机相关函授毕业论文范文2万字》word下载【免费】
支持向量机相关论文范文资料