当前位置:论文写作 > 论文集 > 文章内容

大学计算机系论文范文参考 大学计算机系毕业论文范文[精选]有关写作资料

主题:大学计算机系 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2024-03-01

大学计算机系论文范文

大学计算机系论文

目录

  1. 第一篇大学计算机系论文范文参考:智能搜索引擎理论与应用研究
  2. 第二篇大学计算机系论文样文:基于特大增量步算法的网络并行计算
  3. 第三篇大学计算机系论文范文模板:资源模型与系统级描述语言的硬件综合
  4. 第四篇大学计算机系论文范例:中文问答系统中问题分类技术研究
  5. 第五篇大学计算机系论文范文格式:信息检索相关性判据及应用研究

★100篇免费大学计算机系论文范文,为你的毕业论文写作提供有价值的参考,为您写大学计算机系毕业论文范文和职称论文提供相关的优秀范文格式模板参考,【快快阅读吧!】

第一篇大学计算机系论文范文参考:智能搜索引擎理论与应用研究

随着Internet的广泛应用,Web得到了迅猛的发展,Web上的信息呈指数级增长,因此,如何对这种海量Web信息进行自动处理成为非常重要的研究课题.传统搜索引擎搜索的内容繁杂,导致查询结果中存在大量无关信息,降低了查询精度.一种新的研究趋势是结合领域知识和智能技术研究搜索引擎,即基于领域的智能搜索引擎(Domain-based Intelligent Search Engine).智能搜索引擎采用机器学习的方法研究文本信息的自动搜集、抽取与分类等处理过程,由此可以减少大量人力资源的需求,并提高信息处理的效率和精度.本文深入研究了智能搜索引擎中所使用的理论、算法与实现技术,采用巩固学习、隐马尔科夫模型(HMM)、朴素贝叶斯分类模型等机器学习方法在网络蜘蛛、信息抽取、文本预处理和信息检索等方面提出了若干新的算法,并建立了仿真平台和实验原型系统.理论分析和实验结果表明,这些算法具有较好的性能.

网络蜘蛛是智能搜索引擎中首先需要解决的问题.本文利用Web网页分布群聚性的特点,结合巩固学习方法,提出了一种新的启发式搜索算法.算法根据网页与主题的相关程度将网页分为与主题相关的网页集群与过渡型的网页集群,利用模拟退火的算法进行评估.在与主题相关的网页集群中进行搜索时,使用立即回报加速挖掘的进度;在过渡型的网页集群中使用未来回报拓宽探测的范围以加快定位过程.针对四所大学计算机系网站搜索的实验表明,算法具有较高的搜索效率.

针对Web上的各种网页信息,如何有效地抽取出论文标题、作者姓名、摘 要 等相关内容以方便查询,是智能搜索引擎的主要任务之一.目前基于隐马尔科夫(HMM)信息抽取模型一般以单词作为基本抽取单位,考虑到文本排版格式、分隔符等信息的存在,文本实际上可以看作是由一些文本分块序列组成,同一分块内的所有单词只可能属于同一个状态,而不同分块可以属于一个或多个状态.结合这种分块的思想,本文提出了基于文本分块的HMM信息抽取算法.实验结果表明,这种方法比基于HMM模型的信息抽取算法具有更好的性能.

文本信息处理通常采用向量空间模型表示文本信息,需要对单词进行预处理以降低单词数量.结合对单词过滤与特征选取两类常用预处理方法的研究,本文提出了基于最小类差异的特征过滤算法.算法通过分析文本特征的分布特性以及区分类的情况,将文本特征划分为单类特征、多类特征与一般特征等三种类型,按照特征在各类之间的分布差异,将类分布差异较小的特征所对应的一般特征进行过滤,实验结果表明这种算法有效地过滤了大量的无关信息和弱相关信息,提高了分类算法的精度.

信息检索是智能搜索引擎中的查询机制.本文结合W亡b信息表示的特点,提出了一种N层向量空间模型.模型将整个W七b信息按照结构的不同划分为多个层次,根据各层次的不同作用分别进行相似度计算.理论分析与实验结果表明,这种模型比传统向量空间模型具有更好的查全率与查准率.

基于超链接的信息检索方法是一种新型的信息检索机制.本文针对基于超链接的HITs(H yPerllnk一玩duced ToPio search)算法,结合N层向量空间模型的思想,提出了一种基于锚点信息的超链接检索排序算法.算法利用N层向量空间模型进行相似度计算,结合网页的链接信息进行排序.与HITS算法、TFIDF算法等信息检索方法的实验结果比较,新算法在信息检索的查全率与查准率方面取得了更好的效果.

针对W七b信息的动态性将导致搜索引擎所采集的信息失效,而一般的策略采用固定周期的信息更新算法,本文提出了一种基于最高响应比算法的WWW索引信息库更新方法,利用索引信息的访问情况以及网页的更新频度计算网页的更新周期,按照不同更新周期的情况进行信息的有效性检查,不仅减轻了系统信息维护的工作量,而且保证了信息的有效性.

最后,本文提出了一个比较完整的搜索引擎设计模型,结合本文在网络蜘蛛、信息抽取、文本分类、信息检索等方面的研究内容,在Windows操作系统平台上实现了一个简单的原型系统.

第二篇大学计算机系论文样文:基于特大增量步算法的网络并行计算

论文第一部分工作对特大增量步算法的体系进行了比较全面完整的阐述.主要成果是:(1)从力学概念出发详细阐述了特大增量步算法源于经典力法的推导思路,给出了完整的特大增量步算法的格式,包括非线性弹性问题、弹塑性问题和有限元格式一般表达的公式,(2)对比了与特大增量步算法具有一定相似性的LATIN 算法,指出基于力法和广义逆矩阵理论的LIM 算法和LATIN 算法虽然在方程分组和迭代形式上有相似之处,但在力学概念和数学理论基础上都有根本的不同,(3)给出了特大增量步算法完整的数学上的证明,包括特大增量步算法解的唯一性、解的收敛性和解的稳定性的证明,由此证明了特大增量步算法在数学上的完备性,(4)针对解的收敛性问题讨论了算法在弹塑性问题下样本点选取,指出在保证问题的收敛性的前提下LIM 算法在样本点的选择上比逐步增量法具有更大的自由性.

论文第二部分工作也是本论文更主要的工作是特大增量步算法的并行化研究工作.主要内容及成果为:(1)深入分析了特大增量步算法的并行性,指出算法在力学概念层面上所具有的时间上的并行和空间上的并行的内在并行性,以及算法在数值计算层面上在矩阵向量运算方面的并行性,(2)设计了特大增量步算法的分布式存储异步并行算法模型,提出了LIM 算法主从式的并行程序结构,(3)以平面应力问题为例,设计并给出了特大增量步算法基于广播的并行方案和基于非阻塞通信的并行方案,(4)描述了本论文所使用的并行环境,其硬件环境为机群系统,软件环境为Linux 操作系统加上基于消息传递MPI 编程环境,(5)对特大增量步算法并行程序的两个方案的并行性能进行了测试,分析了方案中的问题,进而给出了针对通信的程序优化方案,在清华大学计算机系高性能计算研究所的MPI环境下机群系统上的运行结果给出了接近10的加速比和95%以上的节点资源占用率,求解的规模可以达到上千单元网格,表现出良好的并行效率.

第三篇大学计算机系论文范文模板:资源模型与系统级描述语言的硬件综合

为更好地描述分析嵌入式系统的行为,近年来出现了系统级描述语言.但系统级程序通常是目标平台无关的.为了挖掘程序最大的运行性能,需要在设计空间中进行探索,将程序模块映射到各目标器件上,并且将各种有关实现细节的决策在新的程序文本中体现出来.这一“探索—决策—重写”的过程是一个不断地从抽象到具体的精化过程.而无论“探索”和“决策”的结果如何,对“重写”而言,都必须保证不在“重写”的过程中引入有违高层规范的实现错误.这需要有与之匹配的理论与工具的支持.

本文继承了用数学方法研究编译器设计的传统,以UTP为理论工具,着重探讨了与硬件综合相适应的有资源的指称语义理论框架.

在该理论框架中,静态资源模型给出了资源约束的“质”的一面.它指出只有当程序满足资源特性的时候,程序才能正常运行.否则,程序就会发生错误.该模型把所有有违资源特性的错误程序都归结为“取消作业”.这样处理的好处是便于构造正确性可证明的编译器设计的理论基础.在此基础上,我们给出了编译器设计的一般规范和三个应用.

资源不但有质的特性,也有量的特性.其后的有限资源模型是第一个模型在“量”的方面的扩展.它刻画了系统可用资源的数量将随程序的运行而减少,直至可用资源全部耗尽这一现象.同时我们发现在有限资源环境下资源重用带来的程序行为的不确定性,并探讨了消除这些不确定性的方法.

为了提高资源的利用率,我们通常会让几个并发进程共享资源.我们结合了CSP,UTP,Action Trace和Separation Logic等理论工具给出了统一解决资源冲突和访问冲突的并发进程共享资源模型,并用该方法讨论了资源共享中常见的冲突消解和死锁等问题.

除了正确性,好的编译器还应有较高的效率.编译器也是个程序,我们把程序比较的方法扩展到编译器比较上来,构造了“资源性能模型”.在考察了目标芯片的技术特性之后,我们给出了在预编译阶段,资源分配阶段,代码生成阶段和器件选型阶段等多个时期的硬件编译优化算法.理论和试验证明了这些方法的有效性.经优化,我们的综合器给出了小而快的网表.

这些资源预编译子句和资源分配算法为我们提供了高性能的资源*和可靠的资源调度方法.而基于资源模型的硬件综合方法的本质是一个将程序从无资源约束环境转换到有资源约束环境的映射,它具有普遍的理论意义和应用价值.它不仅适用于硬件综合,也可用于软件编译,特别是可重定向软件编译器设计.

第四篇大学计算机系论文范例:中文问答系统中问题分类技术研究

问答(Question Answering, QA)系统允许用户以自然语言形式进行提问,并直接返回精确的答案.与传统搜索引擎相比,问答系统的查询方式更加人性化,较好地满足了用户快速、准确地获取信息的需求,代表着下一代智能搜索引擎的发展方向.

问题分类通过确定问题的目标答案类型,为后续答案抽取和选择提供语义限制和约束,缩小候选答案的查找范围,并针对不同的问题类型选择不同的答案选择策略,对提升问答系统的整体性能具有特别重要的意义.

问题分类类似于文本分类,但问题分类比文本分类更难.问题分类的处理对象是简短的问句,所含特征信息相对较少.对于当前基于监督学习的问题分类来说,其关键在于特征提取,所提取的特征越丰富,分类的精度也就越高.但是,现有研究存在以下两点不足:

(1)特征提取很大程度上依赖于自然语言处理技术.无论是从现阶段的自然语言处理技术水平来看,还是从问答系统的实时性要求方面考虑,这种特征提取方式不仅会遇到实现技术上的限制,而且也难以满足实际问答系统的需求.

(2)忽视了对所提取特征的组合优化.现有工作大都根据所提取特征本身的分类精度,将一些认为比较重要的特征组合到一起.这种单纯依据特征本身重要性的特征组合方法具有一定的主观性,进而也影响了实际的问题分类效果.

大学计算机系论文范文相关参考属性
有关论文范文主题研究: 关于大学计算机系论文范文数据库 大学生适用: 2000字学位论文、2000字专升本毕业论文
相关参考文献下载数量: 61 写作解决问题: 如何写
毕业论文开题报告: 文献综述、论文选题 职称论文适用: 期刊目录、中级职称
所属大学生专业类别: 大学计算机系专业 论文题目推荐度: 优秀大学计算机系论文范文选题

对于中文问题分类,上述两点更加明显.由于中文自然语言处理技术相对于英文还远远不够成熟和完善,加之相应的语言处理基础资源(知识库、语料库等)等的缺乏,与英文问题分类相比,问句特征的提取更加困难.同时,由于中文语言表达的多样性和复杂性,所提取的中文问题特征之间的关联性更强,对这些特征进行组合优化就显得更为重要.

本文针对中文问题分类精度偏低的现状,从丰富特征集合及优化特征组合等层面,来探讨提升当前中文问题分类性能的具体实现途径.具体工作如下:

(1)针对中文问题分类缺乏丰富的特征,提出一种融合基本特征和词袋绑定特征的问句特征模型.在词袋、词性和词义等基本特征的基础上,通过将词性、词义等基本特征与词袋特征分别进行绑定,自动获取一类新的问句特征——词袋绑定特征,并将基本特征与词袋绑定特征进行融合,以获取更加高效的问句特征集合.这种新的问句特征模型不仅具有实现简单、处理开销小的优点,而且有效弥补了基本特征在句法、语义表达方面的不足.实验结果表明,在基本特征基础上融入词袋绑定特征以后,取得了与目前同类型问题集上已知最好的分类精度相当的分类效果.

(2)针对(1)中词袋绑定操作只是将词性、词义等基本特征单独绑定到词袋上,将其扩展为可以将词性、词义等若干基本特征同时绑定到词袋上的多重词袋绑定(multi-ple bag_of_words binding,MBWB)操作.通过在普通词袋和主干词词袋(trunk_BOW, T_BOW)上分别应用MBWB操作,自动生成两类潜在的问句特征——MBWB特征和T MBWB特征.MBWB操作可以更加充分地挖掘蕴含于基本特征之间的潜在特征,定程度上缓解了现有特征提取方法所面临的语言技术限制问题.实验结果表明,在基本特征基础上加入MBWB特征、T_MBWB特征以后,问题分类精度获得了较大的提升.

(3)针对依据特征重要性分析(importance analysis,ⅠA)的特征组合方法具有一定的主观性,提出一种基于重要性和抑制性分析(importance-inhibition analysis,ⅡA)的特征组合方法.该方法在组合问句特征时不仅考虑了单个特征本身的重要性,还考虑了待组合特征之间的抑制性.实验结果表明,与IA特征组合方法相比,ⅡA方法总体上要更加高效.

(4)考虑到ⅡA特征组合方法在特征数量较大时实现效率较低,进一步提出一种基于差异性和重要性的特征组合(diversity and importance based feature combination, DIFC)方法.借鉴分类器集成领域中的分类器互补指数来度量特征之间的差异性,并将差异性的定义由仅考虑样本集被错误分类时的差异(错分差异),扩展为同时考虑样本集被正确分类时的差异(正分差异);将互补性的定义扩展为同时考虑待组合特征与当前特征组合的差异性,以及待组合特征本身的重要性.实验结果表明,与ⅡA等其他特征组合方法相比,DIFC方法灵活高效,准确率更高.

第五篇大学计算机系论文范文格式:信息检索相关性判据及应用研究

相关性是情报学基本问题的观点得到了国内外图书情报学界的普遍认同.国外的相关性研究无论在理论还是实证方面都取得了丰硕的成果,相关成果可参见Saracevic(1975)、Mizzaro (1997)、Schamber(1994)以及Saracevic (2007)等完成的综述.相关性研究虽然也得到了国内学界的重视,但是只能检索到为数不多的国外研究成果的综述与介绍.鉴于此,本文开展了基于本土的面向用户的相关性判据研究以及相关性判据应用研究.本研究的主要成果与结论有:

(1)相关性判据集.本文以南京大学信息管理系4个年级以及南京大学教育科学系1个年级的相关性判据文本数据为信息源,采用内容分析法解析出了包括传播特征,内容,情境,使用,系统特征,愉悦,质量,总体以及文献特征等9类相关性判据.通过频次分析发现,文献特征、质量判据以及内容判据、总体和使用占据了相关性判据的主要位置,而愉悦、情境、传播特征以及系统特征则相对没有那么重要.与Schamber(1991)以及Barry(1993)等前人研究相比,本研究拓展了面向用户的相关性判据集,提炼出了包括文献总体、文献使用以及传播特征等三个新的相关性判据类别.

(2)影响信息用户相关性判断的文献特征.通过对相关性判据文本数据的内容分析,解析出了包括参考文献、出版单位、出版时间、关 键 词 、基金、篇幅、全文、题名、文献格式、文摘、语种、文献类型、来源期刊、作者以及机构等在内的15个影响信息用户相关性判断的文献特征.

(3)任务复杂性以及性别影响相关性判据的选择.研究结果显示,用户在面对不同复杂性的任务时,在文献内容、文献使用、文献特征、作者以及文献类型等相关性判据的选择方面存在差异;而性别维度仅影响作者、文献类型以及文献总体层面的相关性判据选择.由于数据量的原因,本文没能证实任务复杂性以及性别对信息用户在选择来源期刊、机构、系统特征、传播特征以及愉悦感知等5个类别相关性判据时的影响.

(4)基于相关性判据、价值增值模型、TEDS模型以及信息系统成功模型构建了面向相关性判据的学术信息检索系统成功模型,并证实了模型的有效性.根据模型设计了问卷,问卷共发放1114份,回收1054份,其中有效问卷929份.通过对数据的结构方程分析证实:①系统因子1和系统因子2对选择性存在正负不同方向的影响,路径系数分别为0.59和-0.39.②系统因子2、系统因子3以及选择性对系统效能存在正性的影响,路径系数分别是0.11、0.15和0.50.③系统因子1和灵活性对自适应性存在正性的影响,路径系数分别达到0.14和0.70.④系统因子5、灵活性、时间认知以及可靠性对系统性能存在正性的影响,路径系数分别为0.20,0.29,0.10以及0.38.⑤美感和娱乐体验对情感认知存在正性的影响,路径系数分别为0.54,0.27.⑥系统因子4和系统因子6对易用认知存在正性的影响,路径系数分别为0.23,0.21.⑦完整性、实时性、权威性、有效性对于信息质量存在正性的影响,路径系数分别为0.26,0.26,0.38以及0.25.⑧系统因子1、灵活性、隐私以及自适应性对服务质量存在正性的影响,路径系数分别为0.10,0.15,0.10,0.52.⑨效能认知、性能认知、选择性、易用认知、情感认知以及自适应性对系统质量存在正性的影响,路径系数分别为0.21,0.30,0.29,0.08,0.32,0.23.⑩系统质量、信息质量对满意度存在正性的影响,路径系数分别为0.56,0.29.最后,结构方程分析的结果表明,信息质量、系统质量以及满意度对使用意图存在正性的影响,路径系数分别为0.35,0.55以及0.11,而服务质量对于使用意图存在负性的影响,路径系数为-0.16.


https://www.mbalunwen.net/dajjemi/078224.html

主要论述了大学计算机系论文范文相关参考文献文献.

大学计算机系引用文献:

[1] 关于大学计算机系的论文选题 大学计算机系专业论文题目怎样拟
[2] 大学计算机系外文文献 大学计算机系专著类参考文献哪里找
[3] 大学计算机系论文大纲范本模板 大学计算机系论文框架怎样写
《大学计算机系论文范文参考 大学计算机系毕业论文范文[精选]》word下载【免费】
大学计算机系相关论文范文资料