当前位置:论文写作 > 参考文献 > 文章内容

生物信息论文范文参考 生物信息毕业论文范文[精选]有关写作资料

主题:生物信息 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2023-12-21

生物信息论文范文

论文

目录

  1. 第一篇生物信息论文范文参考:前列腺癌转移相关基因的生物信息学分析及功能预测
  2. 第二篇生物信息论文样文:药用植物基因资源的生物信息学研究
  3. 第三篇生物信息论文范文模板:2型糖尿病相关的代谢组学和生物信息学研究
  4. 第四篇生物信息论文范例:口腔鳞状细胞癌的生物信息学分析
  5. 第五篇生物信息论文范文格式:化学生物信息学新方法及其在医药研究中的应用

★100篇免费优秀的关于生物信息论文范文资料,适合作为生物信息方面相关硕士毕业论文和本科毕业论文写作参考的免费论文范例格式模板,【快快阅读吧!】

第一篇生物信息论文范文参考:前列腺癌转移相关基因的生物信息学分析及功能预测

前列腺癌(prostate cancer, PCa)是危害男性健康最常见的肿瘤之一,其发病率在美国居男性恶性肿瘤之首,占男性死亡原因的第二位,在中国前列腺癌的发病率远低于西方国家,然而,近20年来,我国前列腺癌的发病率也呈现逐年上升趋势,并且发病年龄也日趋年轻化,可能与生活方式、寿命延长、人口老龄化以及诊断技术的提高有关.前列腺癌多发生在外周带,早期无特异性症状,病变发展到晚期,则多发生局部浸润或远处转移,盆腔淋巴结是PCa最早转移部位,而骨骼是常见转移部位.局限性的PCa患者5年生存率几乎100%,而发生远处转移的PCa患者5年生存率下降到约为29%,前列腺癌患者一旦发生转移不仅预后差,而且严重影响其生活质量.骨转移是前列腺癌重要的临床特征和主要致死原因,美国死于前列腺癌的患者中,80%以上合并骨转移.前列腺癌骨转移可导致患者发生骨痛、病理性骨折、脊髓压迫、活动受限等骨相关事件(skeletal related events, SREs).前列腺癌骨转移诊断主要依赖X片、CT以及MRI等影像学检查,骨扫描是前列腺癌转移诊断的最重要的诊断方法,骨扫描通过放射性追踪剂显示区分正常和异常骨活动,当怀疑骨转移、前列腺癌患者出现临床症状或者治疗过程中PSA升高应考虑行骨扫描进一步检查.雄激素与正常前列腺细胞与前列腺癌细胞的生长存在密切关系,目前,内分泌治疗目前仍是转移性前列腺的最有效治疗手段,其目的在于减少或消除雄激素对前列腺生长的促进作用,从而缓解转移性前列腺癌的症状.内分泌治疗通常包括手术去势与药物去势.药物去势通过使用雌激素类药物、抗雄激素类药物或黄体素释放激素类似物等药物以阻断雄激素与雄激素受体的结合或减少体内雄激素的产生.转移性前列腺癌患者的内分泌治疗属于姑息治疗.其治疗目的主要是在于减少或消除雄激素对前列腺生长的促进作用,控制前列腺癌的进展,减少相关症状,提高生活质量,目前对于临床医师来讲其治疗仍旧是巨大的挑战.前列腺癌转移是一系列复杂而有序的过程,其临床表现及转归也不尽相同,对转移机制的研究尚待继续深入.与此同时,遗传学及分子生物学研究正努力寻找敏感、有效的判断肿瘤发生、发展及转移的标记物,用于临床指导治疗方案的选择,为前列腺癌治疗的发展奠定坚实的基础.

前列腺癌转移与其它恶性肿瘤一样是多基因、多因子相互作用和相互影响的复杂过程,也是肿瘤防治工作中面临的难题.转移包括肿瘤细胞的播撒入血液和淋巴系统、粘附管壁、维持生长、分泌生长因子和细胞因子、同转移部位微环境之间的分子相互作用等多个步骤.只有有效控制、阻断肿瘤转移才可能实现肿瘤的治愈.肿瘤在演进过程中,一些肿瘤细胞具有了侵袭和转移能力,而这种转移表型的获得在很大程度上是由于肿瘤细胞内基因发生异常改变引起的.因此,从分子水平揭示肿瘤转移的本质,研究肿瘤转移相关基因成为肿瘤转移研究的热点.近年发展起来的基因芯片技术和生物信息学显示了其在分析疾病方面的优越性.

基因芯片是生命科学领域的一项重要的技术平台,是筛选差异表达相关基因的有效手段,具有高通量和快速测量等优点.在基因表达谱分析、新基因发现、基因突变及多态性分析、基因组文库作图、疾病诊断和预测、药物筛选、基因测序等领域得到广泛的应用.但得到了基因芯片结果,并不等于获得了信息和知识,如何解读芯片上成千上万个基因点的杂交信息,将无机的信息数据与有机的生命活动联系起来,阐释生命特征和规律以及基因的功能,是基因芯片后期数据挖掘的一个重要方向.高通量微阵列杂交技术和测序技术的快速发展,产生了大量的基因数据,生物信息迅速膨胀成为数据的海洋.为适应这种高通量基因表达数据的不断增长和人们共享数据的需要,各种数据库应运而生,其中,美国国立生物信息技术中心(National Center for Biotechnology Information, NCBI)的高通量基因表达数据库(Gene Expression Omnibus, GEO)是世界上最大的储存高通量分子丰度数据的公共数据库,用户可以提交、储存和检索多种形式的数据并免费使用.GEO数据库操作简单,数据全面,免费共享的优势为后期数据挖掘和信息推广提供了良好的平台.

生物信息学是二十世纪80年代末随着基因组测序数据迅猛增加而逐渐形成的一门交叉学科.随着生物学和医学的迅速发展,特别是人类基因组计划的顺利推进,产生了海量的生物学数据,这些数据具有丰富的内涵,隐藏着丰富的生物学知识.充分利用这些数据,通过数据分析、处理,揭示这些数据的内涵,得到对人类有用的信息,将是生物学家和数学家所面临的一个严峻的挑战,生物信息学正是为迎接这种挑战而发展起来的一门交叉学科.具体地说,生物信息学是现代生物学与医学科学和信息科学、计算机科学、生物统计学、数学等学科相互渗透并高度交叉形成的一门新兴前沿学科,它以获取、加工、储存、管理、检索、分配、分析和释读生物学实验信息为手段,综合运用数学、计算机科学和生物学工具,以达到理解数据中所蕴含的生物学含义为目的.目前,生物信息学已广泛地渗透到生命科学的各个研究领域中,成为不可或缺的重要工具,在人类疾病与功能基因的发现、识别,基因与蛋白质的功能研究方面都发挥着关键的作用,如药物设计、基因多态性分析、基因表达调控、疾病相关基因鉴定、基因产物结构与功能预测、基因进化、基于遗传的流行病学、癌症的遗传机制研究等.随着近年来生物实验方法和检测数据的发展,积累了大量生物学,尤其是分子生物学实验数据,通过对这些数据的分类、收集、整理,产生了成千上万的数据库.为了高效处理日益增长的海量生物数据,使全世界的研究人员能共享已有的研究成果,数据库技术在生物数据的处理和储存上有越来越重要的应用.数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域.目前,生物信息学已广泛地渗透到生命科学的各个研究领域中,成为不可或缺的重要工具,在人类疾病与功能基因的发现、识别,基因与蛋白质的功能研究方面都发挥着关键的作用,如药物设计、基因多态性分析、基因表达调控、疾病相关基因鉴定、基因产物结构与功能预测、基因进化、基于遗传的流行病学、癌症的遗传机制研究等.

生物信息学最使人们感兴趣的是它利用计算方法分析生物数据,如根据核酸序列预测蛋白质序列、结构、功能的算法等.虽然这些预测还不是非常精准,但是当可靠的实验数据还无法得到的情况下,这一预测可以作为一盏路灯,指示你应如何开展实验.利用基因芯片技术和生物信息学方法系统分析肿瘤相关基因及其调控机制,是当前功能基因组学的重要研究手段.它明显优于过去的单一基因研究模式,可以在整体的、基因组的水平对基因的表达调控网络机制进行系统全面的分析.

本研究从GEO数据库中下载157个前列腺癌转移相关的基因表达谱数据集(G*152931-G*152991,G*152856-G*152880, G*799468-G*799489和C*799490-G*799518)为分析材料,采用BRB-ArrayTools4.3.0Beta软件筛选前列腺癌原发肿瘤和转移肿瘤芯片数据的差异表达基因,再结合生物信息学工具和数据挖掘方法对差异基因及其相互作用关系进行分析,从中发现两个前列腺癌转移高度相关基因SPP1、VCAN,最后再运用生物信息学方法对SPPl、VCAN基因进行结构和功能研究,为前列腺癌癌转移的发病机制提供新的思路,也为转移性前列腺癌的分子诊断和个体化治疗奠定基础.

本研究的内容和过程分为四部分

第一部分:前列腺癌转移相关基因的生物信息学分析

在公共基因芯片数据库(GEO)中下载前列腺癌转移的相关基因芯片数据,其中61例原发性局限性前列腺癌样本,25例前列腺癌转移样本,利用BRB-ArrayTools4.3.0Beta3软件、STRING、ToppGene、GOEAST、D*ID等工具对前列腺癌差异基因进行生物信息学分析.通过BRB-ArrayTools4.3.0Beta3分析筛选出210个前列腺癌转移差异基因,其中上调84个,下调126个.对其进行生物信息学分析发现AR、FOS、JUN、ACTB、FN1、MYL9、MYH11、 MYLK、SPP1等基因以及Rho GTPase调节细胞骨架通路、整合素信号通路、钙粘蛋白信号通路、Wnt信号通路等信号通路在前列腺癌转移的发生发展中可能起着重要作用.

第二部分:前列腺癌骨转移相关基因的生物信息学分析

在公共基因芯片数据库(GEO)中下载前列腺癌骨转移的相关基因芯片数据,利用BRB-ArrayTools4.3.0Beta3软件、STRING、ToppGene、GOEAS、D*ID等生物信息学工具进行数据挖掘及生物信息学分析.通过BRB-ArrayTools4.3.0Beta3分析筛选出501个前列腺癌骨转移差异基因,其中上调181个,下调320个.对其进行生物信息学分析发现SPP1、HBB、AR、MMP9、AZGP1、POSTN、 FN1、VCAN等基因以及胶原蛋白及其生物合成、细胞粘附、小分子代谢过程、黏着斑、ECM受体相互作用、细胞周期、整合素信号通路等分子生物学过程及通路在前列腺癌骨转移的发生发展中可能起着重要作用.


https://www.mbalunwen.net/kexueqianyan/088395.html

第三部分:基于基因芯片的前列腺癌转移基因SPPl的生物信息学分析

在公共基因芯片数据库(GEO)中下载前列腺癌转移的相关基因芯片数据,利用BRB-ArrayTools4.3.0Beta3软件、protparam、MotifScan、SignalP4.0、 TMHMM、NetPhos2.0、PredictProtein、GO、KEGG、STRING等生物信息学工具进行数据挖掘及生物信息学分析.一共筛选出前列腺癌转移共同差异基因73个,其中表达上调21个,表达下调52个,其中对前列腺癌转移高表达基因SPP1进行生物信息学发现,SPP1蛋白由314个氨基酸组成,其相对分子质量为35422.7,该蛋白含有2个N-连接糖基化位点、8个酪蛋白激酶Ⅱ磷酸化位点、2个豆蔻酰基化位点、3个PKC磷酸化位点,主要参与细胞因子活动、细胞外基质结合、骨化、成骨细胞分化、炎症反应、细胞粘附等分子功能及生物学过程以及参与PI3K-Akt signaling pathway、Focal adhesion、ECM-receptor interaction、 Toll-like receptor signaling pathway等信号通路.

生物信息论文范文相关参考属性
有关论文范文主题研究: 关于生物信息论文范文数据库 大学生适用: 8000字专科毕业论文、2000字自考论文
相关参考文献下载数量: 78 写作解决问题: 毕业论文怎么写
毕业论文开题报告: 论文提纲、论文目录 职称论文适用: 职称评定、初级职称
所属大学生专业类别: 生物信息课题 论文题目推荐度: 最新生物信息论文范文题目

第四部分:基于基因芯片的前列腺癌转移基因VCAN的生物信息学分析

在公共基因芯片数据库(GEO)中下载前列腺癌转移的相关基因芯片数据,利用BRB-ArrayTools4.3.0Beta3软件、protparam、*ART、SignalP4.0、 TMHMM、NetPhos2.0、PredictProtein、SWISS-MODEL、GO、KEGG、STRING等生物信息学工具进行数据挖掘及生物信息学分析.一共筛选出前列腺癌转移共同差异基因73个,其中表达上调52个,表达下调21个,其中对前列腺癌转移基因VCAN进行生物信息学发现,VCAN蛋白由3396个氨基酸组成,其相对分子质量为372820.0,该蛋白含有1个IG (Immunoglobulin)结构域、2个Link (HA, Hyaluronan-binding)结构域,1个EGF (Epidermal growth factor-like domain)结构域、1个EGF_CA (Calcium-binding EGF-like domain)结构域、1个CLECT (C-type lectin)结构域和1个CCP (Domain abundant in complement control proteins)结构域,主要参与细胞粘附、透明质酸结合(hyaluronic acid binding)、钙离子结合、糖胺聚糖结合(glycosaminoglycan binding)、细胞外基质、Cell adhesion molecules (CAMs)等分子功能及信号通路.

综上所述,利用基因芯片及生物信息学方法探讨了前列腺癌转移发生的可能的分子机制及潜在分子标记物的筛选,通过生物信息学对前列腺癌转移相关基因的挖掘发现,MMP9、EGFR、MMP2、ADM、MIF、IGFBP3、I

第二篇生物信息论文样文:药用植物基因资源的生物信息学研究

生物信息学(Bioinformatics)是将生物学与计算机科学、数学等相结合而形成的新兴学科.近年来,分子生物学的进步带动了生物信息学的发展,并将其应用到药用植物领域,为中药研究提供了新的研究手段.本研究将生物信息学应用到药用植物基因组、后基因组和分子鉴定研究,对其中的关键生物信息技术进行了开发、比较和分析.

基因组是对药用植物进行系统的生物学研究的基础.本研究对药用植物基因组中的生物信息学技术和算法进行了研究.在基因组组装方面,基于重叠图的组装策略构建了基因组组装流程,并使用物理图谱进行组装结果验证和优化,以紫芝为例,构建得到48.9Mb的紫芝基因组,共12条染色体序列.在基因预测方面,使用基于隐马尔可夫模型的从头预测和基于证据的预测方法相结合的方式,提高了基因预测的准确性.在基因功能注释方面,使用Smith-Waterman算法和隐马尔可夫模型相结合的方法构建了基因功能注释流程,可搜索Nt、Nr、Swissprot、COG数据库进行同源分析,搜索KEGG数据库进行代谢通路分析,搜索Pfam和InterPr0进行结构域和基因功能分析.此外,本研究还通过基于后缀树的基因组比较研究,发现紫芝和赤芝基因组结构基本一致,但发现它们的某些染色体之间存在结构差异,有可能在进化过程中发生了染色体重排事件.本研究使用最大似然法构建了基因组水平的系统进化树,并基于化石证据对灵芝的进化时间进行估计,发现灵芝属的分化时间约为3800万年前.此外,本研究编写了基因簇挖掘算法,并对紫芝PKS和TPS基因簇进行挖掘.

后基因组学,也被称为功能基因组学,主要围绕基因功能及其调控机制展开研究.本研究使用生物信息学技术和算法对差异表达基因以及RNA编辑、小RNA和DNA*化进行了全基因组水平的分析.我们使用基于负二项分布检验的方法建立了基因差异表达分析流程,并对差异基因进行GO和KEGG富集分析,结果显示,紫芝菌丝期和子实体期有76个基因具有明显的表达差异,并且与次生代谢产物的生物合成相关.RNA编辑机制通过改变RNA的碱基形式对基因进行调控,本研究基于单核苷酸变异发现方法建立了RNA编辑位点预测流程,包括对编辑类型进行分类,计算编辑度,对编辑位点附近的基因进行注释和富集分析.小RNA是另外一类基因调控机制,它通过与转录本结合特异性地降解转录产物,从而抑制基因表达.本研究建立了小RNA的分析流程,包括对小RNA进行分类、与参考基因组进行比对、并对小RNA的潜在靶基因进行预测.另外,基于重硫酸盐处理的方法,我们建立了一套DNA*化分析方法识别*化位点.

生物信息学在药用植物DNA条形码研究中的应用包括DNA条形码鉴定算法研究和DNA条形码数据库构建.本研究使用种内种间遗传距离,",barcoding gap',和Wilcoxon秩和检验对不同DNA条形码候选序列的种内和种间变异程度进行评估,以筛选出适合于特定类群的DNA条形码序列.本研究使用基于Smith-Waterman算法的BLAST方法和基于Needleman-Wunsch算法的最近距离方法进行DNA条形码序列鉴定,根据研究结果,BLAST方法速度快、精度高,更适用于DNA条形码鉴定.

生物信息学通过构建数据库对大量数据进行存储、整理和分析.本研究构建了药用植物基因组数据库和中药材DNA条形码网络鉴定系统.对于药用植物基因组数据库,使用MySQL数据库语言对基因模型、基因注释等信息进行存储,创建了基因组浏览器,对基因组结构信息、基因位置信息、转录本比对信息进行查询.该数据库还提供了基因簇发掘工具,用于基因簇分析,编写了可视化软件用于展示基因在染色体上的相对位置.本研究运用BLAST鉴定方法和计算机编程语言构建了中药材DNA条形码鉴定系统,为DNA条形码鉴定提供参考序列和鉴定方法.该系统目前包含的序列涉及中国药典、美国药典、日本药典、韩国药典、欧洲药典和印度药典的药材及其混伪品.ITS2和psbA-trnH序列分别为73,800条和31,241条.通过使用网站的物种鉴定功能,用户能够使用查询序列与数据库进行比对,系统将返回与查询序列特征相近的匹配结果,为药材鉴定提供参考.

在本研究中,生物信息学技术在药用植物基因组、后基因组和分子鉴定研究中得到充分应用.在组学研究层面,建立了组学研究的生物信息学方法,丰富的数据和分析结果为后期开展进一步研究提供了基础.在分子鉴定层面,将BLAST算法用于DNA条形码鉴定,并通过构建DNA条形码数据库进行条形码数据整合,为数据的有效利用提供平台.总之,生物信息学可广泛应用于药用植物研究中,并促进中药现代化和全球化进程.

第三篇生物信息论文范文模板:2型糖尿病相关的代谢组学和生物信息学研究

摘 要 :本文主要介绍了本人博士期间在2型糖尿病及其相关的组学研究中的一些工作.2型糖尿病是一种受多因素影响、多发病因素的复杂代谢性疾病.采用多种组学方法对该疾病的研究能够为疾病的发病机制探索、疾病的早期诊断、药物疗效评估、作用机制阐述等方面的工作带来新的解决方案.

糖尿病的临床特征为糖类、脂类、氨基酸等物质的代谢紊乱,因而采用代谢组学的方法研究糖尿病是非常合适的.本文首先使用代谢组学方法对2型糖尿病进行研究,研究的对象有相关的动物模型,也有基于2型糖尿病患者的体液样本.具体的研究工作包括:结合GC-MS分析技术和随机森林算法对AMPK基因敲除小鼠与健康小鼠的代谢产物进行检测分析,不仅发现了AMPK基因对小鼠糖类、脂类等的代谢影响,同时还发现不同性别AMPK基因敲除小鼠的代谢差异;利用构建的糖尿病小鼠模型,考察了经诺和龙和罗格列酮治疗不同周期的小鼠的代谢轨迹,两种药物的作用机制虽然不同,但是在代谢产物层面,两种药物对主要的糖尿病指标,血糖、血脂等都有明显的下降效果,同时各自又具有自身特异的代谢标志物;由于代谢组数据的复杂性,采用有效的数据分析和模式识别方法在代谢组学数据分析中是必不可少的,而选用随机森林算法,其不仅可以有效地发掘样本代谢产物中的差异,而且能够提供变量间的相互作用关系,帮助寻找潜在的生物标志物,同时在建模的过程中,得到样本与样本间的相似度分析,可视化的表征代谢谱的综合变化趋势.

在2型糖尿病相关的生物信息学研究中,主要开展了GPCR翻译后修饰位点识别与淋巴细胞(T淋巴细胞和B淋巴细胞)抗原决定簇识别工作.

胰岛素缺陷,包括胰岛素分泌缺陷、胰岛素p细胞受损等是2型糖尿病的主要发病因素和机制.胰岛素p细胞能整合营养物质、神经递质和激素相互作用,使得机体胰岛素处于一个稳定水平.神经递质和激素对胰岛素的调节作用主要是通过G蛋白偶联受体(GPCR)介导的信号传递系统,而GPCR的信号传导过程受到多种因素的协调和抑制,其中蛋白质翻译后修饰是其中较为重要的一种.因而本论文中分别用支持向量机方法、集成的支持向量机方法、随机森林方法对影响GPCR信号传导机制的磷酸化翻译后修饰、糖基化修饰、棕榈化修饰做了相关的研究,并取得了较好的预测结果.这些研究为阐明GPCR的信号传导机制、解释其与胰岛素分泌之间的作用关系提供有效地支持,而不同的翻译后修饰方式及其它们之间复杂的相互作用关系研究、相互作用网络的构建将是下一步工作的重心.

前期的研究发现,2型糖尿病与胰岛慢性炎性、自身免疫有着紧密的联系.针对与2型糖尿病相关的免疫应答,本文开展了相关的研究工作.特异性免疫应答首先需要抗原决定簇对抗原的的特异性识别,并与其构成复合物传递至免疫细胞从而引发相应的免疫效应.对抗原决定簇的准确识别是阐述T淋巴细胞和B淋巴细胞介导的信号传导机制的首要工作.在本文中,将多肽序列的氨基酸物理化学性质与多肽的小分子性质相结合,构建了一种新的多肽序列描述方式,并将其应用到T淋巴细胞和B淋巴细胞抗原决定簇的识别工作中,取得很好的预测效果.

最后,将这些代谢组学数据、生物信息数据和机器学习方法整合后,构建了一个多功能的在线预测网站,其中集成了本论文所构建的大部分模型、数据集.在今后的研究中,需要进一步完善蛋白质序列数据库,构建2型糖尿病相关的代谢产物数据库,实现数据的有效管理和模型的实时更新,为从系统生物学角度研究2型糖尿病的发病发展机制研究做出铺垫.

第四篇生物信息论文范例:口腔鳞状细胞癌的生物信息学分析

口腔鳞状细胞癌是口腔颌面部最常见的恶性肿瘤.它具有恶性程度高,淋巴结易转移,预后差等特点.从分子水平研究口腔鳞状细胞癌的发生发展,对于口腔鳞状细胞癌的预防、控制和治疗具有重要意义.

生物信息学是一门交叉学科.它整合了信息学、统计学和计算机学等多种技术分析海量生物数据所包含的信息.它先对生物芯片的海量数据进行筛选,再采用序列比对、统计分析、生物聚类、通路分析、可视化作图等方式,进行数据挖掘,从而对疾病从分子水平进行分析,丰富对疾病进展的认识.随着生物信息学的发展,形成了新的生物学研究模式,即利用现有的数据信息,先作理论推测,再行实验验证.

本研究课题以GEO及TCGA数据库为研究基础,采用BRB-ArrayTools软件分别筛选口腔鳞状细胞癌中差异表达的基因、microRNA及lncRNA,联合生物信息软件和文献挖掘等方法对他们之间相互作用关系进行分析,从而探索与口腔鳞状细胞癌相关的基因、microRNA及lncRNA,为更好地理解口腔鳞状细胞癌发生、发展的分子机制提供重要的信息,为进一步研究口腔鳞状细胞癌的发生、发展提供新的方向.

第一部分:口腔鳞状细胞癌差异表达基因的生物信息学分析

研究背景:口腔鳞状细胞癌是目前我国常见的肿瘤之一.我国口腔鳞状细胞癌的发病率约在3.6/10万-8.0/10万人.现已证实,口腔鳞状细胞癌是复杂的多基因疾病,环境因素和遗传因素共同参与了疾病的发生和发展.基因芯片因其具有高通量、高特异性、快速等特点,可检测基因的丰度和种类,并从整个基因组层面进行相关分析.

目的:通过对多个口腔鳞状细胞癌表达芯片的生物信息学分析,筛选与该肿瘤相关的差异表达基因,对差异表达基因进行功能注释、通路分析及蛋白质互作网络分析,为探索口腔鳞状细胞癌发生、发展的分子机制提供理论基础.

方法:本课题整理GEO公共数据库的基因芯片数据集,以针对口腔鳞状细胞癌目标的Affymetrix芯片表达谱数据作为研究对象,系统地分析口腔鳞状细胞癌的基因表达谱芯片数据,进行数据预处理后,选择非配对t检验统计方法筛选差异表达基因,应用D*ID软件选取GO数据库进行功能注释、KEGG数据库进行通路分析,导入STRING在线数据库绘制差异表达基因编码蛋白互作网络图,并应用Cytoscape软件计算网络及各节点的拓扑特性.

结果:(1)本研究在口腔鳞状细胞癌中发现92个基因表达异常,其中表达上调的61个,表达下调的31个.(2)GO分析发现表达上调的差异表达基因主要集中在对损伤的反应、胶原代谢过程、多细胞生物大分子代谢过程等.其中参与胶原代谢过程有MMP9、MMP1、MMP10、MMP11、MMP3、MMP7等基因.KEGG通路分析发现,表达上调的差异表达基因主要集中在细胞外基质受体相互作用、黏着斑、肿瘤通路、Toller样受体通路等通路.(3)GO分析发现表达下调的差异表达基因主要集中在上皮细胞分化、上皮发育、表皮发育、外胚层发育等过程.KEGG通路分析发现,表达下调的差异表达基因主要集中在通过视黄醇的代谢、细胞色素p450外源性物质代谢、药物代谢等通路.(4)经STRING软件共筛选出35个差异表达基因编码的蛋白产物存在相互作用,构建差异表达基因互作网络图,Cytoscape软件共筛选五个关键基因,分别为MMP-9、MMP-1、 COL1A2、MMP-7、PLAU.

结论:(1)成功筛选出口腔鳞状细胞癌中差异表达的92个基因,并对其进行功能注释与通路分析,为该疾病的实验室研究提供了理论基础.(2)成功构建口腔鳞状细胞癌差异表达基因的蛋白质相互作用网络,并筛选出五个关键基因,提示MMPs家族成员可能参与在口腔鳞状细胞癌发展过程,有利于进一步研究差异表达基因的相互作用关系,并为该疾病的诊断和治疗提供了研究方向.

第二部分口腔鳞状细胞癌差异表达microRNA的生物信息学分析

研究背景:microRNA是内源性非编码小RNA(18-25nt)的总称.microRNA通过转录后抑制基因的表达.它可以通过与靶基因mRNA的3’端非翻译区(3',-untranslationalregion,3',-UTR)结合达到抑制蛋白翻译的作用.目前发现miRNA可调节约60%的基因,且可能与多种不同的靶基因有调控关系.越来越多的研究发现,miRNA在细胞的生长、分化、增殖和调亡等重要过程发挥了重要的作用,并参与了肿瘤的发生发展过程.

目的:通过整理TCGA数据库的口腔鳞状细胞癌miRNA数据,并进行生物信息学分析,探索口腔鳞状细胞癌差异表达miRNA,进一步研究其靶基因的作用.

方法:本研究利用BRB-ArrayTools对来自TCGA数据库的口腔鳞状细胞癌miRNA进行分析,得到差异表达miRNA,通过miRecords预测差异miRNA的靶基因,对差异靶基因进行GO功能注释、KEGG通路分析,应用STRING在线数据库绘制靶基因编码蛋白互作网络图,并应用Cytoscape软件计算网络及各节点的拓扑特性.

结果:(1)采用BRB-ArrayTools分析TCGA数据集中miRNA表达谱的数据,我们发现了53个显著差异的miRNA.(2)针对差异靶基因的GO功能注释发现,差异表达的靶基因参与细胞增殖的调节、内源性刺激应答、有机物质应答、激素刺激应答等功能.(3)KEGG通路分析中,差异表达靶基因主要参与了细胞因子及其受体的相互作用、MAPK信号通路、Wnt信号通路、Jak-STAT信号通路.(4)经STRING软件在线数据库分析共筛选出73个差异表达microRNA的靶基因存在相互作用,构建靶基因编码蛋白互作网络图;Cytoscape软件共筛选出十二个关键靶基因,分别为STAT3, CCND1, PTGS2, IL8, PPARG, ERBB2, MMP2, PLAU, FGF1, CASP3, FASLG和IL10.

结论:(1)成功筛选口腔鳞状细胞癌中差异表达的microRNA.其中,miR-375可能是口腔鳞状细胞癌分子标志物.miR-21、miR-101、let-7c和mir-200c表达异常为研究口腔鳞状细胞癌EMT过程提供了生物信息学证据.(2)差异表达microRNA的靶基因主要参与细胞增殖的调节、内源性刺激应答、有机物质应答、激素刺激应答等功能.(3)差异表达microRNA的靶基因主要参与了细胞因子及其受体的相互作用、MAPK信号通路、Wnt信号通路、Jak-STAT信号通路.(4)成功构建差异表达microRNA对应靶基因的蛋白质相互作用网络图,并筛选出12个关键靶基因.

第三部分口腔鳞状细胞癌差异表达长链非编码RNA的生物信息学分析

研究背景:长链非编码RNA (long non-coding RNA, lncRNA)因其在生物基因调控方面的潜在巨大作用,在近几年获得广泛关注.研究显示长链非编码RNA和疾病发生及发展进程相关,但是其发挥作用的具体机制尚不十分清楚.目前lncRNA在口腔鳞状细胞癌中作用及机制知之甚少.

目的:本研究拟通过生物信息学的方法,分析GEO数据库中的口腔鳞状细胞癌数据,探索口腔鳞状细胞癌中的差异表达lncRNA,为后续研究lncRNA在口腔鳞状细胞癌中的作用机制提供了新的思路.

方法:本研究利用BRB-ArrayTools对GEO数据库的口腔鳞状细胞癌数据集进行分析,筛选得到差异lncRNA.

结果:本部分研究发现,与正常组织相比,口腔鳞状细胞癌17个lncRNA的表达出现差异.其中表达上调的有4个,表达下调的有13个.H19在口腔鳞状细胞癌中表达显著下调.

结论:(1)成功筛选出口腔鳞状细胞癌中差异表达的lncRNA17个,为进一步研究lncRNA在该疾病中的作用提供了方向.(2)LncRNA H19在口腔鳞状细胞癌中表达下调,提示其可能与mir-200家族作用,调控了口腔鳞状细胞癌上皮-间质转变(EMT)的生物学过程.

第五篇生物信息论文范文格式:化学生物信息学新方法及其在医药研究中的应用

随着后基因组时代的到来,药物研发已经由传统的研发模式转向了基于系统药理学的研发模式.基于此种模式,海量的数据在药物研发过程中需要分析和处理.化学生物信息学是一门新兴的用于研究药物及药物相关系统中信息内容和信息流向的综合系统学科.将化学生物信息学引入到药物研究过程中,可以极大地加快新药研究进程,缩短研究周期,降低研究费用.从药物研究全过程来看,几乎每一个环节都与化学生物信息学有着密切的关系,如药物靶标发现,药物先导化合物发现,候选物结构修饰和优化、药代动力学研究,药物的临床前研究和临床研究,以及药物投入市场后的不良反应跟踪等.不过面对如此复杂的数据,化学生物信息学研究面临诸多困难问题:(1)高质量QSAR/SAR模型的建立经常涉及到奇异样本检测、特征选择以及非线性等建模问题;(2)如何提取不同水平上不同数据结构信息并加以整合来建立一个假设可测试的模型已成为当今化学生物信息学乃至系统生物学面临的最大挑战;(3)在高通量扫描和药物临床实验数据中,经常会伴随有缺失值、混合数据类型、数据不平衡、存在奇异样本、特征多样本少、非线性、以及多类别多模式等一系列问题;(4)如何对常用药物信息进行提取和收集并转化为药物化学家容易使用的工具是化学生物信息学急切需要解决的问题;(5)如何提取网络中的特征信息以及建立高精度网络预测模型是需要迫切解决的问题.针对这些困难问题,本论文发展了一些新型的化学生物信息学方法,并且基于这些新方法对药物研发中关注的两个问题(药物ADMET性质评估和药物靶标发现)进行了研究.本论文研究内容主要包括两个部分:基础研究部分(第二章-第五章)和实际应用部分(第六章和第七章).基础研究部分包括化学生物信息学新型方法和药物信息提取方法研究,实际应用部分为药物ADMET性质评估和药物-靶点相互作用网络预测.本论文主要研究内容包括:

一、对化学生物信息学及其研究内容进行了简要的介绍,比较了化学生物信息学与化学信息学,生物信息学在药物研发中的异同.明确地提出了化学生物信息学研究应以系统的观点对药物信息进行提取,即从分子水平、细胞水平和组织乃至更高水平上对药物进行描述,并最终有机地整合在一起共同加深对药物行为的理解.鉴于各种统计学习算法在药物数据挖掘中的重要性,对化学生物信息学中常用的数据挖掘方法进行了简要介绍.网络建模在化学生物信息学*得越来越重要,本章对网络模型的构建以及一些难点问题进行了分析.最后对化学生物信息学研究中的难点问题进行了总结,在以下几章中将通过发展各种化学生物信息学新型方法来解决这些难点问题.(第一章)

二、提出了基于模型特征的分布进行奇异样本诊断和特征选择的新方法.通过研究样本在模型种群中预测误差的分布,发现预测误差分布的统计特征能够有效地区分正常样本和各种类型奇异样本.基于此,我们发展了一种用于奇异样本诊断的蒙特卡洛方法.此方法能够同时诊断数据中的各种类型的奇异样本,并且降低了掩蔽效应带来的风险.通过和其它奇异样本诊断和稳健回归方法进行比较,证实了我们提出的方法的优越性能.考虑到样本空间和特征空间的相互作用,我们构建了一个统一的框架来进行奇异样本诊断和变量选择.其主要思想是通过模型系数的统计分布进行变量选择,通过样本预测误差的分布进行奇异样本诊断,后项消除策略用来捕捉样本空间和变量空间的交互作用.将此方法应用到模拟数据和QSAR数据的分析,得到了非常显著的性能提高.(第二章)

三、对核方法及核融合算法进行了深入的研究,提出了几种用于药物数据挖掘的新型核方法.由核方法的模块化可知,核函数的选择和建模方法的选择可以分离开来考虑.通过选择不同的核函数和建模方法,我们能够构建满足不同需求的核模型.基于此,我们发展了一种基于*ILES表征的字符串核支持向量机算法,并将其应用到毒性数据的分类研究.通过和其它核函数及描述符的比较,证实了我们方法的高性能.基于*ILES表征的字符串核支持向量机模型不需要计算任何分子描述符,因此应用简单方便.通过考虑不同的建模方法,我们在核框架内发展了一种核k-近邻算法,并将其和不同核函数结合,有效地克服了原始k-近邻算法的缺点.在核方法中,核特征空间内出现冗余特征时,将会严重影响核方法的预测性能.通过在核特征空间内应用核主成分分析,发展了一个两步算法来解决核空间内冗余特征问题.核主成分分析首先用来在核特征空间内进行去噪处理,然后线性支持向量机在此空间内进行分类研究.将此算法应用于QSAR数据的分析,获得了高的预测性能.(第三章)

四、对决策树及基于决策树的集成算法进行了深入的研究,提出了几种用于药物及组学数据挖掘的新方法.由于特征选择在药物数据建模中的重要性,我们研究了决策树及基于决策树的集成模型的特征选择问题,发展了一个广义的框架用来选择有信息的变量子集.通过对随机森林算法的原理进行分析,发展了一种特征重要度采样的自适应随机森林算法,并将其应用于QSAR数据的分析,获得了比原始随机森林更高的预测性能.通过充分利用决策树的自动逐步特征选择和样本复杂度缩减的优点,我们结合蒙特卡洛采样技术发展了一种蒙特卡洛树算法用于分析代谢组学数据中的模式信息.将此算法应用于两个代谢组学数据分析,获得了代谢组学数据中清晰的模式.最后我们发展了一种基于树核的核Fisher别分析算法,并将其应用到代谢组学数据的分析中,获得了显著的效果.(第四章)

五、针对于分子特征表征在化学生物信息学中的重要性,我们开发了四套用于分子特征提取的软件包,并且构建了基于web的分子特征计算服务器.四套软件分别为:(1)用于化学小分子特征提取的ChemoPy软件包;(2)用于蛋白质序列特征提取的ProPy软件包;(3)用于生物网络特征提取的PyNet软件包;(4)用于药物-靶点相互作用及蛋白质互作用描述符PyDPI软件包.应用这些软件包和网络服务器能够很好地辅助药物化学家和生物学家进行复杂分子数据的表征和分析.(第五章)

六、对药物ADMET及物理化学性质进行了基于计算机辅助的预测研究,并最终构建了一个药物ADMET',性质数据库和基于web的在线预测平台.鉴于水溶性在药物研发中的重要性,我们发展了三个预测模型用于化合物水溶性的预测,通过对选择的分子描述符进行分析,发现了影响药物水溶性的因素.运用第四章发展的改进随机森林算法对药物最大日推荐剂量进行结构-活性关系预测研究,通过分析不同疗效药物的子结构碎片,发现了一些相关药物分子毒性的特征碎片.此方法能够提前预估临床一期实验中药物的最大推荐剂量.基于随机森林和子结构模式,我们发展了一个结构-活性关系模型框架对化合物毒性进行计算机辅助预测,此方法有助于化学家对化合物的毒性评估.通过发展2D-QSAR模型,研究了100个结构多样的天然产物对OATPIBI调控的雌酮硫酸盐摄取的抑制效应,一些影响抑制效应的结构因素被识别.通过研究天然产物结构和抑制效应间的定量关系,获得了深入的天然产物-药物相互作用潜在机制的视野.最后我们构建了一个药物ADMET性质数据库和基于web的在线预测平台,旨在方便药物学家对ADMET性质的分析和评估.(第六章)

七、基于化学基因组学框架,提出了基因标度地预测药物-靶点相互作用网络的方法.通过药物-靶点对的Ki结合常数,我们区分了整个药物-靶点对集为正样本集和负样本集.化学基因组学方法用来表征药物-靶点相互作用关系,即一个药物-靶点对能够通过同时考虑药物描述符和蛋白质描述符共同来表征.随机森林模型用来构建预测模型.预测结果和深入分析证实了我们提到的化学基因组学框架的合理性.通过对未知药物-靶点对的预测和网络分析,显示了药物在临床上的多药理特征.此方法提供了一种有效方式来研究药物和靶点的行为.基于web的预测服务器PreDPI-Ki最后被构建方便药物学家对此研究成果的应用.在此方法的基础上,通过引入网络特征描述符,药物-靶点相互作用的预测精度能够显著地提高.在四个标准数据集上的预测模型的比较证实了网络特征在药物-靶点相互作用网络预测中的重要性.基于化学、生物和网络特征融合构建的预测模型,我们扫描了未知的药物-靶点对,发现预测排序在前的药物-靶点对大部分能够被实验证实.此方法能够为药物重定向分析和靶点鉴别提供了一种可供选择的方式.最后,基于构建的药物-靶点相互作用预测模型,我们评估了26种天然产物的升压机制.通过预测天然产物和相关靶点间的关系,发现不同的升压机制由不同的靶点所引起.因此通过对天然产物的靶点谱进行聚类分析,可清晰地发现天然产物不同的升压机制.此方法提供了一种药物分子作用机制评估的新途径.(第七章)

此文是一篇生物信息论文范文,为你的毕业论文提供有价值的参考.

生物信息引用文献:

[1] 生物信息方向论文题目 生物信息专业论文题目怎么拟
[2] 容易写的生物信息学论文题目 生物信息学论文题目怎么定
[3] 最新生物信息学论文参考文献 生物信息学核心期刊参考文献哪里找
《生物信息论文范文参考 生物信息毕业论文范文[精选]》word下载【免费】
生物信息相关论文范文资料