《基于大数据技术构建嵌入式智能持续审计系统》
本文是人工智能和大数据类论文范文检索与大数据技术方面硕士学位论文范文.
[摘 要]本文结合四川长虹建设嵌入式智能持续审计系统的实践,探讨在大数据、云计算背景下实施关键风险领域嵌入式智能持续审计的重要性和可行性,介绍建设过程中形成的实施方法、主要效果及智能嵌入模型的数据挖掘流程.
[关键词]大数据 嵌入式 持續审计 风险导向 实施框架虹智能审计平台分为审计管理、风险预警、
长嵌入式审计和大数据分析四个相对独立的部分,采用搭积木的方式建设,2018年完成嵌入式审计系统(Embedded Audit System,简称EAS)建设并试运行,未来计划建设大数据分析系统、审计云,使审计工具向智能化、云服务转型.
一、嵌入式持续审计
长虹现有风险预警系统定期或不定期地从业务系统和会计系统取数,通过运行模型发现和评估风险.与传统审计相比,具有审计成本低、效率高的优势,但只能在业务发生后进行审计,不能实时监控及时中断高风险业务,不能进行事中审计,所以持续审计(Continuous Auditing,简称CA)被提上日程,其根本优势在于报告时隔短、追踪事件及时和风险控制强.
(一)嵌入式持续审计的定义
1.长虹嵌入式持续审计的定义.在审计对象IT系统的关键控制环节或领域嵌入控制监控模块,通过该模块持续对审计对象的业务数据实时监控.当系统处理与审计设定的界限和参数不一致时,监控程序按预定义的风险处置方式实时干预业务流程.嵌入式持续审计框架如图1所示.
2.创新风险处置方式.长虹嵌入模块的风险处置方式是设定风险级别,实行红黄两级风险处置.对低中风险,在业务系统中实时提示业务,预警数据推送到EAS备查;对高风险,直接在业务系统中冻结业务,审计在EAS审核通过后解冻或进入专项审计.
(二)实施嵌入式持续审计的意义
在交易界面频发风险点和业务管控能力不足的控制点嵌入使用两级风险处置方式的审计模块,一方面可强制业务主动自查、整改以保证业务开展;另一方面可分析业务熔断或预警原因,跟踪解冻情况,边听取业务单位意见、边提出报告、边督促整改,提高业务整改的及时性和有效性.通过嵌入式审计,审计监督既融合又分离,实现了由事后审计向事中与事后审计相结合的转变,由静态审计向动态与静态审计相结合的转变,最终在审计能力、层次和水平上实现有效提升,审计监督效能得以充分发挥.
(三)实施嵌入式持续审计的可行性分析
1.文献概述.在中国知网搜索关键字“持续审计”“连续审计”或“嵌入式审计”,发现相关文献较少,尚未发现嵌入式持续审计实务方面的文献.侯佳利等在《新常态下嵌入式审计的创新研究》(2017)中,以审计局对行政事业单位的审计为出发点,提出信息化嵌入式审计的建设思路,同时也指出“目前关于嵌入式审计的文献很少,有些只是提出在审计工作中运用嵌入的思想,至于怎么运用、如何实施都没有具体的思路和方案”.在政府审计方面的嵌入式审计文献相对较多,姜江华(2016)总结提出嵌入式审计具有更强的时效性、持续性和更高的参与性.其特征是审计监督既独立又融合,既事中又事后,既静态又动态.胡镇鑫(2017)结合近年来在东莞农村集体经济审计运用嵌入式审计理念的实践,分析嵌入式审计新模式的理论和实践,为内部审计部门践行嵌入式审计提供借鉴.《高级审计技术方法》(2013)指出持续审计技术实现模式分为三种类型:嵌入式、分离式、混合式.嵌入式持续审计适合内部审计,具有实时审计、时间同步性好的优点,但存在通用性不足、降低系统性能、设计不合理产生垃圾信息等缺点以及影响审计独立性的风险.
2. IT技术的快速发展使嵌入式持续审计变得可
行.(1)系统性能和通用性方面.与Groomer & Murthy在2003年提出系统性能问题相比,现在计算机的软件技术和硬件性能已有了很大提升,合理的设计可以把影响降低到可接受的水平.在长虹云架构下,借助微服务技术和云计算,通过把嵌入模型的控制逻辑和计算逻辑分离,从而减少与业务系统的耦合度来提高通用性.计算逻辑在EAS统一建立和管理,通过修改计算逻辑适应常规业务变化.控制逻辑放在业务系统,根据EAS发送的风险阈值判断业务流程正常通过、预警或中断.(2)审计嵌入模块设计合理性方面.若嵌入模块设计不合理,会给审计和业务产生大量误报信息,影响审计效果.但大数据和人工智能的产生和发展,采用基于统计学、机器学习的数据挖掘技术构建审计嵌入模型,可以提高审计分析的广度和深度,提高模型预测的准确度和精准度.
3. 嵌入式持续审计不影响审计实质上的独立性.审计独立性包括实质上的独立性与形式上的独立性.长虹嵌入式持续审计要求内部审计人员冻结或解冻高风险业务,由于程度深、时间长,使得审计行为的独立性在形式上受到影响,但因审计在组织、人员、薪酬等方面独立于业务单位,从而保证内部审计的客观性.
(四)智能审计云平台的架构
1. 建设策略.维系现有审计系统(已完成的审计管理模块、风险预警模块)技术架构不变,并对其进行优化开发、完善功能,之后逐步择机迁移到云架构.2018年开发的嵌入式审计、未来建设的审计大数据分析系统均基于云架构设计及开发.
2. 系统架构.基于分布式互联网IT架构,能够快速构建审计业务,满足审计中长期需求;能够利用大数据、云计算及数据挖掘技术,实现底层数据颗粒化、平台功能及分析模型的动态扩展,如图2所示.其中,LaaS为基础设施;DaaS基于大数据平台构建审计数据中心,利用大数据丰富的算法库,搭建审计挖掘模型;PaaS基于长虹云平台搭建审计云,采用Docker容器、Spring Cloud微服务等技术实现审计应用的容器化、微服务化,提供数据可视、能力输出、数据分析等服务能力;SaaS可实现审计管理、风险预警、嵌入式审计和大数据分析等智能审计云平台应用功能.
(五)影响制约因素
1.信息系统建设管理水平的影响和制约.若信息系统一般控制和应用控制不足、信息化流程不完善、业务流程不规范,会降低嵌入模块的可靠性和持续性;若信息系统存在孤岛或无有效关联、业务数据不完整,会降低模型的通用性,甚至导致不能成功建立模型;若系统数据质量差,则不仅增加数据清洗工作量,还会直接影响模型的准确度和精准度,产生大量异常的垃圾信息.
2.对审计人员的胜任能力提出更高要求.审计不仅参与业务时间长、介入程度深,而且需熟悉数字化审计,同时还需通过内部审计咨询服务实现审计增值功能,这对内部审计人员的素质、能力和作风必然提出更高要求和标准.
二、长虹嵌入式持续审计的实施方法
EAS实施方法有五大步骤,具体包括:风险识别与评估、选择嵌入点、开发审计嵌入模型、异常数据管理和处置、风险闭环管理,如图3所示.
(一)风险识别和评估
参考2017版COSO-ERM (企业风险管理框架)的5个风险要素,结合历年审计案例识别公司交易界面日常经营活动的风险控制水平,发现采购和销售业务子流程存在的高风险点或薄弱环节.
(二)选择嵌入点
选择合适的嵌入点是实现嵌入式审计有效的关键因素之一,业务单位因自身原因控制不力的高风险点是首选嵌入目标,而数据质量不高、业务流程未信息化的关键控制风险点及事后检查性控制都不适合作为嵌入点.在确定嵌入点时,应对该业务流程的信息系统控制进行应用控制审计,对存在的控制缺陷进行完善或建立补偿性控制,防止因IT控制缺陷影响嵌入审计模块效果.
(三)开发审计嵌入模型
审计嵌入模型主要由EAS的计算逻辑和嵌入业务系统的控制逻辑组成,两者通过数据接口实时交互.计算逻辑的核心功能是测算业务的预警和熔断阈值,并据此计算每笔业务的风险等级;控制逻辑根据计算逻辑传送的风险等级执行红黄两级风险控制.嵌入模型由两种方法构建,如图4所示.一种是利用审计经验建立规则;另一种是通过大数据技术创建和训练模型.数据源除业务数据外,还应拓展其他渠道的数据源.
(四)异常数据管理和处置
异常数据是指审计嵌入模块实时将预警和熔断数据发送到EAS的数据,审计和业务人员对熔断和预警数据分析后进行处置.对于误报异常,审计需要完善模型以提高精准度和准确度;对于真实异常,除因内外部经营环境发生变化产生的熔断数据由业务发起解冻申请、审计审核同意后解冻外,其他事项则由业务自查整改或进入专项审计,如图5所示.
(五)风险闭环管理
EAS自动逐笔建立审计熔断和预警台账,并根据后续处理结果逐一销账:申请解冻成功的数据通过解冻流程自动销账;业务熔断后,业务人员主动完成整改后通过EAS销账;审计人员判断需要启动专项审计的,转入审计项目管理后销账;对于未按期完成解冻或整改的,将自动生成审计整改未完成报表.同时,审计人员还需对熔断数据和预警数据进一步分析,持续完善模型,以提高审计模型的精准度;结合现场审计,对业务流程提出优化或整改建议,对相关人员提出问责建议.
三、嵌入式持续审计系统指标构建和运行
(一)搭建嵌入式持续审计指标体系
以采购指标为例,根据风险矩阵、风险频繁程度,结合长虹已建的预警系统指标体系和功能,选择降价不同步、涨幅异常和超配额下单三个风险点作为嵌入审计指标,如表1所示.
(二)基本算法和运行流程
在机器学习的众多算法中,统计分析是最基本的算法,包含许多重要模型,并为其他机器学习算法提供训练样本等,其中概率分布模型是统计分析中最重要的组成部分.正态分布是许多统计方法的理论基础.检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布.有的统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的.基于以上依据,将采购的绝对值波动转化为价差比后,可通过正态分布模型设计降价不同步、涨幅异常指标模型,给出合理的预警值和熔断值.需要说明的是:
差价比等于(时间区间模型内-时间区间模型内最小)/最小价
1.机器学习算法运行流程.首先,对采购信息记录进行数据预处理和清洗,引入格拉布斯检验法进行异常值剔除.其次,使用正态分布模型计算得到预警值和熔断值.实际过程中,引入偏度和峰度模型修正正态分布模型,降价不同步指标引入时间区间模型,从而更加准确计算预警值和熔断值.最后,进行模型验证,办法是引入实时接口,使用智能化模型调参界面供EAS审计人员进行验证,减少人为出现的失误等,如图6所示.
2.数据分析工具框架.使用Python作为数据分析框架核心工具,实现离线与实时接口轻量级化,满足不同的业务场景,如图7所示.
(三)采用格拉布斯检验法处理异常值
对采购信息记录数据进行清洗、基础分析后,发现部分物料存在不同程度数据异常,其中异常情况有:货币代码不一致、计量单位不一致等.对此,为不影响后续数据分析结果,采取格拉布斯检验法剔除异常值.具体步骤如下:第一步,从小到大顺序排列数据.第二步,计算平均值和标准差.第三步,使用双边测试方法计算G值:G等于.对于双边
测试,异常值的假设在显著级别α级被拒绝的
值为G大于,
表示上臨界值的t分布与N-2自由度和显著水平α/(2N),其中t分布可用于构建真实均值的置信区间.第四步,定检出水平α, 判定数据值是否为异常.多次样本数据选择发现,有95%的概率模型计算的区间包含真实参数值,即大概有95个置信区间包含真实值.可见,格拉布斯检验法能精准找到数据中的异常值,且经过数据验证准确率可达97%以上.为确保所有的异常值都能被找出,可按数据不同属性类别进行多元格拉布斯检验.
(四)运用正态分布模型分析波动规律
1.正态分布概念.若随机变量X服从一个位置参数为μ、尺度参数为σ的概率分布,记为: ,则其概率密度函数为
.如图8所示,正态
分布分析的优势显而易见.
2.偏度和峰度.由于数据的分布存在不对称和方差较大的情况,导致根据历史数据计算得到的部分熔断值大于数据样本最大值的情况,需要采取峰度和偏度模型辅助正态分布模型.偏度计算公式
为:,其中SD代
表标准差.数在均值处峰值高低的特征,通常定义为四阶中心矩除以方差的平方减3.具体计算公
式为:
3.正态分布计算过程.(1)确定时间区间内最小,根据最小计算每条记录的差价比,计算所有差价比的均值和标准差.(2)根据3σ原则确定数据的小概率事件区间,示例数据如表2所示.修正列数据为T的行项目熔断值小于差价比,不符合业务逻辑,需要修正偏度和峰度.(3)修正方法.根据业务逻辑和模型细化,需要对样本数据进行偏度和峰度模型修正,方法如下:第一步,计算时间区间模型内差价比的偏度和峰度.第二步,根据偏度值调整预警值和熔断值.当偏度在0.5时, 对正态分布模型的偏度和峰度进行调整,取最大差价比乘以0.95作为预警值,最大差价比乘以0.99作为熔断值;当偏度小于-0.5时,剔除差价比小于平均值的记录,对其他记录重新计算均值、标准差,依据正态分布模型给出预警值和熔断值.需要说明的是,偏度值选取±0.5是依据多次样本数据选择、模型调参,大概率符合样本真实性,且置信概率区间达到99%等条件来确定,示例数据如表3所示.由此可见,针对降价不同步和涨幅异常指标,运用正态分布模型以及修正峰度偏度后得到的预警值和熔断值,能够给审计指导性建议.
(五)模型验证以及参数调整
通过Python数据分析框架提供的实时接口,可根据审计需要进行实时参数调整,从而达到模型与业务相结合,这不仅能对模型进行线下线上验证,同时可以提高EAS的可扩展性和时效性.
综上所述,针对采购指标使用机器学习统计分析算法,通过线下线上验证阈值、模型多重选择、模型验证、实时接口及灵活的参数调整,可以较好完成嵌入需求,提高模型的智能化水平.
四、主要成效
(一)风险和问题导向的审计模式得以实现
在交易界面频发的风险点和业务管控薄弱环节实施嵌入式持续审计,通过对EAS的熔断和预警数据分析,能够及时发现业务部门内部控制风险和存在的问题,适时启动审计项目,确保风险和问题导向审计以较低的成本取得较好效果.比如,试点单位申请解冻某物料的定价流程,审计和业务单位沟通后发现实际情况与申请内容有较大差距,于是立即启动专项审计并发现该类物料由于采购策略不当造成的定价偏高,后经业务单位整改后该系列物料采购平均降低5%.
(二)审计效率和效果得以提高
通过数据挖掘技术提高预警值和熔断阈值的准确度和精准度,降低预警和熔断误报率,从而实现精准审计,提高了审计效率和效果.
(三)内部控制和业务流程得以优化和完善
由于EAS对高风险业务强制中断,在审计熔断与业务单位申请解冻的过程中,审计人员通过与业务部门互动,第一时间暴露业务的高风险点,从而有效避免可能带来的经济损失,培养了业务人员的成本意识、风险控制意识,提高了业务整改的及时性和有效性.
(四)数据分析方法得以突破
采用历史数据挖掘进行数据分析并构建审计风险模型,在降价不同步和涨幅异常风险模型实现了数据分析技术从基于审计经验到基于统计学的突破,完成了相关物料的熔断阈值智能初始化.
理论分析和长虹一年多的嵌入式智能持续审计创新实践成果,证明IT技术支撑信息化嵌入式审计建设在实践上可行,有助于推动内部审计提质增效.基于大数据技术构建嵌入式智能持续审计系统,将审计模块嵌入信息系统并使其成为业务流程中不可或缺的一环,保证了审计监控的持续性和有效性;通过红黄两级风险处置方式实现事后审计向事中和事后审计相结合的转变,提高了审计和审计整改的及时性;通过大数据挖掘技术并结合审计经验建立模型以提升审计预警和熔断的准确度和精准度,提高了审计效率和质量.
(作者单位:四川長虹电子控股集团有限公司,邮政编码:621000,电子邮箱:49380142@.com)
主要参考文献
侯利佳,李厚杰,傅英韬,吴迪.新常态下嵌入式审计的创新研究[J].商情, 2017(11):26-27
胡镇鑫.内审部门践行“嵌入式审计”新模式的理论与实践:以东莞为例[J].中国内部审计, 2017(4):24-28
王会金,陈丹萍.高级审计技术方法[M].北京:中国时代经济出版社, 2013
小结,此文是适合不知如何写大数据技术方面的人工智能和大数据专业大学硕士和本科毕业论文以及关于人工智能和大数据论文开题报告范文和相关职称论文写作参考文献资料.
人工智能和大数据引用文献:
[1] 人工智能和大数据毕业论文怎么写 人工智能和大数据方面专科开题报告范文8000字
[2] 人工智能和大数据论文范文数据库 人工智能和大数据方面有关硕士论文开题报告范文10000字
[3] 人工智能和大数据开题报告范文 人工智能和大数据有关学年毕业论文范文8000字