当前位置: 首页 > 审计论坛

新常态下审计数据挖掘技术探析

发布日期:2017-02-07 14:21 访问次数: 信息来源:威海市审计局 字号:[ ]

新常态下,被审计单位的管理方式越来越依赖于更加高效但却复杂的信息系统,审计人员面临的不仅仅是实物的凭证、账簿、报表等,而且是信息系统集成的大量数据和信息系统本身。审计人员能够迅速、准确地从海量数据中获取有价值的信息线索变得尤为重要。本文结合审计工作,对数据挖掘技术进行探讨,从而提高计算机辅助审计的工作效率,更大限度地保证审计质量。

一、数据挖掘式审计的含义

数据挖掘式审计是更加适应现代信息技术环境的一种新型的审计取证方法,审计工作中创新性地引入数据挖掘技术,体现出速度和效率上的巨大优势。成功运用电算化技术进行记账和经营管理的被审计单位计算机系统中通常都蕴藏着大量的财务电子数据,传统的手工抽凭证的审计方法面对被审计单位复杂多样的记账方式和海量的财务数据,效率低下并且效果差强人意,只有利用数据挖掘技术,才能更加高效有序地实现审计目标,完成审计工作和任务。数据挖掘技术作为信息技术的一种特有的技术手段应用在审计领域,能够协助审计人员高效地筛选出审计人员所需要的审计数据样本,从而大大提高了审计效率。随着数据挖掘技术的快速发展,通过对被审计单位大量的数据日志进行差异性分析,可以建立自动化的非法入侵数据检测系统,更加有效地节省人力资源成本。

二、数据挖掘式审计的分类

数据挖掘技术包括许多不同的技术分类。在计算机辅助审计业务工作中,可以采用的数据挖掘技术通常包括离群点挖掘、异常点检测、聚类分析、关联规则发现和建立决策树等方法,从而获得对审计工作有帮助的审计证据。

离群点技术可以发现和分析明显偏离数据总体、不符合被审计单位业务规律的离群数据,从而找到对完成审计工作有价值的信息的一种数据挖掘方法,它的本质是从被审计单位海量的财务数据中发掘出少部分的不符合整体规律的或明显存在异常的离群数据进而进行审计任务的模式。通常来说这种异常的离群数据通常会比大多数的数据更具有审计价值。因为在审计工作中审计人员要对财务数据抱有怀疑精神,在这样的情况下很多看似正常的财务数据都有可能发现是造假的,更何况是本来就异于正常数据总体的特殊数据。这样通过对离群数据进行可靠性的分析,发现异常状况的可能性比分析海量的正常数据大得多,节省了大量的人力成本和审计资源。

在被审计单位提供的财务数据中有时还会随机出现一种与其他数据类型不一致的数据。由于其无法得到合理的猜测或解释,这种数据被称为异常点。异常点检测也是数据挖掘技术的重要研究内容,它是从大量审计数据对象中挖掘少量具有异常行为模式的数据对象。异常点与离群点不同的是离群点有可能再次出现,而异常点则是随机出现并且一般是不再重复出现的。由于“异常点数据”与其它数据存在极其不合理的差异,有理由怀疑该“异常点数据”可能是随机产生的,它产生的原因可能是度量错误或录入错误,需要通过查询记账凭证与原始凭证来消除“异常点数据”的影响,从而进行数据的梳理和排查,提高审计数据的质量和准确性。

将抽象对象的数据集合总体按照具有相同特征的对象分为一组的过程被称为聚类。由聚类活动所生成的一组数据集合中的数据单体彼此相似,与其他组中的数据对象则明显相异。风险导向审计的要求聚类分析技术也可以适应,它将审计对象按照审计风险的等级进行聚类。其优势是摆脱了审计人员的先验知识或知识局限,是科学而非靠直觉地使得具有相似行为特征的对象聚为一类。

关联规则发现是指通过资料分析,确定会同时出现在某一资料或事件中的东西。关联规则不但用于发现大量数据集合间有意义的关系,而且侧重于不同领域之间在数据方面的联系。审计信息系统就是运用关联规则提取数据之间的关联特征,通过对安全事件间的关联分析,提高审计风险报警事件的准确率。

建立决策树是数据挖掘中经常用到的一种技术,一棵决策树的建立只需要扫描几遍数据库,这就意味着建立过程需要计算的资源较少,而且包含很多变量的情况也会很容易得到处理,所以,决策树模型可以迅速地建立起来,同时,建立起来的决策树可以应用到大量的数据上。归纳分类是决策树数据挖掘技术的重要程序,在审计中利用这种归纳分类可以转化成对风险的识别。决策树的数据分析方法有别于一般的趋势分析、统计分析、比率分析等,它以数学规律的角度为出发点进行审计分析,将众多的信息数字化,归纳数据的特点和关联性。

三、数据挖掘式审计的流程

(一)数据的获取

获得被审计单位的财务数据和财务报表(标准格式的数据和报表),这是利用信息挖掘技术对被审计单位进行审计的基础,只有获得了被审计单位的财务数据才能按照正常审计的程序对被审计单位的财务状况进行进一步分析,从而获得充分的审计证据。在被审计单位提交财务数据和财务报表以后,审计人员同时还应搜集与被审计单位有关的外部数据信息,并从中筛选出适宜进行数据挖掘的数据,对获得的数据进行选择时不能只考虑精简而不考虑数据的完整性和相关性,需要审计人员尽可能地搜集与审计业务关联密切的财务信息。通常来说这些相关的信息不光包括被审计单位自身的数据信息,还包括与被审计单位相关的单位的来往数据。并且获得的数据应该统一格式,为以后的数据挖掘工作节省时间。

(二)数据的清理

数据的清理就是对获得的审计数据进行处理,剔除对审计工作无用的数据,对有用的财务数据进行分类汇总,从而形成对计算机辅助审计工作有用的数据集合总体。这一过程一般不是一蹴而就的,可能需要反复进行多次。在建立挖掘模型的过程中往往会发现一些未能预料到的问题,因此数据的选择和清理就有可能是不合理的,因而需要重新进行这一过程。

(三)运用恰当的数据挖掘工具对数据进行分析并建立挖掘模型

采用恰当的数据挖掘技术对审计数据集合进行分析,发现财务数据中隐藏的信息,并且获取与众不同的异常信息。正确地选择数据挖掘工具来进行挖掘十分关键。应当考虑该工具能否适应建立挖掘模型的需要,同时考虑进行数据挖掘的成本效益。当选择好一个工具后,就要针对审计问题建立挖掘模型,因为这将影响到挖掘结果的准确性和易于理解性。

(四)审计人员进行职业判断

对处理好的财务数据进行统计,根据统计的结果进行后续的审计工作(进行职业判断)。一般情况下需要考虑被审计单位的业务水平发展状况与其营业规模的符合程度、是否存在异常的数据信息以及业务流程的可靠性程度等。这是为进一步得出审计结论发表审计意见收集直接的证据,是数据挖掘技术得到的结果能否得到肯定的依据。

(五)分析和评价审计的结果

对数据挖掘技术得到的成果进行分析和总结,同时将数据的结果通过有经验的审计人员转换为被审计单位能够理解的审计结果,这个转换成审计结果的过程也是一个评价的过程,假如得到的审计证据不足以使审计风险降低到可以接受的程度的,即其结果并不能使进行审计工作的人员满意,就必须重新运用数据挖掘工具进行搜集数据,处理结果,总结意见,直至结果令人满意为止。

四、应用好数据挖掘审计技术的途径

(一)利用数据挖掘工具广泛实施审计

常用的数据挖掘工具有以下几种:Intelligent Miner; SAS Enterpreise Miner; SPSS Clementine; 马克威分析系统;GDM。由于目前并未出现专门用于审计的数据挖掘工具,在审计时应灵活采用。

一是利用数据挖掘技术辅助税务精细化管理。税务行业以数据挖掘技术为契机,迎来了更进一步的数据融合、数据智能分析阶段。逐步形成包括风险建模、预测分析、关联分析等高级数据应用管理工具的管理模式,进行税源专业化管理。大量外部数据的引入和融合,导致税源的分析探查层次可以从多角度进行丰富深化。灵活的风险控制,可以更加精确地进行风险模型微调,对数据指标进行风险探查。例如能够通过纳税户的历史记录跟踪和风险数据指标输入,进行行业、企业类型、地区、产业等多角度的回归分析,得出偷逃税的风险概率,进行审计核查。

二是利用数据挖掘技术进行医保审计。在海量业务的情况下,审计部门只能抽审病例,难以实施全面核查,其中存在问题的风险较大。通过数据挖掘技术,根据数据的特征,查找明显不符合常规的疑问数据,进行审计核查。

三是利用数据挖掘技术进行综合绩效审计。通过对职能部门业务数据的分析审计实现对其工作成效客观评价,从部门事物纵向时间轴、区域业务横向对比,全面审计政府治理得失。目前,政府部门量化的绩效审计只有财政绩效,未来则可以开展人大监督、工作量和编制核定、业务办结情况等绩效评估领域。

(二)运用数据挖掘技术应注意防范风险

虽然利用数据挖掘机技术进行计算机辅助审计拥有众多的优势,但新生事物的产生必然存在不完善的方面,它的运用也存在着一定的风险。一是系统风险。运用数据挖掘技术和计算机辅助手段本身存在的风险,它包括硬件风险和软件风险。其中硬件风险主要是来源于数据的存储过程发生错误导致数据丢失的风险例如硬盘的损坏、感染病毒、或人员操作不规范导致的数据丢失。软件的风险包括使用的技术手段不合适或软件的缺陷导致的财务数据的分析达不到要求或结果的不准确,进而影响了审计的效率和质量。二是数据的风险。由于计算机的运用是通过程序语言来控制的,有可能被审计单位的财务系统的数据是经过修改并且清除了修改痕迹的。审计人员很难发现数据被修改,从而按照正常的审计程序进行审计,得到的审计结果和审计结论注定是不正确的。并且进行审计的过程中审计人员只有在被审计单位的配合下才能顺利地完成审计工作达到预计的审计目标,假如被审计单位为了某些目的故意隐瞒修改或者操控审计数据和程序,审计工作必定会受到影响。三是来自审计人员的风险。审计人员对审计和计算机辅助技术的掌握程度是有差别的,由于审计人员对运用数据挖掘技术进行计算机辅助审计掌握程度的差别,也会使审计结论及分析结果与实际情况不吻合,增大了审计风险。对此,审计人员应注意防范风险,并且新型技术的发展是极其迅速的,很多传统的审计软件运用的数据挖掘方法是陈旧的,需要审计人员充分发掘财务数据和报表中隐藏的信息从而完美地达到预计的审计目标。

(三)适应新形势完善制度提高能力

数据挖掘手段和计算机辅助审计技术因其高效率和低成本的优势必将引领未来审计发展的趋势。但针对数据挖掘技术和计算机辅助审计过程中存在的问题,应积极改革。一是.完善和健全计算机辅助审计准则及标准。现在由于数据挖掘技术和计算机辅助审计的发展还处于起步的阶段,很多法律和规范十分不完全,并没有完善的关于计算机审计的准则及标准。这样就在一定程度上限制了数据挖掘和计算机辅助审计技术的发展,加大了审计的风险。在这样的现状下,制定可以规范数据挖掘和计算机审计的准则对于完善数据挖掘技术在审计中的应用将会发挥极大的推动作用。同时国家应该大力倡导利用计算机辅助进行审计,推动计算机辅助审计的创新。二是提高审计人员的计算机技术能力。制约数据挖掘和计算机辅助审计发展的因素除了技术的融合过程缓慢以外,更主要的因素是审计人员对计算机技术并不精通。提高审计人员的计算机技术可以直接有效地推动数据挖掘技术和计算机辅助审计的发展。因为从事多年审计工作的审计人员很清楚运用计算机技术和数据挖掘技术的优势,相比从事繁重的数据处理工作,更多的审计人员在熟悉计算机辅助审计的状况下更乐意运用数据挖掘技术来减轻大部分的工作量。这在非常大的程度上有利于数据挖掘技术和计算机辅助审计的发展。三是大力推动运用数据挖掘技术的审计软件的开发。很多时候即使审计人员明白计算机辅助审计的优势但由于年龄或其他方面的因素并不能很好地掌握计算机技术,更不用说把计算机技术和审计方法进行结合。这时候功能完善的计算机辅助审计软件的出现将极大改善这一状况,并且十分有利于数据挖掘技术在审计活动中的使用和发展。通过数据挖掘式审计可以极大地提高审计效率,提升审计能力,充分发挥审计在国家治理中的基石和重要保障作用,使审计结论更公允,让审计人员更有公信力。(林雨虹)

分享到: 新浪微博 微信
Produced By 大汉网络 大汉版通发布系统