聚焦审计质量控制丨为什么不能以大数据分析结果直接得出审计结论
直接得出审计结论
当前,大数据技术飞速发展,在政务、商务领域应用越来越广泛,国家审计也在实践中积极探索应用大数据分析。根据相关制度规定,审计人员将数据分析结果作为违纪违法违规问题审计证据的,应当经过抽查核实。那么,为什么大数据分析结果未经抽查核实不能直接得出审计结论呢?
受限于大数据分析自身技术特点
大数据分析在证明因果关系方面有局限。大数据分析与传统审计模式相比,在反映相关关系方面具有独特优势,但在解释因果关系方面却缺乏说服力。如,审计人员通过数据分析发现,某工程建设项目施工单位财务负责人个人名下有多张银行卡,存在在其居住地和承揽工程所在地同时消费的情况,是否能据此认定施工单位通过赠送银行卡的方式向建设单位相关人员行贿?其中可能存在财务负责人的银行卡为工程项目部或其亲属实际使用等其他情况。如果不进行抽查核实,便难以对具体问题情形作出定论。审计工作强调因果关系分析,不仅要查清楚是什么,还要弄明白为什么,才能提出有针对性的处理意见和审计建议,因此抽查核实是审计中非常重要的环节。
大数据分析结果不具备绝对精确性。大数据分析与传统审计模式相比,整体性是其突出优势,能够通过对整个底层数据库的分析,达到把握事物总体的目的,但纳入分析范围的数据越多,其精确性就越弱。大数据的天然特征是体量大、来源广、产生速度快,其中很可能夹杂着大量无用、冗余乃至错误的数据,形成大数据中的噪声。数据挖掘作为大数据分析的重要技术方法之一,就是从充满噪声的数据中提取潜在有用信息和知识。它在很大程度上依赖于概率统计,并非绝对精准。目前这一技术方法已广泛用于商业营销和用户推广。但审计工作要确保事实清、证据实、定性准,要对被审计对象精准画像,对每一项违纪违法违规事实的认定和处理,都必须建立在坚实的审计证据基石之上,因此数据分析结果只有经过必要的核实后才能作为审计证据。
大数据分析对非结构化数据处理存在技术挑战。大数据来源复杂,格式多样,既包括结构化数据,也包括图像、音频、视频等非结构化数据。目前对于非结构化数据的分析处理,技术难度较大,应用程度还非常有限。一些被审计单位在履职行为方面存在问题,但承载具体行为相关信息的数据,如记录相关执法部门监督检查的数据,很多是非结构化数据。目前对非结构化数据进行处理的大数据审计分析技术还很不成熟。一般而言,需要在对结构化数据进行系统分析、发现疑点的基础上,对记录行为的相关图像、音频、视频等或其他未作为数据存储的信息进一步抽查核实,才能对是否存在实质性违纪违法违规问题作出准确的审计结论。
受限于数据质量普遍不高的现状
大数据分析优势发挥较大程度受限于数据质量不高的现状,对错乱的、残缺的、滞后的、割裂的数据进行分析的结果将无法反映现实。
数据错误影响大数据分析作用发挥。如,审计人员将领取养老保险人员数据与死亡人员数据进行比对,发现数万条记录属于已死亡人员仍领取养老保险的情况。但经核查,发现某殡仪馆相关人员在录入死亡人员数据时,误把死亡人员家属的身份证号录入在死亡人员身份证号一栏,如不经核实,将造成严重的审计结论错误。
数据残缺影响大数据分析作用发挥。如,根据脱贫攻坚项目库建设的相关规定,未明确绩效目标的项目不得纳入脱贫攻坚项目库,未进入项目库的项目不得安排使用财政专项扶贫资金。在信息系统数据完整的情况,审计人员能够快速筛查出未明确绩效目标的项目却被纳入项目库或安排有扶贫资金的问题。但由于基层扶贫部门大量存在依赖纸质文件办理业务、在项目库中填报数据不完整的情况,数据筛查出的项目可能确实未明确绩效目标,但也可能是未予填报,如未经核实则无法作出准确判断。
数据滞后影响大数据分析作用发挥。如,审计人员将获得医保补助的人员数据与低保特困人员数据进行比对,发现某地区有大量低保特困人员未获基本医保缴费补助和医疗救助。后经核实发现,民政部门相关信息系统中的低保特困人员数据包含了实际已经注销低保或特困身份的人员,其中还有部分人员已经死亡。由于数据更新严重滞后,在此基础上的数据分析结果是不可信的。
数据割裂影响大数据分析作用发挥。大数据分析的常见做法是将各类数据进行关联比对,但由于不同系统开发时对字段设定的标准和口径不尽一致,如仅靠字段名称等进行关联比对,可能存在较大偏差。
但无论在传统审计模式下还是大数据审计模式下,对审计证据的要求是一致的。审计证据必须同时具备适当性和充分性,这是我国国家审计准则的明确要求,也是国际公认的审计证据标准。最高人民法院、最高人民检察院、公安部《关于办理刑事案件收集提取和审查判断电子证据若干问题的规定》(法发〔2016〕22号)也对电子证据真实性、完整性的审查判断作出了具体规定。大数据分析的基础是数据,数据的真实性、完整性、更新的及时性以及与其他系统数据之间的衔接性等质量问题将直接影响大数据分析结果的可靠性。在数据质量不高的情况下,以此为基础进行的数据分析结果必然是不可靠的,即审计证据的适当性无法保证。在这种情况下,只有进行必要的抽查核实才能最大程度降低审计风险。
政策环境具有复杂性
大数据分析需要审计人员基于对政策法律法规制度的认识和解读构建数据分析模型,在此基础上筛查或挖掘符合相关特点或规则的数据。数据分析模型与政策规定的吻合程度在很大程度上决定了数据分析结果的有效性,但政策规定体系是复杂的,审计人员可能存在对政策规定了解掌握不够全面深入的情况,或者即使熟悉相关政策规定,也难以获取适当的数据来构建与政策规定完全契合的数据分析模型。
如,我国实行永久基本农田保护制度,规定永久基本农田经依法划定后,任何单位和个人不得擅自占用或者改变其用途,但对涉及永久基本农田的矿业权设置问题还有专门具体规定,矿业权设置并非完全不能与永久基本农田重合,有许多需要考虑的具体情形。对每种情形相应的政策要求不同,对于是否须进行审批、履行什么样的审批程序具体规定也有差异。构建同时考虑所有因素的数据分析模型,技术上和数据获取上都存在困难,审计时很大程度上还依赖于具体的抽查核实。
现实状况存在多样性
现实世界是千差万别的,其多样性可能远超数据分析模型的预设场景。在未经抽查核实的情况下,审计人员仅简单通过构建数据分析模型得出审计结论,可能存在极大审计风险。
如,审计人员通过数据关联分析发现某地区多发放渔业受灾补助问题,将财政部门实际发放补助的鱼塘面积亩数与相关主管部门登记在册的鱼塘面积亩数进行关联比对,结果发现二者之间存在较大差异,是否能据此认定虚假发放渔业救灾补助?该数据分析模型的重要假设前提是,主管部门登记在册的鱼塘面积亩数是应发放补助的,而实际情况是,鱼塘除了有证的还有无证的,但无证鱼塘渔民养殖鱼虾受损的事实也是客观存在。
又如,审计人员将乡村保洁人员的身份信息与残疾人员的身份信息进行关联比对,发现部分乡村保洁人员为重度残疾人员,由此认定不具备保洁能力,提出聘请具有保洁能力的人员担任乡村保洁员的处理意见。但经核实,存在残疾证管理不规范的问题,有的虽为残疾人员,但仍有一定的保洁能力。
从上述案例可以看出,现实情况是复杂多样的,审计人员必须充分调查研究,尊重客观事实。大数据审计并不能完全替代审计人员进行必要的抽查核实。
综上,大数据分析的自身技术特点、数据质量普遍不高的现状、政策环境的复杂性以及现实状况的多样性决定了仅凭大数据分析结果目前还无法直接得出审计结论。当前,审计工作受到党中央国务院高度重视以及人民群众的广泛关注,审计成果利用也越来越深化,审计人员应强化质量意识,既向大数据分析要效率,又通过必要抽查核实来夯实审计证据,确保大数据分析成果落实落地,经得起历史和实践检验。
(作者单位 审计署审理司)
责任编辑:牛淋淋