在审计中我们很少运用统计学中的概念,一般都核对财务账面数据,查看相对应的合同、发票等原始凭证来执行实质性程序。
但是对于电商、零售等交易金额小,交易笔数海量的数据,一般都没有我们传统意义上的原始凭证,也就很难执行实质性程序。
这时,我们为验证其业务的真实性,往往会查看其信息系统,通过对其海量的业务数据执行多维度的分析性程序。
除了正常的一些分析维度外,引入一些统计学上的分析概念,也能够帮助我们从侧面去验证其真实性。
本文我们以一个实际项目案例,讲解标准差及正态分布在审计中的运用。
标准差?标准差(StandardDeviation),是离均差平方的算术平均数的算术平方根,用σ表示。标准差也被称为标准偏差,或者实验标准差,在概率统计中最常使用作为统计分布程度上的测量依据。标准差能反映一个数据集的离散程度。-----百度百科
?根据我们初中学习的标准差概念可知,其反应了一个数据集的离散程度。
正态分布正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,通过数据集的标准差和均值,可以计算出,每个值对应出现的概率。其图形呈钟型。
实际案例
这里有一个物流运输公司,我按照运输的起点城市和终点城市给他划分出运营的线路,我想测算其线路的运输单价的稳定性。那么我就可以考虑使用标准差来看单价的偏离程度,用正态分布和其实际运单出现的频率对比,查看是否符合。
标准差计算这里我们使用python中的numpy库,该库是用于数学计算的非常强大的库。
封装了求平均值的:mean()函数。
以及求标准差的:std()函数。
这里假设datas数据集包含了所有线路的单价、运输数量、金额信息(这里我已经通过SQL语句整理好数据)
importnumpyasnpdatas=读取你的数据output=[]forline,dataindatas.items():row=[]line_np=np.array(data)mean=line_np.mean()std=line_np.std()row.append(line)row.append(mean)row.append(std)output.append(row)df=pandas.DataFrame(output,columns=[线路,平均值,标准差])df.to_csv(线路标准差.csv)
我们用:标准差/平均值定义其波动率。
再统计不同波动率的线路数:
假设30%以内的波动率我们觉得是价格稳定的,占比达到了89%,剩余的11%的线路我们再去分析明细数据为什么波动大。这样我们把核查范围大幅度缩小。
正态分布我们根据正态分布公式写出自定义函数normdis。利用plotly的histogram图形画图方法,画出实际单价的概率分布以及正态分布。
#!/usr/bin/envpython3#-*-coding:UTF-8-*-#Author:nigoimportpandasimportplotly.expressaspximportplotly.graph_objectsasgoimportnumpyasnp#normdis正态分布函数,mu:均值,sigma:标准差,pdf:概率密度函数,np.exp():概率密度函数公式defnormdis(x,mu,sigma):p=np.exp(-((x-mu)**2)/(2*sigma**2))/(sigma*np.sqrt(2*np.pi))returnpif__name__=="__main__":df=读取线路数据prices=df[price]#线路单价mean=prices.mean()std=prices.std()top=prices.max()x=np.arange(0,top,0.1)y=normdis(x,mean,std)*figue=px.scatter(df_test,x=x,y=y)fig=px.histogram(df_test,x=price,histnorm=percent)norm_line=go.Scatter(x=x,y=y,mode=lines,name=标准正态分布)fig.add_trace(norm_line)fig.update_layout(title=运单单价概率分布图)fig.show()
我们可以看到红色为正态分布,蓝色直方图为实际频率分布,虽然有差异,但原因是价格并不是随机变化的,根据公司业务很多和客户签订过合同。还是可以这条线路是相对稳定集中的。
当然你也可以看到价格波动范围较大的图形:
该线路波动大是因为我们是根据城市来划分的,当相近的两个大型城市,不同区域其实距离也是差距较大的,统计口径导致短途的波动范围大。同时短途也随当前市场行情波动也会更大。
通过模型-查找异常-分析原因-证实或排除。
通过这样的分析思路,帮助我们去完成分析工作。
使用知识和工具总结知识标准差正态分布工具或技术python
numpypandasplotly相关阅读:本福特定律发现财务造假(VBA工具)我开发的审计数据查询网站:青藤数据-审计师自己的平台我写的书:nigo赞赏是喜欢,转发才是爱
本文编辑:佚名
转载请注明出地址 http://www.yizhijiana.com/yzjgj/16123.html