摘要
近些年,基于大数据分析模型的风险度量和控制方法研究变得越来越重要,而风险度量模型的后验分析研究能够保障和检验所用分析技术在实际数据分析中的有效性。边际期望损失(MES)作为度量个体对系统性风险的边际贡献的重要工具,其后验分析也是一个值得关注的问题。本文将C. Acerbi等提出的关于ES的后验分析方法进行二维变量下的延伸,提出2个新的对于MES的统计量。模拟实验的结果表明,在原假设分布和备择假设分布相差相对较小的情况下,2个统计量的统计功效均大于D. Banulescu等采用的统计量。实证分析的结果也表明,对于同样的预测结果,文中新提出的统计量在原假设的接受程度上相对更为谨慎。该方法对于大数据模型算法的后验分析具有一定的理论借鉴意义。
近年来,随着数据量的急剧暴增以及计算性能的提高,基于大数据的风险度量和分析模型开始盛行并推广应用于各行各业。系统性风险的概念最早起源于金融领域,因为其极强的破坏性,不少学者提出各种系统风险度量工具。边际期望损失(MES)则是其中的度量工具之一,指的是在市场遭受比较极端损失情况下金融机构个体的期望损失,衡量的是在危机发生时金融机构个体对整个系统风险的边际贡
一般通信系统中传输的信号都具有一定的不确定性,因此都属于随机信号(Random Signal),它的幅度未可预知,任何一次观测只代表其在变动范围中可能产生的结果之一,但又服从一定的统计特性,又称不确定信号。
从信息论的观点,对接受者而言只有信号表现出某种不确定性才蕴含信息,关于更多随机信号的建模和预测详见赵淑清
环境信号的异常是频谱感知中通常会关注的问题。随着无线电技术的迅猛发展,越来越多的通信设备利用电磁波传播信息,电磁空间环境日益复杂,对于电磁空间环境异常信号的检测也受到了越来越多的关注。近年来,频谱异常检测问题已得到了广泛研究,并取得了一定的成果。根据频谱异常检测所采用的方法,现有的研究可分为两类:第一类是利用信号传输时的各个特征进行频谱异常检测,包括接收信号强度空间分布、接收信号强度变化、物理信道属性、直接路径的幅度差、受扰路径的幅度差以及通话时间利用率等,相关成果见文献[
后验分析,也即检验真实值是否与估计值一致,是为了确保一个估计方法在实际数据分析中的有效性。对于比较主流、提出时间比较早的风险度量,譬如在险价值(Value at Risk,VaR),其后验分析方法相对来说比较多,相关理论发展得也比较完善。但是关于MES的后验分析方法目前文献中涉及得还不是太多。从其定义可以看到,MES可看成是ES(Expected Shortfall)(也叫期望损失,代表了一个随机变量在大于自身较高分位数下的条件期望,可表示为E(X)=E(X|X≥VaR(X))在二维变量下的延伸。由于ES不是可诱发的,因此曾经在很长一段时间内被认为是无法进行后验分析的。出于ES在实际应用的需要,许多学者也相继对其后验分析方法进行探究,这些研究成果既促进了ES在实际中的使用,也为对其他风险度量工具进行后验分析提供了思路和借鉴。其中,Acerbi
后验分析相当于一个统计上的假设检验,对于一个假设检验,其统计功效是值得关注的问题。针对VaR的后验分析问题,Dumitrescu
本文对Acerbi等提出的ES进行后验分析的方法进行维度上的延伸,从而提出2个新的关于MES后验分析的统计量。设计模拟实验来检验其统计功效,并将其与Banulescu等提出的用于检验MES的方法的统计功效进行对比。最后将这2个方法应用于电磁频谱数据的实证分析。
首先给出本文中MES的定义:令分别代表个体和整个系统在时刻的取值,其中。在(,)有连续分布函数的条件下,给定置信水平为,则个体在时刻的边际期望损失可表示为:
(1) |
式中:=,相当于的分位数。如果真实的分布是已知的,则可以根据定义来计算出其对应的MES度量值。但在实际中,其实是未知的,往往需要通过一个预测的分布,暂且记作,来计算个体在时刻的边际期望损失。这样一来自然就需要考虑一个问题:能否接受在下计算得到的MES就是真实的MES这个假设,这正是后验分析需要解决的问题。这一节将介绍2个MES的后验分析方法。
该方法是Acerbi等关于ES的后验分析方法在二维变量下的延伸。本文同样采用一般的假设检验框架来进行MES的无条件后验分析。
取原假设和备择假设分别为 存在,使。其中,表示在下计算得到的MES。本文进行的其实是单边的假设检验,也即检验的是在下计算得到的MES是否低估其真实值。由
(2) |
(3) |
不难猜想,在与真实的MES非常接近的情况下,统计量和应该会非常接近零。如果低估了真实的MES,则统计量的值会显著大于零;如果高估了真实的MES,则统计量的值自然小于零。此外也可以看到,统计量和不同的地方在于分母,这体现了两者在出发点上略微的差异。在处理实际损失时是先对所有超过阈值的求和,然后除以实际个数,相当于是对这部分的取平均;对所有超过阈值的求和后除以的则是期望的个数,也即。同时注意到有成立,也即如果
的估计是准确的,超过阈值的实际个数应该会很接近于期望的个数。这个微小的区别使得这2个统计量之间也有所不同,其功效在下一节的模拟实验中进行展示。
方法二是Banulescu等用来进行MES后验分析的方法,该方法通过巧妙地利用CoVaR和MES的关系,从而创造了一套关于MES的检验方法。
首先给出本文中CoVaR的定义,注意到均代表的是损失,本文将某个个体在时刻的CoVaR表示为:
(4) |
式中,可看成是另一个置信水平。因此,MES和CoVaR的关系为:
(5) |
与VaR的后验分析类似,可以通过一个碰撞序列对CoVaR进行后验分析。具体来说,定义,通过检验是否是一个期望为的伯努利变量,或者等价地,通过检验是否为鞅差序列来说明对CoVaR的估计是否准确。基于
(6) |
式中:,,和分别是在预测分布下和的边际分布。并且由于和相互独立,故,从而检验MES估计是否准确就转化成了检验的期望是否为,也即可定义原假设为:, 。
进一步计算可得到方差为,因此可构造统计量:
(7) |
式中。换言之,如果在下计算得到的MES是准确的,则由
在实际操作中,通过比较与分布右侧的临界值,就可对MES估计(预测)的准确性进行判断。
由于样本的随机性,当应用某个检验结果来做判断时,有可能会犯弃真和取伪两类错误(错误和错误,或者也叫第一类错误和第二类错误),并且在样本量一定的条件下这两类错误不可能同时减小,故通常会采取折中的方案,即控制犯第一类错误的概率不大于某个给定的值。在统计学的假设检验中,统计功效(Statistical Power)指的是由样本计算得到的统计量落入拒绝域的概率。当原假设不为真时,这个概率越大,意味着犯取伪错误的概率越小。这一节将通过模拟数据实验来对上述2种方法的统计量的功效进行比较。
采用二元的分布生成模拟实验数据。首先给定3个原假设的分布,每个原假设下分别设置2个备择假设,第1个备择假设的自由度与原假设保持一致,比原假设大;第2个备择假设在第一个备择假设的基础上减小了自由度,而不变。不难看出,第2个备择假设的分布与原假设分布的差别要比第1个备择假设与原假设的差别更大。此外,分布中越小的自由度意味着越大的方差,同时,越大意味着变量间的相关关系越强,而在这里每个原假设下的2个备择假设的都大于原假设,并且(或者)v要小于原假设,这意味着每个备择假设的MES会高于原假设下的MES。故该模拟实验探究的是当不为真,也即下的MES确实低估了真实值时,统计量取伪的概率大小。对每个备择假设,都设置了10%和5%两个显著性水平,每个模拟实验取样本量大小为250和500两种情况,MES的置信水平分别取90%、95%和97.5%三个值。
power/% | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
T=250 | T=500 | |||||||||||||||
H0 | H1 | significance level/% | ||||||||||||||
0.4 | 6 | 0.6 | 6 | 10 | 58.3 | 47.8 | 44.1 | 36.8 | 31.2 | 27.7 | 83.2 | 70.7 | 67.8 | 53.7 | 50.0 | 39.7 |
5 | 41.3 | 34.1 | 27.7 | 24.6 | 17.2 | 18.0 | 70.6 | 56.1 | 51.0 | 39.3 | 32.9 | 26.8 | ||||
0.6 | 3 | 10 | 80.3 | 86.9 | 68.8 | 85.9 | 53.7 | 83.8 | 95.1 | 97.6 | 88.7 | 96.9 | 76.3 | 96.0 | ||
5 | 71.4 | 80.0 | 55.6 | 79.0 | 38.7 | 77.2 | 91.5 | 95.8 | 81.4 | 94.9 | 64.7 | 93.3 | ||||
0.4 | 30 | 0.6 | 30 | 10 | 71.8 | 56.3 | 58.2 | 42.8 | 42.8 | 32.5 | 92.3 | 75.6 | 81.8 | 58.1 | 64.3 | 42.3 |
5 | 56.9 | 41.2 | 39.8 | 30.5 | 26.8 | 21.0 | 83.7 | 63.6 | 68.0 | 44.9 | 47.1 | 30.4 | ||||
0.6 | 10 | 10 | 80.0 | 76.0 | 68.0 | 71.1 | 52.1 | 65.4 | 95.4 | 92.0 | 88.8 | 87.9 | 75.2 | 83.4 | ||
5 | 68.2 | 63.9 | 51.7 | 58.8 | 34.9 | 53.4 | 90.1 | 86.3 | 79.0 | 80.8 | 60.9 | 74.7 | ||||
0.2 | 6 | 0.4 | 6 | 10 | 57.7 | 54.0 | 44.1 | 41.1 | 32.2 | 31.7 | 79.2 | 75.0 | 63.9 | 58.6 | 47.4 | 43.9 |
5 | 41.9 | 39.5 | 29.4 | 27.7 | 17.8 | 20.7 | 66.4 | 61.3 | 47.9 | 44.3 | 33.1 | 28.5 | ||||
0.4 | 3 | 10 | 71.3 | 79.8 | 59.6 | 77.2 | 46.4 | 74.9 | 88.2 | 93.6 | 78.7 | 91.2 | 65.4 | 89.0 | ||
5 | 60.4 | 72.7 | 48.0 | 69.6 | 32.2 | 67.2 | 82.0 | 90.2 | 69.0 | 87.5 | 53.8 | 84.5 |
从
power/% | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
H0 | H1 | significance level/% | T=250 | T=500 | ||||||
0.4 | 6 | 0.6 | 6 | 10 | 34.6 | 27.6 | 23.6 | 48.0 | 38.5 | 30.6 |
5 | 23.5 | 19.6 | 15.5 | 36.1 | 27.3 | 21.4 | ||||
0.6 | 3 | 10 | 77.6 | 83.2 | 84.6 | 94.2 | 96.4 | 96.7 | ||
5 | 68.3 | 75.0 | 77.5 | 90.1 | 93.7 | 94.3 | ||||
0.4 | 30 | 0.6 | 30 | 10 | 39.0 | 32.6 | 27.5 | 52.1 | 41.6 | 33.8 |
5 | 27.3 | 23.1 | 19.2 | 39.4 | 30.9 | 24.2 | ||||
0.6 | 10 | 10 | 57.5 | 59.0 | 58.6 | 78.1 | 78.1 | 77.1 | ||
5 | 45.6 | 47.3 | 47.9 | 68.4 | 69.1 | 68.0 | ||||
0.2 | 6 | 0.4 | 6 | 10 | 31.6 | 27.1 | 22.4 | 45.3 | 36.1 | 29.8 |
5 | 22.0 | 18.4 | 15.2 | 33.3 | 25.5 | 19.9 | ||||
0.4 | 3 | 10 | 73.7 | 79.1 | 81.4 | 91.2 | 94.5 | 95.4 | ||
5 | 63.2 | 70.7 | 73.6 | 85.5 | 91.4 | 92.2 |
但在某些方面也有着略微的优势。可以注意到的一点是,随着置信水平的增加,在第2个下,的表现略优于和。将MES置信水平为97.5%下每个原假设对应的第2个备择假设的数据取出来,共12组对比数据,其中有8组数据的功效值是大于和,说明在较高的置信水平并且备择假设的分布与原假设的分布相差较大的情况下(虽然实际中可能性较少),统计量的表现稍佳。可以猜想,在更高的置信水平下以及同样是备择假设的分布与原假设的分布相差较大的情况下,的表现有可能会相对更优。并且还可以注意到,与和不同,的功效并不一定随着MES置信水平的增大而减小。而且,由于在原假设下的分布是已知的,故统计量的p值可直接获得,而不需要像和一样需要通过大量的模拟计算。
总的来说,在原假设分布和备择假设分布相差相对较小时,统计量的统计功效最大,表现最好,其次是,而的统计功效最低,效果最差;在原假设分布和备择假设分布相差相对较大时,整体看来,统计量的表现最好,对于置信水平较高的MES,的统计功效相对稍大些。但这种情况在实际中发生的概率相对比较小,因为估计的分布一般不会和真实的分布相差特别远。因此可以认为在实际中,统计量的结果可能相对会更可靠。
通过实际的数据分析来验证前文中后验分析方法的功效。其中的数据来自一个公开的射频频谱数据集,由伊利诺伊理工学院联合图尔库大学和弗吉尼亚理工大学共同收集,以用于对射频环境的时空变化进行建模,从而实现对频谱利用率更精确的估计,提高频谱利用率。观测点有3个在美国,2个在芬兰,采集的时间区间是2015年到2018年间每年的1月20日至1月27日连续8天时间,采集的频率范围为30~6 000 Hz,分为30~130 Hz、130~800 Hz、650~1 200 Hz、1 200~3 000 Hz和3 000~6 000 Hz五个频段。本小节从其中650~1 200 Hz的频段中随机选取20个频点,暂且将每个频点对应的电磁信号表示为X1,X2,…,X20,同时假定在同一个时间点有一个信号是由这20个频点的电磁信号叠加得到,暂且记为Y。本文选取了其在2015年1月22日这一天,在经度为22.27,纬度为66.44处的数据,由于数据在采集过程中是每隔3 s左右记录1次,因此在这24 h内每个频率共有28 272个采集样本。取训练和测试的样本数据比例大致为3:1,也即前面的21 000个样本数据作为第一部分用来估计模型参数,剩下的作为第二部分用来做后验分析以检验估计结果的有效性。这里先展示每个频点的电磁信号的统计特征,限于篇幅,仅展示其中前4个频点上电磁信号的情况,如
signal | mean | SD | skewness | kurtosis | ARCH | Ljung_Box |
---|---|---|---|---|---|---|
signal 1 | -93.105 9 | 6.811 7 | -1.260 4 | 2.204 4 | 0 | 0 |
signal 2 | -112.657 0 | 3.767 3 | -0.788 1 | 1.921 1 | 0.103 6 | 0.083 8 |
signal 3 | -114.452 0 | 5.614 1 | -1.086 1 | 2.069 1 | 0.139 7 | 0.156 4 |
signal 4 | -107.250 0 | 3.968 6 | -0.538 9 | 1.318 3 | 0.019 4 | 0.020 1 |
从
在对分布的估计上,为了增加一定的灵活性,本文并不直接对其二元联合分布进行建模,而是采用先估计边际分布,再估计相依结构(Join Structure)的二步拟合的方式。从
signal number | µ | ο | λ | ρ |
---|---|---|---|---|
signal 1 | -85.145 6 | 10.978 4 | -5.652 7 | 0.427 9 |
signal 2 | -108.462 1 | 5.574 6 | -2.528 6 | 0.207 5 |
signal 3 | -107.639 1 | 8.769 8 | -4.157 7 | 0.285 6 |
signal 4 | -103.335 5 | 5.501 8 | -1.772 0 | 0.206 3 |

图1 每个信号的功率箱线图
Fig.1 Boxplots of power for each signal
用第二部分的数据对MES的估计结果进行后验分析,即通过计算对应的统计量来判断模型对MES的估计是否正确。由于每个统计量在计算过程中均需涉及到Y与阈值的比较,故先对VaR估计的准确性进行衡量,结果如
789(0.539 0) | 362(0.202 8) | 173(0.141 1) |
statistics | signal | |||
---|---|---|---|---|
signal 1 | -0.006 072(0.990 1) | -0.002 618(0.781 6) | -0.000 472(0.579 5) | |
signal 2 | 0.000 301(0.392 4) | -0.000 274(0.569 8) | -0.000 313(0.566 5) | |
signal 3 | 0.003 176(0.050 7) | 0.004 042(0.062 7) | 0.002 439(0.285 9) | |
signal 4 | 0.000 718(0.306 0) | -0.001 941(0.822 2) | -0.001 416(0.695 0) | |
signal 1 | 0.014 763(0.361 8) | -0.065 599(0.843 1) | -0.104 978(0.878 6) | |
signal 2 | 0.021 270(0.311 4) | -0.063 403(0.839 0) | -0.104 835(0.879 2) | |
signal 3 | 0.024 205(0.288 2) | -0.059 360(0.823 6) | -0.102 370(0.872 2) | |
signal 4 | 0.021 695(0.308 8) | -0.064 965(0.845 3) | -0.105 823(0.882 1) | |
signal 1 | 1.328 517(0.092 0) | -0.945 105(0.827 7) | -1.356 476(0.912 5) | |
signal 2 | 0.007 291(0.497 1) | -1.251 312(0.894 6) | -1.494 165(0.932 4) | |
signal 3 | -1.246 605(0.893 7) | -2.435 229(0.992 5) | -2.052 488(0.979 9) | |
signal 4 | -0.134 229(0.553 4) | -0.757 781(0.775 7) | -1.113 731(0.867 3) |
后验分析作为检验风险预测模型准确程度的重要步骤,直接关系到最终结论的可靠性。本文将Acerbi等关于ES的后验分析方法进行二维变量下的延伸,提出了2个新的对于MES后验分析的统计量。这2个新的统计量基于MES的定义式得到,同样也是无分布假定的、非参的,且比较直观,从概念上也易于理解。本文将其与Banulescu等采用的统计量进行比较,发现在原假设分布和备择假设分布相差相对较小的情况下,2个统计量的统计功效均大于Banulescu等采用的统计量。由于这种情形一般情况下与实际更相符,因此可以认为在实际中,统计量Z1的结果可能相对会更可靠。实证分析的结果也表明,对于同样的预测结果,文中新提出的统计量对原假设的接受相对更为谨慎。
本文的主要贡献在于:一方面提出了2个新的对于MES后验分析的统计量,丰富了对系统性风险度量进行后验分析的方法;另一方面也丰富了对系统性风险度量后验分析的功效问题的讨论,对于其他的后验分析方法,也可以类似的方式进行统计功效的对比讨论,衡量其在原假设不成立下的取伪概率,探讨在不同情况下各统计量的优劣。本文将该后验方法用于电磁频谱数据分析中,为单个频点的电磁信号对整体异常的贡献程度的衡量提供了思路,对于大数据模型算法的后验分析具有一定的理论借鉴意义。
参考文献
ACHARYA V V,PEDERSEN L H,PHILIPPON T,et al. Measuring systemic risk[J]. CEPR Discussion Papers, 2017,29(1002):85-119. [百度学术]
赵淑清,郑薇. 随机信号分析[M]. 哈尔滨:哈尔滨工业大学出版社, 1999. [百度学术]
ZHAO Shuqing,ZHENG Wei. Stochastic signal analysis[M]. Harbin,China:Harbin Institute of Technology Press, 1999. [百度学术]
王永德,王军. 随机信号分析基础[M]. 北京:电子工业出版社, 2013. [百度学术]
WANG Yongde,WANG Jun. Fundamentals of stochastic signal analysis[M]. Beijing:China Publishing House, 2013. [百度学术]
张海勇. 基于局域波法的非平稳随机信号分析中若干问题的研究[D]. 大连理工大学, 2001. [百度学术]
ZHANG Haiyong. Research on some problems in non-stationary random signal analysis based on local wave method[D]. Dalian,China:Dalian University of Technology, 2001. [百度学术]
张海勇,李勘. 非平稳随机信号的参数模型分析方法[J]. 系统工程与电子技术, 2003,25(3):386-390. [百度学术]
ZHANG Haiyong,LI Kan. Parametric model analysis method of non-stationary random signal[J]. Systems Engineering and Electronics, 2003,25(3):386-390. [百度学术]
杨娟,卞保民,闫振纲,等. 典型随机信号特征参数统计分布的分形特性[J]. 物理学报, 2011,60(10):86-92. [百度学术]
YANG Juan,BIAN Baomin,YAN Zhengang,et al. Fractal characteristics of statistical distribution of typical random signal characteristic parameters[J]. Acta Physica Sinica, 2011,60(10):86-92. [百度学术]
SONG L,CHEN Y,TRAPPE W,et al. ALDO:an anomaly detection framework for dynamic spectrum access networks[C]// IEEE INFOCOM 2009. Rio de Janeiro,Brazil:IEEE, 2009:675-683. [百度学术]
YIN S,LI S,YIN J. Temporal-spectral data mining in anomaly detection for spectrum monitoring[C]// The 5th International Conference on Wireless Communications, Networking and Mobile Computing. Beijing:IEEE, 2009:1-5. [百度学术]
LIU S,GREENSTEIN L J,TRAPPE W,et al. Detecting anomalous spectrum usage in dynamic spectrum access networks[J]. Ad Hoc Networks, 2012,10(5):831-844. [百度学术]
ZHANG L,DING G,WU Q,et al. Spectrum sensing under spectrum misuse behaviors:a multi-hypothesis test perspective[J]. IEEE Transactions on Information Forensics and Security, 2018,13(4):993-1007. [百度学术]
夏伟,王琳娜,沈小青,等. 基于单类支持向量机模型的频谱异常检测方法[J]. 微处理机, 2012,33(4):73-75. [百度学术]
XIA Wei,WANG Linna,SHEN Xiaoqing,et al. Spectral anomaly detection method based on single-class support vector machine model[J]. Microprocessor, 2012,33(4):73-75. [百度学术]
闫戈. 基于大数据的频谱分析算法的研究[D]. 北京:北京邮电大学, 2017. [百度学术]
YAN Ge. Research on spectrum analysis algorithm based on big data[D]. Beijing:Beijing University of Posts and Telecommunications, 2017. [百度学术]
LI Zhijing,XIAO Zhujun,WANG Bolun,et al. Scaling deep learning models for spectrum anomaly detection[C]// Proceedings of the Twentieth ACM International Symposium on Mobile Ad Hoc Networking and Computing. New York,NY,USA:ACM, 2019:291-300. [百度学术]
李忠,安建琴,宋奕瑶,等. 一种滑动阈值的自适应随机信号异常提取方法:CN108898117A[P]. 2018. [百度学术]
LI Zhong,AN Jianqin,SONG Yiyao,et al. Abnormal extraction method of adaptive random signal with sliding threshold:CN108898117A[P]. 2018. [百度学术]
张小飞,李恒帅,石志鑫,等. 一种电磁频谱异常告警分析算法及实现[J]. 中国无线电, 2020(6):34-36,41. [百度学术]
ZHANG Xiaofei,LI Hengshuai,SHI Zhixin,et al. An electromagnetic spectrum anomaly alarm analysis algorithm and its implementation[J]. China Radio, 2020(6):34-36,41. [百度学术]
ACERBI C,SZEKELY B. Backtesting expected shortfall[R]. New York,NY,USA:MSCI Inc., 2014:1-33. [百度学术]
DU Z,ESCANCIANO J C. Backtesting expected shortfall:accounting for tail risk[J]. Management Science, 2017,63(4):940-958. [百度学术]
BANULESCU D,HURLIN C,LEYMARIE J,et al. Backtesting marginal expected shortfall and related systemic risk measures[J]. Management Science, 2021,67(9):5730-5754. [百度学术]
DUMITRESCU E I,HURLIN C,PHAM V. Backtesting value-at-risk:from dynamic quantile to dynamic binary tests[J]. Finance, 2012,33(1):79-112. [百度学术]
HURLIN C,TOKPAVI S. Une evaluation des procédures de backtesting:tout va pour le mieux dans le meilleur des mondes[J]. Finance, 2008,29(1):53-80. [百度学术]