基于统计理论的电力系统暂态稳定评估
发布时间:2006-10-14 7:51:08   收集提供:gaoqian
  许涛,贺仁睦,王鹏,徐东杰

  (华北电力大学电力系统控制研究所, 北京 102206)

  摘 要:该文利用基于结构风险最小化原理的支持向量机,结合装袋和近似推理,提出了电力系统暂态稳定评估模型的构造方法。该方法充分发挥支持向量机在解决有限样本、非线性及高维识别中体现出的优势,有效地提高了暂稳评估模型的泛化能力,并通过训练样本集重构解决了暂稳评估的多类识别问题,在该评估模型中利用样本规范化、装袋和近似推理提高了训练速度和预测结果的精度及稳定性。在IEEE39节点测试系统中的应用结果证明了该方法对暂态稳定评估的有效性。

  关键词:暂态稳定评估;装袋;支持向量机;数据集重构

  1 引言

  近年来,人工智能技术在电力系统暂态稳定评估方面的应用取得了较大的进展,其中,利用人工神经网络找出系统状态参数和稳定指标间的映射关系表现得最为活跃[1~5],但这些方法在实际应用中依然存在一定的难题,其主要表现为:

  (1)无法保证暂态稳定评估的泛化误差

  电力系统的高维特性决定了有限数据在输入空间中仅表现为一个稀疏分布,无法覆盖整个输入空间。而神经网络算法(以BP算法为例)训练目标则过分强调在训练样本上的学习误差[6],训练出的模型无法保证在整个输入输出空间上的逼近误差(泛化误差),从而出现过渡匹配训练数据,即过拟合现象。

  (2)模型参数选择困难、训练结果不够稳定

  神经网络在学习阶段普遍存在局部极值和学习速度较慢等问题,其训练模型的优劣与隐单元数目、权值的初始值有关,当在指定训练时间内无法得出理想的结果时,仍然无法判断究竟是问题本身无解还是模型参数不够好或是训练时间不够所致。这些问题限制了其在暂态稳定预测中的应用。

  针对以上问题,本文利用由统计学习理论发展而来的支持向量机算法[6],提出了一种新的暂态稳定评估模型。该模型可充分发挥支持向量机在解决有限样本、非线性及高维识别中表现出的优势,找到划分系统是否暂态稳定的超平面及其附近的临界样本,以控制住预测模型的泛化误差。同时,该模型利用装袋及近似推理相结合的策略,对未知样本进行精确推理,提高了预测稳定性和精度,在IEEE39节点测试系统中的应用结果证明了该方法对电力系统暂稳监测的有效性。

  2 支持向量机算法简介

  由统计学习理论发展而来的支持向量机(Support Vector Machine, SVM)算法能够有效地解决高维、非线性及有限样本下的模式识别问题。它通过非线性变换,将输入向量映射到一个高维空间H,在H中构造最优分类超平面,从而达到最好的泛化能力[6]。

  设给定一样本数据集E=(x1, y1),…,(xp, yp),其中xi∈Rn为输入向量,描述系统的状态,yi为系统输出向量,表征系统运行模式,p为样本数量,n为输入向量维数。

  根据支持向量机算法,输入向量xi(i=1,…,p)可通过满足Mercer条件的非线性变换K(x,xi)映射到一个高维特征空间(Hilbert空间),见图1,而后在该特征空间里构造最优分类超平面f(x)为





  根据Karush-Kuhn-Tucker(KKT)[6]条件, ai10的样本为影响分类结果的“关键”样本,被称为支持向量。

  3 暂态稳定评估模型的构造

  3.1 一般模式识别问题的支持向量机模型

  采用支持向量机进行模式识别的基本模型如图2所示。具体的识别过程包括2个环节:① 根据给定的已知训练样本求取对系统输入输出依赖的支持向量机结构;② 利用支持向量机对未知输出的样本作出尽可能准确的识别。



  3.2暂态稳定评估模型

  电力系统是典型的高维、非线性动态系统,其暂态稳定评估可看作有限样本下的模式识别问题。为此,本文以支持向量机理论为基础构造了暂态稳定评估模型,见图3。该模型主要由暂态稳定评估输入与输出模块、输入规范化模块、训练样本输出重构模块、暂稳评估子平面构造模块及暂稳近似推理机模块组成,各模块功能介绍如下:

  (1)暂态稳定评估的输入与输出

  本文在综合现有文献[3]~[5]的基础上,经过大量仿真计算,构造了暂态稳定评估原始样本集ES=(x1,y1),…,(xo,yo) ,如图3所示。其中xi∈R18为描述电力系统特征的18维特征向量,见表1,yi∈R为表示系统暂态稳定程度的一维向量。o表示样本数量。





  根据各样本极限切除时间Tcct(单位为周波)的不同,描述暂态稳定程度的一维向量yi的取值范围为{1,2,3,4},其中,1表示系统不稳定;2表示系统临界稳定;3表示系统稳定;4表示系统非常稳定,见图4所示。稳定程度的连续值定量分析将在后续文章详述,此处不再介绍。



  此时暂态稳定评估问题变为4类模式识别问题。由于传统的支持向量机只能够解决2类识别问题,为此,本文在图3的模型构造中使用了支持向量机MSVMi(i∈{1,2,3,4})来处理暂稳多类识别问题。

  (2)输入规范化及训练样本输出重构 为避免所选变量单位不同对数据分析造成困难,本文提出采用零-均值规范化对原始样本集中的向量xi进行转换,形成原始规范数据集为



  (3)暂稳评估子平面的构造

  根据支持向量机理论,本文利用高斯径向基函数K(x,xi)在特征空间里构造对应于MSVMi (i∈{1,2,3,4})的暂态稳定预测超平面fi为



  由于暂稳评估超平面可使不同类别的暂稳样本分类间隙最大,提高了在有限样本学习下的泛化能力,而且在建模寻优过程中只涉及训练样本之间的内积运算,大量的计算将在数据空间而不是在高维特征空间完成,这一特点可以很好地解决电力系统中的“维数灾难”问题,提高了该模型的实用性。

  (4)暂稳评估近似推理机

  构造暂稳近似推理机的目的在于应对多类模式识别结果不宜处理的问题,同时也能提高暂稳评估的精度。具体步骤如下:

  1)将未知稳定程度的样本U输入fi(i∈{1,2,3,4}),令q表示输出为+1的评估函数个数。

  2)当q=1时,表明只有一个评估函数输出为+1,那么U就属于该评估函数所对应的稳定级别。

  3)当q>1时,利用C-均值算法计算输出为+1的各评估函数所对应的训练样本集(仅考虑重构后输出为1的样本子集)中心点,而后计算样本U与这些中心点之间的距离,得到与其最接近的中心点所对应的评估函数,那么U的稳定程度与该评估函数所代表的稳定程度相同。为了更好地体现电力系统特征样本之间的距离,使其不受指标测量单位的影响,并考虑指标之间的相关性,本文使用马氏距离来计算样本U与中心点之间的距离。

  4)当q=0时,表示所有评估函数的输出都为-1,无法判定U的稳定程度,此时,将它推理为拒判样本。

  4 暂态稳定评估模型的进一步改进

  由于电力系统的暂态稳定性受如系统结构、故障类型、控制措施及其它诸多未知因素的影响,直接利用支持向量机构造的评估模型对上述因素的变化较为敏感,致使计算结果不够稳定。为此本文针对电力系统暂态稳定评估的实际特点,使用装袋策略对原有的暂稳评估模型进行改进。由于装袋(bagging)方法可通过减少差异而提高模型计算的稳定性[8,9],通过它可进一步提高未知暂稳程度样本的预测稳定性及精度。

   本文构造相应的装袋模型MBaggingi(i∈{1,2,3,4})来代替单一的暂稳评估子平面f i(i∈{1,2,3,4}),以进一步提高预测精度和稳定性,以MSVM1的替代过程为例,图5所示,其构造过程如下:



  利用引导方法[10]在MSVM1的训练集中挑选出暂稳训练子集Sj(j=1,…,T),而后应用SVM算法生成暂稳预测模型Vj(j=1,…,T),将T个暂稳预测模型组合起来就形成了装袋模型MBagging1,其中,T为奇数。

  将未知稳定程度的样本U输入到MBagging1,即可利用每个支持向量模型Vj(j=1,…,)返回的预测值来判断U的稳定状态。



  式(7)中,左边表示所有输出为1的SVM预测模型的个数,右边为输出为-1的SVM模型个数。若满足式(7),MBagging1的输出结果为1,表示U属于该MBagging1所代表的稳定级别,反之其输出为-1,说明U不属于该稳定级别。装袋过程见图5。按照同样步骤,本文可得到由4个装袋模型组成的最终暂态稳定组合评估模型。

  5 算例分析及讨论

  5.1 暂态稳定评估数据采集

  本文利用Matlab编制了暂稳预测模型生成程序,采用的算例为IEEE 39节点测试系统如图6所示。以中国电力科学研究院开发的中国版BPA程序为核心,编制了暂稳空间仿真样本生成程序。其中,发电机模型采用经典模型,使用直流式励磁系统,故障类型为线路短路、母线短路等[11],随机抽取故障类型及位置(也可选择不同线路的不同故障地点),在70%~130%基准负荷下,随机抽取负荷状态,每种状态自动配置相应的发电机出力,同时随机抽取不同的励磁状态,共得到2000个样本,所提取特征量见第3节,随机抽取1400个样本进行训练,其余600个样本用于测试。

  5.2 暂态稳定评估结果

  按照第3、4章所介绍的方法,本文构造了暂态稳定评估组合预测模型,其中,各装袋模型由3个SVM模型构成(T=3),每个子模型的训练集大小为1200。各装袋模型训练时间约为3.6s(Pentium4 2.40GHz,512MB内存),输入测试样本对其中的装袋模型MBagging1进行测试,可得到如表2所示的结果,(由于篇幅有限,仅列出8个样本,预测单个样本的时间约为0.11s):



  由表2可以看出,样本3通过装袋模型MBagging1的表决,正确地判断了其稳定程度,不仅提高了暂稳预测精度,并且使分类结果更加稳定;但样本8出现了误判,这就需要通过进一步的近似推理来得到最终的结果,同时还可采用其它语言编程,以进一步提高计算速度。

  对最终的组合暂态稳定评估模型进行测试,可得到如表3所示的结果。



  5.3 与神经网络算法比较

  本文利用文献[2]中的GRNN方法在5.1节的数据集上进行了训练,经过反复优化参数和选择最优模型,统计出训练样本及测试样本的正确率,将其与本文暂稳评估组合算法的训练结果相比较,得到如表4所示的结果。通过比较可以看出:在样本信息有限(不可能在实际中得到无穷样本)的情况下,GRNN算法虽然在训练样本中达到非常高的精度(比本文提供的算法还要高),但其对未知样本的预测能力较差,出现了过拟合现象,而本文利用有限的样本信息在模型的复杂性和学习能力之间寻求最佳的结合点,得到了最好的推广能力,并进一步利用装袋和近似推理,提高了预测的稳定性和精度,仿真结果也验证了该方法的有效性。



  5.4 拒判与错判样本讨论

  查看表5所示的部分测试样本的暂态稳定评估过程,可以看出,表5中的测试样本3通过近似推理,正确判断了其稳定级别,在一定程度上提高了预测的准确率。但该表中仍存在一定比例的拒判(如样本5)及错判(如样本9)。如果出现实际失稳的样本被预测为安全,将会严重误导调度人员的操作,追究其原因,本文认为这2个样本应为典型的、新的重要范例,原有的支持向量无法对其进行正确判断,因此,本文认为平时要注重收集尽量多的仿真及实测样本,打好数据基础,一旦在实际运行中发现这类样本,应采取措施对其进行强化增量学习,这也是本文下一步的研究重点。



  6 结论

  本文通过构造支持向量机,找到了划分系统是否暂态稳定的最优分界超平面和临界样本,利用装袋和近似推理,快速精确地判断了电力系统当前状态的稳定程度。该方法结果信息丰富,不仅提供了最优分界超平面,还提供了距离稳定边界最近的范例样本(支持向量)及各样本与稳定边界之间的距离,该方法不受“维数灾难”的限制,可应用于实际的复杂电力系统。在IEEE39节点测试系统中的应用结果证明了该方法对电力系统暂态稳定监测的有效性,为解决电力系统的暂态稳定评估问题提供了一条新的思路。但该方法还有待完善,例如:如何保证SVM在大规模数据集下的在线训练速度、怎样对拒判及实测样本进行增量学习及对后续摇摆稳定程度的判定等,都是需进一步研究的问题。

  致 谢

  中国电力科学研究院系统所卜广全高工提供的暂态稳定仿真程序为本文暂稳空间仿真样本生成程序奠定了基础,在此表示衷心的感谢!

  参考文献

  [1] Aboytes F, Ramirez R. Transient stability assessment in longitudinal power system using artificial neural networks [J]. IEEE Trans. on Power Systems,1996,11(4):2003-2010.

  [2] Suresh Muknahallipatna,Badrul H.Chowdhury. Input dimension reduction in neural network training-case study in transient stability assessment of large systems[C]. Intelligent Systems Applications to Power System, ISTP’96,International Conference,28 Jan. -2 Feb ,1996:50-54.

  [3] Aggoune M, El-sharkawa M A, Park D C, et al. Preliminary results on using artificial neural networks for security assessment[J].IEEE Trans. on Power Systems,1991,6(2):890-896.

  [4] Tso S K,Gu X P, Zeng Q Y, et al. Input space decomposition and multilevel classification approach for ANN-based transien security assessment[C], Proceedings of the 4th International Conference on Advances in Power system Control, Operation and Management,Apscom-97,1997(2):499-504.

  [5] Louis A.Wehenkel. Automatic learning techniques in power system [M]. Boston: Kluwer Academic Publishers, 1998.

  [6] Vapnik V. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1995.

  [7] Gunn S R. Support vector machines for classification and regression [R]. Faculty of Engineering and Applied Science Department of Electronics and Computer Science, University of Southampton, 1998.

  [8] Breiman L. Bagging Predictors[R]. Department of Statistics, University of California, Berkeley, California 94720,1994.

  [9] Stankovic S, Milosavljevic M, Buturovic L, et al. Statistical learning: data mining and prediction with applications to medicine and genomics [C]. Neural Network Applications in Electrical Engineering, NEUREL'02. 2002 6th Seminar on:5-6.

  [10] Jiawei H, Micheline K. Data Mining.Concepts and techniques[M]. Simon Fraser University:Morgan Kaufmann Publishers, 2000.

  [11] 丁明, 黄凯, 李生虎(Ding Ming, Huang Kai, Li Sheng Hu).交直流混合系统的概率稳定性分析(Probabilistic stability assessment for hybrid AC/DC power systems) [J].中国电机工程学报(Proceedings of the CSEE),2002,22(8):11-16.


摘自《中国电机工程学报》
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50