王 奎,刘 昊
(国网天津静海供电有限公司,天津 301600)
0 引 言
在电力的生产、输送和分配过程中,能量损失是不可避免的,主要包括技术性损失和非技术性损失。技术性损失主要是子站、变压器和线路等硬件设施造成的电力损失,非技术性损失则是在配电网络中因用户非法用电而造成的电力损失[1]。在电力系统中,由于存在大量不合理的用电行为,对电力系统造成了严重影响[2]。从电网的角度来看,窃电等手段导致的线损不断增加,对电网的安全运行构成了威胁,对电力行业的健康发展造成了很大的冲击。目前,针对电网异常用电行为的监控主要依赖常规巡视、人工检查设备配置以及旁路传输等手段,这些手段不仅消耗大量的人力、物力,而且容易产生大量的虚警,因此需要新的识别手段来取代。针对这些问题,通过映射用户历史用电行为,将其视为异常用电数据样本,从海量数据中挖掘异常信息并识别。
随着我国智能电网的不断发展,智能电表的使用日益增多,电力企业可获得大量配电网络终端数据,采集频率较高,数据类型丰富,为数据挖掘技术的发展提供数据依据。利用数据挖掘技术对电力消费数据进行高效分析,及时发现电力消费中的异常现象。与传统的现场检测方式相比,数据挖掘技术不仅能降低费用,还能减少用电异常造成的经济损失,从而有效保障电力工业的安全生产。支持向量机是一种强大的分类算法,具有较强的适应能力,适用于小样本数据处理。在电力用户用电行为异常检测中,能够利用有限的数据进行学习,并取得较好的分类效果。电力用户用电行为数据可能包括电量消耗、电力峰值、用电模式等多个维度的信息。支持向量机能够有效地处理这些高维数据,提取出相关特征,通过构建一个分类模型,学习并识别不同类型的异常用电行为,从而有效地区分正常用电行为和异常用电行为,提高异常检测的准确性。文章结合支持向量机,设计研究电力用户异常用电行为智能检测方法。
1 电力用户用电行为数据预处理
在电力企业运行过程中,存在缺失值、异常值和噪声数据等问题,不仅会影响后续的数据分析和异常检测,还会对异常检测算法产生干扰,影响异常检测的准确性。因此,为有效识别和提取用户用电行为中的异常行为,需要对获取的海量用户用电行为数据进行预处理。预处理包括缺失值处理和数据归一化[3]。
利用拉格朗日插值方法来处理数据缺失问题,补充缺失值。针对每一个已知非缺失值数据点(xi,yi),计算拉格朗日基函数L(x),即
式中:i表示已知数据点的索引;x表示自变量的取值,即要进行插值的位置。
对于每个缺失数据点xj(j=m,n,…,k),将其代入插值函数L(x)来计算对应的估计值yj,实现缺失数据的补充。由于各个电力用户的用电行为数据特征比例不同,为了使后续的检测精度满足电力企业提出的检测精度要求,需要对数据进行标准化处理。数据归一化处理表达式为
式中:x'表示经过归一化处理后得到的电力用户用电行为数据;表示未经过处理的电力用户用电行为数据;xmin表示原始电力数据中的最小值;xmax表示原始电力数据中的最大值。根据上述操作,完成对电力用户用电行为数据的预处理。
2 基于支持向量机的异常用电数据检测
针对完成预处理的电力用户用电行为数据,结合支持向量机检测其中的异常用电数据。针对电力异常监测中的小子样、非线性等问题,提出一种基于小子样的电力异常监测算法。该算法的实质是借助核函数将原始数据映射到高维空间,通过这种映射将原本低维空间中无法线性分割的数据在高维空间中线性分割,并在此基础上寻找满足线性可分的最佳超平面,将非线性问题转化成线性可分问题,从而解决电力异常监测中的非线性问题[4]。
由于传统的支持向量机更适用于二分类问题,针对电力用户异常用电行为的多分类问题,应当对其进行优化和扩展。引入二叉树法,将所有需要检测的样本类型划分为2 个子类别,然后对子类别再次划分,以此类推,直到只剩1 个类别为止,得到多个子类别。在每一个非叶节点上对支持向量机分类器进行训练。利用支持向量机模型对电力用户用电行为数据进行分类,将分类结果作为二叉树的叶子节点。根据分类结果的可信度等因素,将叶子节点进行划分,形成新的内部节点。重复此过程,直到满足停止条件,得到完整的二叉树。在构建好的二叉树上,对需要检测的电力用户用电行为样本数据进行遍历。根据每个节点的分类结果和可信度,判断该样本数据是否属于异常用电行为。
为提高检测方法的全局优化能力,解决收敛速度慢和局部优化问题,引入边界收缩因子,并对其进行位置修正[5]。在此基础上,引入边界压缩因子,使解空间的搜索更加完整,并加快算法的收敛。通过动态调整位置,能够有效避免陷入局部极值的问题。通过位置更新的动态权重系数,以此有效防止支持向量机算法陷入局部最优的问题。
3 异常用电行为检测与智能预警
在完成对基于支持向量机的异常用电数据检测的设计后,针对电力用户的用电行为进行检测,并实现智能预警。考虑到电力用户用电数据量较大,在具体检测过程中可利用改进后的蚁狮优化算法(Ant Lion Optimizer,ALO)优化支持向量机参数,以此缩短训练时间,提高检测精度。
第一步,对ALO 算法和支持向量机算法进行初始化处理;第二步,通过改进后的ALO 算法,对支持向量机的参数进行优化;第三步,计算适应性,并采集优等参数;第四步,找出最佳参数,然后计算其适应性和定位;第五步,判断是否符合检测结束条件,若满足则退出,若不满足则重复第三步;第六步,完成对支持向量机参数的优化,并得到最优参数,利用该参数构建模型;第七步,将检测数据集输入模型进行分类,并输出分类结果。
区分正常用户用电行为和异常用电行为后,通过子类别的划分可以进一步将异常用电行为划分为具体类型,如欠流、移相、扩差等。结合得到的分类结果,对异常用电行为进行预警。在预警时,追溯该异常用电数据的产生来源、产生时间和持续时间,将得到的信息一起在预警显示界面中展示,方便管理人员快速确定异常用电行为的各项信息,从而根据得到的检测结果修正或屏蔽异常用电行为,确保用户的用电安全。
4 对比实验
为验证基于支持向量机的智能检测方法在实际应用中的效果,将该方法作为实验组,将基于Grassberger 熵随机森林的检测方法和基于长短期记忆(Long Short Term Memory,LSTM)的检测方法作为对照组A 和对照组B,利用3 组检测方法检测同一电力企业中的电力用户异常用电行为。
获取某电力企业近3 年的电力数据,其中包含3 000 名用户的用电信息数据。将用电信息数据中的1 000 个用户设置为窃电用户,对数据进行替换,即将普通用户的数据信息转换为窃电用户。在实验过程中,模拟4 种异常用电行为,包括欠流法A、欠流法B、移相法C 以及扩差法D,每种情况下异常用电的用户数均为250 个。利用3 组检测方法对获取的3 000 名用户的用电行为进行智能检测,通过对比每种方法检测到的异常用电行为用户数量,检验检测精度。当检测的异常电力用户个数与实际情况相符时,表明该方法具有较高的准确度。实验结果如表1 所示。
表1 检测结果对比
由表1 可知,实验组检测到的异常用户数与实验设置的异常用户数更接近,而对照A 组和对照B组均存在检测到的异常用户数与实际值差距较大的情况。因此,文章提出的基于支持向量机的智能检测方法具有更高的检测精度,可以实现对电力用户异常用电行为的高精度检测,对于促进电力企业用电安全具有重要意义。
5 结 论
文章主要结合支持向量机理论,提出一种全新的针对电力用户异常用电行为的智能检测方法。通过对比实验,证明了该检测方法在实际应用中的优势。该方法能够避免传统人工采集数据的烦琐过程,为电力企业的智能化转型提供有力的技术支持。在后续的研究中,将结合更多智能化的技术和手段,如机器学习算法,实现对用户异常用电行为的自主实时检测等,促进电力系统的稳定运行。