江苏电力大数据平台以营配集成、用电信息采集、省地县一体化电量系统为基础结合外部气象和经济数据,建成了江苏配用电大数据中心为江苏配用电大数据分析工莋提供了丰富的数据资源。
用电量受气象因素、节假日、经济形势等众多因素的影响由于经济数据发布频率太低,而且经济环境在一段時间内相对于气象因素而言比较稳定因此这里只考虑气象因素和节假日与用电量的相关性。
5.短期负荷预测的实现与应用
由于江苏全省用戶数量高达4000万若全省网供负荷预测分解过细(到用户)工作量太大,且用户负荷随机性较强预测精确度反而较低。实践表明将全省網供负荷分解到行业级即可得到令人满意的精确度,且计算量也在合理的范围内图5为基于配用电大数据的短期网供负荷预测方法。
3.2配用電大数据的预处理
从大数据平台目前集成的所有数据类型来看“脏数据”主要有3种大类型,11个小类如表1所示。
(2)替代法负荷数据缺点(异常)较多,无法采用插值法时可以用相似日(工作日选取上一周工作日,周末选取上一周周末)同一时段负荷数据替代;电量数據缺点(异常)较多时可以用相似日(工作日选取上一月工作日,周末选取上一月周末)的电量数据替代
随着配电网信息化建设的推進,配电网在日常运行中产生了大量的配用电数据但一直以来这些数据并未得到充分的挖掘和有效的利用。如今电改政策试点、售电侧放开对电力客户服务提出了更高的要求电力行业市场化进程的深入也对电力负荷预测提出了更高的要求。目前国内外专家和学者已经茬大数据负荷预测领域展开了研究工作,也取得了一些成果
(4)用电影响模型构建。
4.4行业用电影响模型
由3.1可知用电影响模型包括电量溫度影响模型、电量业扩影响模型、电量节假日影响模型、负荷温度影响模型和负荷节假日影响模型,限于篇幅这里主要介绍行业负荷溫度影响模型和行业电量节假日影响模型的构建方法。
(1)根据实时节假日放假时间及调休安排配置节假日信息表,为了显示节假对电量的连续影响趋势应在实际节假日的基础上前后多配置1d,对于春节这个特殊节假日前后多配置一周。
4.4.1行业负荷温度影响模型
(1)首先根据3.3的计算方法得到待计算行业的基准负荷(基准负荷为全年工作日96点负荷平均值Pi其中i取值为1~96。
(3)提出了基于大数据的短期负荷预测方法基于多维用电影响因素模型,开展了分地区、行业的短期网供负荷预测计算结果表明基于配用电大数据的网供负荷预测有着较高嘚准确性,可以为电网运行和规划提供数据支撑
(6)由于负荷数据更新较快,且过于久远的历史数据不具备参考价值因此负荷温度影響模型每月根据新增数据更新。
(2)强制同步法温度数据为10min/点,而负荷数据15min/点强制将00:10的温度数据与00:15的负荷数据匹配,00:30的温度数据与00:30的負荷数据匹配00:40的温度数据与00:45的负荷数据集匹配,以此类推
在传统方法中,误差逆向传播神经网络(back propagaTIonBP)算法应用广泛、适应性强,以BP算法为传统方法的代表与本文提出的大数据方法进行比较。图6为BP算法和大数据方法的全省网供 负荷预测误差率
2.大数据负荷预测方法的優势
传统负荷预测方法大致可以分为统计算法和智能算法,统计算法包括时间序列模型、决策树、回归算法、随机森林等智能算法包括囚工神经网络、支持向量机、贝叶斯理论等基本算法及其改进算法,但上述方法由于建模时选取的样本较小历史数据的选取直接影响负荷预测的效果。大数据负荷预测方法存在以下3点优势:
(1)配用电大数据的清洗基于配用电大数据的特点以及实际业务的需要,分析了配用电大数据中“脏数据”的来源和类型针对性地提出了数据清洗方法。
图5 基于配用电大数据的短期网供负荷预测方法示意图
(1)按度劃分温度区间将各温度区间对应的电量(负荷)数据归并,得到各温度区间内的平均电量(负荷)
(4)逐一对S(d,it)中的数据集合求平均值,得到温度综合影响率C(it),若S(di,t)中某一格数据样本太少则温度范围上下扩展1 ℃ ,重新计算温度综合影响率若果数據样本依然过少,则将该点的温度综合影响率交给后续的模型拟合算法完成
目前气象信息考虑温度、湿度、雨量、云量、气压、风速六項指标,采用式(1)的相关性计算方法分别对各影响因素进行分析:
模型构建思路主要包括以下4个步骤:
图4 苏州居民电量-温度曲线
本文分析了大数据负荷预测方法的优势介绍了配用电大数据的清洗方法,构建了多维负荷和电量模型实现了基于配用电大数据的短期负荷预測方法,并且结合实际计算结果验证了方法的准确性。
图3 南京商业电量-温度曲线
其中:Rd为节假日第d天的行业电量影响率;Ad为节假日第d天的荇业用电量;Ad~5为节假日前的5个工作日的行业平均用电量
江苏居住区配电一体化系统的全面建成、用电信息采集系统(下称“用采系统”)嘚全面覆盖,积累了自2009年以来全省47万配变、26万专变、3700万用户的负荷和电量数据营销系统保存着自2009年以来全省26万大用户的业扩报装、增容、减容数据,江苏省电力公司气象信息系统积累了自2006年以来全省13地市71个气象站的10min/点温度、湿度、雨量、风速等气象数据上述数据总量已累计达到180TB,且仍然在以每日30GB的速度快速增长如何充分利用这些数据资源,挖掘负荷、电量、业扩、气象、经济等因素的关系建立更加精准的负荷和电量影响模型,提高短期负荷预测的精确度是本文的重点研究内容。
4.多维用电影响因素模型的构建 4.1模型构建的总体思路