基于容量增量曲线与GWO-GPR的锂离子电池SOH估计-【蓝狮平台】

基于容量增量曲线与GWO-GPR的锂离子电池SOH估计

作者：王琛, 闵永军

单位：南京林业大学汽车与交通工程学院

引用：王琛, 闵永军. 基于容量增量曲线与GWO-GPR的锂离子电池SOH估计[J]. 储能科学与技术, 2023, 12(11): 3508-3518.

DOI：10.19799/j.cnki.2095-4239.2023.0458

摘要 电池健康状态(state of health， SOH）的准确估计是电池管理系统的关键技术之一，对保障电动汽车安全、可靠运行至关重要。针对当前高斯过程回归(gaussian process regression，GPR)中单一核函数泛化性能不足，超参数选取易陷入局部最优导致SOH估计精度较低的问题，提出一种灰狼优化算法(grey wolf optimization，GWO)和组合核函数改进GPR的SOH估计方法。首先，基于容量增量分析法提取用于表征电池老化的特征，对电池恒流充电的容量-电压曲线插值并以差分法计算容量增量(increment capacity，IC)曲线，应用Savitzky-Golay滤波平滑处理，提取峰值高度、峰值电压及峰面积作为健康特征；其次，引入多维尺度变换(multidimensional scaling， MDS)消除特征冗余性同时降低模型计算复杂度，利用Pearson系数验证所提健康特征与SOH的相关性；然后，结合SOH退化轨迹的非线性和电池容量再生的准周期性特点，将神经网络核函数与周期核函数组合作为GPR的协方差核函数，以GWO对组合核函数超参数的初值进行优化；最后，基于NASA电池数据集将所提方法与SVR、ELM、GPR模型作对比，检验GWO-GPR模型的准确性，估计结果的最大均方根误差(root mean square error，RMSE)和平均绝对误差(mean absolute error，MAE)分别为1.03%和0.5%，以第60、80、100个循环为估计起始点，验证模型的鲁棒性，结果显示最大RMSE控制在1.03%以内。

关键词 锂离子电池；健康状态；容量增量曲线；高斯过程回归；灰狼优化算法

面对环境污染和化石能源短缺的双重压力，电动汽车被认为是推进电气化交通、优化能源结构、改善空气质量的重要举措，在全世界得到推广应用。动力电池是电动汽车最核心的部件，锂离子电池作为一种清洁能源，以其能量密度高、循环寿命长、无记忆效应、续航能力强等诸多优点，成为了新一代电动汽车的首选动力源。然而在使用过程中，其内部会发生复杂的化学反应，导致SEI膜加厚、电极材料和电解质溶液损耗等，电池的安全性降低、续驶里程减少。因此实现电池健康状态(state of health，SOH)准确估计是锂离子电池安全应用的基础。

电池的退化是内部反应和外部环境影响的综合过程，除了电池内部耦合、时变的电化学反应外，外部负载、温度和放电深度等因素也会影响电池老化，最终导致不同的衰退轨迹，这给SOH监测和评估带来了挑战。锂离子电池SOH估计方法主要分为模型法和数据驱动法2类。模型法又分为电化学模型和等效电路模型2种。电化学模型通过建立偏微分方程来描述电池动态特性，过高的模型计算复杂度使其更多应用于电池衰退机理方面的研究；等效电路模型根据电池的外部电气特性，利用基本电子元件和受控电压源建立电路模型，常与自适应滤波算法如卡尔曼滤波(extended Kalman filter，EKF)、粒子滤波(particle filter，PF)等结合，通过更新模型参数实现SOH估计。然而电池是一个复杂的系统，其荷电状态、充放电倍率、温度等都会影响电池参数的变化，因此等效电路模型参数辨识难度较大，难以全面准确地描述电池动态特性。

数据驱动法从外部可测量的参数中提取与电池衰退具有强关联性的健康特征，通过机器学习等智能算法，建立健康特征与电池SOH的映射模型，具有较高的灵活性和可拓展性。Wu等从充电曲线中提取SOH特征参数，将重要性采样策略应用到前馈神经网络(feed forward neural network，FFNN)以减少神经元数量，一定程度上减轻了模型调参难度；Yayan等以电池恒流充电电压、电流作为SOH特征参数，基于双向长短期神经网络(bi-directional long short-term memory，Bi-LSTM)构建模型，但其前期训练需要大量数据，且模型抗干扰能力也不强；Wang等从差分热伏安(differential thermal voltammetry，DTV)曲线中提取特征建立电池退化模型，然而DTV曲线形状易受环境温度影响，难以从中提取到高质量健康特征；Nuhic等提取电池循环次数、使用时间、温度等参数，建立支持向量回归(support vector regression，SVR)模型实现SOH估计，且在实际驾驶循环下进行了验证；此外，极限学习机(extreme learning machine，ELM)、随机森林(random forest，RF)也广泛应用于SOH估计，然而上述方法无法量化结果的不确定性。高斯过程回归(gaussian process regression，GPR)是一种基于统计学原理和贝叶斯理论的方法，在处理小样本回归问题时有突出优势，同时可以输出置信区间表示结果的不确定性，是一种应用十分广泛的机器学习方法。Richardson等以GPR模型实现了电池SOH预测，但单一核函数存在拟合、泛化能力较弱，易陷入局部最优等缺点，使得模型对容量再生现象难以精确捕捉。

针对上述问题，本工作提出一种基于容量增量(increment capacity，IC)曲线与灰狼优化算法(grey wolf optimization，GWO)改进GPR的SOH估计方法，该方法应用容量增量分析法(incremental capacity analysis，ICA)从电池IC曲线上提取健康特征，采用多维尺度变换(multidimensional scaling，MDS)非线性降维方法消除特征的冗余性同时降低模型计算复杂度；结合SOH退化轨迹的非线性和电池容量再生的准周期性特点，提出以组合核函数改进GPR，针对共轭梯度法依赖初值、容易陷入局部最优的缺点，采用GWO算法对核函数超参数初值进行优化，实现了锂电池SOH的准确估计。

1 电池数据介绍

1.1　电池数据

本工作使用的是美国国家航天局(NASA)锂离子电池公开数据集，选取编号为B0005、B0006、B0007的电池作为研究对象。在室温下以1.5 A进行恒流充电，电压升高到4.2 V后在恒压模式下继续充电，直至充电电流降至20 mA。放电以2 A恒流进行，直到电池电压分别降至2.7 V、2.5 V和2.2 V。实验记录了3块电池在每个充放电循环中的温度、电流、电压、容量等信息，其容量随循环次数的变化曲线如图1所示。

图1 NASA数据集电池容量退化曲线

随着循环次数的增加，电池容量曲线并非呈单调递减趋势，容量再生的现象导致曲线出现局部波动，且在后期循环中出现了准周期性的特点，这种非线性关系对电池SOH准确估计提出了更高的技术要求。

1.2　电池健康状态定义

电池SOH是指将电池当前时间点的状态和初始状态相比来评估当前特定性能的健康水平，随着电池循环次数增加，可用容量逐渐降低，因此本工作采用可用容量与电池额定容量之比来定义电池SOH。

式中，图片为电池第图片个循环的电池SOH，图片为第图片个循环的电池可用容量，图片为额定容量。

2 算法介绍

2.1　Pearson系数

Pearson系数用于衡量2个变量图片和图片之间的线性关系，其计算公式如下：

其中，图片是数学期望，图片是方差，图片为图片和图片的协方差。协方差和标准偏差的商称为2个变量的相关系数图片。Pearson系数的值介于-1和1之间，绝对值越大代表2个变量之间的线性相关性越强，其正负表示二者呈正相关或负相关。

2.2　多维尺度变换

为消除特征冗余，减少机器学习模型的训练成本并一定程度上提高模型准确性和泛化性能，通常对多维特征进行降维。应用广泛的主成分分析法(principal component analysis，PCA)适用于线性变换，降维后数据间的非线性相关性有可能丢失，而电池充电过程的复杂性和不确定性会造成所提取的健康特征之间呈非线性关系，因此本工作采用MDS非线性降维方法。同时，该方法将高维数据的相对距离映射到低维空间时尽可能保持不变，这些距离度量可以更好地反映数据之间的相似性和差异性，从而提升MDS的降维效果。其降维过程具体描述如下。

假设图片个样本在高维空间的距离矩阵为图片，图片中第图片行图片列的元素图片代表样本图片和图片之间的距离；经MDS方法降至图片维的样本表示为图片，且图片，令降维后样本的内积矩阵为图片，且图片，则有：

将数据中心化处理，表示为

2.3　高斯过程回归

GPR有非参数化和概率性等优点，其通过定义似然函数来反映经验风险，然后利用贝叶斯理论得到后验概率的假设，无需建立输入图片与输出图片之间具体的函数关系。高斯过程(gaussian process，GP)被看作是遵循高斯分布的有限数量随机变量的集合，其性质主要由均值函数和协方差函数决定，它们统称为核函数，如式(9)所示：

出于对称的考虑，均值核函数图片通常设置为0，协方差核函数图片通常为平方指数协方差函数，如式(11)。在实际使用中，也可以根据应用场景选用不同的核函数。

实测数据中包含噪声，因此对于回归问题，观测数据图片与隐式函数图片的对应关系为

其中，图片是输入变量，图片为高斯噪声，服从均值为0、噪声方差为图片的高斯分布。因此观测值图片的先验分布表示为

式中，图片为n维对称正定协方差矩阵，用于描述各个观测点之间的相关性；图片为图片维单位矩阵。GPR的超参数对回归模型的效果有着重要影响，对超参数集图片的优化采用的是最大边缘似然法，表示为

对上式超参数求偏导，通过共轭梯度法使偏导数取最小值，即得到最优超参数。由于GP是一个随机的过程，当新的训练集图片的变量都与原训练集图片具有相同的高斯分布，那么在测试点图片处的观测值图片与预测值图片的联合先验分布可表示为：

根据图片的联合高斯先验分布，可推导出后验分布：

其中，

式中，均值图片为图片的估计值；图片为测试样本的协方差矩阵，反映估计值的可靠性。GPR给出的95%置信区间为

GPR模型所采用的单一协方差核函数拟合、泛化能力有限，仅适合对数据的某一方面进行描述；通过将不同类型的核函数组合，可以更好地适应复杂数据形式，增强模型非线性映射能力，提升整体准确性和鲁棒性。结合电池SOH退化的非线性和电池容量再生的准周期性特点，本工作选取神经网络核函数和周期核函数组合作为GPR的协方差核函数，表示如下：

针对共轭梯度法本身存在依赖初值、容易陷入局部最优等缺点，采用GWO算法对组合核函数的超参数初值进行优化，构建GWO-GPR模型，以解决传统GPR模型超参数寻优结果不理想、预测效果差的问题。

2.4　灰狼优化算法

GWO算法灵感来自灰狼的自然狩猎行为和狼在狼群中的领导能力，具有参数少、收敛速度快、拟合精度高等多方面优势。首先在搜索空间内随机生成种群，每次迭代依据适应度的高低将前3只狼记为图片，其余为图片；图片对猎物进行定位，领导图片不断逼近猎物，实现获取目标问题的最优解。本工作将GPR模型组合协方差核函数的超参数作为狼群个体位置的初始信息，随着狼群寻找猎物的位置而不断更新，从而获取最优超参数。GWO算法的具体步骤如下所述。

2.4.1　包围

狼群围捕猎物首先要对其进行包围，数学模型可表示为

其中，图片是猎物和狼群之间的距离，图片是迭代次数；图片和图片分别是狼群位置向量和猎物位置向量;图片和图片是协同向量，定义为

式中，图片、图片为区间[0,1]的随机向量；图片是取值为(0, 2)的收敛因子，并随着迭代次数的增加线性减小。

2.4.2　狩猎

猎物的位置被识别和包围后，狼群进行狩猎。每次迭代期间图片依靠图片(当前最优解)、图片(次优解)、图片(第三优解)的位置信息来更新自身位置，不断缩小与猎物的距离，狼群个体位置变化的数学表达式如下：

2.5　算法流程

本工作提取充电IC曲线的峰值高度、峰值电压和峰面积为特征参数，经MDS降维后划分为训练集和测试集，将训练集的数据输入GPR，选取神经网络核函数和周期核函数组合作为协方差核函数改进GPR，并使用GWO算法对组合核函数的超参数初值进行优化，建立GWO-GPR模型，将测试集数据输入训练后的模型实现SOH估计。整体算法流程如图2所示。

图2 GWO-GPR算法流程

3 实验验证与误差分析

3.1　健康特征的提取及降维

锂离子电池恒流充电期间，电压达到一定值后增长变得缓慢，这被称为电压平台期，如图3所示。此时电池正负极材料中锂离子的迁移速率和反应速率达到了动态平衡，电压平台期的变化是评估电池SOH的重要依据。

图3 不同循环下充电电压变化曲线

容量增量分析法能够将平缓的电压平台转化为IC曲线上易识别的波峰，容量增量是指单位电压所对应充入的容量dQ/dV，表达式如下：

式中，图片为第图片和图片时刻已充入的电池容量，图片为第图片和图片时刻的电池端电压。电池的老化程度不同，绘制出的IC曲线也会有明显差异，因此可从IC曲线上提取出电池老化特征，如波峰高度、位置和峰下面积等；同时该方法在统一的电压尺度下分析充电数据，解决了实际应用中直接对电压、电流数据进行分析时时间尺度难以统一、健康特征难以构建的问题。NASA数据中没有给出实时的容量变化信息，而在恒流充电状态下电流几乎不变，因此本工作使用电流和时间差来计算容量变化，如式(28)~(29)所示：

由式(29)可知，电压间隔对IC值有显著影响，原始数据电压采样间隔较大且存在不确定性，如波峰、波谷等对应的电压位置不在实验采样点则IC曲线上会忽略这些重要特征，导致提取的电池健康特征难以表征电池退化程度。为此，首先对充电电压数据进行线性插值，缩小采样间隔从而方便捕捉特征，再采用电压差分法计算获取IC曲线。此时图片较插值前更小甚至为负，易使图片结果出现异常值，在IC曲线上表现为产生大量噪声。为进一步获得易于识别的IC曲线，选用Savitzky-Golay滤波器进行降噪。这是一种基于时域局部多项式最小二乘拟合的滤波方法，其最大特点是可以保证信号的形状和宽度不变，保留低频数据信号的同时去除相关高频部分[23]。如图4所示，降噪后曲线变得平滑，波峰位置清晰可见，易于健康特征的提取。

图4 IC曲线滤波前后对比

图5为B0005电池在部分循环下的IC曲线，可以看出电压在3.8～4.1 V之间IC曲线变化明显，第一个波峰随循环次数增加逐渐消失，第二个波峰的峰值在逐渐减小的同时位置后移，这是由于电池内部的活性材料和锂离子损失使得化学反应发生变化，导致内阻增加，引起电压平台偏移。因此，IC曲线第二个波峰的峰值及位置反映出电池老化的过程，可作为评估电池SOH的2个重要健康特征。文献[24]中提出将各个波峰对应的20 mV电压区间峰下面积作为特征，以减小滤波算法直接引起的波峰峰值和位置漂移所造成的误差，本工作在此基础上提出以IC曲线变化最明显的3.9～4.1 V定电压区间峰下面积作为健康特征，进一步扩大面积计算范围以减小滤波前后峰下面积的误差。按照上述方法分别提取出B0005、B0006、B0007电池IC曲线的峰值高度、峰值电压、峰面积，与SOH对应的三维分布关系如图6所示，可以直观看出随着电池SOH衰退，峰值高度逐渐降低，峰面积逐渐减小，峰值电压逐渐升高，反映出3个健康特征与SOH均存在较好的线性关系。

图5 不同循环下的IC曲线

图6 电池健康特征与SOH关系

使用Pearson系数法定量衡量上述健康特征与电池SOH之间的相关性，分析结果见表1。

表1 健康特征相关性分析结果

为消除特征冗余同时减少后续机器学习模型训练成本，应用MDS非线性降维方法将三维特征降至一维，降维后特征与电池SOH相关性计算结果见表2。

表2 降维后特征相关性分析结果

由分析结果可见，降维前的特征与电池SOH相关性系数最低为0.9550，降至一维后的相关性系数最低为0.9878，证明MDS降维方法一定程度上提升了所提特征与电池SOH之间的相关性，降维后的特征能够更加准确地反映出SOH变化趋势。

3.2　GWO-GPR模型预测结果

本研究以电池数据前80个循环作为训练集，后88个循环作为测试集，将所提基于IC曲线的GWO-GPR模型与目前电池SOH估计领域常用的SVR、ELM、未改进的GPR模型作对比，以验证所提模型的准确性。

为清晰量化不同模型的评估效果，选用均方根误差(root mean square error，RMSE)和平均绝对误差(mean absolute error，MAE)对SOH估计结果进行定量评价，MAE是SOH真实值和估计值之间绝对差值的平均，可以评估所提出方法的预测水平，其主要缺点是对异常值不敏感，而RMSE是均方误差的均方根，弥补了MAE的不足，表示如下：

其中，图片表示电池SOH的真实值，图片为估计值，图片为实验电池循环的总次数。

由图7可知，在测试循环前期，4种方法对SOH退化轨迹均有较好的跟踪能力，但随着实验周期的增加，退化曲线的非线性越来越强，导致SVR、ELM及GPR的结果逐渐偏离SOH真实值；相比其他模型，GWO-GPR的SOH估计结果能较好地描述电池的退化轨迹，并可输出95%置信区间为结果提供不确定度量：3块电池SOH的真实值均落在GWO-GPR的置信区间内，证明该模型的估计结果有较强的可靠性。置信区间的上限和下限与真实值越接近，则估计结果的可信度越高，由于GWO-GPR对SOH的预测分布是从早期电池循环中产生，随着循环次数的增加，其置信区间的上下限范围不断扩大，表明对于循环后期的SOH退化估计的不确定性增加。通过误差分析图可以更直观地看出GWO-GPR模型的RMSE和MAE均为最小，说明模型估计精度高且稳定性好。其余3种模型的精度和稳定性较差，在B0005电池上误差从小到大排序为SVR、GPR、ELM，在B0006电池上误差从小到大排序为ELM、GPR、SVR，在B0007电池上误差从小到大排序为SVR、ELM、GPR。

图7 不同算法的SOH估计及误差分析

4种方法的SOH估计结果定量评价如表3，应用SVR模型估计B0005、B0006、B0007电池SOH的最大RMSE及MAE分别为0.0282和0.0214，应用ELM模型估计结果的最大RMSE及MAE为0.0190和0.0167，应用GPR模型估计结果的最大RMSE及MAE为0.0244和0.0180，均高于GWO-GPR模型的0.0103和0.0050。文献[25]使用未改进的GPR在相同起点进行SOH估计，3块电池的最大RMSE达到0.0210，为GWO-GPR误差的2倍多，进一步证明了本改进模型可以提供更精确的SOH估计。

表3 不同方法SOH估计结果评价

3.3　鲁棒性分析

SOH的衰退是动态过程，在实际使用中电池的老化状态通常是未知的，能否在不同老化阶段均实现准确的SOH估计是模型实用性能的重要标准。为进一步分析GWO-GPR模型的鲁棒性，验证其在不同电池老化状态下的SOH估计精度，本工作基于B0005、B0006、B0007数据集，以每块电池前60、80、100个循环作为GWO-GPR模型的训练集，后续循环作为测试集进行实验。由图8可知，不同电池老化状态下GWO-GPR模型均展现出良好的SOH估计效果，证明该模型具有较高的鲁棒性。

图8 第60、80、100个循环为起点的SOH估计效果

不同起始循环下的SOH估计RMSE如表4所示，最大误差出现在B0006电池以第60个循环为估计起始点时，仅为1.03%。随着估计起始点后移、训练集样本数增加，模型输出的95%置信区间逐渐缩小，表明对估计值的不确定性降低，这是由于更大的训练样本使模型能够更全面地理解数据的特征、分布和趋势；同时模型的估计精度也有进一步提升，在起始循环为100时，3块电池的估计精度达到了0.46%、0.73%、0.52%。

表4 不同起始循环下SOH估计均方根误差

综上所述，本工作所提基于容量增量曲线的GWO-GPR模型具有较高的准确性和鲁棒性，能够对不同老化程度的电池进行准确的SOH估计。

4 结论

本工作提出一种基于IC曲线的GWO-GPR锂离子电池SOH估计模型。以容量增量分析法从IC曲线上提取峰值高度、峰值电压、峰面积作为健康特征，利用MDS进行非线性降维，消除特征冗余性同时降低模型计算复杂度，通过Pearson系数法验证了降维后的特征与SOH有更强的相关性。结合SOH实际衰退轨迹，采用组合核函数改进GPR模型，为克服共轭梯度法对超参数求解时依赖初值、容易陷入局部最优等缺点，使用GWO算法对组合核函数的超参数进行优化，建立GWO-GPR模型；以NASA电池数据集中的前80个循环为训练集，后88个循环为测试集，与SVR、ELM及未改进的GPR作比较，证明了GWO-GPR模型具有更高的精度，RMSE和MAE最大仅为1.03%和0.5%；以每块电池第60、80、100个循环作为估计起始点，结果显示最大误差控制在1.03%以内，验证了模型的鲁棒性。

【责任编辑:孟瑾】

基于容量增量曲线与GWO-GPR的锂离子电池SOH估计

相关推荐