介绍三种元启发式算法,用于拟合基于皮尔逊Ⅲ型分布的洪水理论频率曲线,以推算指定频率的设计洪水流量。 皮尔Ⅲ型曲线 通过统计学分析,经典情况下皮尔逊Ⅲ型曲线比较符合我国多数地区水文现象的实际情况。我国水利、公路、铁路等工程有关规范在水文统计中,大多采用皮尔逊Ⅲ型曲线作为近似于水文现象的频率密度分布函数,在洪水流量、暴雨径流以及波浪高度等频率分析中广泛应用。实际应用中通常通过确定水文统计参数CS、CV来进行计算,以节约计算工作量,方便工程人员使用。随着计算能力提升和电算的普及,可采用元启发式算法,直接确定皮尔逊曲线分布的细化参数,进一步推算指定频率的设计洪水流量。
介绍三种元启发式算法,用于拟合基于皮尔逊Ⅲ型分布的洪水理论频率曲线,以推算指定频率的设计洪水流量。
皮尔Ⅲ型曲线
通过统计学分析,经典情况下皮尔逊Ⅲ型曲线比较符合我国多数地区水文现象的实际情况。我国水利、公路、铁路等工程有关规范在水文统计中,大多采用皮尔逊Ⅲ型曲线作为近似于水文现象的频率密度分布函数,在洪水流量、暴雨径流以及波浪高度等频率分析中广泛应用。实际应用中通常通过确定水文统计参数CS、CV来进行计算,以节约计算工作量,方便工程人员使用。随着计算能力提升和电算的普及,可采用元启发式算法,直接确定皮尔逊曲线分布的细化参数,进一步推算指定频率的设计洪水流量。
已知皮尔逊概率分布曲线满足以下微分方程:
(1)
其中参数 a、b 0 、b 1 和 b 2 是实数。更准确地说,皮尔逊曲线是 p( x ) 作为 x 的函数的图表。方程(1) 的解的分布与超几何分布的极限形式一致。皮尔逊曲线根据方程(2)根的性质分类:
(2)
此时,当
(3)
此时分布为皮尔逊Ⅲ型,这个分布是偏伽马分布的,特殊情况下为卡方分布和伽马分布。
皮尔逊Ⅲ型曲线可表示为:
(4)
其中:x 是变量, μ 是位置参数 (Location Parameter) , 控制曲线的中心位置, σ 是尺度参数 (Scale Parameter) ,控制曲线的宽度和波动, γ 是形状参数 (Shape Parameter) , 控制分布的偏斜程度, Γ(γ) 是伽马函数,用于归一化。
拟合皮尔逊Ⅲ型曲线的目标是找到三个参数 (μ,σ,γ) 的最优值,使得拟合后的皮尔逊三型分布与原始数据之间的均方差最小。均方差(MSE) 可以表示为:
(5)
其中 n 是数据点的数量,第 yi 个数据点的原始值即统计洪水流量 Qi, 是通过皮尔逊三型曲线模型预测的第 i 个数据点的值。
这是一个典型的NP(Non-deterministic Polynomial)问题,可采用各种启发式算法来求解。初始启发式算法的初始可行域较大,为了缩小可行域,减少搜索时间,本文采用元启发式算法。首先采用贪心算法求出可行解,再采用不同的启发式算法(粒子群、蚁群、差分进化算法)进行求解。贪心算法也可以嵌入启发式算法的某些步骤中,从而得到更快的求解时间和更优的结果。
求矩目估适线法
某水文站有1958年至1987年30年的实测洪峰流量资料。通过历 史洪水调查与考证,在200年中历史洪峰流量最大是1903年的 洪水,第二位是1921年的洪水,此外还调查到1956年的洪水是 近50年中的第一位,但在200年考证期中序位无法得到。求 Q 1%
基于已知洪水的经验频率,可通过求矩目估适线法求解得到,当 C S =0.331, C V =6C S ≈2时,具有较好的拟合效果(如图1)。但求矩手算过程耗时且繁琐,目估适线带有较大主观性。
图1 求矩目估适线法求解结果
粒子群优化 (PSO)
PSO是模拟鸟群狩猎行为的一种算法。在PSO中,每个“粒子”代表潜在的解决方案,本应用场景中的指确定皮尔Ⅲ形曲线的一组参数 (μ,σ,γ)。
初始化:随机生成一群粒子,每个粒子有随机的位置(代表一组潜在的参数值)和速度。在更新粒子速度和位置时,考虑当前解和个体历史最佳解的均方差(MSE),贪心选择更好的解作为参考点。另外,考虑预测百年一遇的洪水流量。我们将 Q 0.1% -Q 10% 的洪水比重设置为70%,其余的设置为30%。
评估:利用当前参数值计算均方差(MSE)计算每个粒子的适应度。
贪心更新:每个粒子根据自己的历史最优位置(个体最优)和群体中的最优位置(全局最优)来更新自己的速度和位置。
迭代:重复评估和更新过程,直到满足停止条件(如达到最大迭代次数或适应度达到预设阈值)。
通过上述算法得到的拟合曲线如图2所示。
图2 贪心-粒子群算法求解结果图
蚁群优化 (ACO)
ACO是模拟蚂蚁寻找食物路径的算法。在ACO中,蚂蚁代表搜索空间中的路径,本应用场景中的指确定皮尔Ⅲ形曲线的一组参数 (μ,σ,γ)。
初始化:蚂蚁在搜索空间中随机选择路径。此外,考虑预测百年一遇的洪水流量,我们将 Q 0.1% -Q 10% 的洪水比重设置为70%,其余的设置为30%。
构建解决方案:每只蚂蚁根据概率规则选择路径,结合信息素强度和贪心选择机制,优先考虑导向当前已知最佳解的路径。
更新信息素:在每只蚂蚁完成其路径后,更新路径上的信息素量,优秀的解会增加更多信息素。
蒸发信息素:降低所有路径的信息素量,避免过早收敛于局部最优解。
迭代:重复上述过程,直到达到终止条件。
通过上述算法得到的拟合曲线如图3所示。
图3 贪心-蚁群算法求解结果图
差分进化 (DE)
DE是一种简单且有效的全局优化算法,特别适合连续函数优化问题。它通过对种群中个体间的差异进行操作来搜索最优解。
初始化:生成初始种群,每个个体代表一组可能的参数 (μ,σ,γ)。另外,考虑预测百年一遇的洪水流量。我们将 Q 0.1% -Q 10% 的洪水比重设置为70%,其余的设置为30%。
变异:对于每个个体,从种群中随机选择三个不同的个体,利用它们的差异生成一个变异向量。
交叉:将变异向量与当前个体结合,生成试验个体。
贪心选择:在选择阶段,比较试验个体和当前个体的适应度,贪心地选择更好的解作为下一代个体。
迭代:重复变异、交叉和选择步骤,直到满足终止条件。
通过上述算法得到的拟合曲线如图4所示。
图4 贪心-差分进化算法求解结果图
设计流量推算结果对比
不同方法的计算结果如上表所示。三种算法都具备出色的计算速度,尽管是启发式算法,由于减小搜索域、初始数据点较少,在启发式算法的种群200,迭代少于100次的条件下就可以收敛,总耗时不超过1秒,相较于其他传统方法大大减少了所消耗的时间。
由上述图表可见,不同方法拟合曲线和洪水记录点存在不同程度的偏差, 设计流量的计算结果也存在一定的波动,可考虑进一步的优化方法,提高推算精度。
本文介绍的三种元启发式算法直接确定皮尔逊III分布的三个参数,而非简化后的参数C S 、C V 等,计算速度快,避免了反复查表的繁琐,但不同方法的设计流量推荐结果具有一定的波动,实际工程应用时需评判不同方法的适用性。