殷峰:高速公路管养优化推进过程采用动态规划最优策略方案探讨
发怒的小摩托
2022年12月29日 10:28:25
只看楼主

一 引言     近年来,公路行业面临着越来越大的压力以及不断增长的要求:一方面,管养资金紧张的现状没有缓解,重车比例没有下降,长大桥隧逐年老化,大中修需求依然紧迫;另一方面,养护科学决策、预防性养护、资金保障制度、专业化养护、养护作业机械化、风险管理和隐患排查、养护管理系统、结构健康监测、安全保护区管理以及智慧运维、智慧高速等要求摆在面前,且很迫切。这说明我们公路管养水平同交通强国的目标、人民的期待还有差距,亟待质的提升。



一 引言

   

近年来,公路行业面临着越来越大的压力以及不断增长的要求:一方面,管养资金紧张的现状没有缓解,重车比例没有下降,长大桥隧逐年老化,大中修需求依然紧迫;另一方面,养护科学决策、预防性养护、资金保障制度、专业化养护、养护作业机械化、风险管理和隐患排查、养护管理系统、结构健康监测、安全保护区管理以及智慧运维、智慧高速等要求摆在面前,且很迫切。这说明我们公路管养水平同交通强国的目标、人民的期待还有差距,亟待质的提升。


要克服巨大的压力,追求高目标,只盯着目标不够,要靠过程,需要改善原来的管理过程,更恰当地说,只有找到正确的过程,才能少走弯路,顺利实现目标,达到“质的提升”的状态。正确过程如此重要,是否可以设想,能不能找到一种方法,帮助我们形成所需的正确过程?


每年的“国检”,目的应当就是评价各地实现新要求的程度,督促执行新理念。所以实质上国检评价和督促的正是过程——是否开始推进、是否正确推进,因此设计评分标准时如能更加突出对过程的考察,就能更好发挥督促作用。


国检以及前面提到的各种新工作的成功推行、新要求的实现,落脚点都在过程,下面详细聚焦公路管养过程,探讨过程优化的规律性。


二 分析


   

公路管养工作分为设施维护和运管服务两类,同一般生产、服务、建设相比,公路管养具有高度的复合特征,体现在:复杂的设施(路、桥、隧、机电、交安、附属等)和程度不同的维护(巡检、经常检查、定期检查、专项检查等;日常保养、日常小修、预防养护、修复养护、专项养护、应急养护等),以及对交通的管理和服务、对运行风险的辨识和管控等。因此,公路管养过程的优化不能直接采用其他行业的做法。


必须回到根源,无论是养护还是运行,公路管养都具有序贯过程的典型特征:其中任一过程,都是按一定顺序进行,划分为若干阶段,在每个阶段通过主体的作为,过程转换到下个阶段。而序贯过程符合一定条件,就能满足动态规划最佳化原理,可以设想,这将有助于找到正确的过程。



1

动态规划最佳化原理及其条件

         

在动态规划问题中,一个序贯过程抽象为按一定顺序的“级”发展。在某“级”s,系统可用一个参数λ来描述,称之为状态变量,全部λ构成状态空间Λ。序贯过程是通过“决策”,从一级进展到下一级。即在每一级的任意一种状态,都要做一次决策xs(λ),决策就是在备选状态中做出选择,全部决策构成决策集Xλ。每次决策选择不同的状态会带来不同的收益(可以为负),每做一次决策后,系统转换到下一个状态并进展到下一级。过程总收益取决于每级所做的决策,将每级决策按顺序排列而成的决策集合就是策略ν,所有可能的策略集合构成一个策略空间Г。过程收益(即目标函数)取决于状态λ和策略ν,故将其记为rν(λ)。过程总收益是各级收益的一个组合,在过程由一个状态进展到下一个状态(一级到一级)中累积所得。所谓最佳策略,就是使总收益(目标函数)最优的策略。


动态规划最佳化原理:一个最佳策略(x1,x2,…xn)所具有的性质是不论初状态λ0和初决策x1如何,剩余的决策(x2,x3,…xn)对于从第一次决策x1产生的状态λ1开始的n-1级过程,也构成一个最佳策略。但需满足两个条件:①目标函数的可分性,即一个n级过程最后k级对目标函数的影响,仅取决于状态λn-k和最后k个决策,分级累加性的目标函数显然是可分的;②状态可分性(马尔可夫无记忆性),即在s级某状态λs做的决策xs+1得到的状态λs+1,仅取决于λs和xs+1,而与以前各级状态λ0,λ1,…λs-1无关。怎样应用最佳化原理找到正确过程?先需按序贯过程要求对公路管养过程进行一下规整。



2

作为序贯过程的公路管养

         

(1)定义
先讨论是否满足最佳化原理两个条件。由于任一级的决策是主体主观选择的结果,只要限定状态完全由决策确定的情形,就能满足状态可分性(无记忆性)。而对于具有自然衰减性目标函数,并且目标函数的每次优化或劣化完全依赖于每级的状态和决策,目标函数最优解由最优策略完全决定,则该目标函数满足可分性。


可以这样确定一个过程,根据某个要求,明年要完成相应任务,如根据“推进隧道风险管理的要求”,明年的任务是认真落实隧道风险管理。


分阶段(分级):根据实际情况,可以是按均匀时间划分,如每月底;也可以按照方案排定的实施节点计划,在每个节点分级。


状态:决策就是选择状态,就会直接影响目标函数值,因此状态最重要。前文说过,我们限定的状态是决策主体行为模式,总体划分为停滞(维持既有做法或习惯)、评估—停滞、评估—解题、评估—细化、评估—改善、评估—修正、评估—调动资源攻坚、评估—保持、无评估调整等大类,构成状态空间。


决策:就是在每一级,决定当从前状态转换到哪个状态。一个过程总是包含不同的管理层级或环节,过程各环节的负责人都是职责范围内的决策者,不同环节分级不同,处在一个分级结构和决策体系中。实际推进过程总有因素影响决策,包括专业要求、担责压力、程序繁复、企业文化、组织结构以及对得失考虑等,可称之为“阻抗”,阻抗的存在导致躲避职责、简单向下传递或久拖不决、工作不实等现象,决策是抵消阻抗的结果,减少阻抗关系到过程的成败。


目标函数:将什么视为公路管养的收益,决定着工作的方向。行业的公共服务属性,要求首先考虑设施状况保持优良、服务质量保持优良、运行安全性、效率提高、通过创新解决问题,然后是管养经费科学配置、管养成本等。可以看出,上述这些收益具有自然衰减性,其保持或改善几乎完全依靠管养决策和行为,综上,将其作为目标函数是合理的。


(2)推进管养新理念过程的最佳策略原则
与一般的序贯过程相比,实现新要求、推进新理念的过程有几点不同:第一,流程和机制是未知的,而推进新理念过程的目标,恰恰是建立最佳流程和机制;第二,会遇到很多全新的细节问题(包括管理、技术两方面);第三,存在“阻抗”。


根据前文的最佳化原理以及公路管养新理念推进过程的上述特点,可得以下推论:
推论一:对新理念最终达到的流程和机制的基本要求是,该流程和机制是稳定的、动态微调的、无限接近并且围绕最佳化策略波动,即正常运行阶段。


推论二:推进过程的未知性决定了必须采取每次决策相对优化原则(避免错过决策优化的机会),产生优化积累、迭代效应,不断逼近最佳化策略。


推论三:每次决策均参考多个目标函数综合评估是获得相对优化决策的重要方法,这体现了问题原则和反馈对照原则。
推论四:从推进过程开始启动到达到推论一的情形,这段过程为试运行阶段,应采用三种做法,一是预设流程和机制→不断修正过程;二是仍按原有相关过程但坚持新目标→每次遇到问题都不放过;三是将前两种做法结合起来。


推论五:对于启动推进新要求工作的时机,因状态的无记忆性,无论起点多低,只要从当前状态开始持续进行推论二的相对优化决策,必能达到推论一的水平。


三 应用讨论

   

1

养护科学决策

         

(1)预设机制—优化
在实践中采取以下一些机制(举例),以之为基准优化:
① 养护决策单元:以现行《公路养护技术规范》、《公路养护工程质量检验评定标准》、《公路桥梁技术状况评定标准》等规范最小检查或评定单元为准,可适当进行单元组合,或调整决策单元规模。


② 决策包含两个阶段,决策单元处于日常养护水平的,及时落实日常养护措施;超过日常养护处理能力的,上报养护工程决策程序。等等


(2)原过程—不放过问题
养护工程决策中,界定设备维修迫切性一直是个问题。在科学决策推进中,这个问题不能放过,为此用“运行时间”、“是否有更新”、“故障频率”、 “重要性”、 “原设备是否停产”、“有无备品”等6个维度描述维修迫切性,效果显著,见表1示例。


   

2

监督评价

         

根据前文推论,监督,包括管养考核、国检等,在设计标准时应着重过程的评价和督促,为此应涉及以下要点:


① 应判断某个推进过程处于试运行阶段、正常运行阶段还是未推进,判断依据是状态、策略、目标函数的水平以及机制是否明确、稳定。例如,状态为“停滞”,策略为持续停滞,目标函数如决策效率不高,机制不明确、不稳定,则可判定该过程“未推进”。


② 应判断某过程是否形成持续优化机制、制度,是否建立优势迭代、积累机制。


③ 应检查评估是否体现在每个决策中,注意是综合多个目标函数评估。


④ 应检查面对问题的处置方式以及效果,是积极主动还是消极被动。


⑤ 对正常运行的流程,应检查是否有修订、优化机制。


四 结语

   

高速公路管理是序贯过程,合理设置状态和目标函数后,就能利用动态规划最佳化原理。并且由此得到5个推论,明确推进新要求的过程分为试运行和正常运行两阶段,指出正常运行状态是动态、围绕最佳策略微调的特征,以及试运行阶段开启持续优化决策的三种方法。实现高要求的任务紧迫而繁重,本文提出的这些方法对顺利推进优化过程有重要的意义。


       

作者:殷峰  上海城投高速公路运营管理中心    




免费打赏

相关推荐

APP内打开