清华大学樊健生教授、王琛助理研究员为您解读土木工程设计公式智能发现方法

土木工程设计公式智能发现方法 1. 研究背景随着数字孪生等数智化转型的推进，智能计算技术在土木工程中的应用日益广泛，为设计优化、运维反演等带来突破

土木工程设计公式智能发现方法

研究背景

随着数字孪生等数智化转型的推进，智能计算技术在土木工程中的应用日益广泛，为设计优化、运维反演等带来突破 ^[1] ，加速新材料、新构件从研发到工程应用的落地转化。然而，人工智能模型的黑盒属性限制了其在土木工程领域的进一步落地应用。一方面，黑盒模型的数据泛化不确定性导致其难以满足实际工程中安全第一的原则；另一方面，黑盒模型的不可解释性导致计算结果难以被工程师和研究者理解，无法广为应用与传播，即使模型出现问题，也鲜有有效手段对其进行校正或改进。

为提升计算结果的透明性和可理解性，同时辅助探索研究新问题的力学机理，本文中提出土木工程设计公式智能发现方法，通过数据驱动的方式自动生成量纲平衡、物理含义清晰、力学可解释性强的设计公式，大幅简化传统设计公式的提出流程（图1）。

图1 智能方法生成设计公式流程与传统流程对比示意

研究过程

2.1 考虑量纲约束的公式生成智能模型

符号树可以将工程设计公式转为一条由数学符号组成的“句子”（图2），从而可应用自然语言处理领域的语言生成模型进行学习（图3）。为保证生成的“数学语句”具有合理的物理含义，根据符号所处位置及上下文对模型生成的符号进行限制。在此基础上，引入局部和整体量纲约束，例如：加减运算符左右两边的变量量纲需相同，生成公式的整体量纲需与拟合力学量的量纲相同等，从而进一步提升公式的可解释性。

图2 公式树转化为波兰表达式

图3 考虑量纲约束的公式生成智能模型

2.2 基 于量纲分析和工程先验知识的特征工程方法

土木工程设计公式的主要特点在于包含大量不同物理单位的力学变量与几何变量，且不同变量（即特征量）的取值范围可能相差悬殊，模型结果与生成结果易受数据尺度的影响而不稳定。常规的归一化方法涉及对变量的函数变换，会改变公式的形式、破坏原始的物理关系。为适应土木工程学科场景，提出了基于量纲分析的智能归一化算法，通过自动调整基本单位的量级实现各特征取值范围相近，从而保留了原始的物理关系，对生成的表达式无需再作还原。以图2的模量转化表达式为例，对于常见的建筑材料，若以MPa为单位， G 和 E 取值范围横跨10 ³ ~10 ⁵ ，而泊松比 ν 取值范围为0~0.5，相差约4个数量级。此时，算法会自动将基本单位MPa调整为10 ⁴ MPa，使得 G 、 E 、 ν 分布相近。

此外，工程规范中的设计公式大多采用分段函数形式，可反映不同参数范围力学机理的变化。因此，模型需要实现输入数据的自动分类，进而针对不同类别数据进行分段公式生成，提高计算结果的准确度。为此，提出基于工程先验知识的数据分段方法（图4），该方法利用谱聚类和决策树等算法，能够将原始数据进行聚类，并对聚类边界作出解释，以服务于下游的公式生成任务；还可以识别影响材料性能的关键因素，辅助探索力学机理。

图4 基于工程先验知识的数据分段方法

应用算例

3.1 破坏模式

以Hu等 ^[2] 收集的配筋水泥基材料连梁（含普通RC连梁、工程水泥基材料（ECC）连梁、钢纤维混凝土（SFRC）连梁）受剪承载力数据集为例，寻找其设计公式。共180条数据样本，其特征字段、含义及量纲如表1所示。

表1 配筋水泥基材料连梁剪切试验数据集

已有文献与规范中配筋水泥基材料连梁受剪承载力的人工经验公式如式（1）~（4）所示，其拟合优度为0.73。

对于RC梁，有

（1）

对于ECC梁 ^[3] ，有

（2）

而对于SFRC梁，则有

（3）

（4）

采用传统符号回归软件Eureqa得到如下公式：

（5）

式（5）拟合优度可达0.86，可以看到，传统符号回归发现的公式较为复杂，虽然拟合度高，但各项量纲不正确，无力学可解释性与工程泛化能力，难以作为合适的工程设计公式。

采用本文中提出的方法进行设计公式智能生成。首先对数据集应用基于量纲分析和工程先验知识的特征工程，在归一化后，进行数据分段。数据分段算法将数据集分为3类，并给出了相应的分段条件（表2）。其中，类别1的有机纤维含量高，主要对应ECC连梁；类别2的有机纤维和钢纤维含量均较低，主要对应RC连梁；类别3的钢纤维含量较高，主要对应SFRC连梁。由此可见，模型成功辨别出数据集中3类材料蕴含的机理差异。

表2 数据分段结果

根据分段条件，在各子数据集上分别应用考虑量纲约束的公式生成智能模型：

（6）

此外，若不应用基于量纲分析和工程先验知识的特征工程，直接将原始数据集输入智能模型进行公式生成，结果如下：

（7）

对比不同公式的回归相关系数 R ² 和平均绝对值误差（MAE），结果如表3所示。可见，智能方法生成的公式 R ² 与MAE相较于人工经验公式分别提升和降低了23.3%和61.3%，性能优异。更重要的是，智能生成的公式量纲一致，力学可解释性与应用泛化性显著强于传统符号回归方法。表现为：当增强纤维含量较低时，主要由纵筋的销栓作用贡献连梁的受剪承载力，且随跨高比的增大而下降；当增强纤维含量较高时，混凝土的受剪贡献占比增大，且有机纤维和钢纤维的影响也略有不同。

此外，无特征工程的模型性能明显劣化， R ² 降低6.7%，MAE增大36.0%，且无法反映钢纤维和有机纤维对配筋水泥基材料连梁受剪承载力的影响。无特征工程的模型无法捕捉这两个重要特征影响的原因在于，纤维体积分数在数值上远小于其他强度指标，若没有预先归一化将会影响模型对特征的偏重，导致不能准确描述3种材料的力学性能。由此可见，有必要开展基于量纲分析和工程先验知识的特征工程以提升模型准确度和可解释性。

表3 不同方法拟合结果对比

结论

1）研发了考虑量纲约束的公式生成智能模型，该模型将符号表达式视作数学词元组成的序列，采用LSTM等序列生成模型辅以物理性和量纲约束进行符号表达式的生成，可以得到量纲协调、物理含义清晰的设计公式。

2）提出了基于工程先验知识和量纲分析的智能特征工程，包括针对多力学-几何变量场景的归一化算法和基于谱聚类和决策树的数据分段方法。前者可在保留物理关系的前提下自动调整各特征的取值范围以消除数据尺度对模型性能的影响；后者可获得具有工程意义的分段条件以产生分段函数形式的设计公式。

3）基于配筋水泥基材料连梁受剪承载力进行数值试验，结果表明智能方法生成的公式准度高、可解释性强，还可以辅助发现力学机理，具有可观的科学与工程应用价值。

附：

成果体验

本文中设计公式智能发现方法的部分功能现已上线“工程结构智能设计计算试验性交互平台DeepSEAI”（图6，https://deepseai.com/），拥有较完善的前后处理功能，欢迎广大读者试用体验！

DeepSEAI平台公式智能发现模块演示

图 6 平台部分功能展示