Corrosion Science|德国汉堡工业大学|LLM 破解镁腐蚀缓蚀剂预测难题,小样本超越传统机器学习

2026-04-07 科技资讯

 

图片







标题: Large language models predicting the corrosion inhibition efficiency of magnesium dissolution modulators


DOI: https://doi.org/10.1016/j.corsci.2025.113080




工作亮点





一、方法创新:提出LLM 小样本预测框架,攻克镁合金缓蚀效率数据稀缺建模难题

首次将通用大语言模型(GPT‑4o/o1/o3‑mini)用于镁合金 ZE41 缓蚀效率预测,仅依托分子名称、SMILES 字符串与少量描述符即可完成建模,无需复杂特征工程;对比化学专用 LLM 与传统神经网络,依托大模型预训练化学知识实现上下文推理,在75 样本极小数据集下规避过拟合,突破腐蚀领域数据匮乏、传统模型依赖大规模标注数据的核心瓶颈。


二、性能突破:GPT‑4o 预测精度全面领先,小样本超越传统机器学习

基线在 RMSE、MAE、皮尔逊相关系数三大指标上,GPT‑4o 配合预分析提示 + 分子描述符输入实现最优表现,MAE 低至 43.4、相关系数达 85.8%,较传统 MLP 基线误差显著降低、相关性大幅提升;o1、o3‑mini 等推理型大模型对提示依赖性低,未优化 prompt 即可超越基线,在小样本化学腐蚀预测任务中实现性能跨越式突破。

三、价值创新:通用大模型赋能腐蚀材料筛选,建立低成本高效筛选新范式

无需针对腐蚀领域微调大模型,仅通过提示工程即可挖掘分子结构‑缓蚀性能关联规律;验证通用 LLM 在材料腐蚀领域的强泛化能力,大幅减少实验量与数据采集成本,形成 “分子信息输入 — 提示工程优化 —LLM 预测 — 候选剂筛选” 的轻量化流程,为镁合金缓蚀剂快速开发、有机腐蚀调节剂高通量筛选提供可落地、高效率的 AI 新范式。



 



图文解析





01

图1.不同评估指标下基线结果的概览。 MLP 结果引自Schiessler等人[38]的研究。相关性指标反映预测值与实验值之间的关联程度,数值越高表明结果越好(右图)。相反,误差指标 RMSE(中图)和MAE(左图)数值越低则表明性能提升。


02


图2.不同参数组合下ChemBERTa方法预测结果的平均绝对误差(MAE)概览。红色虚线表示我们前期研究中用于直接对比的 MLP 结果。



03

图3.通用LLM结果概览:未添加额外描述符输入时的平均绝对误差(MAE)。红色虚线表示用于对比的 MLP 结果。提示方法包括1种ChatGPT生成提示和3种人工编写提示策略。基础少样本方法未包含任何辅助步骤,而人工优化提示则包含这些步骤。预分析阶段指在预测步骤前预先对训练数据进行分析的提示方法。

04


 

图4.通用LLM结果概览:含附加描述符输入的平均绝对误差(MAE)。红色虚线表示用于对比的 MLP 结果。提示方法包括1种ChatGPT生成提示和3种人工编写提示策略。基础少样本方法未包含任何辅助步骤,而人工优化提示则包含这些步骤。预分析阶段指在预测步骤前对训练数据进行预先分析的4种提示方案。

05


图5.通用大语言模型(LLM)结果概览:与附加描述符输入的相关性分析。红色虚线显示用于对比的 MLP 结果。提示方法包括1种ChatGPT生成提示和3种人工编写提示策略。基础少样本方法未包含任何辅助步骤,而人工优化提示则包含这些步骤。预分析阶段指在预测步骤前对训练数据进行预先分析的4种提示方案。


06

图6.各组使用不同评估指标的最佳结果概览。 MLP 结果引自Schiessler等人[38]的研究。相关性指标反映预测值与实验值之间的关联程度,数值越高表明结果越好。反之,误差指标 RMSE 均方根误差(RMSE)和平均绝对误差(MAE)数值越低,则说明模型性能越优。


07

图7. 提示策略概述。除少数例外情况外,提示系统的工作原理类似于聊天界面:从顶部开始,当前提示前会以聊天记录形式附加历史提示与回答。该示意图展示了未添加描述符时的提示方案。当输入数据中添加描述符时,预分析提示将扩展为具有不同聚焦点的分析集合。