润滑科技信息平台

Corrosion Science|德国汉堡工业大学|LLM 破解镁腐蚀缓蚀剂预测难题，小样本超越传统机器学习

2026-04-07 科技资讯

标题: Large language models predicting the corrosion inhibition efficiency of magnesium dissolution modulators

DOI: https://doi.org/10.1016/j.corsci.2025.113080

工作亮点

一、方法创新：提出LLM 小样本预测框架，攻克镁合金缓蚀效率数据稀缺建模难题

首次将通用大语言模型（GPT‑4o/o1/o3‑mini）用于镁合金 ZE41 缓蚀效率预测，仅依托分子名称、SMILES 字符串与少量描述符即可完成建模，无需复杂特征工程；对比化学专用 LLM 与传统神经网络，依托大模型预训练化学知识实现上下文推理，在75 样本极小数据集下规避过拟合，突破腐蚀领域数据匮乏、传统模型依赖大规模标注数据的核心瓶颈。

二、性能突破：GPT‑4o 预测精度全面领先，小样本超越传统机器学习

基线在 RMSE、MAE、皮尔逊相关系数三大指标上，GPT‑4o 配合预分析提示 + 分子描述符输入实现最优表现，MAE 低至 43.4、相关系数达 85.8%，较传统 MLP 基线误差显著降低、相关性大幅提升；o1、o3‑mini 等推理型大模型对提示依赖性低，未优化 prompt 即可超越基线，在小样本化学腐蚀预测任务中实现性能跨越式突破。

三、价值创新：通用大模型赋能腐蚀材料筛选，建立低成本高效筛选新范式

无需针对腐蚀领域微调大模型，仅通过提示工程即可挖掘分子结构‑缓蚀性能关联规律；验证通用 LLM 在材料腐蚀领域的强泛化能力，大幅减少实验量与数据采集成本，形成 “分子信息输入 — 提示工程优化 —LLM 预测 — 候选剂筛选” 的轻量化流程，为镁合金缓蚀剂快速开发、有机腐蚀调节剂高通量筛选提供可落地、高效率的 AI 新范式。

图文解析

图1.不同评估指标下基线结果的概览。 MLP 结果引自Schiessler等人[38]的研究。相关性指标反映预测值与实验值之间的关联程度，数值越高表明结果越好（右图）。相反，误差指标 RMSE（中图）和MAE（左图）数值越低则表明性能提升。

图2.不同参数组合下ChemBERTa方法预测结果的平均绝对误差（MAE）概览。红色虚线表示我们前期研究中用于直接对比的 MLP 结果。

图3.通用LLM结果概览：未添加额外描述符输入时的平均绝对误差（MAE）。红色虚线表示用于对比的 MLP 结果。提示方法包括1种ChatGPT生成提示和3种人工编写提示策略。基础少样本方法未包含任何辅助步骤，而人工优化提示则包含这些步骤。预分析阶段指在预测步骤前预先对训练数据进行分析的提示方法。

图4.通用LLM结果概览：含附加描述符输入的平均绝对误差（MAE）。红色虚线表示用于对比的 MLP 结果。提示方法包括1种ChatGPT生成提示和3种人工编写提示策略。基础少样本方法未包含任何辅助步骤，而人工优化提示则包含这些步骤。预分析阶段指在预测步骤前对训练数据进行预先分析的4种提示方案。

图5.通用大语言模型（LLM）结果概览：与附加描述符输入的相关性分析。红色虚线显示用于对比的 MLP 结果。提示方法包括1种ChatGPT生成提示和3种人工编写提示策略。基础少样本方法未包含任何辅助步骤，而人工优化提示则包含这些步骤。预分析阶段指在预测步骤前对训练数据进行预先分析的4种提示方案。

图6.各组使用不同评估指标的最佳结果概览。 MLP 结果引自Schiessler等人[38]的研究。相关性指标反映预测值与实验值之间的关联程度，数值越高表明结果越好。反之，误差指标 RMSE 均方根误差（RMSE）和平均绝对误差（MAE）数值越低，则说明模型性能越优。

图7. 提示策略概述。除少数例外情况外，提示系统的工作原理类似于聊天界面：从顶部开始，当前提示前会以聊天记录形式附加历史提示与回答。该示意图展示了未添加描述符时的提示方案。当输入数据中添加描述符时，预分析提示将扩展为具有不同聚焦点的分析集合。