🚀 在我们的新课程中掌握提示工程和构建 AI 代理!使用 PROMPTING20 可享受 8 折优惠 ➜ 立即注册

LLM 推理

在过去几年里,大型语言模型(LLMs)在广泛的任务中取得了显著进展。最近,LLMs 在达到足够大尺寸时展现出了推理能力的潜力。不同类型的推理对于智能至关重要,但目前尚未完全理解 AI 模型如何学习和利用这种能力来解决复杂问题。这是许多研究实验室高度关注和投入的领域。

使用基础模型进行推理

Sun 等人 (2023) (在新标签页中打开) 最近提出了一个关于使用基础模型进行推理的概览,重点关注了各种推理任务的最新进展。这项工作还更广泛地探讨了跨多模态模型和自主语言代理的推理。

推理任务可能包括数学推理、逻辑推理、因果推理、视觉推理等。下图显示了该综述论文中讨论的推理任务概览,包括用于基础模型的推理技术,例如对齐训练和情境学习。

推理任务 图源:Sun 等人,2023 (在新标签页中打开)

如何在 LLMs 中引发推理能力?

可以使用许多不同的提示方法来引发和增强 LLMs 的推理能力。Qiao 等人 (2023) (在新标签页中打开) 将推理方法研究分为两个不同的分支,即推理增强策略和知识增强推理。推理策略包括提示工程、过程优化和外部引擎。例如,单阶段提示策略包括思维链 (在新标签页中打开)Active-Prompt (在新标签页中打开)。关于使用语言模型提示进行推理的完整分类法可以在论文中找到,并总结在下图中

推理分类 图源:Qiao 等人,2023 (在新标签页中打开)

Huang 等人 (2023) 也解释了提高或引发 LLMs(如 GPT-3)推理能力的技巧摘要。这些技巧包括使用在解释数据集上训练的完全监督微调模型,以及思维链、问题分解和情境学习等提示方法。以下是论文中描述的技巧摘要

推理技术 图源:Huang 等人,2023 (在新标签页中打开)

LLMs 能进行推理和规划吗?

关于 LLMs 是否能进行推理和规划存在很多争论。推理和规划都是解锁 LLMs 复杂应用(如机器人和自主代理领域)的重要能力。Subbarao Kambhampati (2024) 的一篇立场论文 (在新标签页中打开) 讨论了 LLMs 的推理和规划主题。

以下是作者结论的摘要

总结一下,我所阅读、验证或进行的任何事情,都没有让我有任何令人信服的理由相信 LLMs 会进行通常理解的推理/规划。相反,它们凭借万维网规模的训练,所做的是一种通用近似检索形式,正如我所论证的,有时会被误认为是推理能力。

参考文献