定向刺激提示
Li et al., (2023) (在新标签页中打开) 提出了一种新的提示技术,以更好地引导LLM生成期望的摘要。
训练了一个可调策略LM来生成刺激/提示。看到越来越多使用RL来优化LLM。
下图显示了定向刺激提示与标准提示的比较。策略LM可以很小,并且经过优化以生成指导黑箱冻结LLM的提示。

图片来源: Li et al., (2023) (在新标签页中打开)
完整示例即将推出!
🎓
在我们的新AI课程中了解更多高级提示方法。 立即加入! (在新标签页中打开) 使用代码PROMPTING20享受额外八折优惠。