虽然大型语言模型在创意写作和基础数学等方面表现出色,但在面对数独或严格的行程规划等复杂、规则繁多的任务时,它们往往会陷入困境。为了弥补这一差距,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究团队在加布里埃尔-格兰德(Gabriel Grand)的带领下,推出了一种名为 DisCIPL(语言模型推理编程分布式约束)的新系统。
该框架以管理者-工人分层结构为基础运行。一个大型的 "老板 "模型首先充当规划者的角色,为解决用户的请求制定策略。然后,它将任务的具体组成部分分配给更小、更高效的 "跟随者 "模型。
为了确保团队不偏离轨道,"老大 "使用 LLaMPPL 来传达指令。LLaMPPL 是一种专门的编程语言,旨在引导模型实现精确的输出。如果从属模型偏离了约束条件,例如在结构化诗歌中使用了错误的措辞,主模型就会介入纠正。
这种方法取得了令人瞩目的成果。根据研究人员的报告,在涉及撰写赠款提案或杂货清单预算等任务的测试中,DiscIPL系统做出的反应比OpenAI的GPT-4o更准确,而且与专门推理模型o1的精确度不相上下。更值得注意的是,它的效率要高得多。与竞争对手相比,通过将繁重的工作卸载到更小的模型上,该系统的推理时间缩短了约 40%,成本降低了 80% 以上。
该团队认为,这种方法为人工智能提供了一条可持续发展的道路,证明了协调较小的模型可以比单纯依赖庞大、耗电的系统更有效、更节能。
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名


