麻省理工学院的研究警告聊天机器人更有可能阻碍某些群体看病

根据麻省理工学院的一项新研究，聊天机器人对健康问题的回答可能会有很大差异--这取决于提问者是谁。(图片来源：DallE3）

人工智能总是客观的吗？不尽然。麻省理工学院的一项新研究显示，一个人的书写方式会影响他们从聊天机器人那里获得的医疗建议，而这往往对他们不利。某些群体总是会根据他们对症状的表述而收到不太准确甚至不安全的建议。

Marius Müller (translated by Ninh Duy), Published 07/09/2025 🇺🇸 🇩🇪 ...

AI Science

ChatGPT、Gemini 和类似工具正越来越多地被用作健康顾问。像 "我头痛--可能是什么原因？"或 "我肩膀疼--我什么时候应该去看医生？"这样的问题现在对这些聊天机器人来说已经是家常便饭了。但麻省理工学院（MIT）的一项新研究表明，并非所有用户都能得到这些常见问题的相同答案。

该研究发表于 6 月 23 日，。题为"媒介即信息：非临床信息如何影响 LLMs 中的临床决策"的研究，探讨了语气、写作风格或格式等看似无关的因素如何影响人工智能系统给出的医疗建议。

为了衡量语言和风格对人工智能聊天机器人决策的影响程度，研究人员建立了一个 "扰动框架"。通过这一工具，他们可以创建同一医疗查询的不同版本--修改后包括不确定性、戏剧性措辞、错别字或大小写不一致等元素。然后，他们在四个大型语言模型上测试了这些变化：GPT-4、LLaMA-3-70B、LLaMA-3-8B 和 Palmyra-Med（一种专为医疗用途设计的模型）。