Notebookcheck Logo

DeepSeek 发布更新的 R1 模型,提高了人工智能性能,减少了幻觉现象

DeepSeek 通过最新更新继续改进其排名前十的 R1 人工智能 LLM 模型。(图片来源:DeepSeek)
DeepSeek 通过最新更新继续改进其排名前十的 R1 人工智能 LLM 模型。(图片来源:DeepSeek)
DeepSeek发布了其R1人工智能模型的最新版本DeepSeek-R1-0528,改进了推理能力,减少了幻觉,并在多个人工智能基准测试中获得了更高的性能,使其更接近顶级专有模型。
AI Software Open Source Business

DeepSeek 发布了其开创性的 R1 人工智能大型语言模型的最新版本,DeepSeek-R1-0528.该公司通过推出 V3 和 R1 打入了人工智能领域,这两个模型都具有前十名的人工智能性能。但与 OpenAI 和谷歌等公司的竞争模型相比,其训练成本更低,所用时间更短。

最新的 R1 模型通过了以下人工智能基准测试:

尽管在所有基准测试中,DeepSeek-R1-0528 的性能都比最初的 R1 版本有所提高,但在难度较高的Humanity's Last Exam 中,它仅正确回答了 17% 的问题。.由于其顶级竞争对手在这一考试中的得分也很低,DeepSeek R1 最新版本的优势很可能来自于额外的人工智能训练时间和调整,而不是人工智能创造方面的任何突破。重要的是,最新的 R1 减少了人工智能的幻觉,因此不太可能产生误导或错误的回答。

想对开源 R1 模型进行修补的读者可以使用配备 24 GB 内存的 Nvidia 4090 GPU 运行经过提炼的 80 亿参数版本。

DeepSeek R1 的 5 月 28 日更新提高了这一开源人工智能在多个基准测试中的性能。(图片来源:DeepSeek)
DeepSeek R1 的 5 月 28 日更新提高了这一开源人工智能在多个基准测试中的性能。(图片来源:DeepSeek)
Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 05 > DeepSeek 发布更新的 R1 模型,提高了人工智能性能,减少了幻觉现象
David Chien, 2025-05-30 (Update: 2025-05-30)