腾讯发布四款紧凑型开源浑源车型，参数分别为 0.5B、1.8B、4B 和 7B

腾讯开源了浑源人工智能模型，发布了四个紧凑型开源语言模型（图片来源：腾讯）

腾讯开源了浑源人工智能模型，发布了四个紧凑型语言模型，参数分别为 5 亿、18 亿、40 亿和 70 亿，可在单个消费级 GPU 上运行。

Nathan Ali (translated by Ninh Duy), Published 08/04/2025 🇺🇸 🇪🇸 ...

AI Open Source Chinese Tech

腾讯。一套新的紧凑型浑源模型： 0.这四种配置目前均已在 GitHub 和 Hug Face 上发布。所有四种配置现在都可以在 GitHub 和 Hugging Face 上找到，每种配置都可以在一块消费级显卡上运行推理，因此适合笔记本电脑、智能手机、智能舱室系统和其他资源有限的硬件。

尽管这些模型规模较小，但在语言理解、数学和推理方面，它们在多个公共基准测试中都取得了领先的成绩。腾讯将这些成绩归功于 "融合推理 "架构，该架构允许用户在快速思考模式和慢速思考模式之间进行选择，快速思考模式可获得简洁的答案，慢速思考模式可获得更复杂的多步骤推理。

一个关键的技术特点是原生的 256K 标记上下文窗口，足以一次性输入大约 500,000 个英文单词。腾讯重点介绍了腾讯会议和微信阅读等内部应用，在这些应用中，模型可以一次性解析整篇会议记录或整本书，为下游查询保留人物关系和情节细节。

这四种紧凑型 LLM 与 SGLang、vLLM 和 TensorRT-LLM 等主流推理框架集成，并支持多种量化格式。Arm、高通（Qualcomm）、英特尔（Intel）和联发科（MediaTek）的初步认可表明，即将推出针对各自客户端处理器进行优化的部署包。

早期使用案例强调了该版本的实用性。腾讯移动管理器报告了毫秒级垃圾邮件拦截功能，无需进行设备外数据传输。与此同时，腾讯智能车载助手中的双模方案平衡了机载功耗和对话深度。腾讯认为，这些例子表明，只要经过深思熟虑的设计，小型模型也能提供企业级的代理功能。

Editor of the original article: Nathan Ali - Tech Writer - 361 articles published on Notebookcheck since 2024

contact me via: @Painite6

Translator: Ninh Ngoc Duy - Editorial Assistant - 789638 articles published on Notebookcheck since 2008

> Notebookcheck中文版（NBC中国） > 新闻 > 新闻档案 > 新闻档案 2025 08 > 腾讯发布四款紧凑型开源浑源车型，参数分别为 0.5B、1.8B、4B 和 7B

Nathan Ali, 2025-08- 4 (Update: 2025-08- 5)

Related Articles