Notebookcheck Logo

腾讯发布四款紧凑型开源浑源车型,参数分别为 0.5B、1.8B、4B 和 7B

腾讯开源了浑源人工智能模型,发布了四个紧凑型开源语言模型(图片来源:腾讯)
腾讯开源了浑源人工智能模型,发布了四个紧凑型开源语言模型(图片来源:腾讯)
腾讯开源了浑源人工智能模型,发布了四个紧凑型语言模型,参数分别为 5 亿、18 亿、40 亿和 70 亿,可在单个消费级 GPU 上运行。
AI Open Source Chinese Tech

腾讯一套新的紧凑型浑源模型: 0.这四种配置目前均已在 GitHub 和 Hug Face 上发布。所有四种配置现在都可以在 GitHub 和 Hugging Face 上找到,每种配置都可以在一块消费级显卡上运行推理,因此适合笔记本电脑、智能手机、智能舱室系统和其他资源有限的硬件。

尽管这些模型规模较小,但在语言理解、数学和推理方面,它们在多个公共基准测试中都取得了领先的成绩。腾讯将这些成绩归功于 "融合推理 "架构,该架构允许用户在快速思考模式和慢速思考模式之间进行选择,快速思考模式可获得简洁的答案,慢速思考模式可获得更复杂的多步骤推理。

一个关键的技术特点是原生的 256K 标记上下文窗口,足以一次性输入大约 500,000 个英文单词。腾讯重点介绍了腾讯会议和微信阅读等内部应用,在这些应用中,模型可以一次性解析整篇会议记录或整本书,为下游查询保留人物关系和情节细节。

这四种紧凑型 LLM 与 SGLang、vLLM 和 TensorRT-LLM 等主流推理框架集成,并支持多种量化格式。Arm、高通(Qualcomm)、英特尔(Intel)和联发科(MediaTek)的初步认可表明,即将推出针对各自客户端处理器进行优化的部署包。

早期使用案例强调了该版本的实用性。腾讯移动管理器报告了毫秒级垃圾邮件拦截功能,无需进行设备外数据传输。与此同时,腾讯智能车载助手中的双模方案平衡了机载功耗和对话深度。腾讯认为,这些例子表明,只要经过深思熟虑的设计,小型模型也能提供企业级的代理功能。

(图片来源:腾讯)
(图片来源:腾讯)
(图片来源:腾讯)
(图片来源:腾讯)

资料来源

快速技术(中文)

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 08 > 腾讯发布四款紧凑型开源浑源车型,参数分别为 0.5B、1.8B、4B 和 7B
Nathan Ali, 2025-08- 4 (Update: 2025-08- 5)