腾讯。一套新的紧凑型浑源模型: 0.这四种配置目前均已在 GitHub 和 Hug Face 上发布。所有四种配置现在都可以在 GitHub 和 Hugging Face 上找到,每种配置都可以在一块消费级显卡上运行推理,因此适合笔记本电脑、智能手机、智能舱室系统和其他资源有限的硬件。
尽管这些模型规模较小,但在语言理解、数学和推理方面,它们在多个公共基准测试中都取得了领先的成绩。腾讯将这些成绩归功于 "融合推理 "架构,该架构允许用户在快速思考模式和慢速思考模式之间进行选择,快速思考模式可获得简洁的答案,慢速思考模式可获得更复杂的多步骤推理。
一个关键的技术特点是原生的 256K 标记上下文窗口,足以一次性输入大约 500,000 个英文单词。腾讯重点介绍了腾讯会议和微信阅读等内部应用,在这些应用中,模型可以一次性解析整篇会议记录或整本书,为下游查询保留人物关系和情节细节。
这四种紧凑型 LLM 与 SGLang、vLLM 和 TensorRT-LLM 等主流推理框架集成,并支持多种量化格式。Arm、高通(Qualcomm)、英特尔(Intel)和联发科(MediaTek)的初步认可表明,即将推出针对各自客户端处理器进行优化的部署包。
早期使用案例强调了该版本的实用性。腾讯移动管理器报告了毫秒级垃圾邮件拦截功能,无需进行设备外数据传输。与此同时,腾讯智能车载助手中的双模方案平衡了机载功耗和对话深度。腾讯认为,这些例子表明,只要经过深思熟虑的设计,小型模型也能提供企业级的代理功能。
资料来源
快速技术(中文)
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名