Notebookcheck Logo

韩国初创公司称其 "人工智能科学家 "性能优于双子座 2.5 Pro 和克劳德 Opus 4

Scinapse 与竞争对手的对比示意图(图片来源:Google、Anthropic 和 Pluto Labs;已编辑)
Scinapse 与竞争对手的对比示意图(图片来源:Google、Anthropic 和 Pluto Labs;已编辑)
冥王星实验室(Pluto Labs)宣布了一项令人惊讶的新进展,称其 Scinapse 人工智能的性能优于谷歌和 Anthropic 的模型,而成本仅为它们的一小部分。这一消息引起了业界的热议,全世界都在等待它的正式发布和独立验证。
Business AI Science

在打造真正的 "人工智能科学家 "的竞赛中,韩国初创公司发布了一款新机型,声称只需竞争对手十分之一的计算成本,就能实现卓越的性能。冥王星实验室(Pluto Labs)的 Scinapse AI 挑战了高级人工智能的成功需要大量暴力计算能力的观念。

Pluto Labs 称,其 "战略效率 "架构是成功的关键--Schinapse AI 将文献综述等数据密集型任务委托给现有的学术搜索平台。这种设计使核心人工智能能够专注于创造性推理,并产生新颖、可测试的想法。

根据一项自我报告的盲测,该公司夸耀说,其人工智能在 "可信度 "和 "可测试性 "方面一直名列第一,与谷歌和Anthropic公司的顶级模型相比,在61个不同的科学主题上都是如此。冥王星实验室声称,这证明其人工智能提供的是 "可操作的科学研究",而不是 "似是而非的虚构"。据说,为了防止人工智能产生幻觉,该系统严格以包含 2.6 亿篇学术论文的数据库为基础。盲测由 3 个相互竞争的人工智能模型进行评判:Gemini 2.5 Pro、Clause Opus 4 和 OpenAI o3。

一家韩国小型初创公司在客观基准测试中证明优于谷歌,这不仅仅是一项技术成就,更是创新领导力的象征性事件。- Hashed 首席执行官西蒙-金(Simon Kim

冥王星实验室计划本季度在全球推出 Scinapse AI。科技界将密切关注独立基准测试,以验证该公司的豪言壮语。

资料来源

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 07 > 韩国初创公司称其 "人工智能科学家 "性能优于双子座 2.5 Pro 和克劳德 Opus 4
Chibuike Okpara, 2025-07-17 (Update: 2025-07-17)