CheckMag | 没有 GPU，没问题。托管自己的 LLM 比大公司的审查产品有趣得多，而且效果出奇的好。

ⓘ Notebookcheck / KoboldCPP

虽然速度不是最快的，但在没有 GPU 的情况下也可以使用，而且至少可以让您随时掌控数据。

无论您是要举办 D&D 活动、排除代码故障、产生创意、创建 NSFW 内容，还是要绕过大公司设置的护栏，使用 KoboldCPP 托管您自己的 LLM 都很容易，而且即使没有 GPU 也能出奇地运行良好。

David Devey, 👁 David Devey (translated by DeepL / Ninh Duy), Published 03/29/2026 🇺🇸 🇩🇪 ...

AI Open Source Server/Datacenter Software

Opinion by David Devey

Views, thoughts, and opinions expressed in the text belong solely to the author.

当你查询人工智能时，你的数据究竟会发生什么变化，谁也说不准，但无论发生什么变化，它肯定都不再属于你了。

与图像和视频生成之外，如果你热衷于大型语言模型（LLM）的实验，但又不想把数据交给大型科技公司，那么托管自己的数据是一件非常容易的事情，而且与大型公司相比有很多优势。

首先，无论您选择用它来做什么，您的所有数据都在您的控制之下，如果您不想把数据交给Mechahitler，这一点就是立竿见影的优势。，这就是一个立竿见影的好处。您还可以使用几乎任何您喜欢的模型，无论是 Deepseek、Gemma2 还是 GPT，而且还可以使用不限制查询类型的版本。

KoboldCPP 是一款易于使用、可单次执行的人工智能文本生成工具，设计用于运行 GGUF 和 GGML 大型语言模型。它支持 GPU 和 CPU，可作为人工智能讲故事和聊天的专用后端。KoboldCPP 可从 GitHub下载，适用于 Windows、Linux、Mac OS 和 Linux。可用于 Windows、Linux、Mac 或 Docker。

通过在容器中托管，可以轻松地将 LLM 暴露给网络上的每台设备，而且还为包括 Unraid 和 TrueNAS 在内的主要平台预制了模板。只要在防火墙中添加必要的规则，其他安装方式也能实现同样的效果。

入门

一旦决定了所选的平台，就需要确定使用哪种模式。抱抱脸是寻找模型的最佳地点，而且模型必须是 GGUF 格式。

如果您打算主持 D&D 场景，您肯定需要一个未经审查的模型，否则 LLM 最终会拒绝伤害任何角色，并可能产生不良结果。不良结果。

有些模型，如Deepseek和Claude等模型有 "思考 "倾向，基本上会将查询的整个思维过程都喷出来。如果使用 GPU 来完成繁重的工作，这种情况可能还好，但如果没有 GPU，处理速度就会大大降低。您必须尝试各种模型才能找到适合您的，但Gemma2是一个很好的开始。

找到文件页面，复制链接到 GGUF 文件的 URL。许多模型都有多种尺寸，因此您需要根据可用内存的限制来选择合适的尺寸。

Unraid docker 模板只需做两处改动即可启动。如果运行时没有 GPU，请移除 GPU 标志，并粘贴 Huggingface 中的 GGUF 文件链接

Windows 上的安装大致相同。不过，如果不使用 GPU，则需要下载NoCUDA版本。由于 KoboldCPP 会先下载模型，然后才显示界面，因此启动可能需要一些时间。在 Windows 上，这一点显而易见，但在 Unraid 或 TrueNAS 上，您必须打开日志才能看到下载进度。在 Unraid 上，您可能需要增加Docker 容器的可用存储空间，这取决于您选择的模型有多大。

KoboldCPP 提供 4 种不同的界面模式，包括指导、故事、聊天和冒险。

Instruct 用于向 LLM 下达指令，chat 类似于聊天机器人，story 适合小说式写作，而 adventure 则最适合 RPG 类型的互动小说。

虽然速度不是最快的，但文本生成速度略低于平均阅读速度。在 16 核 AMD 5950x（亚马逊有售）上运行时，完全可以满足 D&D 场景的需要，在更现代的 CPU 上运行速度可能会更快。内核越多越好，内存越大越好，这样可以运行更大的机型，不过 16GB 应该没问题。机型的大小和类型也会对生成速度产生重大影响，选择更轻便的机型可以显著提高整体速度。

显然，要获得最佳体验，使用 GPU 运行大型语言模型是最佳选择，不过，如果您热衷于尝试托管自己的模型，绕过 ChatGPT、Claude 或 Gemini 的限制或数据隐私影响，您不需要任何高级硬件即可开始使用，而且还能获得不错的体验。

资料来源

LostRuins/KoboldCPP via Github,《卫报,Huggingface,forums.unraid.net,Reddit/LocalLLama,Silly Workshop（通过 YouTube）

Previous article

vivo X300 Ultra 上手体验：蔡司摄像头比 vivo X200 Ultra 更厚

Next article

堡垒之夜》"胜利杯 "提高了排名参赛门槛，并提供了丰厚的现金奖励

Add as a preferred source on Google

Related Articles

David Devey

Editor of the original article: David Devey - Magazine Writer - 121 articles published on Notebookcheck since 2023

DeepL / Ninh Duy

Translator: Ninh Ngoc Duy - Editorial Assistant - 763966 articles published on Notebookcheck since 2008

contact me via: Facebook

> Notebookcheck中文版（NBC中国） > 新闻 > 新闻档案 > 新闻档案 2026 03 > 没有 GPU，没问题。托管自己的 LLM 比大公司的审查产品有趣得多，而且效果出奇的好。

David Devey, 2026-03-29 (Update: 2026-03-29)