Notebookcheck Logo
人工智能生成的图像中,一名男子穿着霓虹灯照亮的赛博朋克夹克,坐在时尚俱乐部的沙发上。他身后的电视上写着:"免费在你的电脑上生成图像"。(图片来源:AI Generated)

指南:如何在电脑上免费生成图像

CheckMag

想在电脑上生成图像而无需依赖云服务?本指南将指导您设置免费的开源工具,无需订阅即可实现完全的创意控制。
Rohith Bhaskar, Rohith Bhaskar (translated by Ninh Duy) Published 🇺🇸 🇵🇱 ...
AI GPU Nvidia Open Source

图像生成工具越来越能够创建最先进的逼真图像。但如果我告诉你,有一种方法可以在本地运行这些工具,而且比在线工具更加灵活呢?

前提条件

1) 至少拥有 8GB VRAM 的 Nvidia 显卡。(建议使用 RTX 3060 或更高版本)

2) 至少 16GB DDR4 系统内存。(内存越大越好)

3) Windows 10/11(需要 64 位操作系统)

4) 至少 100-150 GB 的可用硬盘空间,用于设置一切和下载模型。

5) 互联网连接,用于初始设置。(仅需用于下载和安装用户界面前端和图像模型)

注意:大多数用户界面前端不支持 AMD 或英特尔 GPU,需要使用变通方法才能运行。

首先要确保运行的是 Nvidia 为显卡提供的最新 studio 驱动程序。如果不确定安装的是 Nvidia GPU,请右键单击桌面上的任意位置,然后单击右键菜单中的 "NVIDIA 控制面板"。

Windows 11 中右键上下文菜单的屏幕,突出显示 Nvidia 控制面板。(图片来源:Windows 屏幕截图)
点击右键菜单中的 Nvidia 控制面板。(图片来源:Windows 屏幕截图)

现在,在打开的页面底部查找 "系统信息"。你应该能在左侧看到显卡的名称,如果需要,还能看到更多信息。

Windows 11 上 Nvidia 控制面板的截图,底部的 "系统信息 "显示为红色。 图片来源:Windows 屏幕截图
查看底部的 "系统信息"(图片来源:Windows 屏幕截图)
Windows 11 上 Nvidia 控制面板 "系统信息 "部分中的 Nvidia GPU 选项卡截图(图片来源:Windows 屏幕截图)
查找左侧 GPU 的名称。(图片来源:Windows 屏幕截图)

在此处打开 Nvidia 的官方驱动程序资源库查找 Nvidia Studio 驱动程序,然后点击下载。这将为你打开一个下载最新驱动程序的页面。现在,值得检查的是驱动程序是否支持你的 Nvidia 产品。点击下载按钮下方的 "支持的产品 "即可。安装驱动程序并重启电脑。

注意:这将覆盖已安装的游戏就绪驱动程序。如果您的系统主要用于游戏,您可能会看到游戏性能降低。

太好了第一步已经完成。现在,我们可以进入有趣的环节,比如下载用户界面前端。我强烈推荐下载并安装 Stability Matrix。它是一款多合一的维护工具,支持多个用户界面前端并自动保持更新。它甚至还能为模型和输出创建共享文件夹,让你可以在一个地方查看。

GitHub 页面,向下滚动到 readme 部分,查找你的操作系统。Stability Matrix 还提供 Linux 和 Mac 版本的下载。在本指南中,我们将使用 Windows 版本。

Stability Matrix 的 GitHub 页面截图,其中突出显示了下载 Windows 10/11 的按钮。(图片来源:Windows 屏幕截图)
点击 Windows 10/11 按钮下载 Stability Matrix。(图片来源:Windows 屏幕截图)

单击操作系统按钮,系统会提示您下载 .zip 文件。.应将该文件放在要安装 Stability Matrix 的硬盘上。确保硬盘上至少有 100-150 GB 的可用空间。这不仅是为了安装 Stability Matrix,也是为了下载所需的模型、文本编码器和其他系统文件。这些文件很快就会增加。

下载文件后,解压缩并运行解压缩文件夹中的 StabilityMatrix.exe。它会自动下载所有需要的文件,并为您设置界面。

太棒了我们现在有了下载和安装多个用户界面前端的界面。

现在,是时候决定你要使用的前端了。前端是一种图形用户界面 (GUI),可让您与图像模型交互、操作设置,更重要的是,还能生成图像。

查找底部的 "添加软件包 "按钮,点击后会出现各种选项。

Windows 11 上 "Stability Matrix "界面的截图,"套餐 "按钮上的红色高亮显示。(图片来源:Windows 屏幕截图)
点击左侧的软件包图标。(图片来源:Windows 屏幕截图)
Windows 11 上的 Stability Matrix 界面截图,添加软件包按钮上的红色高亮显示。(图片来源:Windows 屏幕截图)
点击底部的添加软件包(图片来源:Windows 屏幕截图)

以下是 Stability Matrix 提供的快速选项列表。

1)Stable Diffusion WebUI Forge

2)Stable Diffusion WebUI Forge - Classic

3)ComfyUI(推荐)

4)Foooocus

5)Foooocus - mashb1t 的 1-Up 版

6)Stable Diffusion WebUI

7)SwarmUI

8)Cogstudio

9)Stable Diffusion WebUI UX

10)RuinedFooocus

11)SD.Next

12)SDFX

13)InvokeAI

我个人强烈推荐使用 ComfyUI。这是一个基于节点的可视化应用程序,刚开始可能会有点吓人,但使用起来却出奇的容易。请记住,Stability Matrix 可以管理多个前端,所以你不必局限于一个。你可以尝试找到最适合自己的前端。

使用上面的列表并导航到每个软件包的 GitHub 页面。在做出选择之前,请慢慢了解每个软件包。

在本指南中,我将指导你下载和安装 ComfyUI 以及一些有用的扩展,它们应该能很好地满足你的需求。

安装和设置 ComfyUI

打开 Stability Matrix 并点击 "Add Package(添加软件包)"按钮。现在在提供的软件包列表中找到 "ComfyUI "并点击。在打开的页面上,确保在下拉框中选择了 "master"。主版本 "是最稳定的版本,建议大多数用户使用。

在 Stability Matrix 中安装 ComfyUI 集线器的截图,构建选择下拉菜单上的红色高亮显示。(图片来源:Windows 屏幕截图)
确保在下拉菜单中选择了母版。(图片来源:Windows 屏幕截图)

点击安装后,Stability Matrix 将开始为您下载软件包。等待下载完成即可。下载可能需要几分钟时间,请继续使用你的系统。如果下载框关闭或您不小心按了 "隐藏 "键,请使用底部的下载按钮查看当前的下载状态。

Stability Matrix 界面截图,红色高亮显示下载按钮。(图片来源:Windows 屏幕截图)
点击此按钮可查看正在进行的下载。(图片来源:Windows 屏幕截图)

安装完成后,你应该会在系统托盘上看到一个弹出通知,告知你 ComfyUI 已准备就绪可以使用。

返回 "软件包",你会在页面上看到 ComfyUI 磁贴,但先不要启动它。ComfyUI 默认设置为在 12GB 或更高 VRAM 的 GPU 上以正常 VRAM 模式启动。如果你使用的是 8GB VRAM 显卡,现在是强制 Comfy 以低 VRAM 模式启动的好时机。

Stability Matrix 软件包中心的截图,其中 ComfyUI 磁贴上的设置以红色突出显示。(图片来源:Windows 屏幕截图)
点击设置图标。(图片来源:Windows 屏幕截图)

点击中间的设置齿轮,向下滚动找到 VRAM 部分。选择"--lowvram "并点击保存。

稳定矩阵上 ComfyUI 磁贴内的设置菜单截图,低 vram 高亮显示。(图片来源:Windows 屏幕截图)
选择"--lowvram "并点击保存。(图片来源:Windows 屏幕截图)

接下来,我们需要安装 ComfyUI 管理器。它是一个关键组件,可让您安装和管理应用程序中的各种自定义节点。点击右侧的 Jigsaw 图标,在 "可用扩展 "部分输入 "ComfyUI-Manager"。选择它,然后点击底部的 "安装"。安装完成后,你应该会看到"(已安装)"字样。现在,我们就可以启动 ComfyUI 了。

稳定矩阵上 ComfyUI 磁贴中拼图图标的截图。(图片来源:Windows 屏幕截图)
点击拼图图标,弹出扩展菜单。(图片来源:Windows 屏幕截图)
Stability Matrix 中 ComfyUI 可用扩展菜单的截图。(图片来源:Windows 屏幕截图)
选择 ComfyUI-Manager 并点击安装(图片来源:Windows 屏幕截图)

启动 ComfyUI,让它完成启动过程。启动完成后,它将自动在默认浏览器的新标签页中打开。如果没有打开,请返回到 "软件包 "选项卡,然后点击 ComfyUI 绿色磁贴上的 "WebUI"。

稳定性矩阵中绿色 ComfyUI 磁贴的截图,WebUI 选项以红色突出显示。 图片来源:Windows 屏幕截图
点击 WebUI 按钮,在默认浏览器中打开 ComfyUI 界面。(图片来源:Windows 屏幕截图)

恭喜您你现在已经完成了所有的先决条件。现在,让我们进入正题,下载和使用图像模型。

下载和使用第一个图像模型

在开始下载图像模型之前,我们先来了解一下你应该熟悉的术语表。

1) UNET/检查点/扩散模型/扩散器 - 大老板。它是操作的大脑,可以把它想象成用你的文字作画的艺术家。

2) Tokenizer - 计时器。在文本编码器接手之前,他们会将您的提示转换成标记嵌入其中。根据不同的模式,您可以使用的标记(单词)数量会有一定的限制。

3) 文本编码器/CLIP--重型设备。它们将文本提示转换为 UNET 可以理解的数字输入。

4) 采样器 - 总指挥。迭代引导图像生成过程,将图像从噪声细化为最终输出。

5) VAE - 清理人员。他们在生成阶段之后清理噪点,帮助提高图像质量。

现在,您在旅途中还会遇到更多的术语,但这些都是基本术语,从现在起,它们将决定一切。现在还不用太担心去详细了解它们。

ComfyUI 中工作流程菜单的截图,其中 "浏览模板 "突出显示。(图片来源:Windows 屏幕截图)
选择浏览模板选项。(图片来源:Windows 屏幕截图)

启动 ComfyUI,它会打开一个干净的工作流程窗口。点击左上角的 "工作流程",然后点击 "浏览模板"。

ComfyUI 中工作流程中心的截图,其中基础知识和图像生成突出显示。(图片来源:Windows 屏幕截图)
单击基础知识,然后单击图像生成。(图片来源:Windows 屏幕截图)

这将打开一个窗口,显示已经为您设置好的工作流程示例。点击 "基础",然后点击 "图像生成"。您会立即在屏幕上看到一个错误,提示您缺少模型。这是因为我们还没有下载图像模型。让我们继续下载吧。点击下载。

ComfyUI 中错误菜单的截图,其中下载按钮突出显示。(图片来源:Windows 屏幕截图)
下载丢失的检查点。(图片来源:Windows 屏幕截图)

在下载文件的同时,让我们来谈谈您将看到的各种型号之间的一些区别。我们现在下载的是Stable Diffusion 1.5基本模型。在 ComfyUI 的画布中,您可能会注意到第一个 "加载检查点 "节点上有三个独立的连接。分别是 MODEL、CLIP 和 VAE。

ComfyUI 中加载检查点节点的特写。(图片来源:Windows 屏幕截图)
加载检查点的所有三个输出都连接到工作流程上的一个节点。(图片来源:Windows 屏幕截图)

这是因为这三个检查点都包含在这个基础检查点中,您不需要为这个特定模型单独使用 CLIP 和 VAE。

但较新的图像模型,如FluxHiDream等,需要单独下载,因此请记住这一点。值得庆幸的是,这些模型都有类似的示例模板,因此您不必担心如何设置一切。我们稍后再讨论这个问题。现在,让我们生成第一张图片。

现在,如果你点击右下角的运行按钮,你会发现 ComfyUI 仍然提示错误。这是因为模型需要放在正确的文件夹中,Comfy 才能识别它。现在,进入文件资源管理器中下载模型的文件夹并复制它。

你会发现文件名的扩展名是".SAFETENSORS"。这是文件使用的格式。一般来说,只下载扩展名为 .safetensors 的文件。不要下载 pickle tensors 或 .pth。相信我!

打开安装 Stability Matrix 的文件夹,查找名为 "Models "的文件夹。双击该文件夹,找到名为 "StableDiffusion "的子文件夹,粘贴其中的 .safetensors 文件。

供今后参考。包含 CLIPS 和 VAE 的模型应放在 "StableDiffusion "文件夹中。仅包含 UNET(无 CLIP 或 VAE)的模型将放在 "DiffusionModels "文件夹中。文本编码器(T5、Llama、CLIP L、CLIP G)需要放在 "TextEncoders "文件夹中。最后,您的 VAE 文件需要放在 "VAE "文件夹中。

正如你可能看到的,除了这三个文件夹,还有很多其他文件夹。我的建议是,到时候再想办法。现在,让我们来关心一下我们的图像。

ComfyUI 中 "加载检查点 "下拉菜单的特写。(图片来源:Windows 屏幕截图)
在下拉菜单中选择 "v1-5-pruned-emaonly-fp16"。(图片来源:Windows 屏幕截图)

刷新浏览器中的 ComfyUI 网页。点击 "加载检查点 "节点中的对话框,选择下载的文件。

由于这是一个模板,一切都已为您设置好。不过,还是值得了解一下未来工作流程的基本基础。让我们从左边开始。我们已经讨论过加载检查点节点,它旁边有两个 "CLIP 文本编码(提示)"节点。

最上面的是正面提示,也就是你想在图像中看到的内容。下面是负面提示或您不想在最终输出中看到的内容的输入。生成图像就是这两个节点的平衡结合。您可以创建一幅图像,检查您不喜欢的地方,然后将其输入到否定提示中。现在,我们已经输入了这些内容,所以让我们点击 "运行"。

ComfyUI 是一个可视化界面,也就是说,你可以看到一个节点一个节点地进行。文本编码完成后,就会发送到 "KSampler",由它开始迭代图像。让我们快速浏览一下该节点中的所有设置。

1) 种子:将其视为图像的地址。相同的正向提示 + 反向提示 + 相同的设置 + 相同的种子 = 相同的图像。对图像的再现和迭代非常有用。

2) 生成后控制:决定种子是在每次生成后随机化还是保持固定。

3) 步数:KSampler 应迭代的步数。大多数模型都有推荐步数。

4) CFG:模型对提示的响应速度。较高的值 = 严格遵守提示,但创造性较低。较低的值 = 更有创造力的输出,但要以遵守提示为代价。

5) Sampler_name(采样器名称):当前使用的采样器名称。点击下拉菜单查看更多选项。尝试使用不同的设置和采样器,以获得不同的输出结果。

6) 调度器:将其视为副手,负责提出指挥批准的策略。同样,尝试使用不同的采样器和调度器,找到适合自己的。

7)去噪:确定在生成过程开始时添加的噪音量。采样器会反复去除噪音。该值不能超过 1.00,低于 1.00 的值(0.45 或 0.65)主要用于图像到图像、细化或内绘工作流程。

ComfyUI 中 KSampler 节点的特写。(图片来源:Windows 屏幕截图)
KSampler 的 "latent_image "输出连接到工作流程上的 "Empty Latent Image "节点。(图片来源:Windows 屏幕截图)
ComfyUI 中空潜像节点的截图。(图片来源:Windows 屏幕截图)
空潜影决定了最终输出的大小。(图片来源:Windows 屏幕截图)

KSampler 节点左侧的 latent_image 输入决定了图像的大小。在工作流程中,它连接到一个 "空潜在图像 "节点,该节点的分辨率为 512x512,批量大小(一次运行中生成的图像数量)为 1。

一个人工智能生成的瓶子,里面有一个星系,放在一张普通的木桌上。(图片来源:人工智能生成)
我们使用生成设置的第一张图片。(图片来源:人工智能生成)

现在,你们看看这个!我们的第一张图片。如果你已经做到了这一步,那么恭喜你!你现在已经了解了图像生成的基础知识。你尝试得越多,就会发现越多,这个兔子洞很深。请尽情享受吧。

实用链接

CivitAI:您下载模型、LoRA、嵌入式等内容的一站式商店。(注意:包含 NSFW 内容,请使用内置网站过滤器)。

Monzon Media:初级和高级 ComfyUI 教程的绝佳资源。

ComfyUI 维基百科:满足您的所有故障排除需求。

Bad ASS ComfyUI 资源列表:您可能需要的所有 Base MODEL、CLIP 和 VAE 的链接。

Comfy 工作流程:分享和下载工作流程的专门社区。

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 07 > 指南:如何在电脑上免费生成图像
Rohith Bhaskar, 2025-07- 9 (Update: 2025-07- 9)