- Agent Scheduler(代理调度器):一个用于排队和跟踪任务历史的工具,使得管理生成任务变得井井有条。
- TemporalKit(时间稳定工具包):这是一个全能解决方案,通过一个自动化扩展,为Stable Diffusion渲染添加时间稳定性,保持连续帧之间的流畅过渡。
- ua UA Localization(乌克兰语本地化):提供对Stable Diffusion界面的乌克兰语本地化,使得乌克兰用户能够更便捷地使用。
- Batch Checkpoints and Prompts(批处理检查点与提示):允许用户对基础提示进行测试,并为不同的检查点提供定制化的提示模板,提高实验的效率和效果。
- Kandinsky(坎丁斯基脚本):加入一个脚本,可以运行坎丁斯基2.X版本,可能用于在生成过程中添加艺术风格或图案。
- Txt/Img to 3D Model(文本/图像转3D模型):这是一个集成了OpenAI Shape-E的扩展,允许用户仅通过文本描述或图像就能生成3D模型,为创意提供了更多维度。
- sd-webui-openpose-editor(sd-webui开放姿势编辑器):为ControlNet集成了openpose编辑器,完整支持手和面部的高级编辑功能。
- sd-webui-segment-anything(sd-webui一键分割):通过点击或文本提示,自动为Stable Diffusion WebUI生成高质量的图像分割/遮罩,用于优化图像的详细部分处理。
- Stable Diffusion AWS Extension(Stable Diffusion AWS扩展):使用户能够将包括检查点合并、模型训练和模型推断在内的工作负载迁移到AWS云服务,为大规模生产环境提供支持。
- Aesthetic Gradients(审美渐变):让用户可以从一张或少数几张图片中训练出一个嵌入模型,这个嵌入模型专门用于为生成的图像应用特定的风格,创造出美学上更加吸引人的作品。
- Dreambooth:基于Shivam Shiaro的代码库,优化了对低VRAM GPU的支持,用于个性化模型训练。
- training-picker(训练选择器):在WebUI中添加一个标签页,用户可以自动提取视频关键帧,并手动提取512x512大小的画面作为模型训练的素材。
- Dataset Tag Editor(数据集标签编辑器):一个功能丰富的UI工具,方便查看、搜索、筛选和编辑图像。
- DreamArtist(梦想艺术家):通过对比提示调优,朝着可控的一次性文本到图像生成迈进。
- Hypernetwork-Monkeypatch-Extension(超网络猴子补丁扩展):提供额外的超网络训练特性,并支持使用多个超网络进行推断。
- Custom Diffusion(自定义扩散):一种精简的微调方法,相比全模型微调,速度相似且需要的步骤更少,但能获得更好的结果。
- Smart Process(智能处理):一个智能预处理工具,包括自动识别主体、交换字幕主体、图像放大和面部修复。
- Embeddings editor(嵌入编辑器):手动编辑文本逆向嵌入编码,帮助用户精确控制生成图像的风格和内容。
- Merge Board(合并面板):支持多达10路的模型合并,可以保存和加载合并设置,以简单文本形式操作。
- Model Converter(模型转换器):将模型转换为更高效的格式,比如fp16或bfloat16,以支持没有ema(指数移动平均)的安全传感器。
- Model Converter(模型转换器):将深度学习模型转换为更为高效的格式,以适应没有ema(指数移动平均)的安全传感器,以及进行模型的转换、复制和删除操作。
- Kohya-ss Additional Networks(Kohya-ss额外网络):允许Web UI使用LoRAs(1.X和2.X版本)生成图像,并允许编辑.safetensors网络的提示元数据。
- Merge Block Weighted(加权合并块):实现不同的U-Net块(输入、中间、输出)使用不同速率的模型合并。
- Embedding Merge(嵌入合并):在运行时合并文本逆向嵌入,支持从字符串文本中提取短语和权重值。
- SuperMerger(超级合并器):无需保存到磁盘即可合并运行,支持顺序XY合并生成,提取并合并loras,绑定loras到ckpt,合并块权重等。
- LoRA Block Weight(LoRA块权重):即时应用LoRA(局部重建Attention)强度,包括预设、权重分析、随机化、XY图表。
- Image browser(图像浏览器):为Web浏览器提供一个界面,用于浏览创建的图像。
- Infinite image browsing(无限图像浏览):一个快速的图像浏览器,允许无分页地浏览所有图像,并支持使用图像参数联合搜索,界面类似VS Code。
- Inspiration(灵感):随机显示艺术家或艺术流派典型风格的图片,让你在创作时无需担心如何选择正确的艺术风格。
- Artists to study(研究的艺术家):展示按类别分隔的艺术家生成图片的画廊。
- Prompt Gallery(提示库):构建一个填充了你角色的提示的yaml文件,点击生成,并快速通过它们的词语属性预览。
- Prompt Gallery(提示画廊):创建一个包含角色提示的yaml文件,一键生成并快速预览它们的属性。
- Infinity Grid Generator(无限网格生成器):根据选定参数构建yaml文件,生成无限维度的网格,并能添加描述性文本。
- Config-Presets(配置预设):添加一个可配置的下拉菜单,让你在文本到图像和图像到图像的选项卡中更改UI预设设置。
- Preset Utilities(预设工具):为用户界面提供预设实用工具,支持自定义脚本(有限度)。
- openOutpaint extension(开放式外部绘制扩展):带有完整openOutpaint用户界面的标签,使用
--api
标志运行。 - quick-css(快速CSS):一个快速选择和应用custom.css文件的扩展,用于自定义界面中元素的外观和位置。
- Aspect Ratio selector(宽高比选择器):添加图像宽高比选择按钮。
- Nevysha’s Cozy Nest(Nevysha的温馨巢穴):为Auto1111的webui提供了改进的用户界面和用户体验的扩展。
- Cappuccino Theme(卡布奇诺主题):添加多种自定义主题。
- Bilingual Localization(双语本地化):无需担心如何找到原始按钮的双语翻译,兼容语言包扩展,无需重新导入。
- Dynamic Prompts(动态提示):实现了一种表达式模板语言,用于随机或组合式的提示生成,支持深层通配符目录结构。
- Unprompted(无需提示):这个工具允许你在提示中包含多种快捷方式,可以从文件中提取文本,设置自己的变量,处理文本通过条件函数等——它就像在激素上的通配符。现在它包括了诸如硬提示之类的整合。
- StylePile(风格堆叠):一个简单的方法,用于混合和匹配影响结果风格的提示元素。
- Booru tag autocompletion(Booru标签自动完成):显示图像板如Danbooru的标签自动完成提示,并包含一个配置以便定制。
- novelai-2-local-prompt(novelai本地化提示转换):在WebUI中添加一个按钮,将在NovelAI中使用的提示转换为WebUI中的使用,并允许回忆以前使用的提示。
- tokenizer(分词器):添加一个标签,让你预览CLIP模型将如何对你的文本进行分词。
- Randomize(随机化):在文本到图像生成过程中允许使用随机参数,此脚本可以与其他脚本一起工作。原作者为https://git.mmaker.moe/mmaker/stable-diffusion-webui-randomize。
- conditioning-highres-fix(高清修正条件):这是一个用于重新编写Inpainting条件掩膜强度相对于降噪强度的扩展,适用于运行时,这对于Inpainting模型如sd-v1-5-inpainting.ckpt非常有用。
- model-keyword(模型关键词):自动将匹配的关键词插入到提示中。更新此扩展以获取最新的模型关键词映射。
- Prompt Generator(提示生成器):使用distilgpt2从一个小基础提示生成一个提示,添加了一个标签以额外控制模型。
- Promptgen(提示生成):使用变压器模型生成提示。
- Prompt Generator(提示生成器):从一个基础提示出发,利用distilgpt2模型生成更详细的提示,并附带模型控制选项。
- Promptgen(提示生成工具):使用变压器模型为图像内容生成详细提示。
- text2prompt(文本转提示):利用数据库和模型为动漫标签生成提示,为想要创建特定动漫风格的图像提供方便。
- Prompt Translator(提示翻译器):集成的翻译器,可用DeepL或百度翻译提示内容,使非英语用户易于生成图像。
- Deforum(Deform扩展):Deform官方扩展,用于2D和3D动画的广泛脚本,支持关键帧序列、动态数学参数调整、深度估计和变形。
- Animator(动画师):基本的img2img脚本,能导出视频文件,适合创建有趣的变形动画。
- gif2gif(GIF到GIF):一个专门为img2img任务提取GIF帧并重新组合成动画GIF的脚本。
- Video Loopback(视频回放):一种试图改善普通vid2vid脚本时间一致性和灵活性的video2video脚本。
- seed travel(种子旅行):为AUTOMATIC1111/stable-diffusion-webui创建在种子之间存在的图像的小脚本。
- shift-attention(注意力转移):生成一系列图像,在提示中转移注意力,并随后生成从一个提示到另一个提示的图像序列。
- prompt travel(提示旅行):AUTOMATIC1111/stable-diffusion-webui的扩展脚本,在潜在空间中的提示之间旅行。
- Steps Animation(步骤动画):从去噪中间步骤创建动画序列。
- Steps Animation(步骤动画):从图像降噪处理的中间步骤创建动画序列,呈现图像生成的过程。
- auto-sd-paint-ext(自动SD绘图扩展):一个Krita插件,可自动化Stable Diffusion的绘图过程。
- Batch Face Swap(批量面部交换):自动检测并替换图像中的人脸。
- Depth Maps(深度图):生成深度图、立体图像、3D网格和视频的扩展工具。
- multi-subject-render(多主体渲染):一个深度感知的扩展,可在单个图像中创建多个复杂主体,生成背景后,对前景主体进行深度分析并粘贴到背景上,完成图像。
- depthmap2mask(深度图转遮罩):基于MiDaS深度估计生成的遮罩,为img2img任务创建遮罩。
- ABG_extension(自动背景移除扩展):自动移除图像背景的工具,专为动漫图像优化,使用GPU加速。
- Pixel(像素化工具):快速轻松地执行图像的下采样、颜色限制和其他有用的像素效果。
- Pixelization(像素化效果):使用预训练模型,在额外标签中制作像素艺术风格的图像。
- haku-img(haku图像工具):一个图像工具扩展,提供混合、分层、色彩调整、模糊和素描效果,以及基本的像素化处理。
- Asymmetric Tiling(非对称平铺):一个始终可见的脚本扩展,用于配置X轴和Y轴独立的无缝图像平铺。
- Latent Mirroring(潜在镜像):应用镜像和翻转到潜在图像中,创造从精细平衡的构图到完美反射的效果。
- Sonar(声纳):提升生成图像的质量,通过搜索邻近区域中类似(甚至更优质)的图像,专注于单个提示的优化而不是多重提示的转换。
- Depth Image I/O(深度图像输入/输出):一个扩展,允许管理Stable Diffusion深度2Img模型的自定义深度输入。
- Ultimate SD Upscale(终极SD放大):为SD Upscale提供更高级的选项,使用更高的降噪比率(0.3-0.5)减少原版放大时的失真。
- Prompt Fusion(提示融合):加入prompt-travel和shift-attention式的内插,但在采样步骤中或之内进行,始终开启且与现有的子提示兼容。
- Neutral Prompt(中性提示):加入新的关键词以操纵噪声混合和提示交互,允许以层级方式组织提示,而不是平面列表。
- Dynamic Thresholding(动态阈值):加入可定制的动态阈值以允许在没有出现‘燃烧’/‘流行艺术’效果的情况下使用高CFG尺度值。
- anti-burn(防烧伤):通过跳过一些最后的步骤并将前面的一些图像平均在一起,来平滑生成的图像。
- sd-webui-controlnet(Stable Diffusion WebUI ControlNet):ControlNet的WebUI扩展。(工作进行中),不要期望种子可重现性——随着更新可能会发生变化。
- Latent Couple(潜在配对):一个内建的可组合扩散扩展,允许你决定反映你子提示的潜在空间区域。
- Composable LoRA(可组合LoRA):启用AND关键词(composable diffusion)以将LoRAs限制于子提示。与Latent Couple配合使用时很有用。
- Auto TLS-HTTPS(自动TLS-HTTPS):让你更容易地,甚至完全自动地开始使用HTTPS。
- booru2prompt(Booru转提示):这个Stable Diffusion扩展让你能够将来自各种图像板的帖子转换成Stable Diffusion的提示,可以直接通过API获取,也可以复制粘贴链接自行操作。
- Gelbooru Prompt(Gelbooru提示):从Gelbooru保存的图片获取标签,并转换成Stable Diffusion的提示。
- e621 Prompt(e621提示):请求e621图像的标签并将其转换为提示。
- NSFW checker(成人内容检测器):自动替换不适宜内容(NSFW)图像为黑色图像。
- Diffusion Defender(扩散防护器):为半私密和公共实例提供提示黑名单,查找和替换功能。
- DH Patch(DH补丁):DBahazard随机补丁。自动加载v2, 2.1模型的YAML配置文件;修复潜在注意力漂移以适应2.1模型;以及DBahazard可能想出的其他内容。
- Riffusion(Riffusion扩展):使用Riffusion模型在Gradio中产生音乐,通过输入提示旅行扩展的输出帧到riffusion标签来复制原始插值技术。
- Save Intermediate Images(保存中间图像):在采样过程中保存中间图像,你还可以从中间图像制作视频。
- Add image number to grid(图像编号添加到网格):在网格中给图像添加编号。
- Multiple Hypernetworks(多重超网络):添加同时应用多个超网络的能力。按顺序、用不同的权重同时应用多个超网络。
- System Info(系统信息):WebUI的系统信息标签,显示服务器的实时信息。也支持发送众包推理数据作为一个选项。
- OpenPose Editor(OpenPose编辑器):可以添加多个姿势角色,从图像检测姿势,保存为PNG格式,然后发送给ControlNet扩展。
- Stable Horde Worker(Stable Horde工作节点):为Stable Horde提供工作节点,使用你的电脑为其他用户生成图片,请查看说明了解更多。
- Stable Horde Client(Stable Horde客户端):利用其他用户的PC生成图片的客户端,如果你没有GPU,这将非常有用。
- Discord Rich Presence(Discord丰富状态):提供连接到Discord RPC的功能,用户个人资料中会显示一个精美的表格。
- mine-diffusion(我的扩散):这个扩展可以将图像转换成方块,并创建方案,以便轻松导入到Minecraft中,使用Liteloader模块。
- Aesthetic Image Scorer(美感图像评分器):利用CLIP+MLP美学评分预测器为生成的图像计算美学分数。
- Aesthetic Scorer(美感评分器):使用现有的CLIP模型和一个额外的预训练模型来计算图像的感知美学分数。
- cafe-aesthetic(咖啡馆美感):预训练模型,确定图像的美感/非美感,提供五种不同风格的识别模式,并确认Waifu风格。同时提供批处理功能。
- Clip Interrogator(Clip询问器):pharmapsychotic的Clip询问器移植到扩展中,具有多种clip模型和询问设置。
- Visualize Cross-Attention(可视化交叉注意力):根据输入提示,生成提交图像的高亮部分,详情请查看说明。
- Dump U-Net(U-Net导出):查看不同的层次,观察U-Net的特征图。通过为unet的每个块提供不同的提示来生成图像。
- posex(姿态估计图像生成器):为Pose2Image估计图像生成器。这个扩展允许在三维空间中移动openpose图形。
- LLuL(局部潜在放大器):针对特定区域以选择性增强细节的局部潜在放大工具。
- CFG-Schedule-for-Automatic1111-SD(自动1111-SD的CFG调度脚本):在生成步骤中动态控制CFG的脚本,正确设置可以在低降噪的img2img生成中保持细节。
- ebsynth_utility(ebsynth辅助工具):使用img2img和ebsynth扩展创建视频的扩展工具,可输出使用ControlNet扩展编辑的视频。
- VRAM Estimator(VRAM估算器):运行txt2img、img2img、highres-fix的工具,可增加维度和批处理大小直至内存溢出(OOM),并输出数据至图表。
- TiledDiffusion with Tiled VAE(带平铺VAE的平铺扩散):无缝地进行大区域图像的生成和放大,同时配有内存效率高的平铺VAE脚本。
- 3D Model&Pose Loader(3D模型与姿态加载器):在webui中加载3D模型/动画或编辑模型姿态,然后发送截图到txt2img或img2img至ControlNet。
- Corridor Crawler Outpainting(走廊爬行外绘):以512分辨率生成走廊的深度到图像模型,可调整以适应其他模型/分辨率。
- Panorama Viewer(全景查看器):提供一个标签以在3D视图中交互式显示等距圆柱投影图像。
- db-storage1111(数据库存储1111):启用在MongoDB数据库中存储图片及其元数据的功能。
- stable-diffusion-webui-rembg(稳定扩散webui-去背景):从图片中移除背景。
- sd-webui-tunnels(SD webui隧道):为默认的隧道方法(包括Cloudflare)添加替代选项。
- 3D Openpose Editor(3D开放姿势编辑器):在WebUI中编辑3D模型的姿态,并生成Openpose/深度/法线/Canny图用于ControlNet。
- sd-webui-enable-checker(SD WebUI启用检查器):通过点击SD Web UI中的启用按钮来切换背景颜色。
- stable-diffusion-webui-state(稳定扩散WebUI状态保存):在重载或重启后保持用户界面状态。
- text2video(文本转视频):将ModelScope和Videocrafter等多种文本转视频模型集成到WebUI中。
- Aspect Ratio Helper(纵横比助手):在保持相同纵横比的同时轻松调整尺寸。
- Canvas Zoom(画布缩放):增加了缩放Inpaint、Sketch和Inpaint Sketch的能力,并添加了有用的热键。
- Regional Prompter(区域提示器):为不同区域指定不同的提示,是潜在对应法的替代方法和潜在改进。
- Auto Translate(自动翻译):允许用户用母语编写提示,并自动翻译UI,无需手动下载配置文件。新插件也可以翻译。
- Prompt Translator(提示翻译器):允许用户基于50种不同语言的提示生成图像。它会将提示从选定的源语言翻译成英语后再生成图像。
- Abysz LAB(时序一致性工具):时序一致性工具集。
- Negative Prompt Weight(负面提示权重):允许用户为负面提示设置全局权重。
- Discord - 动态丰富状态(Discord - Dynamic Rich Presence):显示您当前选择的sd模型,并显示您是空闲还是在生成某物;如果是后者,还会显示总生成图像数。
- PBRemTools(精确背景移除工具):是一套工具集,用于从单张图片中高精度裁剪背景。
- a1111-sd-webui-lycoris(a1111稳定扩散webui-lycoris):在webui版本大于等于1.5.0后不再需要,加载lycoris:非常规排名适配器;在独立的网络图库标签页中。
- sd-canvas-editor(稳定扩散画布编辑器):一个功能齐全的画布编辑器,可以使用图层、文本、图片、元素等。
- Infinite Zoom(无限缩放):允许用户使用稳定扩散外绘法创建无限缩放效果视频。
- Eye Mask(眼部遮罩):通过自动识别和重绘,结束不佳的眼睛绘制问题。
- zh_CN Localization(简体中文本地化):提供简体中文本地化,建议与双语本地化配合使用。
- zh_TW Localization(繁体中文本地化):提供繁体中文本地化。
- ko_KR Localization(韩文本地化):提供韩文本地化。
- th_TH Localization(泰文本地化):提供泰文本地化。
- es_ES Localization(西班牙文本地化):提供西班牙文本地化。
- it_IT Localization(意大利文本地化):提供意大利文本地化。
- de_DE Localization:德语本地化,让德语使用者能更流畅地使用软件。
- ja_JP Localization:日语本地化,为日本用户提供了更好的软件使用体验。
- pt_BR Localization:巴西葡萄牙语本地化,适应巴西用户的使用习惯。
- tr_TR Localization:土耳其语本地化,满足土耳其使用者的特定需求。
- no_NO Localization:挪威语本地化,方便挪威用户使用。
- ru_RU Localization:俄语本地化,为俄罗斯用户定制。
- fi_FI Localization:芬兰语本地化,提供给芬兰用户更便捷的服务。
- zh_Hans Localization:简体中文本地化,针对使用简体中文的用户。
- old localizations:旧的、未维护的本地化文件,曾经是主要仓库的一部分。
- Model Organizer:模型组织者,允许存储和管理个人模型收藏,添加信息、注释、预览和模型的下载链接。可以轻松从Google Drive下载或分享模型链接。
- Model Preset Manager:模型预设管理器,让你能够为每个模型创建和应用预设,比如提示、否定提示、配置比例、分辨率等,并自动获取模型触发词和来自Civitai的缩略图。
- Model toolkit:多功能模型工具包,用于修剪、编辑和修复模型。
- sd-webui-prompt-all-in-one:增强提示输入框用户体验的工具,提供更直观、强大的界面,支持自动翻译、历史记录和收藏夹。
- sd-model-preview-xd:向用户界面添加模型预览、LoRA和嵌入式预览,包括预览图像、描述和LoRA提示列表。
- ADetailer:自动检测、遮蔽和修补细节的工具。
- Weight Gradient:在生成过程中动态改变词语权重的功能,有助于形态变换。
- One Button Prompt:适用于初学者和高级用户的脚本,一键生成整个提示,随机但又具有控制性,启发创意。
- Miaoshouai Assistant:增强automatic1111 webui用户体验的助手工具,包括更新启动设置、空间释放、从civitai.com和liandange.com下载模型,通过chatgpt生成提示等功能。
- miniPaint:miniPaint扩展提高了图片编辑能力,可以直接在webui中编辑图片。
- StableSR:为真实和动漫图像提供的强大上采样WebUI扩展。
- Web UI client queue:为web界面添加队列功能,可以处理一系列设置,便于加载和应用多个配置。
- Distributed:通过将不同的webui实例链式连接,更快地生成批量图片。
- StableStudio Adapter:为webui自定义扩展,用于扩展REST API以在StableStudio中执行本地操作。
- Quick Tab Switch:Stable Diffusion WebUI的简易标签切换工具,再也不用手动寻找打开的多个标签页。
- Lua:在Stable Diffusion webui中使用Lua脚本生成图片。
- Model Downloader:下载模型的替代工具,推荐给云服务用户使用。
- Styles Editor:为已保存的风格添加类似电子表格的编辑器,支持筛选、搜索、替换,并可分割风格到不同文件。
- Clip I/O:这个扩展让你研究嵌入式编码/条件设置,并将条件设置反馈到Stable Diffusion。
- Inpaint Anything:执行Stable Diffusion的修复操作,更干净的ControlNet修复,并发送分割结果作为掩模到img2img。
- QR Code Generator:为ControlNet生成QR码。
- sd-webui-roop:启用与参考图片的面部交换。
- sd-webui-color-enhance:使用GIMP/GEGL“Color Enhance”算法增强图片色彩。
- sd-webui-bluescape:将生成的图片上传到Bluescape工作空间进行审查和协作。
- sd-webui-prompt_history:自动存储生成信息与图片,可以随时应用回去。
- Danbooru Prompt:从Danbooru图片链接获取标签。
- Pixel art:用于像素艺术的扩展,提供缩小、调色板限制、灰度、黑白等基本功能,可自定义调色板颜色。
- Lobe Theme:用于Stable Diffusion webui的现代化界面主题,也称为厨房主题。
- Kitchen Theme:Stable Diffusion webui的自定义界面主题。
- IF_prompt_MKR:通过本地ILMs使用Ooaboobooga text webUI API创建提示。
- 3D Editor:3D建模特性,可以添加/编辑基础元素,载入你的自定义模型,修改场景等,然后将截图作为ControlNet的参考图像发送到基于ThreeJS的编辑器。
- Aspect Ratio selector plus:带有新功能和逻辑的宽高比选择器插件。
- SD Delete Button:为txt2img和img2img添加删除按钮,使用Send2Trash。
- sd-webui-qrcode-toolkit:与Anthony的QR Toolkit整合,轻松生成和验证QR码。
- SadTalker:生成带有面部图像和语音音频的说话头像视频。
- Auto-Photoshop-StableDiffusion-Plugin:为Auto-Photoshop-StableDiffusion插件添加API路由。
- Civitai Shortcut:这个扩展允许你将civitai上可用的模型注册为sdui中的收藏夹(快捷方式),然后可以在需要时下载模型使用注册的快捷方式。
- WD 1.4 Tagger:查询单个或多个图片文件,使用多种替代模型进行相似性比对,类似于深度问询。
- Loopback Scaler:通过用户控制的逐步解析度提升,迭代改进图片质量与细节。
- Mask2Background:将PNG图片生成背景和蒙版,然后发送到img2img以生成新背景图。
- ComfyUI:在WebUI的不同部分嵌入ComfyUI工作流。
- GPU温度保护:当GPU温度过高时暂停图像生成,支持NVIDIA和AMD GPU。
- zoom-image:使用鼠标和手势在全屏图像查看器中缩放和移动。
- 关机按钮:在快速设置中添加一个关闭webui的按钮。
- Latent Upscale:在img2img中提供更多潜在放大选项,优于Hires Fix的txt2img过程。
- sd-history-slider:基于使用历史,用滑块更改提示。
- 提示过滤:过滤掉提示和负提示中的禁用词,同时过滤掉重复的提示和空提示。
- sd-webui-animatediff:这个扩展将AnimateDiff整合到WebUI中,并生成像生成图片一样的GIF。
- Dynamic Javascript:在积极和消极的提示中嵌入Javascript代码块。
- Detection Detailer:Dotgeo(hijack) Detection Detailer。是ddetailer的分支,用于Stable Diffusion web UI的对象检测和自动生成蒙版扩展。
- seamless-tile-inpainting:一种脚本,用于使用inpainting模型制作无缝瓷砖效果,为SD1.5的inpainting模型设计,在512x512尺寸工作良好,但也适用于其他inpainting模型。
- FaceSwapLab:具备多面部交换、inpainting、检查点等功能的面部交换扩展。
- Style Selector for SDXL 1.0:Automatic1111扩展,允许用户通过SDXL 1.0选择并应用不同的风格到他们的输入中。
- sd-webui-oldsix-prompt:带有内置中文图书馆的提示库。
- Customer Hires Fix:为SDXL细节改进添加高级功能的客户定制扩展。
- Refiner:为SDXL细化模型添加支持,扩展了处理最后步骤的流程,与细化模型Unet一同工作。
- sd-webui-deoldify:基于deoldify为Stable Diffusion WebUI着色旧照片和旧视频的扩展。
- sd-wav2lip-uhq:一个一体化的解决方案,用于基于视频或图片创建高质量唇同步视频。
- Controlnet Fastload:保存和加载controlnet参数。
- LoRA Control:在图片生成过程中动态控制LoRAs的权重。
- Wildcards:允许你在提示中使用__name__语法,从名为name.txt的文件中获取随机行。
- SD Ratio Lock:锁定图片的纵横比。
- sd-webui-chatgpt:在Stable Diffusion web UI中使用ChatGPT,当你说类似“生成一张图片”这样的话时,ChatGPT会自动产生一个提示并生成图片。
- sd-webui-auto-tweet.json:自动生成的图片会自动发布到您的Twitter上,还有一个按钮可以直接推送生成的图片到Twitter。
- zh_Hant Localization:提供繁体中文本地化支持(混合了zh_TW和zh_Hans)。
- SD Webui Vectorscope CC:在生成过程中通过潜在噪声操作调整输出图像的亮度、对比度、饱和度。
- Prompt Formatter - by uwi.dev:移除多余的空格并转换嵌套括号。
- Prompt Format - by Haoming02:去除重复的空格和逗号。
- FABRIC:不需要训练即可个性化Diffusion模型,使用迭代反馈的方法调整扩散过程。
- Webpage close confirmation dialogue:当您尝试“关闭”、“离开”或“重新加载”网页时,会添加一个确认对话框。
- sd-webui-discord-ex:支持SD节点的Stable Diffusion WebUI Discord机器人的分布式部署。
- CivitAI Browser+:通过WebUI访问CivitAI的扩展:下载、删除、扫描更新、列出已安装模型、分配标签以及推动下载等,支持多线程处理。
- Img2img batch interrogator:该扩展在处理每张图片之前运行查询器。
- SD Masonry Gallery:一个图片标签页,以紧凑的砌体式画廊形式展示本地图像。
- sd-webui-depth-lib:与ControlNet扩展一起使用的深度图库。
- Stable Diffusion Webui Civitai Helper:从civitai.com下载或填充带有元数据和预览图的模型。
- Scenario loader:系列工具,简化图像创建过程。
- PromptsBrowser:一个扩展,便于快速处理、探索和目录化提示。
- Model Mixer:检查点模型混合/合并扩展,合并模型而不保存合并后的模型,用于图像生成。
- Fast PNG Info:不需要上传到webui后端服务器,就可以查看PNG图片信息,当webui托管在远程(如Colab)时速度更快。
- sd-webui-mov2mov:逐帧处理视频,并自动合并导出。
- EasyPhoto:支持使用在线训练的LoRA模型生成与输入紧密相关的高质量输出图像的简易照片生成工具。
- sd-webui-rich-text:一个允许使用富文本编辑器进行文本到图像生成的扩展(参见https://github.com/songweige/rich-text-to-image)。
- sd-webui-bg-mask:生成图像背景的遮罩。
- Ranbooru:从不同的booru网站获取随机提示,并通过丰富的创意功能影响提示内容,支持txt2img和img2img。
- CivBrowser:用于搜索和下载Civitai模型的扩展,支持多标签管理和保存模型信息,可以直接发送样本信息文本到txt2img。
- NSFW Blurrer-NSFWJS:使用基于onnxml的NSFWJS模糊不适宜内容(NSFW)图像。
- NegPiP:在提示中启用负面强度,其效果比负面提示更强。
- CD(Color/Detail) Tuner:使用LoRA或ADtailer的不同机制调整色调、亮度和细节水平。
- DevDark theme:基于Cappuccino主题的自定义css,可通过扩展标签启用/禁用。
- auxiliary API:添加API路由进行上传、删除、同步模型等操作。
- ReActor:快速且简单的面部交换扩展,包含多项改进,安装需要阅读README文件并进行额外步骤。
- TensorRT:为搭载NVIDIA RTX GPU的Stable Diffusion提供TensorRT加速。
- encrypt-image:加密并保存图像到磁盘,降低在公共云存储图像时账户被封的风险,使用时需要加入 --encrypt-pass=你的密码。
- NudeNet NSFW Censor:使用NudeNet自定义检测和审查图像中的不适宜内容。
- Latent Consistency Models:仅用四步就能生成高质量图像,使用Automatic1111运行Latent Consistency Models。
- CADS:通过在推断时添加预定的噪声到条件中,显著提高生成图像的多样性,基于arXiv:2310.17347 [cs.CV]所述的新方法。
- sd-webui-facefusion:视频面部交换和增强工具。
- Hotshot-XL-Automatic1111:最先进的AI文本到GIF模型,与Stable Diffusion XL配合工作。
- Inpaint difference:使用两张图像之间的差异生成补漆蒙版,新增了操作模式。
- Temporal:加强版的循环反馈,允许以更高级的方式处理图像或创建变形动画。
- FaceChain:一个深度学习工具链,用于生成你的数字双胞胎,仅需一张人像照片,即可在不同环境中生成个人肖像。
- Stylez:改进的风格库,内含600多种内置风格。包括提示生成、风格创建/编辑、自动CSV转换到CivitAI图像浏览器。
- sd-webui-panorama-tools:各种创建/编辑/查看360度全景图像的工具。
- sd-webui-extended-style-saver:轻松保存所有提示的扩展。此扩展有助于保存重要细节,如名称、模型、VAE、图像尺寸、提示和负面提示。
- Semantic Guidance:添加额外的正/负提示来修改细节而不必改变整体构图。可进行细微或重大编辑。基于arXiv:2301.12247 [cs.CV]的非官方实现。
- SD Web UI Modal Info:当图像处于全屏时显示提示信息。
- (人物面具生成器)A Person Mask Generator:Automatic1111的扩展,自动为Img2Img中的背景/头发/身体/脸部/衣物创建面具。
- (样式变量)Style variables:在提示中使用现有风格作为变量。
- SD-WebUI API Payload Display:在WebUI中生成后显示对应的API负载信息。
- (微检测细节器)μ Detection Detailer:检测细节器的分支,支持bbox/分割物体检测、自动蒙版和补漆,使用mmdetection、mediapipe和ultralytics,并且支持ControlNet。
- (Lora队列帮手)Lora Queue Helper:一个脚本,帮助您使用相同的提示和设置批量生成Lora,便于比较Lora或切换Lora时使用。
- Deep Shrink Hires.fix:实现Kohya's Deep Shrink Hires.fix。
- (测试我的提示!)Test my prompt!:通过连续移除提示的各个部分来生成一系列图像,以便比较它们各自的效果。
- sd-webui-breadcrumbs:添加面包屑导航并改进快速设置菜单。
- Kohaku-NAI:为SD-WebUI构建的新颖AI客户端。
- (快速补漆器)Replacer - fast inpaint:通过检测提示快速生成补漆图像的标签页。需要sd-webui-segment-anything。同时适用于批量补漆和在视频中使用AnimateDiff补漆。或者您可以自己绘制面具并使用hiresfix进行强大的补漆,或者使用controlnet fullres补漆。
- Color Correction Extras:在“额外”选项卡中添加原生颜色校正功能,丰富视觉效果。
- State Manager:能迅速保存并恢复A1111中之前的配置设置,简化状态管理。
- Agent Attention:使用Agent Attention技术加快图像生成速度并提升图像质量,基于非官方实现的arXiv:2312.08874论文。
- Deepdanbooru object recognition:查询Deepdanbooru并识别图片中的对象。
- Deepdanbooru Tag2Folder:通过Deepdanbooru分类来移动图片的脚本。
- sd-webui-ocr:PaddleOCR的sd-webui扩展,基于pytorch实现,可以识别和处理图片中的文本。
- Characteristic Guidance Web UI:一种新的引导方法,无需分类器即可改善图像质量,与现有的采样方法兼容。
- embedding-inspector:检查任何标记(词)或文本倒置嵌入,并快速找出相似的嵌入,支持混合、修改或创建嵌入。
- Lama cleaner as masked content:在Inpaint标签中使用sd-webui-controlnet的lama清洁器预处理器,适用于去除图片中不需要的对象。
- Latent Regional Helper:简化潜在的局部调整设置,使Latent Couple和Regional Prompter的设置变得简单易用。只需从下拉列表中选择即可输出设置值。
- Thumbnailizer:一个缩略图画廊和设置管理工具,可以生成并在不同的缩略图集之间切换,便于管理你的检查点。
- GPT-4 Vision Image Captioner:这个扩展利用了GPT-4 Vision API的能力,在稳定扩散Web UI中提供图像标题功能,需要订阅OpenAI服务。
- Video in Extras tab:这个扩展允许你在额外的选项卡中逐帧处理视频。
- Inpaint background:使用rembg生成填充掩码,增加了一种新的操作模式。
- DAAM:DAAM代表Diffusion Attentive Attribution Maps,需要输入注意力文本(必须是提示中的字符串),并生成一个热图与原始图片重叠显示每个注意力的图像。
- ControlNet Preprocessor in extras tab:在额外的选项卡中添加了ControlNet预处理功能。
- Stable Diffusion Database Manager:支持单独或批量生成图像,并将它们插入到一个或多个数据库中。
- RPG-DiffusionMaster:WebUI扩展的RPG-DiffusionMaster实现,利用LLM模型的能力生成区域提示,以获得更好的生成结果。
- sd-webui-creaprompt:这个扩展为A1111随机生成精彩的提示。
- Workflow:在img2img标签中添加一个新面板,以简化你的图像处理工作流程。
- QIC Console:添加了一个控制台标签页,方便快速测试Python和Javascript代码片段。警告:非开发者请勿安装此扩展!
- Custom AutoLaunch:自动在非默认浏览器中启动WebUI。
- SimpleTaggerEditor:逐个编辑由图像标题自动生成的标签。
- ReSharpen:增加或减少图像的细节清晰度。
- Clear Screen:添加一个按钮来清除控制台窗口中的内容。
- SD Webui Image Comparison:在WebUI中轻松比较img2img结果。
- SD Webui Tabs Extension:使用标签重新组织扩展面板的布局。
- Mosaic Outpaint:无需ControlNet即可进行外绘制操作。
- SD Webui Boomer:一个扩展,用于恢复某些UI更改。
- Diffusion Color Grading:根据潜在张量值范围进行色彩分级。
- Moar Generate Button:添加第二个生成按钮。
- Old Photo Restoration:使老照片重获新生。
- Mobile friendly UI tweaks:优化Web界面,使其在移动设备上更加友好,尤其是竖屏模式。
- Easy Tag Insert:提供快捷按钮,便于用户插入预设的提示词。
- Token Downsampling:实施改进的令牌合并版本,以提高推理速度并减少质量损失。
- Aspect Ratio Resolutions selector-xhox:扩展了稳定扩散WebUI,增加了图像宽高比选择按钮。
- Hires Fix Tweaks:为高分辨率修复提供额外选项和功能,如CFG、批量计数、提示语法、输出目录设置。
- Simple Manga Maker:通过简单操作,允许创建和应用漫画风格的图像。
- Card Master:为“额外网络”卡片(特别是LoRAs)添加强大工具,包括详细视图、简易激活文本应用、多节激活文本的局部应用,以及自动清理多余的LoRA。
- cli-interruption:通过SIGINT信号(Ctrl+C)中断生成过程,而不是关闭服务器。
- DemoFusion:在WebUI中作为一个标签页,提高分辨率图像生成的民主化。
- Incantations:实施多种新的指导算法以提升图像质量,减少概念混淆,并增强提示效果。
- Old SD firstpasser:使用旧版SD模型、LoRas、嵌入等进行首次图像生成。
- SD Image Editor:一个快速且易于使用的图像编辑器,适用于Stable Diffusion Web UI。
- A1111 SD WebUI DTG:一个用于在Stable Diffusion Web UI中利用DanTagGen增强提示的扩展工具。