SillyTavern - 为高级用户打造的开源本地 LLM 前端

上线于 2026年3月24日

SillyTavern 是一款开源本地 LLM 聊天界面，支持连接 OpenAI、Claude、Ollama、KoboldCpp 等 20+ 种后端服务。完全本地运行确保数据不离开设备，实现 100% 隐私保护。提供强大的角色卡系统、世界信息管理以及丰富的主题和插件定制功能。

AI 对话公开定价隐私优先自然语言处理大语言模型多语言支持开源

访问网站

什么是 SillyTavern SillyTavern 的核心功能谁在使用 SillyTavern 技术特点常见问题评论相关内容

什么是 SillyTavern

在人工智能交互领域，云端 AI 服务虽然便捷，但带来了数据隐私泄露、订阅费用高昂、角色扮演功能受限等诸多痛点。用户的大量对话数据被云端服务器收集和分析，个人隐私难以得到保障；同时，ChatGPT Plus 等服务的月费支出对于频繁使用 AI 的用户而言是一笔不小的开销；而通用 AI 平台的角色扮演功能往往过于简单，无法满足深度定制需求。

核心要点

开源本地 LLM 前端界面，数据 100% 本地处理
支持 20+ 种 LLM API，涵盖云端与本地模型
强大的角色卡系统，支持多人组聊和复杂对话场景
完全免费开源，采用 AGPL-3.0 许可证

SillyTavern 正是为解决这些痛点而生的新一代 LLM 前端应用。它定位为「为高级用户打造的 LLM 前端」（LLM Frontend for Power Users），完全开源免费，任何人都可以在自己的设备上本地运行。与依赖云端服务器的 AI 聊天工具不同，SillyTavern 支持连接 Ollama、KoboldCpp、llama.cpp 等本地模型运行框架，让用户的对话数据永远不离开自己的设备，真正实现了隐私保护。

在 API 支持方面，SillyTavern 展现了其强大的兼容性。它不仅支持 OpenAI GPT、Google Gemini、Anthropic Claude 等主流云端 API，还支持通过 OpenRouter、AI Horde、NanoGPT 等平台访问数百种不同的语言模型。这种多后端架构让用户可以根据需求灵活选择：需要隐私时使用本地模型，想要免费体验时接入 AI Horde 社区捐赠的 GPU 资源，追求最高质量输出时切换到 GPT-4 或 Claude。

市场数据印证了 SillyTavern 的广泛认可。项目在 GitHub 拥有 24,800 颗星标，5,000 次分支，319 位代码贡献者参与了项目开发。Discord 社区拥有 78,710 名成员，其中 10,778 人同时在线。自 2023 年 2 月从 TavernAI 1.2.8 分支独立发展以来，项目已完成超过 11,490 次提交，发布 100 个版本，持续迭代超过三年时间。这些数据充分说明 SillyTavern 已成为开源 LLM 前端领域的标杆产品。

SillyTavern 的核心功能

SillyTavern 提供了一套完整的高级 AI 交互功能，覆盖从模型连接、角色定制到内容生成的完整工作流。

多后端 LLM 连接是 SillyTavern 最核心的能力。项目支持超过 20 种 LLM API 后端，包括云端的 OpenAI、Anthropic、Google、Mistral、DeepSeek 等服务商，以及本地的 KoboldCpp、Ollama、Oobabooga TextGen WebUI、TabbyAPI 等框架。技术上支持 Chat Completion 和 Text Completion 两种 API 结构，兼容 OpenAI 格式，同时保留了对 KoboldAI 旧版 API 的支持。流式输出（Streaming）和上下文窗口管理功能让对话体验更加流畅自然。

**角色卡系统（Character Cards）**是 SillyTavern 最受用户喜爱的功能之一。用户可以通过 JSON 或 PNG 格式定义 AI 角色的姓名、描述、背景故事、性格特征和示例对话。PNG 格式支持将角色信息内嵌为元数据，方便分享和传播。角色卡 v2 格式还支持 Alt Greetings（备用问候语）和高级定义字段，允许用户编写复杂的系统提示来精确控制 AI 行为。通过 Group Chats 功能，用户可以同时与多个 AI 角色互动，甚至让多个 AI 角色之间相互对话。

高级文本生成控制让用户能够细粒度调整 AI 输出质量。Temperature、Top-K、Top-P、Presence Penalty、Frequency Penalty 等采样参数均可自定义。用户可以保存和切换预设配置，社区也分享了大量针对不同场景优化的预设参数。自动模型检测功能会根据所选后端推荐最优参数组合。

提示词格式化与模板功能解决了不同模型训练格式不兼容的问题。SillyTavern 内置了 Alpaca、Llama2-chat、Vicuna 等主流指令模板，用户也可以自定义前缀和后缀。ST-Script 脚本引擎允许编写复杂的对话逻辑，配合 Data Bank 功能还能实现本地知识库的检索增强生成（RAG）。

**世界信息（World Info / Lorebooks）**功能让用户能够构建丰富的世界观设定。通过关键词触发系统，Lorebook 中的内容会在适当时机自动插入到对话上下文中，支持多层级管理和动态激活抑制，非常适合长篇角色扮演和故事创作。

高度可定制：插件系统、ST-Script 脚本引擎、自定义 CSS 注入
完全免费：AGPL-3.0 开源许可，无任何付费功能
隐私保护：100% 本地运行，数据不离开设备
图像与语音集成：内置 Stable Diffusion、FLUX、DALL-E 连接，Coqui TTS 支持

需要技术知识：需要了解 API 配置、模型部署等基础概念
本地模型需要硬件：7B 参数模型建议 6GB+ VRAM，更大模型需要更强显卡
无官方移动 App：需要通过 Termux 或浏览器访问

图像生成集成支持连接 Automatic1111、ComfyUI 等 Stable Diffusion 客户端，以及 FLUX、DALL-E 等云端 API。用户可以为角色生成立绘、创建场景插画，甚至使用图像到图像功能进行创意加工。

**文字转语音（TTS）**功能基于 Coqui TTS（kokoro-js）引擎，支持多语言语音合成。用户可以为不同角色定制专属语音，调节语速和音调，获得更加沉浸式的交互体验。

谁在使用 SillyTavern

SillyTavern 的用户群体广泛，从隐私主义者到创意作家，从游戏玩家到开发者，都能在这款工具中找到价值。

隐私敏感型用户是 SillyTavern 的核心用户群体之一。通过 Ollama 或 KoboldCpp 在本地运行 LLaMA、Mistral 等开源模型，用户可以确保自己的对话数据 100% 留在本地设备上，没有任何数据会被发送到第三方服务器。这种本地化部署特别适合处理敏感信息的场景，如医疗咨询、法律建议或个人日记类应用。

免费 AI 角色扮演爱好者充分利用 SillyTavern 的多后端支持。他们可以通过 AI Horde 连接社区捐赠的免费 GPU 资源，或者使用 Pollinations 的免费云端 API，甚至利用 Cohere 和 Mistral 的免费 tier，在零成本前提下体验完整的 AI 角色扮演功能。配合强大的角色卡系统，用户可以创建或导入心仪的角色，与之进行深度互动。

创意写作与故事创作者使用 SillyTavern 进行长篇内容创作。通过精心设计的角色卡确保 AI 输出的文字风格一致，利用 World Info 构建复杂的世界观，借助 ST-Script 脚本引擎控制叙事流程，再配合 Claude 或 GPT-4 的高质量输出，可以创作出符合角色设定的完整故事作品。

自定义 AI 助手开发者则将 SillyTavern 作为构建专业领域 AI 助手的基础平台。他们创建针对特定行业的角色卡，配置高级定义字段设置详细的业务指令，连接本地知识库实现 RAG 能力，并可选配 Web Search 扩展获取实时信息。这种方式构建的 AI 助手在定制深度上远超 ChatGPT 的 GPTs 功能。

💡 选择建议

隐私优先的用户建议选择 Ollama 或 KoboldCpp 本地部署；预算有限的用户推荐 AI Horde 或 Pollinations 免费 API；追求最高输出质量的用户可选择 Claude 或 GPT-4 云端 API。

游戏与虚拟世界爱好者利用 SillyTavern 的 Group Chats 和 Visual Novel Mode 创建动态交互体验。他们可以同时与多个 AI 角色交流，让 AI 角色之间相互对话，甚至结合图像生成功能为游戏创建素材。这种 AI 驱动的交互方式为文字冒险游戏带来了革命性的创新。

本地模型实验者将 SillyTavern 作为测试最新开源模型的统一平台。通过 Ollama 一键部署最新模型，使用相同的角色卡和提示词比较不同模型的输出效果，快速迭代采样参数优化结果。这是完全免费的 LLM 实验环境，特别适合模型研究者和开发者。

多语言学习者利用 SillyTavern 创建沉浸式语言练习环境。通过翻译扩展实时翻译对话内容，与 AI 角色进行目标语言对话，结合 TTS 功能练习听力和口语，获得远超传统教材的互动学习体验。

开发者与测试工程师则使用 SillyTavern 进行 AI 模型的批量评估和对比测试。统一界面测试多个 API 提供商的响应质量，使用相同测试用例保存不同模型的输出进行对比，编写脚本实现自动化测试流程，大幅提升模型选型效率。

技术特点

SillyTavern 采用现代化的前后端分离架构，在保证功能丰富的同时保持了良好的可扩展性和性能表现。

从技术栈来看，项目主体使用 JavaScript 编写，占比 85.8%，HTML 占 10.2%，CSS 占 3.4%。这种技术选型使得 SillyTavern 能够运行在任何支持 Node.js 的平台上，包括 Windows、macOS、Linux 以及 Android（通过 Termux）。项目依赖 Node.js 18 或更高版本，内置 Express 服务器处理 HTTP 请求，通过 WebSocket 实现实时通信。

架构设计上，SillyTavern 支持 Chat Completion 和 Text Completion 两种 API 结构，兼容 OpenAI 格式的 API 调用。项目还提供了插件扩展系统和 ST-Script 脚本引擎，允许高级用户深度定制行为逻辑。这种开放式架构吸引了大量第三方开发者参与贡献，目前已有 300 多位代码贡献者参与了项目开发。

在模型支持方面，SillyTavern 展现了其强大的兼容性。本地模型方面，项目支持 KoboldCpp、llama.cpp、Ollama、Oobabooga TextGen WebUI、TabbyAPI、KoboldAI Classic 等主流本地运行框架。云端 API 方面，OpenAI、Anthropic Claude、Google Gemini、Mistral、DeepSeek、AI21、Cohere、Perplexity、NovelAI、OpenRouter、AI Horde、NanoGPT、Pollinations、Mancer AI、DreamGen、AI/ML API 等服务商均被支持。项目还支持 GGUF、GPTQ、AWQ、Exl2 等量化格式，大幅降低本地推理的硬件门槛。

完全免费：AGPL-3.0 开源许可，无任何付费功能
高度可定制：插件系统、ST-Script 引擎、自定义 CSS/主题
隐私安全：100% 本地运行，不追踪用户数据，支持 Docker 部署
活跃社区：319 位贡献者、78,710 Discord 成员、持续更新

需要技术背景：需要理解 API 配置、模型部署、量化等概念
硬件要求：本地 LLM 推理推荐 NVIDIA 3000 系列显卡，6GB+ VRAM
无开箱即用体验：需要用户自行配置后端和模型

性能表现方面，SillyTavern 本身对硬件要求极低，只需 Node.js 18+ 即可运行，4GB 内存即可满足基础需求。但对于本地 LLM 推理，7B 参数模型推荐至少 6GB VRAM 的显卡（如 RTX 3060），13B 参数模型建议 12GB+ VRAM（如 RTX 4070），更大模型需要更高端的配置。项目支持通过量化技术降低模型资源需求，让中端显卡也能运行较大参数量的模型。

在安全性与隐私保护方面，SillyTavern 继承了开源项目的透明特性。项目遵循 GitHub Security 策略，支持用户配置 SSL/TLS 加密连接，Docker 部署时支持健康检查和卷管理。.nomedia 文件机制可防止媒体文件被系统扫描。对于隐私要求极高的用户，Docker 部署提供了隔离的运行环境。

常见问题

SillyTavern 和 TavernAI 有什么区别？

SillyTavern 于 2023 年 2 月从 TavernAI 1.2.8 分支独立开发，至今已新增数百个功能和改进。主要区别包括：支持更广泛的 API（ TavernAI 主要支持 KoboldAI 系列，SillyTavern 扩展到 20+ 后端）；更强大的扩展系统和插件架构；持续的功能更新和 bug 修复；以及活跃的社区维护（Discord 78,710 成员 vs TavernAI 相对较小的社区）。

运行 SillyTavern 需要什么配置的电脑？

SillyTavern 本身只需要 Node.js 18+ 即可运行，对硬件几乎无要求。如果要进行本地 LLM 推理（推荐使用 Ollama 或 KoboldCpp），7B 参数模型建议 NVIDIA 3000 系列显卡（6GB+ VRAM），如 RTX 3060；13B 参数模型需要 12GB+ VRAM，如 RTX 4070；70B 参数模型需要 24GB+ VRAM，如 RTX 4090。7B 模型也可在无显卡的电脑上通过 CPU 运行，但速度会非常慢。

SillyTavern 是免费的吗？

完全免费。SillyTavern 本身采用 AGPL-3.0 开源许可，不收取任何费用。但需要注意：使用云端 API（如 OpenAI GPT-4、Claude）会产生 token 费用，由用户自行承担；在本地运行模型完全免费；SillyTavern 还支持多个免费 API，如 AI Horde（社区捐赠 GPU）、Pollinations（带广告）、Cohere 免费 tier、Mistral 免费 tier。

SillyTavern 支持中文吗？

支持。SillyTavern 界面本身支持多语言显示，包括简体中文。用户可以通过翻译扩展自动翻译对话内容，实现跨语言交流。推荐使用本地运行的中文模型（如 Chinese-LLaMA、Qwen、Baichuan）配合 SillyTavern，可获得全流程的中文交互体验。

如何获取角色卡？

获取角色卡有三种主要方式：从 AICharacterCards.com 等社区网站下载现成的角色卡；在 SillyTavern 内置的角色卡编辑器中自行创建和编辑；或者从其他用户处导入 PNG/JSON 格式的角色卡文件。角色卡采用 v2 格式，支持将 JSON 元数据内嵌到 PNG 图片中，方便分享和传播。

SillyTavern 有手机版吗？

没有独立的手机 App，但提供多种移动端访问方式：Android 用户可通过 Termux 安装完整版 SillyTavern；用户可以在手机浏览器中访问本地部署的 SillyTavern 服务（需在同一网络下）；项目采用响应式布局设计，在移动设备上也能获得良好的操作体验。

可以同时和多个 AI 角色聊天吗？

可以。使用 Group Chats 功能，用户可以创建包含多个 AI 角色的对话场景。多个 AI 角色可以同时与你互动，也可以让 AI 角色之间相互对话。这种功能非常适合创建复杂的故事场景、模拟多人会议或构建互动游戏体验。

如何在 SillyTavern 中使用 Claude？

在 SillyTavern 中连接 Claude 非常简单：进入「API Connections」设置页面；选择「Chat Completion」作为 API 类型；在「Source」下拉菜单中选择「Claude」；输入你的 Anthropic API Key（需要从 anthropic.com 获取）；保存设置后即可开始与 Claude 对话。SillyTavern 还支持 Claude 的 prefill 功能，可以引导 AI 的回复方向。