什么是 SillyTavern
在人工智能交互领域,云端 AI 服务虽然便捷,但带来了数据隐私泄露、订阅费用高昂、角色扮演功能受限等诸多痛点。用户的大量对话数据被云端服务器收集和分析,个人隐私难以得到保障;同时,ChatGPT Plus 等服务的月费支出对于频繁使用 AI 的用户而言是一笔不小的开销;而通用 AI 平台的角色扮演功能往往过于简单,无法满足深度定制需求。
- 开源本地 LLM 前端界面,数据 100% 本地处理
- 支持 20+ 种 LLM API,涵盖云端与本地模型
- 强大的角色卡系统,支持多人组聊和复杂对话场景
- 完全免费开源,采用 AGPL-3.0 许可证
SillyTavern 正是为解决这些痛点而生的新一代 LLM 前端应用。它定位为「为高级用户打造的 LLM 前端」(LLM Frontend for Power Users),完全开源免费,任何人都可以在自己的设备上本地运行。与依赖云端服务器的 AI 聊天工具不同,SillyTavern 支持连接 Ollama、KoboldCpp、llama.cpp 等本地模型运行框架,让用户的对话数据永远不离开自己的设备,真正实现了隐私保护。
在 API 支持方面,SillyTavern 展现了其强大的兼容性。它不仅支持 OpenAI GPT、Google Gemini、Anthropic Claude 等主流云端 API,还支持通过 OpenRouter、AI Horde、NanoGPT 等平台访问数百种不同的语言模型。这种多后端架构让用户可以根据需求灵活选择:需要隐私时使用本地模型,想要免费体验时接入 AI Horde 社区捐赠的 GPU 资源,追求最高质量输出时切换到 GPT-4 或 Claude。
市场数据印证了 SillyTavern 的广泛认可。项目在 GitHub 拥有 24,800 颗星标,5,000 次分支,319 位代码贡献者参与了项目开发。Discord 社区拥有 78,710 名成员,其中 10,778 人同时在线。自 2023 年 2 月从 TavernAI 1.2.8 分支独立发展以来,项目已完成超过 11,490 次提交,发布 100 个版本,持续迭代超过三年时间。这些数据充分说明 SillyTavern 已成为开源 LLM 前端领域的标杆产品。
SillyTavern 的核心功能
SillyTavern 提供了一套完整的高级 AI 交互功能,覆盖从模型连接、角色定制到内容生成的完整工作流。
多后端 LLM 连接是 SillyTavern 最核心的能力。项目支持超过 20 种 LLM API 后端,包括云端的 OpenAI、Anthropic、Google、Mistral、DeepSeek 等服务商,以及本地的 KoboldCpp、Ollama、Oobabooga TextGen WebUI、TabbyAPI 等框架。技术上支持 Chat Completion 和 Text Completion 两种 API 结构,兼容 OpenAI 格式,同时保留了对 KoboldAI 旧版 API 的支持。流式输出(Streaming)和上下文窗口管理功能让对话体验更加流畅自然。
**角色卡系统(Character Cards)**是 SillyTavern 最受用户喜爱的功能之一。用户可以通过 JSON 或 PNG 格式定义 AI 角色的姓名、描述、背景故事、性格特征和示例对话。PNG 格式支持将角色信息内嵌为元数据,方便分享和传播。角色卡 v2 格式还支持 Alt Greetings(备用问候语)和高级定义字段,允许用户编写复杂的系统提示来精确控制 AI 行为。通过 Group Chats 功能,用户可以同时与多个 AI 角色互动,甚至让多个 AI 角色之间相互对话。
高级文本生成控制让用户能够细粒度调整 AI 输出质量。Temperature、Top-K、Top-P、Presence Penalty、Frequency Penalty 等采样参数均可自定义。用户可以保存和切换预设配置,社区也分享了大量针对不同场景优化的预设参数。自动模型检测功能会根据所选后端推荐最优参数组合。
提示词格式化与模板功能解决了不同模型训练格式不兼容的问题。SillyTavern 内置了 Alpaca、Llama2-chat、Vicuna 等主流指令模板,用户也可以自定义前缀和后缀。ST-Script 脚本引擎允许编写复杂的对话逻辑,配合 Data Bank 功能还能实现本地知识库的检索增强生成(RAG)。
**世界信息(World Info / Lorebooks)**功能让用户能够构建丰富的世界观设定。通过关键词触发系统,Lorebook 中的内容会在适当时机自动插入到对话上下文中,支持多层级管理和动态激活抑制,非常适合长篇角色扮演和故事创作。
- 高度可定制:插件系统、ST-Script 脚本引擎、自定义 CSS 注入
- 完全免费:AGPL-3.0 开源许可,无任何付费功能
- 隐私保护:100% 本地运行,数据不离开设备
- 图像与语音集成:内置 Stable Diffusion、FLUX、DALL-E 连接,Coqui TTS 支持
- 需要技术知识:需要了解 API 配置、模型部署等基础概念
- 本地模型需要硬件:7B 参数模型建议 6GB+ VRAM,更大模型需要更强显卡
- 无官方移动 App:需要通过 Termux 或浏览器访问
图像生成集成支持连接 Automatic1111、ComfyUI 等 Stable Diffusion 客户端,以及 FLUX、DALL-E 等云端 API。用户可以为角色生成立绘、创建场景插画,甚至使用图像到图像功能进行创意加工。
**文字转语音(TTS)**功能基于 Coqui TTS(kokoro-js)引擎,支持多语言语音合成。用户可以为不同角色定制专属语音,调节语速和音调,获得更加沉浸式的交互体验。
谁在使用 SillyTavern
SillyTavern 的用户群体广泛,从隐私主义者到创意作家,从游戏玩家到开发者,都能在这款工具中找到价值。
隐私敏感型用户是 SillyTavern 的核心用户群体之一。通过 Ollama 或 KoboldCpp 在本地运行 LLaMA、Mistral 等开源模型,用户可以确保自己的对话数据 100% 留在本地设备上,没有任何数据会被发送到第三方服务器。这种本地化部署特别适合处理敏感信息的场景,如医疗咨询、法律建议或个人日记类应用。
免费 AI 角色扮演爱好者充分利用 SillyTavern 的多后端支持。他们可以通过 AI Horde 连接社区捐赠的免费 GPU 资源,或者使用 Pollinations 的免费云端 API,甚至利用 Cohere 和 Mistral 的免费 tier,在零成本前提下体验完整的 AI 角色扮演功能。配合强大的角色卡系统,用户可以创建或导入心仪的角色,与之进行深度互动。
创意写作与故事创作者使用 SillyTavern 进行长篇内容创作。通过精心设计的角色卡确保 AI 输出的文字风格一致,利用 World Info 构建复杂的世界观,借助 ST-Script 脚本引擎控制叙事流程,再配合 Claude 或 GPT-4 的高质量输出,可以创作出符合角色设定的完整故事作品。
自定义 AI 助手开发者则将 SillyTavern 作为构建专业领域 AI 助手的基础平台。他们创建针对特定行业的角色卡,配置高级定义字段设置详细的业务指令,连接本地知识库实现 RAG 能力,并可选配 Web Search 扩展获取实时信息。这种方式构建的 AI 助手在定制深度上远超 ChatGPT 的 GPTs 功能。
隐私优先的用户建议选择 Ollama 或 KoboldCpp 本地部署;预算有限的用户推荐 AI Horde 或 Pollinations 免费 API;追求最高输出质量的用户可选择 Claude 或 GPT-4 云端 API。
游戏与虚拟世界爱好者利用 SillyTavern 的 Group Chats 和 Visual Novel Mode 创建动态交互体验。他们可以同时与多个 AI 角色交流,让 AI 角色之间相互对话,甚至结合图像生成功能为游戏创建素材。这种 AI 驱动的交互方式为文字冒险游戏带来了革命性的创新。
本地模型实验者将 SillyTavern 作为测试最新开源模型的统一平台。通过 Ollama 一键部署最新模型,使用相同的角色卡和提示词比较不同模型的输出效果,快速迭代采样参数优化结果。这是完全免费的 LLM 实验环境,特别适合模型研究者和开发者。
多语言学习者利用 SillyTavern 创建沉浸式语言练习环境。通过翻译扩展实时翻译对话内容,与 AI 角色进行目标语言对话,结合 TTS 功能练习听力和口语,获得远超传统教材的互动学习体验。
开发者与测试工程师则使用 SillyTavern 进行 AI 模型的批量评估和对比测试。统一界面测试多个 API 提供商的响应质量,使用相同测试用例保存不同模型的输出进行对比,编写脚本实现自动化测试流程,大幅提升模型选型效率。
技术特点
SillyTavern 采用现代化的前后端分离架构,在保证功能丰富的同时保持了良好的可扩展性和性能表现。
从技术栈来看,项目主体使用 JavaScript 编写,占比 85.8%,HTML 占 10.2%,CSS 占 3.4%。这种技术选型使得 SillyTavern 能够运行在任何支持 Node.js 的平台上,包括 Windows、macOS、Linux 以及 Android(通过 Termux)。项目依赖 Node.js 18 或更高版本,内置 Express 服务器处理 HTTP 请求,通过 WebSocket 实现实时通信。
架构设计上,SillyTavern 支持 Chat Completion 和 Text Completion 两种 API 结构,兼容 OpenAI 格式的 API 调用。项目还提供了插件扩展系统和 ST-Script 脚本引擎,允许高级用户深度定制行为逻辑。这种开放式架构吸引了大量第三方开发者参与贡献,目前已有 300 多位代码贡献者参与了项目开发。
在模型支持方面,SillyTavern 展现了其强大的兼容性。本地模型方面,项目支持 KoboldCpp、llama.cpp、Ollama、Oobabooga TextGen WebUI、TabbyAPI、KoboldAI Classic 等主流本地运行框架。云端 API 方面,OpenAI、Anthropic Claude、Google Gemini、Mistral、DeepSeek、AI21、Cohere、Perplexity、NovelAI、OpenRouter、AI Horde、NanoGPT、Pollinations、Mancer AI、DreamGen、AI/ML API 等服务商均被支持。项目还支持 GGUF、GPTQ、AWQ、Exl2 等量化格式,大幅降低本地推理的硬件门槛。
- 完全免费:AGPL-3.0 开源许可,无任何付费功能
- 高度可定制:插件系统、ST-Script 引擎、自定义 CSS/主题
- 隐私安全:100% 本地运行,不追踪用户数据,支持 Docker 部署
- 活跃社区:319 位贡献者、78,710 Discord 成员、持续更新
- 需要技术背景:需要理解 API 配置、模型部署、量化等概念
- 硬件要求:本地 LLM 推理推荐 NVIDIA 3000 系列显卡,6GB+ VRAM
- 无开箱即用体验:需要用户自行配置后端和模型
性能表现方面,SillyTavern 本身对硬件要求极低,只需 Node.js 18+ 即可运行,4GB 内存即可满足基础需求。但对于本地 LLM 推理,7B 参数模型推荐至少 6GB VRAM 的显卡(如 RTX 3060),13B 参数模型建议 12GB+ VRAM(如 RTX 4070),更大模型需要更高端的配置。项目支持通过量化技术降低模型资源需求,让中端显卡也能运行较大参数量的模型。
在安全性与隐私保护方面,SillyTavern 继承了开源项目的透明特性。项目遵循 GitHub Security 策略,支持用户配置 SSL/TLS 加密连接,Docker 部署时支持健康检查和卷管理。.nomedia 文件机制可防止媒体文件被系统扫描。对于隐私要求极高的用户,Docker 部署提供了隔离的运行环境。
常见问题
SillyTavern 和 TavernAI 有什么区别?
SillyTavern 于 2023 年 2 月从 TavernAI 1.2.8 分支独立开发,至今已新增数百个功能和改进。主要区别包括:支持更广泛的 API( TavernAI 主要支持 KoboldAI 系列,SillyTavern 扩展到 20+ 后端);更强大的扩展系统和插件架构;持续的功能更新和 bug 修复;以及活跃的社区维护(Discord 78,710 成员 vs TavernAI 相对较小的社区)。
运行 SillyTavern 需要什么配置的电脑?
SillyTavern 本身只需要 Node.js 18+ 即可运行,对硬件几乎无要求。如果要进行本地 LLM 推理(推荐使用 Ollama 或 KoboldCpp),7B 参数模型建议 NVIDIA 3000 系列显卡(6GB+ VRAM),如 RTX 3060;13B 参数模型需要 12GB+ VRAM,如 RTX 4070;70B 参数模型需要 24GB+ VRAM,如 RTX 4090。7B 模型也可在无显卡的电脑上通过 CPU 运行,但速度会非常慢。
SillyTavern 是免费的吗?
完全免费。SillyTavern 本身采用 AGPL-3.0 开源许可,不收取任何费用。但需要注意:使用云端 API(如 OpenAI GPT-4、Claude)会产生 token 费用,由用户自行承担;在本地运行模型完全免费;SillyTavern 还支持多个免费 API,如 AI Horde(社区捐赠 GPU)、Pollinations(带广告)、Cohere 免费 tier、Mistral 免费 tier。
SillyTavern 支持中文吗?
支持。SillyTavern 界面本身支持多语言显示,包括简体中文。用户可以通过翻译扩展自动翻译对话内容,实现跨语言交流。推荐使用本地运行的中文模型(如 Chinese-LLaMA、Qwen、Baichuan)配合 SillyTavern,可获得全流程的中文交互体验。
如何获取角色卡?
获取角色卡有三种主要方式:从 AICharacterCards.com 等社区网站下载现成的角色卡;在 SillyTavern 内置的角色卡编辑器中自行创建和编辑;或者从其他用户处导入 PNG/JSON 格式的角色卡文件。角色卡采用 v2 格式,支持将 JSON 元数据内嵌到 PNG 图片中,方便分享和传播。
SillyTavern 有手机版吗?
没有独立的手机 App,但提供多种移动端访问方式:Android 用户可通过 Termux 安装完整版 SillyTavern;用户可以在手机浏览器中访问本地部署的 SillyTavern 服务(需在同一网络下);项目采用响应式布局设计,在移动设备上也能获得良好的操作体验。
可以同时和多个 AI 角色聊天吗?
可以。使用 Group Chats 功能,用户可以创建包含多个 AI 角色的对话场景。多个 AI 角色可以同时与你互动,也可以让 AI 角色之间相互对话。这种功能非常适合创建复杂的故事场景、模拟多人会议或构建互动游戏体验。
如何在 SillyTavern 中使用 Claude?
在 SillyTavern 中连接 Claude 非常简单:进入「API Connections」设置页面;选择「Chat Completion」作为 API 类型;在「Source」下拉菜单中选择「Claude」;输入你的 Anthropic API Key(需要从 anthropic.com 获取);保存设置后即可开始与 Claude 对话。SillyTavern 还支持 Claude 的 prefill 功能,可以引导 AI 的回复方向。
SillyTavern
为高级用户打造的开源本地 LLM 前端


评论