LTX 2.3 - 开源22B参数AI视频生成器轻松创作电影级4K内容

上线于 2026年3月20日

还在为视频制作成本高、周期长而烦恼？LTX 2.3是Lightricks推出的220亿参数开源AI视频模型，支持文生视频、图生视频、音频驱动视频和原生9:16竖屏生成，最高输出4K@50fps。H100上速度比WAN 2.2快18倍，让创作者和开发者几分钟内完成电影级视频创作。

AI 视频免费增值图像生成视频生成开源

访问网站

什么是 LTX 2.3 LTX 2.3 的核心功能，帮你解决什么问题谁在用 LTX 2.3？真实场景一览如何上手使用 LTX 2.3 选对方案，少走弯路：LTX 2.3 定价一览常见问题解答评论相关内容

什么是 LTX 2.3

想象一个场景：你的团队刚刚敲定了一个新的营销方向，需要一支产品视频在本周上线，但外包报价动辄数万元，内部制作又需要专业设备和剪辑人员。这样的困境，几乎困扰着每一个内容团队、营销部门和独立创作者。

视频制作的高成本、漫长周期和专业门槛，长期以来都是中小团队的"拦路虎"。好的想法往往因为资源不足而卡在执行阶段。

LTX 2.3 就是为了打破这一局面而生的。它是由以色列创意 AI 公司 Lightricks 推出的 220 亿参数开源 AI 视频生成模型，底层采用 DiT（Diffusion Transformer，扩散变换）架构——这意味着它拥有远超传统扩散模型的语义理解和时序建模能力。无论你是写一段文字描述、上传一张产品图、提供一段音轨，还是拿出一段已有视频，LTX 2.3 都能将其转化为电影级的动态视频内容，最高支持 4K@50fps 输出。

LTX 2.3 的诞生并非闭门造车。学术论文已发表于 arXiv（arXiv:2601.03233），模型权重在 Hugging Face 完全开放下载，GitHub 已积累超过 5,000 个 Star 和 750+ Fork，每天有数千名电影制作人、营销人员和开发者在使用它。在性能上，LTX 2.3 在 H100 GPU 上的生成速度比同类开源模型 WAN 2.2 快 18 倍，这让实时创作工作流成为可能。

对于大多数个人创作者和中小企业而言，更重要的一点是：年收入低于 1000 万美元的用户可以免费商用，无需支付额外许可费用。

LTX 2.3 核心要点

22B DiT 架构：基于扩散变换模型，生成质量与语义理解大幅领先传统扩散模型
多模态输入：支持文本、图像、音频、视频四种输入方式，覆盖全生产流程
原生 9:16 竖屏支持：基于真实人像数据训练，专为 TikTok/Reels/Shorts 优化，非横屏裁剪
4K@50fps 专业输出：支持广播级分辨率与帧率，满足专业制作要求
完全开源可商用：Hugging Face 免费下载，年收入 <1000 万美元免费商用

LTX 2.3 的核心功能，帮你解决什么问题

文生视频：从一段文字到电影级画面

您可以用它来把脑海中的任何场景变成视频——只需用自然语言描述，最长支持 2000 个字符的提示词。LTX 2.3 的 22B DiT 引擎会精准理解您的意图，生成流体运动、准确光照和真实物理模拟的画面。想要一个咖啡杯在清晨阳光下冒出热气的产品镜头？还是一段城市街头的慢动作行人画面？描述出来，交给 LTX 2.3 去实现。

图生视频：让静态图像"活"起来

您可以用它来将一张普通的产品图、设计稿或照片，自动转化为带有自然镜头运动的动态视频片段。相较于同类工具，LTX 2.3 明显减少了画面冻结和伪影问题，生成结果更加流畅自然。对于 UX 设计师来说，几分钟内就能把 App 界面截图变成一段精致的 Walkthrough 演示视频。

音频驱动视频：声音带动画面

您可以用它来上传一段音频轨道，系统会自动生成与之高度匹配的视觉内容，支持唇形同步、节拍对齐运动和空间音频提示。这对音乐可视化创作者、播客品牌和需要制作本地化广告的营销团队来说极其实用。

原生 9:16 竖屏视频

您可以用它来直接生成原生 1080×1920 竖屏视频，而不是从横屏内容中裁剪——这个区别至关重要。LTX 2.3 的竖屏模式基于真实人像和竖屏场景数据训练，生成的内容天然适配 TikTok、Instagram Reels 和 YouTube Shorts 的构图习惯和观看体验。

4K@50fps 专业级输出

您可以用它来输出 1080p、1440p 或 4K 分辨率视频，帧率选择涵盖 24/25/48/50 fps，完全满足广播级制作和电影预可视化的要求。无论是提交给客户的商业提案，还是直接上传到流媒体平台，输出质量都无需妥协。

多风格引擎：一个工具搞定所有风格

您可以用它来在动漫、电影级写实和照片级真实感之间自由切换，无需为不同风格安装不同的模型或工具。正如用户 Emma Zhang 所说："多风格引擎可以处理动漫、电影级和写实内容，完全不需要切换工具。"

完全开源免费：模型权重开放下载，年收入 <1000 万美元可免费商用，极大降低使用门槛
真正的多模态：文本、图像、音频、视频四种输入方式，覆盖从策划到制作的完整工作流
速度领先 18×：H100 GPU 上比 WAN 2.2 快 18 倍，实时创作不再是奢望
原生竖屏支持：专为社交媒体短视频场景训练，而非简单裁剪
专业输出规格：4K@50fps 满足广播和电影级制作需求

本地部署门槛较高：完整运行需要 32GB+ VRAM 的 NVIDIA GPU，普通消费级显卡可能力不从心
单次生成时长有限：最长支持 20 秒，不适合直接生成长篇视频内容

谁在用 LTX 2.3？真实场景一览

社交媒体创作者：告别"视频荒"

当您需要每周稳定输出 5-10 条短视频时，LTX 2.3 的原生 9:16 竖屏模式可以让您批量生成 TikTok、Reels 和 Shorts 内容，同时轻松创建多个 A/B 测试变体，看哪个版本更受欢迎。制作时间从过去的数天压缩到数小时，让创意始终走在发布节奏的前面。

营销与电商团队：以小预算做大量产

假如您是电商品牌的营销负责人，需要为 200 个 SKU 制作产品视频，传统拍摄方案根本无法承受。用 LTX 2.3 上传参考图、保持品牌视觉一致性，系统可以批量生成产品演示视频，以传统工作室成本的一小部分完成目录级规模的视频制作。用户 Rachel Kim 分享："我们用 LTX 2.3 制作产品视频，费用只是传统工作室的零头。"

电影预制作团队：低成本验证创意

当您的团队在筹备一部新项目时，预可视化阶段的动态分镜成本往往令人望而却步。LTX 2.3 可以帮助您在真正开机之前，快速测试不同的镜头角度、光线方案和视觉效果。Ryan Nakamura 的团队实践证明：切换到 LTX 2.3 后，"制作产出量翻倍，总体成本降低了一半"。

独立游戏开发者：省下数周动画工作

3D 动画制作历来是独立开发者最难啃的硬骨头。用 LTX 2.3 生成游戏预告片和过场动画，可以节省数周的手工动画制作时间，输出质量完全可以媲美专业团队制作的过场动画，帮助独立游戏在发行阶段留下第一印象。

UX 设计师 / 产品经理：让原型"动"起来

假如您正在为一款新 App 准备投资人 Demo，静态界面截图说服力有限，而专业的产品视频制作又费时费力。LTX 2.3 的图生视频模式可以将您的 App 模型图直接转化为精致的 Walkthrough 演示视频。设计师 Aisha Patel 表示，这个过程"几分钟内就能完成"。

💡 云端 or 本地，您可以自由选择

如果您希望零配置快速上手，访问 ltx23.app 注册免费账户即可立刻开始生成，所有计算在云端完成，无需任何本地硬件。如果您希望完全掌控数据、进行自定义微调或构建私有工作流，可前往 Hugging Face 下载开源模型权重自行部署。两条路径都完全支持，按需选择。

如何上手使用 LTX 2.3

路径一：云端在线，零门槛起步

对于大多数用户，最快的方式就是直接使用在线平台，全程无需安装任何软件：

注册账户：访问 ltx23.app，创建免费账户并获得试用积分
选择生成模式：根据需求选择文生视频、图生视频或音频驱动视频
输入内容：填写文本描述（最长 2000 字符），或上传参考图像、音频文件
设置参数：选择时长（4-20 秒）、宽高比（16:9 / 9:16 / 1:1 / 4:3）、分辨率和帧率
生成下载：点击生成，等待云端渲染完成，即时下载高清视频，全程无需本地 GPU

整个流程像使用普通在线工具一样简单，生成的视频带有完整商业授权，无水印，可直接用于发布。

路径二：本地部署，开发者自定义

如果您需要完全的数据控制权、自定义 LoRA 微调或企业级私有部署，本地路径更适合您：

环境要求：Python ≥3.12，CUDA >12.7，推荐 NVIDIA GPU（32GB+ VRAM），32GB RAM，60GB 存储空间（Windows）
模型获取：前往 Hugging Face 下载所需 Checkpoint，包括完整 bf16 基础版（ltx-2.3-22b-dev）、8步蒸馏快速版（ltx-2.3-22b-distilled）、LoRA 版本，以及空间/时间上采样器
集成方式：通过 ComfyUI 原生节点拖拽搭建工作流，或使用 Python 代码库深度集成到现有管线；Diffusers 库支持也即将上线
自定义能力：支持 LoRA 微调，可针对特定品牌风格或角色一致性进行训练

如果您想先体验 API 能力，可以访问 console.ltx.video/playground/ 直接在线调用。

💡 低显存用户必看

如果您的 GPU VRAM 不足 32GB，不必放弃本地部署。可以选择 GGUF 或 FP8 量化版本（如 ltx-2.3-22b-distilled-lora-384），在显著降低显存占用的同时，依然保持相当高的生成质量。这是社区中许多 RTX 3090/4090 用户常用的折中方案。

选对方案，少走弯路：LTX 2.3 定价一览

LTX 2.3 提供两条完全不同的使用路径：如果您需要云端托管、稳定更新和商业支持，订阅计划是更省心的选择；如果您是开发者或技术团队，开源免费路径同样完整可用。

订阅计划对比（年付可省约 30%）

计划	月付	年付（约省30%）	年额度	每100积分成本	适合人群
Starter	$19.9/月	$13.9/月（$166.8/年）	14,400 积分	$1.16	个人创作者、小型团队
Premium	$39.9/月	$27.9/月（$334.8/年）	33,600 积分	$1.00	成长中的营销团队
Advanced	$99.9/月	$69.9/月（$838.8/年）	120,000 积分	$0.70	高频生产的专业团队

所有付费计划均包含：文生视频、图生视频、AI 图像生成全部模型，Motion Control 运动控制，最高 4K 分辨率输出，生成内容隐私保护，优先处理队列，完整商业使用授权，以及随时取消的灵活性。

我们建议：刚开始尝试的个人用户选 Starter，注册即可获得免费试用积分，成本极低；需要稳定批量产出的营销团队选 Premium，优先客户支持让问题解决更高效；对生成速度和产出量有强需求的专业团队选 Advanced，每百积分成本最低，且享有专家团队支持。

开源免费路径

如果您倾向于本地部署，可以直接从 Hugging Face 免费下载完整模型权重。年收入低于 1000 万美元的个人和企业，可以完全免费用于商业用途，无需支付任何许可费用。年收入超过 1000 万美元的大型组织则需要购买商业许可，具体可联系 Lightricks 官方洽谈。

详细定价信息请参阅：ltx23.app/pricing

常见问题解答

LTX 2.3 是什么，和普通 AI 视频工具有什么不同？

LTX 2.3 是由 Lightricks 开发的 220 亿参数开源 AI 视频生成模型，基于 DiT（扩散变换器）架构，学术论文已发表于 arXiv。它与普通 AI 视频工具最大的不同在于三点：第一，真正的多模态输入，支持文本、图像、音频、视频四种方式；第二，完全开源，模型权重在 Hugging Face 免费开放，开发者可以自由部署和微调；第三，原生支持 9:16 竖屏格式，基于真实竖屏数据训练，而非简单裁剪横屏输出。

使用 ltx23.app 需要本地 GPU 吗？本地部署对硬件有什么要求？

使用 ltx23.app 在线平台完全不需要本地 GPU，所有渲染在云端完成，注册账户即可开始生成。如果您希望本地部署，推荐配置为：NVIDIA GPU（32GB+ VRAM）、32GB 系统内存、60GB 存储空间，环境要求 Python ≥3.12 和 CUDA >12.7。显存不足的用户可以使用 GGUF 或 FP8 量化版本降低硬件门槛。

支持哪些视频规格（分辨率、帧率、宽高比、时长）？

LTX 2.3 支持以下输出规格：分辨率覆盖 1080p、1440p 和 4K；帧率选项包括 24、25、48、50 fps；宽高比支持 16:9（横屏）、9:16（竖屏）、1:1（方形）和 4:3；单次生成时长为 4 到 20 秒。原生竖屏输出分辨率为 1080×1920，基于真实人像数据训练。

LTX 2.3 生成的视频可以用于商业用途吗？

可以。通过 ltx23.app 订阅计划生成的视频，所有方案均包含完整商业授权，无水印，无版税限制，可直接用于商业发布。使用开源模型本地生成的视频，年收入低于 1000 万美元的个人和企业同样可以免费商用，年收入超过 1000 万美元的组织需联系 Lightricks 购买商业许可。

LTX 2.3 与 Sora 2、Veo 3.1、Kling 3.0 相比有哪些优势？

与 Sora 2 相比，LTX 2.3 完全开源可访问，支持真正的多模态管道和原生音频同步，而非仅限文生视频；与 Veo 3.1 相比，LTX 2.3 在匹配 4K@50fps 输出质量的同时，提供完整开源访问权限和 LoRA 微调支持，灵活性更高；与 Kling 3.0 相比，LTX 2.3 支持更宽的分辨率范围、原生竖屏格式，以及完全开放的模型权重。对于需要定制化部署和本地控制的团队，开源这一点是决定性优势。

积分是如何消耗的，没用完会过期吗？

积分根据生成视频的分辨率、时长和帧率等参数消耗，更高质量的输出消耗更多积分。订阅计划按年分配额度，如需了解积分的具体过期政策，建议参阅 ltx23.app 的服务条款或联系支持团队（support@ltx23.app）获取最新说明。

支持哪些开发者集成方式（ComfyUI、Python、API）？

LTX 2.3 提供三种主要开发者集成路径：一是 ComfyUI 原生节点，可在 ComfyUI Manager 中直接安装，通过拖拽搭建可视化工作流；二是 Python 代码库，支持 Python ≥3.12 环境，可深度集成到现有 AI 管线；三是 LTX API，可通过 console.ltx.video/playground/ 体验，并接入到自定义应用中。此外，Diffusers 库的官方支持也正在开发中，即将上线。

如何保护我的生成内容隐私？

ltx23.app 对所有传输数据进行加密保护，并配有访问控制和日志记录机制。所有订阅计划均包含"生成隐私保护"，平台不会出售您的个人数据，仅在必要时与核心服务提供商共享，并遵循适用法律处理国际数据传输。详细隐私政策请参阅：ltx23.app/privacy-policy（更新于2025年10月24日）。如果对数据安全有更高要求，本地部署方案可让您完全掌控数据，不经过任何第三方服务器。

LTX 2.3

开源22B参数AI视频生成器轻松创作电影级4K内容

访问网站

创作者

Maker

Jennifer Pitaniello

加入于 2026年3月

提交了该产品

精选

查看全部

AI Jewelry Model

AI驱动的珠宝虚拟试戴和摄影工具

SVGMaker

AI驱动的SVG生成和编辑平台

DatePhotos.AI

真正帮你获得匹配的AI约会照片生成器

iMideo

一体化AI视频生成平台

No Code Website Builder

汇聚1000+精选无代码模板的一站式平台

精选文章

2026 年 5 个最佳 AI 博客 SEO 写作工具

我们测试了顶级 AI 博客写作工具，找出最适合 SEO 的 5 个。对比 Jasper、Frase、Copy.ai、Surfer SEO 和 Writesonic——包含定价、功能和诚实的优缺点。

2026 年 12 款最佳 AI 编程工具：实测排名

我们实测了 30+ 款 AI 编程工具，精选出 2026 年最值得用的 12 款。涵盖 Cursor、GitHub Copilot、Windsurf 等热门工具的功能、定价与实际表现对比。

信息

访问量

更新时间

请先登录再发表评论。

还没有评论。成为第一个分享想法的人吧！