LTX 2.3

LTX 2.3 - 开源22B参数AI视频生成器轻松创作电影级4K内容

上线于 2026年3月20日

还在为视频制作成本高、周期长而烦恼?LTX 2.3是Lightricks推出的220亿参数开源AI视频模型,支持文生视频、图生视频、音频驱动视频和原生9:16竖屏生成,最高输出4K@50fps。H100上速度比WAN 2.2快18倍,让创作者和开发者几分钟内完成电影级视频创作。

AI 视频免费增值图像生成视频生成开源

什么是 LTX 2.3

想象一个场景:你的团队刚刚敲定了一个新的营销方向,需要一支产品视频在本周上线,但外包报价动辄数万元,内部制作又需要专业设备和剪辑人员。这样的困境,几乎困扰着每一个内容团队、营销部门和独立创作者。

视频制作的高成本、漫长周期和专业门槛,长期以来都是中小团队的"拦路虎"。好的想法往往因为资源不足而卡在执行阶段。

LTX 2.3 就是为了打破这一局面而生的。它是由以色列创意 AI 公司 Lightricks 推出的 220 亿参数开源 AI 视频生成模型,底层采用 DiT(Diffusion Transformer,扩散变换)架构——这意味着它拥有远超传统扩散模型的语义理解和时序建模能力。无论你是写一段文字描述、上传一张产品图、提供一段音轨,还是拿出一段已有视频,LTX 2.3 都能将其转化为电影级的动态视频内容,最高支持 4K@50fps 输出。

LTX 2.3 的诞生并非闭门造车。学术论文已发表于 arXiv(arXiv:2601.03233),模型权重在 Hugging Face 完全开放下载,GitHub 已积累超过 5,000 个 Star 和 750+ Fork,每天有数千名电影制作人、营销人员和开发者在使用它。在性能上,LTX 2.3 在 H100 GPU 上的生成速度比同类开源模型 WAN 2.2 快 18 倍,这让实时创作工作流成为可能。

对于大多数个人创作者和中小企业而言,更重要的一点是:年收入低于 1000 万美元的用户可以免费商用,无需支付额外许可费用。

LTX 2.3 核心要点
  • 22B DiT 架构:基于扩散变换模型,生成质量与语义理解大幅领先传统扩散模型
  • 多模态输入:支持文本、图像、音频、视频四种输入方式,覆盖全生产流程
  • 原生 9:16 竖屏支持:基于真实人像数据训练,专为 TikTok/Reels/Shorts 优化,非横屏裁剪
  • 4K@50fps 专业输出:支持广播级分辨率与帧率,满足专业制作要求
  • 完全开源可商用:Hugging Face 免费下载,年收入 <1000 万美元免费商用

LTX 2.3 的核心功能,帮你解决什么问题

文生视频:从一段文字到电影级画面

您可以用它来把脑海中的任何场景变成视频——只需用自然语言描述,最长支持 2000 个字符的提示词。LTX 2.3 的 22B DiT 引擎会精准理解您的意图,生成流体运动、准确光照和真实物理模拟的画面。想要一个咖啡杯在清晨阳光下冒出热气的产品镜头?还是一段城市街头的慢动作行人画面?描述出来,交给 LTX 2.3 去实现。

图生视频:让静态图像"活"起来

您可以用它来将一张普通的产品图、设计稿或照片,自动转化为带有自然镜头运动的动态视频片段。相较于同类工具,LTX 2.3 明显减少了画面冻结和伪影问题,生成结果更加流畅自然。对于 UX 设计师来说,几分钟内就能把 App 界面截图变成一段精致的 Walkthrough 演示视频。

音频驱动视频:声音带动画面

您可以用它来上传一段音频轨道,系统会自动生成与之高度匹配的视觉内容,支持唇形同步、节拍对齐运动和空间音频提示。这对音乐可视化创作者、播客品牌和需要制作本地化广告的营销团队来说极其实用。

原生 9:16 竖屏视频

您可以用它来直接生成原生 1080×1920 竖屏视频,而不是从横屏内容中裁剪——这个区别至关重要。LTX 2.3 的竖屏模式基于真实人像和竖屏场景数据训练,生成的内容天然适配 TikTok、Instagram Reels 和 YouTube Shorts 的构图习惯和观看体验。

4K@50fps 专业级输出

您可以用它来输出 1080p、1440p 或 4K 分辨率视频,帧率选择涵盖 24/25/48/50 fps,完全满足广播级制作和电影预可视化的要求。无论是提交给客户的商业提案,还是直接上传到流媒体平台,输出质量都无需妥协。

多风格引擎:一个工具搞定所有风格

您可以用它来在动漫、电影级写实和照片级真实感之间自由切换,无需为不同风格安装不同的模型或工具。正如用户 Emma Zhang 所说:"多风格引擎可以处理动漫、电影级和写实内容,完全不需要切换工具。"

  • 完全开源免费:模型权重开放下载,年收入 <1000 万美元可免费商用,极大降低使用门槛
  • 真正的多模态:文本、图像、音频、视频四种输入方式,覆盖从策划到制作的完整工作流
  • 速度领先 18×:H100 GPU 上比 WAN 2.2 快 18 倍,实时创作不再是奢望
  • 原生竖屏支持:专为社交媒体短视频场景训练,而非简单裁剪
  • 专业输出规格:4K@50fps 满足广播和电影级制作需求
  • 本地部署门槛较高:完整运行需要 32GB+ VRAM 的 NVIDIA GPU,普通消费级显卡可能力不从心
  • 单次生成时长有限:最长支持 20 秒,不适合直接生成长篇视频内容

谁在用 LTX 2.3?真实场景一览

社交媒体创作者:告别"视频荒"

当您需要每周稳定输出 5-10 条短视频时,LTX 2.3 的原生 9:16 竖屏模式可以让您批量生成 TikTok、Reels 和 Shorts 内容,同时轻松创建多个 A/B 测试变体,看哪个版本更受欢迎。制作时间从过去的数天压缩到数小时,让创意始终走在发布节奏的前面。

营销与电商团队:以小预算做大量产

假如您是电商品牌的营销负责人,需要为 200 个 SKU 制作产品视频,传统拍摄方案根本无法承受。用 LTX 2.3 上传参考图、保持品牌视觉一致性,系统可以批量生成产品演示视频,以传统工作室成本的一小部分完成目录级规模的视频制作。用户 Rachel Kim 分享:"我们用 LTX 2.3 制作产品视频,费用只是传统工作室的零头。"

电影预制作团队:低成本验证创意

当您的团队在筹备一部新项目时,预可视化阶段的动态分镜成本往往令人望而却步。LTX 2.3 可以帮助您在真正开机之前,快速测试不同的镜头角度、光线方案和视觉效果。Ryan Nakamura 的团队实践证明:切换到 LTX 2.3 后,"制作产出量翻倍,总体成本降低了一半"。

独立游戏开发者:省下数周动画工作

3D 动画制作历来是独立开发者最难啃的硬骨头。用 LTX 2.3 生成游戏预告片和过场动画,可以节省数周的手工动画制作时间,输出质量完全可以媲美专业团队制作的过场动画,帮助独立游戏在发行阶段留下第一印象。

UX 设计师 / 产品经理:让原型"动"起来

假如您正在为一款新 App 准备投资人 Demo,静态界面截图说服力有限,而专业的产品视频制作又费时费力。LTX 2.3 的图生视频模式可以将您的 App 模型图直接转化为精致的 Walkthrough 演示视频。设计师 Aisha Patel 表示,这个过程"几分钟内就能完成"。

💡 云端 or 本地,您可以自由选择

如果您希望零配置快速上手,访问 ltx23.app 注册免费账户即可立刻开始生成,所有计算在云端完成,无需任何本地硬件。如果您希望完全掌控数据、进行自定义微调或构建私有工作流,可前往 Hugging Face 下载开源模型权重自行部署。两条路径都完全支持,按需选择。


如何上手使用 LTX 2.3

路径一:云端在线,零门槛起步

对于大多数用户,最快的方式就是直接使用在线平台,全程无需安装任何软件:

  1. 注册账户:访问 ltx23.app,创建免费账户并获得试用积分
  2. 选择生成模式:根据需求选择文生视频、图生视频或音频驱动视频
  3. 输入内容:填写文本描述(最长 2000 字符),或上传参考图像、音频文件
  4. 设置参数:选择时长(4-20 秒)、宽高比(16:9 / 9:16 / 1:1 / 4:3)、分辨率和帧率
  5. 生成下载:点击生成,等待云端渲染完成,即时下载高清视频,全程无需本地 GPU

整个流程像使用普通在线工具一样简单,生成的视频带有完整商业授权,无水印,可直接用于发布。

路径二:本地部署,开发者自定义

如果您需要完全的数据控制权、自定义 LoRA 微调或企业级私有部署,本地路径更适合您:

  • 环境要求:Python ≥3.12,CUDA >12.7,推荐 NVIDIA GPU(32GB+ VRAM),32GB RAM,60GB 存储空间(Windows)
  • 模型获取:前往 Hugging Face 下载所需 Checkpoint,包括完整 bf16 基础版(ltx-2.3-22b-dev)、8步蒸馏快速版(ltx-2.3-22b-distilled)、LoRA 版本,以及空间/时间上采样器
  • 集成方式:通过 ComfyUI 原生节点拖拽搭建工作流,或使用 Python 代码库深度集成到现有管线;Diffusers 库支持也即将上线
  • 自定义能力:支持 LoRA 微调,可针对特定品牌风格或角色一致性进行训练

如果您想先体验 API 能力,可以访问 console.ltx.video/playground/ 直接在线调用。

💡 低显存用户必看

如果您的 GPU VRAM 不足 32GB,不必放弃本地部署。可以选择 GGUF 或 FP8 量化版本(如 ltx-2.3-22b-distilled-lora-384),在显著降低显存占用的同时,依然保持相当高的生成质量。这是社区中许多 RTX 3090/4090 用户常用的折中方案。


选对方案,少走弯路:LTX 2.3 定价一览

LTX 2.3 提供两条完全不同的使用路径:如果您需要云端托管、稳定更新和商业支持,订阅计划是更省心的选择;如果您是开发者或技术团队,开源免费路径同样完整可用。

订阅计划对比(年付可省约 30%)

计划 月付 年付(约省30%) 年额度 每100积分成本 适合人群
Starter $19.9/月 $13.9/月($166.8/年) 14,400 积分 $1.16 个人创作者、小型团队
Premium $39.9/月 $27.9/月($334.8/年) 33,600 积分 $1.00 成长中的营销团队
Advanced $99.9/月 $69.9/月($838.8/年) 120,000 积分 $0.70 高频生产的专业团队

所有付费计划均包含:文生视频、图生视频、AI 图像生成全部模型,Motion Control 运动控制,最高 4K 分辨率输出,生成内容隐私保护,优先处理队列,完整商业使用授权,以及随时取消的灵活性。

我们建议:刚开始尝试的个人用户选 Starter,注册即可获得免费试用积分,成本极低;需要稳定批量产出的营销团队选 Premium,优先客户支持让问题解决更高效;对生成速度和产出量有强需求的专业团队选 Advanced,每百积分成本最低,且享有专家团队支持。

开源免费路径

如果您倾向于本地部署,可以直接从 Hugging Face 免费下载完整模型权重。年收入低于 1000 万美元的个人和企业,可以完全免费用于商业用途,无需支付任何许可费用。年收入超过 1000 万美元的大型组织则需要购买商业许可,具体可联系 Lightricks 官方洽谈。

详细定价信息请参阅:ltx23.app/pricing


常见问题解答

LTX 2.3 是什么,和普通 AI 视频工具有什么不同?

LTX 2.3 是由 Lightricks 开发的 220 亿参数开源 AI 视频生成模型,基于 DiT(扩散变换器)架构,学术论文已发表于 arXiv。它与普通 AI 视频工具最大的不同在于三点:第一,真正的多模态输入,支持文本、图像、音频、视频四种方式;第二,完全开源,模型权重在 Hugging Face 免费开放,开发者可以自由部署和微调;第三,原生支持 9:16 竖屏格式,基于真实竖屏数据训练,而非简单裁剪横屏输出。

使用 ltx23.app 需要本地 GPU 吗?本地部署对硬件有什么要求?

使用 ltx23.app 在线平台完全不需要本地 GPU,所有渲染在云端完成,注册账户即可开始生成。如果您希望本地部署,推荐配置为:NVIDIA GPU(32GB+ VRAM)、32GB 系统内存、60GB 存储空间,环境要求 Python ≥3.12 和 CUDA >12.7。显存不足的用户可以使用 GGUF 或 FP8 量化版本降低硬件门槛。

支持哪些视频规格(分辨率、帧率、宽高比、时长)?

LTX 2.3 支持以下输出规格:分辨率覆盖 1080p、1440p 和 4K;帧率选项包括 24、25、48、50 fps;宽高比支持 16:9(横屏)、9:16(竖屏)、1:1(方形)和 4:3;单次生成时长为 4 到 20 秒。原生竖屏输出分辨率为 1080×1920,基于真实人像数据训练。

LTX 2.3 生成的视频可以用于商业用途吗?

可以。通过 ltx23.app 订阅计划生成的视频,所有方案均包含完整商业授权,无水印,无版税限制,可直接用于商业发布。使用开源模型本地生成的视频,年收入低于 1000 万美元的个人和企业同样可以免费商用,年收入超过 1000 万美元的组织需联系 Lightricks 购买商业许可。

LTX 2.3 与 Sora 2、Veo 3.1、Kling 3.0 相比有哪些优势?

与 Sora 2 相比,LTX 2.3 完全开源可访问,支持真正的多模态管道和原生音频同步,而非仅限文生视频;与 Veo 3.1 相比,LTX 2.3 在匹配 4K@50fps 输出质量的同时,提供完整开源访问权限和 LoRA 微调支持,灵活性更高;与 Kling 3.0 相比,LTX 2.3 支持更宽的分辨率范围、原生竖屏格式,以及完全开放的模型权重。对于需要定制化部署和本地控制的团队,开源这一点是决定性优势。

积分是如何消耗的,没用完会过期吗?

积分根据生成视频的分辨率、时长和帧率等参数消耗,更高质量的输出消耗更多积分。订阅计划按年分配额度,如需了解积分的具体过期政策,建议参阅 ltx23.app 的服务条款或联系支持团队(support@ltx23.app)获取最新说明。

支持哪些开发者集成方式(ComfyUI、Python、API)?

LTX 2.3 提供三种主要开发者集成路径:一是 ComfyUI 原生节点,可在 ComfyUI Manager 中直接安装,通过拖拽搭建可视化工作流;二是 Python 代码库,支持 Python ≥3.12 环境,可深度集成到现有 AI 管线;三是 LTX API,可通过 console.ltx.video/playground/ 体验,并接入到自定义应用中。此外,Diffusers 库的官方支持也正在开发中,即将上线。

如何保护我的生成内容隐私?

ltx23.app 对所有传输数据进行加密保护,并配有访问控制和日志记录机制。所有订阅计划均包含"生成隐私保护",平台不会出售您的个人数据,仅在必要时与核心服务提供商共享,并遵循适用法律处理国际数据传输。详细隐私政策请参阅:ltx23.app/privacy-policy(更新于2025年10月24日)。如果对数据安全有更高要求,本地部署方案可让您完全掌控数据,不经过任何第三方服务器。

评论

评论

请先 登录 再发表评论。
还没有评论。成为第一个分享想法的人吧!