Diffusion Transformers

腾讯网28 天

ViT作者飞机上也要读的改进版Transformer论文，花2个小时详细批注解读 ...

这篇论文被他简写为DiffTranformer，不过不是Sora底层架构的那个Diffusion Transformer，而是不久前来自微软的Differencial Transformer。论文中介绍，整体思路 ...

新浪网28 天

ViT作者飞机上也要读的改进版Transformer论文，花2小时详细解读

ViT核心作者Lucas Beyer，长文分析了一篇改进Transformer架构的论文，引起推荐围观。他前不久从谷歌跳槽到OpenAI，这次是在飞机上阅读论文并写下了分析。

来自MSN1 个月

图森未来发布图生视频开源大模型“Ruyi”：RTX 4090 就能运行

据介绍，Ruyi 是一个基于 DiT 架构的图生视频模型，它由两部分构成：一个 Casual VAE 模块负责视频数据的压缩和解压一个 Diffusion Transformer 负责压缩 ...

Android Police11 天

Meet Sora: OpenAI's text-to-video AI

Sora uses a hybrid approach combining diffusion modeling and transformer networks. The process begins with random noise, akin to static on a TV, which is gradually refined into detailed video frames.

当前正在显示可能无法访问的结果。

隐藏无法访问的结果