e t n a

Performance of Etna

最新架构

DiT架构,加入时空卷积和注意力层

时长8-15秒

时空序列同时保持稳定和连续

分辨率4K

最高3840*2160,画面细腻逼真

帧率60fps

超20亿参数训练,视频流畅自然

Etna模型FAQs

  • Etna能做什么?

    七火山科技的Etna(埃特纳)模型,是一个文生视频的AIGC模型,它能够根据简短的文本描述生成相应的视频内容。

  • Etna采用什么技术架构?

    Etna模型目前的主干网络采用了Diffusion架构,同时正在一个更大的数据集上实验和适配与Sora相似的Diffusion+Transform架构。

  • Etna的技术原理是什么?

    Etna模型在语言模型和图像模型中插入时空卷积和注意力层,能够处理视频数据,即考虑图像序列中的时间连续性,这意味着Etna拥有一定的时空理解能力,能够理解并生成具有时间维度的视频内容。

  • Etna如何训练模型?

    Etna模型在一个大型视频数据集上进行充分训练,过程采用先进的deep-learning技术策略,包括LDS大规模训练、复杂HPO超参数优化和DPO微调,确保了模型的强大性能和生成能力。

Go To Top