发布时间:2023-07-09
点击次数: 文生图模型stable diffusion开源后,将「ai艺术」彻底平民化,只需一张消费级显卡即可制作出非常精美的图片。
而文本转视频领域,目前质量较高的只有Runway前不久推出的商用Gen-2模型,开源界还没有一个能打的模型。
最近,Huggingface上有作者发布了一个文生视频模型Zeroscope_v2,基于17亿参数量的ModelScope-text-to-video-synthesis模型进行二次开发。
图片
模型链接:https://huggingface.co/cerspense/zeroscope_v2_576w
相比于原版本,Zeroscope生成的视频没有水印,并且流畅度和分辨率都得到了提升,适配16:9的宽高比。
开发者cerspense表示,他的目标就是和Gen-2进行开源较量,即提高模型质量的同时,还能免费供大众使用。
Zeroscope_v2包括两个版本,其中Zeroscope_v2 567w可以快速生成576x320像素分辨率、帧率为30帧/秒的视频,可用于视频概念的快速验证,只需要约7.9GB的显存即可运行。
使用Zeroscope_v2 XL生成高清视频,分辨率为1024x576,占用约15.3GB的显存。
Zeroscope还可以与音乐生成工具MusicGen一起使用,快速制作一个纯原创短视频。
Zeroscope模型的训练用到了9923个视频片段(clip)以及29769个标注帧,每个片段包括24帧。偏移噪声包括视频帧内对象的随机移位、帧定时(frame timings)的轻微变化或微小失真。
训练期间引入噪声可以增强模型对数据分布的理解,从而可以生成更多样化的逼真视频,并更有效地解释文本描述中的变化。
使用stable diffusion webui
在Huggingface上下载zs2_XL目录下的权重文件,然后放到stable-diffusion-webui\models\ModelScope\t2v目录下即可。
在生成视频时,推荐的降噪强度值为0.66到0.85
使用Colab
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ChatGPT Writer
免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。
106
查看详情
笔记链接:https://cola
b.research.google.com/drive/1TsZmatSu1-1lNBeOqz3_9Zq5P2c0xTTq?usp=sharing
先点击Step 1下的运行按钮,等待安装,大约需要3分钟;
图片
当按钮旁边出现绿色复选标记时,继续执行下一步。
图片
点击想要安装模型附近的运行按钮,为了能够在Colab中快速获得3秒左右的剪辑视频,更推荐使用低分辨率的ZeroScope模型(576或448)。
图片
需要在执行更高分辨率模型(如Potat 1或ZeroScope XL)时,权衡执行时间会更长。
再次等待复选标记出现,继续执行下一步。
选择在Step2中安装并希望使用的模型型号,对于更高分辨率的模型,推荐下面的配置参数,不需要太长的生成时间。
图片
接下来,您可以输入目标视频的提示词来改变效果,并且还可以输入否定提示词(negative prompts),然后点击运行按钮。
等待一会后,生成的视频就会被放置在outputs目录下。
图片
目前来说,文生视频领域仍处于起步阶段,即便是最好的工具也只能生成几秒钟的视频,并且通常存在较大的视觉缺陷。
但其实文生图模型最初也面临着类似的问题,但仅仅几个月后就实现了照片级真实感。
不过与文生图模型不同的是,视频领域在训练和生成期间所需要的资源都要更比图像更多。
虽然谷歌已经研发出了Phenaki和Imagen Video模型,可以生成高分辨率、更长、逻辑连贯的视频片段,但公众无法使用到这两个模型;Meta的Make-a-Video模型也同样没有发布。
目前可用的工具仍然只有Runway的商用模型Gen-2,此次Zeroscope的发布也标志着文生视频领域第一个高质量开源模型的出现。
以上就是AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑的详细内容,更多请关注其它相关文章!
# 开源
# 目录下
# 谁能
# 更高
# 只需
# 还可以
# 首个
# 显存
# phenaki
# stable diffusion
# runway
# ai
# 高质量
# 天津优化网站哪个好
# seo专员职位职责
# 邯郸天猫网站推广介绍
# 营销推广怎么注册营业执照
# 巩义网站建设与推广方案
# 通州区网站建设好处
# 初级seo工程师
# 福州市网站推广服务外包
# seo精准营销分类
# 餐饮网站如何优化
# 上海
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动
13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了
丰田汽车研究院推出生成式人工智能汽车设计工具
美图公司影像节或发布AI设计新品
这效果能打几分?AI真人化《名侦探柯南》
12页线性代数笔记登GitHub热榜,还获得了Gilbert Strang大神亲笔题词
磐镭发布全新 GeForce RTX 4080 ARMOUR 显卡,售价为 9499 元
一文看懂基础模型的定义和工作原理
大厂出品!这个AI网站太顶了,所有功能免费用
谷歌推出 SAIF 框架,倡导安全环境下探索和发展人工智能
北京市通用人工智能产业创新伙伴计划名单公布,京东科技入选“算力伙伴”
首家承认ChatGPT影响其收入的公司Chegg选择拥抱AI ,裁减4%员工
特斯拉机器人面世 未来将大幅提振磁材需求,引领人工智能时代
上影节直击 | AI技术降低了短片拍摄门槛?金爵奖评委不赞同
阿里云全面支持Llama2训练部署,助力企业快速构建自有大型模型
令人惊叹!AI模型能够以iPhone照片为基础创作诗歌
美军AI无人机“误杀”操作员,人工智能要在军事领域毁灭人类?
跟着AI大热的“光模块”到底是什么?
微软 Copilot 团队主管呼吁用户与 AI 交流时应使用恰当的礼貌用语
三个全球首创,青岛西海岸新区“海元宇宙”亮相世界人工智能大会
“五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?
阿里云连续两年进入Gartner云AI开发者“挑战者象限”
小米又拿下国际比赛第一:AI翻译立功
智能机器人正在彻底改变客户服务
360°/180°双模式,佳能公布可折叠小体积的VR全景相机
软通动力天枢元宇宙研究院签约落户江宁高新区
云南首例达芬奇机器人微创心脏手术成功开展
当孔子遇见AI|尼山的“数字”
美踏控股推出创新人工智能大数据模型“心乐舞河”:虚拟人音舞社交的新体验
中国最强AI研究院的大模型为何迟到了
中国AI公有云市场2025年逆势蓬勃增长,增速高达80.6%
Ai智能机器人,chat-免注册登入,直接使用新版gpt4.0!
小艺将具备大模型能力,鸿蒙4加速AI普及之路
微软推出人工智能模型 CoDi,可互动和生成多模态内容
大疆 Air 3 无人机售价和实物照片曝光
智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”
朝鲜出现国产大型察打一体无人机,实力世界第二,太意外了
盘古大模型3.0正式发布 AI开发正走向新“工业化开发模式”
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
智能化解决方案:保障数据安全阻击泄露和丢失
马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术
AI无法对传统文化符号进行解构和创新
物联网和人工智能的协同作用:释放预测性维护的潜力
V社谈AI制作游戏被ban:为确保开发者有素材所有权
《爱康未来之夜嘉宾官宣,携手共赴AI未来》
“风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!
羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品
7大探索区域打造沉浸式玩乐“元宇宙” 昆明京东MALL未来科技探索官全城招募中
OpenAI夺冠:人工智能为云计算带来新变革
郭帆导演成功利用AI技术制作的《流浪地球3》预告片在央视热播,引发巨大反响