英伟达也来卷AI绘画支持几笔完成精准构图还提出扩散模型进化新方向_亚洲科技网

英伟达也来卷扩散模型了。

(资料图片仅供参考)

这一次，它将文本生成图像的效果再次提高一个level。

比如，面对超长文本描述，它（下图最右列）比Stable Diffusion和DALL-E 2表达的都更精确：

注意第一组图刺猬的夏威夷风衬衣，以及第三组图猫猫的头盔。

当描述要求展示出具体的文字时，也只有它（下图最右列）可以准确做到：

除此之外，即时样式转换也是小菜一碟，只需一张样图就成。

比如来一个梵高风的泰迪熊冲浪：

或者这样的鸭子：

当然，英伟达最擅长的分割图作画，它也支持，可以让你用寥寥几笔完成精准构图：

（其中，每一个颜色块代表一个元素。）

看起来还阔以吧，它背后的方法也值得说道说道。

两个文本编码器+专家去噪网络

我们知道，扩散模型包含两个阶段：

从原图逐步到噪声的正向过程/扩散过程；

以及从噪声逐步到原图的逆向过程。

第二个过程就是去噪，作者想到，在此阶段，面对不同的噪声水平时都用不同的模型进行处理，也就是开发一个叫做“专家去噪”的网络，效果是不是会更好一些？

于是就诞生了这个新的AIGC工具：eDiffi。

eDiffi的pipeline由三个扩散模型级联而成：

一个可以合成64×64分辨率样本的基础模型，以及两个可以分别将图像分辨率递增到256×256和1024×1024的超分辨率模型。

当模型接收到一条文本描述时，会首先同时计算T5 XXL embedding和CLIP text embedding。

注意是用了两个文本编码器哦，不然效果不会这么好：

Ps. T5指的是谷歌的文本到文本转换器（Text-to-Text Transfer Transformer ），它可以帮助模型做到更精准地理解文本描述。

接着选择根据参考图像计算得出的CLIP图像编码，用作样式向量（可选可不选）。

然后再将所有embedding都馈送到上面的级联扩散模型中，最后逐渐生成分辨率为1024×1024的图像。

再来说说主角：去噪专家（Denoising experts）网络。

我们知道，在扩散模型中，图像的合成是通过迭代去噪过程来完成的，这个过程又指的是从随机噪声中逐渐生成图像。

在传统的扩散模型训练中，都是训练一个模型来对整个噪声分布进行去噪。

而在作者的这个框架中，他们训练了一组专家去噪器，专门用于在生成过程的不同步骤进行去噪。

如下图所示，作者是先从一个完整的随机噪声开始，然后分多个步骤逐步操作，最终生成一张骑自行车的熊猫图像。

一位StabilityAI员工认为，这种方法可能是扩散模型的下一大突破/进步。因为不止英伟达的这个eDiffi，还有百度的文心ERNIE-ViLG 2.0也是这么做的。

zero-shot FID上获SOTA得分

eDiffi模型是在“公共和专有数据集的集合”上训练而成。

其中基础模型花了256块英伟达A100 GPU，两个超分辨率模型则花了128块A100。

用于PK的模型包括GLIDE、Make-A-Scene、DALL-E 2、Stable Diffusion和谷歌的两个图像合成系统Imagen和Parti。

作者从COCO验证集中随机提取30000个文本描述，然后让这些模型生成结果，纪录zero-shot FID-30K得分。

最终，eDiffi获得了最低也就是最佳分数，说明它与文字的匹配度是最高的。

最后，再来两组效果展示和对比：

以及风格迁移的（第一列为参考风格，第二列为结果，第三列为参考图像）：

关于作者

一共有12位，都来自英伟达，其中3位华人：

毕业于康奈尔大学的博士黄勋（AdaIN一作）、毕业于清华本科和斯坦福博士的Song Jiaming以及英伟达高级研究总监Liu MingYu。

目前，该模型还未开源，不过有人表示改动不算大，所以实现起来并不难，应该很快就有人复现出来了。

推荐内容

英伟达也来卷AI绘画支持几笔完成精准构图还提出扩散模型进化新方向

2022-11-04
环球速看：大脑神经元连接协调恰似“交响乐”

2022-11-04
天天快看：兔子繁殖能力多强？男子捡回3只7个月生育近百只

2022-11-04
懒人的福音：这个新专利能简化共享车辆解锁步骤

2022-11-04
天天观热点：北大本科生用乐高打造显微镜成本不到3千元

2022-11-04
水稻首次在太空结穗！中国空间站已展开多项科学实验

2022-11-04
每日视点！三次发射失败也不能阻挡NASA的决心阿尔忒弥斯1号准备就绪

2022-11-04
好看也痛苦！女子长期穿高跟鞋致双脚变形治疗晚了走路都困难

2022-11-04
蚊子凭啥只咬你？Cell：都怪皮肤分泌的羧酸太“诱蚊”

2022-11-04
马斯克没有打价格战的基因

2022-11-04
最新资讯：NASA新月球车设计借鉴“祝融”号？中国航天技术专家这样说

2022-11-04
实时：联合国教科文组织：“乞力马扎罗的雪”可能会在2050年消失

2022-11-04
天天快资讯丨你睡对了吗？专家称入睡姿势不对可能睡出毛病：右侧卧/仰卧最好

2022-11-04
最新消息：“电摩”时代也要来了？

2022-11-03
18人入选中国第三批航天员第四批航天员选拔将首增港澳人员

2022-11-03
时讯：抑郁患者的福音？研究发现单剂合成的“神奇蘑菇”可缓解严重抑郁

2022-11-03
环球微头条丨那些猝死的人都因为搞坏了这个人体最长器官

2022-11-03
【世界热闻】比亚迪布局全球将在巴西投资约5.83亿美元建设三座新工厂

2022-11-03
什么是“自限性疾病”？

2022-11-03
“永别了，迪达”：肯尼亚拥有最大象牙的母象去世

2022-11-03
阿根廷首现“超级真菌”感染，公众需要担心吗？

2022-11-03
环球实时：他们做了个试验给冰川“盖被子”

2022-11-03
世界快讯:失去心跳的第3年他活成了“炸场王”

2022-11-03
【全球时快讯】治癌抗衰二合一？《自然》新研究揭示免疫疗法还能清除衰老细胞

2022-11-03
打破传统认知！英国研究首度发现：猴痘可在症状出现之前传播

2022-11-03
联合国教科文组织：到2050年被列为世界遗产的冰川有三分之一将消失

2022-11-03
不到两万美元？特斯拉首款人形机器人曝光：能浇水跳舞

2022-11-03
【聚看点】人类命运共同体理念连续第六年写入联大外空安全领域决议外交部回应

2022-11-03
最新快讯!GMC悍马推出电动自行车：全轮驱动功率2400瓦

2022-11-03
当前看点!特斯拉22.36.6软件版本更新面向国内车主推送动能回收补偿、驾驶室过热保护来了

2022-11-03
研究人员展示脑控技术：患者可用大脑控制苹果iPad

2022-11-03
全球微动态丨美国近2400万成年人患有“长期新冠”后遗症

2022-11-03
每日头条!天文学家发现直径超1.1公里“行星杀手”：将穿过地球轨道但没机会撞击

2022-11-02
环球视讯！西媒：蠕虫研究揭示人类衰老之谜

2022-11-02
焦点！“回拨”DNA时钟可以让人类返老还童？

2022-11-02
世界简讯:献血会导致传染病、贫血？对身体有害？6条献血流言，一文读懂！

2022-11-02
11月天宇“排片表”出炉：月全食将精彩上演

2022-11-02
世界新资讯：英媒：史上最大规模禽流感来袭威胁英国圣诞节火鸡大餐

2022-11-02
3岁女孩连吃8个柿子长胃结石在胃里长达8cm：医生科普怎么食用

2022-11-02
世界快报:外媒：印度建成首个“太阳能村”

2022-11-02
偶遇“白素贞” 男子江边散步捡到雪白球蟒：外来物种、不宜放生

2022-11-02
每日播报!美国研发中的新药物可让新冠病毒自我对抗

2022-11-02
今日快看!美时隔三年再射“重型猎鹰”火箭送多颗军用卫星进入太空

2022-11-02
俞敏洪回应东方甄选转战天猫：无稽之谈

2022-11-02
世界热文：男子被封单位7天自制加热洗澡神器：双喷火枪头效果很好

2022-11-02
天天短讯！防疫究竟是防毒，还是防病？

2022-11-02
全球热文：身体会被折叠？这500万人并非“不死癌症”

2022-11-02
信息：不确定的环境，心理咨询有用吗？

2022-11-02
环球消息！性寄生：为什么被寄生的总是雌性？

2022-11-02
因为地球越转越慢互联网可能会崩溃

2022-11-02
在我国内蒙古宁城县发现1.25亿年前“宁城中华草”
土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏
我国车联网产业发展进入快车道，智能网联汽车数量快速增加
腾讯与奥迪宣布达成战略合作，“微信车载版”上线
“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力
自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持
半导体厂商一季度业绩向好，国产替代进程加速
据预测：2025年，全球卫星网络接入设备将达2亿台套
我国海上风电总装机容量仅次于英国，位居第二
里程碑式突破！揭示高能宇宙线起源之谜
青海省开启“集控站+无人值守”运维新模式提高设备运行水平
安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”
航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合
我国活体组织成像技术干细胞研究应用领域达世界先领先水平
加快推进“双千兆”网络建设，聚焦网络质量提升
英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%
2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办
ASO-S“探日”有望于2022年发射升空！探索太阳磁场
超高速互联网将普及计算助力缩小数字鸿沟
1至2月，我国规模以上互联网企业完成业务收入同比增长达29%
数字化转型找准“方向感”，打造国内商业数字化发展高地
加快5G网络规模化部署，打造数字经济新优势
探索5G行业融合应用 5G专网将进一步推动融合应用发展
中国移动香港5G商用一周年开拓5G商业场景应用
早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响
7709米！哈工程“悟空”号创中国AUV潜深新纪录
人工智能领域新算法发布数据传输更高效精准
科技创新技术加持，我国船舶制造已达到世界前列
我国5G网络要坚持适度超前原则，探索5G应用发展
我国汽车自动变速器技术创新按下“快进键” 加速行业转型升级
AMR智能物流机器人，推动汽车行业智慧物流应用和发展
小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?
我国可再生能源技术装备水平大幅提升，开发利用规模稳居世界第一
吉利帝豪S正式开启预售 8.67万元-11.07万元
科技助力智能生活垃圾分类投放点全新亮相
“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布
《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布
第一门户搜索网站雅虎旗下知名问答平台“雅虎问答”将于5月4日关闭
乐视贾跃亭回国有望？FF已提交上市文件
国内首个“5G+北斗”高速公路智能护栏预警系统上线
LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统
新一轮科技革命和产业变革持续演进，提高制造业生产效率
“能联全球”平台正式发布，推动全球能源电力发展合作
网曝拯救者电竞手机2 Pro真机谍照：采用RGB呼吸灯
雷军开启个人第三场直播：小米进军智能电动汽车行业
700MHz 5G网络共建共享落地实施！着重建设5G“黄金频段”
2021年底，5G网络基本实现县级以上区域、部分重点乡镇覆盖
腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价
苹果文档曝光：新一代Apple TV将发布配置大幅升级
智能机器人完成多项智能巡视任务，作业效率提高三倍
科技加持，长循环寿命的碳基锂离子电容器问世
在5G技术普及和共享市场日趋成熟下，共享充电宝集体涨价
苹果或将研发自动驾驶汽车平台，助力行业发展
人脸识别技术发展尚存三大隐忧，行业监管有待加强
郭守敬望远镜发布最新数据集 2022年光谱数量有望突破2000万
新技术助力机器人通过“透视墙壁”找到目标
在线办公平台用户规模增长迅猛新型“无纸化”工作方式成为热潮
科技加持，无人机阵列海水取样项目通过验收鉴定
数据转储作业整体时间缩短98% 建议运营商尽快出台指导标准
南京智能网联汽车先导区建设启动发布南京制造业2.0版新政策
一键接入贵州信息通信业全力推进适老化服务
信创产业正在迎来发展黄金期统信软件加快与主流芯片厂商合作
打破“只租不卖”的共享出行模式哈啰推自研智能两轮电动车
由于芯片短缺现代已经暂停IONIQ 5等电动车生产
滴滴货运将在北京等11座城市上线，具备录音桔视等安全功能
小米宣布将于明天举行小米影像品鉴会聊聊小米影像
腾讯控股日内成交额突破1300亿港元，港股下跌 0.79%
大众将为MEB平台加载V2G技术稳定可再生能源的波动供应
三星Galaxy Quantum 2首批谍照曝光黑色和白色
B站否认商谈收购游族网络 24% 股权及总部大楼游族网络直线拉升
消息称苹果因供应紧缺推迟MacBook和 iPad 生产苹果拒绝置评
小米电视及Redmi电视部分产品型号宣布涨价新机价格平均上涨 5-10%
微软宣布将于4月21日正式展示DirectX 12新功能与SDK
App Annie最新报告：全球用户在线视频应用使用时长近1万亿小时
小米 11 Ultra于4月8日海外开售，售价 5999 元起
联想拯救者电竞手机2 Pro正式预热拥有更出色的散热设计
苹果公司近日又遭集体诉讼 App 已构成非法赌博罪
LGD OLED官方电视面板已经获得 “防止炫光的显示产品”国际验证
微软Surface Laptop 4页面泄露将有英特尔和 AMD 两个版本
外星人推出M15 R5游戏本内含外星人高端外设
E Ink推出Spectra 3100电子纸扩大电子价签与零售广告牌应用
微信iOS版8.0.4正式版正式发布表情包上限提升到了 999 个
抖音内测 “发现”页大改，拥有播放器、音乐推荐等功能
蔚来汽车创始人李斌：目前每月7500台产能也存在压力
暴雪《暗黑破坏神 2 重制版》将开启限时技术测试持续到 4 月 12 日
魅族官方消息：魅族18的新用户中，45%来自苹果iPhone用户
消息称一加9R预计将在近期推出：一加国内的第二款中端机
realme GT Neo0点开启首销：顶配版2299元
小米11 Ultra明日海外开售：与国内6999元售价相近
realme真我GT Neo明日开售：搭载天玑 1200 处理器
2021中国（北京）国际游乐设施设备博览会在京开幕深圳市维亚环球科技有限公司受邀参加，并取得圆满成功
深入实施制造强国战略以四个方向加强制造业发展
有颌类动物的演化“谜团” 硕果仅存的有颌鱼类化石
数年攻克难题新科技“飞秒激光” 改变传统化学杀毒的新技术
我国神州十二号载人飞船成功发射中国人首次进入自己的空间站
我国研发人员总量连续多年居世界首位科技领军人才从哪里来？
如何打造一部更好的车？需要高性能计算平台支撑
重大科技电子枪顺利完成安装工程建设正式进入设备安装阶段
智能化极地科考船“雪龙2”号首次执行环南极考察任务
小米推出自动驾驶职位互联网造车话题再起