AI赋能影像技术，让修图小白秒变大师

近日，计算机视觉顶级会议CVPR 2022公布了会议录取结果，美图影像研究院（MT Lab）与北京航空航天大学可乐实验室联合发表的论文被接收。该论文突破性地提出分布感知式单阶段模型（DAS），用于解决极具挑战性的多人3D人体姿态估计问题。该方法通过一次网络前向推理同时获取3D空间中人体位置信息以及相对应的关键点信息，从而简化了预测流程，提高了效率。此外，该方法有效地学习了人体关键点的真实分布，进而提升了基于回归框架的多人3D人体姿态估计方法的精度。

实际上，这只是美图利用人工智能为影像技术赋能的冰山一角。早在2010年，美图就成立了核心研发部门——美图影像研究院，该研究院致力于计算机视觉、机器学习、增强现实等人工智能（AI）相关领域的研发，在人脸技术、人体技术、图像分割、图像识别、图像生成、图像增强等方面处于领先水平，为美图现有和未来的产品提供核心算法支持，并通过前沿技术推动美图产品发展，曾先后多次参与CVPR、ICCV、ECCV等计算机视觉国际顶级会议，并斩获冠亚军10余项，被称为美图的“技术中枢”。

视觉中国供图

高效精准获取多人3D人体姿态估计结果

计算机视觉中的经典技术——多人3D人体姿态估计在AR/VR、游戏、运动分析、虚拟试衣等领域具有广泛的应用潜力，近年来随着元宇宙概念的兴起，更是让这一技术备受关注。

目前，通常采用两阶段方法来解决多人3D人体姿态估计的问题：自顶向下方法，即先检测图片多个人体的位置，之后对检测到的每个人使用单人3D姿态估计模型来分别预测其姿态；自底向上方法，即先检测图片中所有人的3D关键点，之后通过相关性将这些关键点分配给对应的人体。

尽管两阶段方法取得了良好的精度，但是需要通过冗余的计算和复杂的后处理来顺序性地获取人体位置信息和关键点位置信息，其速率通常难以满足实际场景需求，因此多人3D姿态估计算法流程亟须简化。

为了克服两阶段方法存在的问题，该论文提出了一种分布感知式单阶段模型用于解决基于单张图片的多人3D人体姿态估计问题。另外，DAS在优化过程中对3D关键点的分布进行学习，这为3D关键点的回归提供了极具价值的指导性信息，从而有效地提升了预测精度。

此外，为了缓解关键点分布估计的难度，DAS采用了一种迭代更新策略以逐步逼近真实分布目标，通过这样一种方式，DAS可以高效且精准地从单目RGB图片中一次性获取多个人的3D人体姿态估计结果。

与已有的两阶段方法相比，该模型可以通过一次网络前向推理同时获取人体位置信息以及所对应的人体关键点位置信息，从而有效地简化预测流程，克服了已有方法在高计算成本和高模型复杂度方面的弊端。另外，该方法成功将标准化流引进到多人3D人体姿态估计任务中，以在训练过程中学习人体关键点分布，并提出迭代回归策略缓解分布学习难度，来达到逐步逼近目标的目的。通过该模型可以获取数据的真实分布，有效地提升模型的回归预测精度。

人工智能技术大大提升摄影修图效率

对人脸皮肤进行精细化的瑕疵修复与暗沉祛除，一键入“齿”修复牙齿上的瑕疵，照片上模糊的容颜清晰重现，全身美型告别大粗腿、水桶腰……AI技术正让修图小白秒变大师。

一家商业摄影机构的业务流程基本包括：营销获客、摄影服务、后期处理、成品制作等环节。其中，后期修图是商业摄影工作流程中占比高、耗时长、工作量大的一个环节。

在旺季或者拍摄任务激增时，从拍摄到出片的周期甚至长达1个月左右。尤其是在人像处理部分，非常考验修图师的专业功底，而一名合格修图师的培养需要耗费高昂的人力、物力成本，还需要面临人员频繁流动的风险。

美图创始人兼首席执行官吴欣鸿在接受科技日报记者采访时表示，据不完全统计，商业摄影1年修图可达120亿张，大量繁杂的重复性劳动以及较高的技术门槛，给商业影楼带来巨大的成本压力。借助AI技术完成重复繁杂的后期初修工作，不仅能够提升商业摄影后期的修图效率，同时也为商业摄影行业提供了深度融合美学艺术的专业级图像处理服务。

由美图技术大脑——美图影像研究院自主研发的美图云修，通过智能预设功能，一键即可完成对照片的批量处理。其中，脸部优化功能可以修复面部瑕疵，打造细腻肌肤；妆容调整功能可实现对妆容的智能调节。此外，美图云修还能够完成塑造立体的面部五官、分区域实现全身美型、美化身体肌肤等80余项修图工作。同时，灵活自由的参数自定义也满足了用户对修图更专业的需求。

“美图云修还提供滤镜特效、牙齿修复、祛双下巴、匀肤、缩头、一键仿妆、背景增强、多人全身美型等独特功能，可以帮助影楼快速完成约80%的精修工作。”美图技术副总裁、美图影像研究院负责人刘洛麒表示。

我国影像软件技术携手AI大步向前

今年3月30日，美图披露2021年全年业绩报告。报告显示，2021年美图研发投入达5.455亿元，同比2020年增长35%。

随着中国影像软件产业对技术研发投入的不断加大，近年来中国影像软件在技术能力方面有了很大的进展，有些已经不输国外同类产品。

“我们推出的视频美颜App——Wink，它的视频人像美化功能需要将人像美颜从图像扩展到视频维度，这就需要实时的人脸检测跟踪、分割、3D建模等技术与人像美颜算法进行有机结合，同时还要应对视频抖动、大侧脸等极端情况，才能为用户提供满意的结果。”刘洛麒说。

“用户拍摄的照片或视频存在清晰度低、画质差、产生噪点等问题，我们利用基于深度学习的画质增强技术能够提高用户照片与视频的质量，满足他们的拍摄需求。同时，我们也将深度学习应用到人像美颜中，例如我们自主研发的AI匀肤技术，既能祛除脸部瑕疵，同时也保留了细腻的皮肤纹理质感。”吴欣鸿说。

“我们基于AI研发的人体美型技术，不是简单地对人体进行拉伸，而是先结合人体3D重建、人体分割等技术去建立人体的三维模型，再利用深度学习算法学习美化之后的人体模型形变，同时对背景的Mesh（网格）进行建模，从而缓解背景的变形扭曲，最终实现用户满意的人体美型效果。”刘洛麒指出。

此外，美图证件照应用到的人像抠图技术，可以实现发丝级的精细抠图，完成对证件照人像的一键换装，同时保持人像和背景的光线和谐性。而基于AI生成的增发技术，可以调整发际线，可以改变发色和发型，还能使头发显得更蓬松。

未来，人工智能将如何赋能影像技术？对此，吴欣鸿表示，一方面，基于人工智能的影像技术，将与各行各业有更多、更深入的结合，这也对影像技术提出了更高的要求。另一方面，通过3D技术和AR技术等，为用户提供沉浸式和可交互的虚拟化体验也是未来影像技术发展的热门方向。

推荐内容

AI赋能影像技术，让修图小白秒变大师

从“在线”到“在场”，远程办公改变工作模式？

探索科技拔尖人才培养新模式

欧洲人的囤鱼妙招，出乎你意料

神舟十三号载人飞船即将撤离空间站核心舱组合体

我国科学家用小分子诱导出人干细胞

《自然》：中国将目光投向遥远的“地球2.0”

北京市鸟由你决定！快来参加这个评选投票

气溶胶传播“飘忽不定”，户外公共场所也要戴好口罩

对大脑中每个细胞成像，美国“脑计划”拟绘人脑细胞多样性图集

神奇蘑菇化合物能“打开”抑郁症患者大脑

加了抗菌涂层的口罩更好？专家：一定要认准国家标准

仙女星系中发现12颗大质量物质转移双星

青海湖完全解冻，开湖奇观为何备受关注？

海洋中发现5000多种新RNA病毒

越来越多的新激素被发现

老片修复：高清重现张国荣经典绝唱

100公里！我国科学家创造量子直接通信最远纪录

风靡网络的自制食品药品安全吗？

暗物质或是来自其他维度的“宇宙难民”

科技帮扶进一线！北京首家园林绿化专家工作站挂牌成立

中国气象局：1小时雨强将纳入暴雨预警信号标准

把玩文玩核桃之我见

免疫“指纹”揭示疾病更佳疗法

生态环境部：到2025年底实现排污许可清单式执法检查全覆盖

新工程菌保护肠道微生物免受侵害

迄今发现的最远恒星 也许开启了研究早期宇宙的新窗口

天舟二号为何离轨再入 ​专家：履行大国担当

四月，这些星空“美景”别错过

世界女子冰球锦标赛：中国队大胜斯洛文尼亚迎三连胜

通过一粒月壤 “看清”月球上的风化作用

首个“全私人”宇航团队进入国际空间站

从三个维度科学看待生物安全

世界帕金森病日：几个动作自测有无患病迹象

“重编程”让皮肤细胞“返老还童”三十岁

新冠引起大规模炎症原因首次揭示

《圆明园防渗之争》的科普担当

植物“化工厂”里的科学

神舟十三号航天员与美国青少年互动

“四叶草”方舱医院3号馆完工交付

便秘是帕金森病的最早症状

春日限定樱花味食品大热 “樱花味”可能只是你想象出来的

未成年人沉迷短视频 刷屏上瘾问题应引起重视

北京五环内城区进入飞絮期

超前版夏天来了！全国换装地图出炉

张伯礼：对轻症尽早干预，普通型“一人一方”

“换手机不如换手机壳”，这届年轻人为啥不换机？

安徽淮南：中药助力抗疫

草莓：欧洲“水果皇后”

追思，给逝去的亲人做个内心告别

在我国内蒙古宁城县 发现1.25亿年前“宁城中华草”

土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏

我国车联网产业发展进入快车道，智能网联汽车数量快速增加

腾讯与奥迪宣布达成战略合作，“微信车载版”上线

“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力

自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持

半导体厂商一季度业绩向好，国产替代进程加速

据预测：2025年，全球卫星网络接入设备将达2亿台套

我国海上风电总装机容量仅次于英国，位居第二

里程碑式突破！揭示高能宇宙线起源之谜

青海省开启“集控站+无人值守”运维新模式 提高设备运行水平

安徽首个量子计算芯片联合实验室成立 打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆 聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域 达世界先领先水平

加快推进“双千兆”网络建设，聚焦网络质量提升

英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%

2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办

ASO-S“探日”有望于2022年发射升空！探索太阳磁场

超高速互联网将普及计算 助力缩小数字鸿沟

1至2月，我国规模以上互联网企业完成业务收入同比增长达29%

数字化转型找准“方向感”，打造国内商业数字化发展高地

加快5G网络规模化部署，打造数字经济新优势

探索5G行业融合应用 5G专网将进一步推动融合应用发展

中国移动香港5G商用一周年 开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞 或解释对于其他黑洞族演化的影响

7709米！哈工程“悟空”号创中国AUV潜深新纪录

人工智能领域新算法发布 数据传输更高效精准

科技创新技术加持，我国船舶制造已达到世界前列

我国5G网络要坚持适度超前原则，探索5G应用发展

迄今发现的最远恒星也许开启了研究早期宇宙的新窗口

天舟二号为何离轨再入专家：履行大国担当

未成年人沉迷短视频刷屏上瘾问题应引起重视

在我国内蒙古宁城县发现1.25亿年前“宁城中华草”

青海省开启“集控站+无人值守”运维新模式提高设备运行水平

安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域达世界先领先水平

超高速互联网将普及计算助力缩小数字鸿沟

中国移动香港5G商用一周年开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响

人工智能领域新算法发布数据传输更高效精准

小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?

科技助力智能生活垃圾分类投放点全新亮相

“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布

《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布

LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统

腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价

苹果文档曝光：新一代Apple TV将发布配置大幅升级

在线办公平台用户规模增长迅猛新型“无纸化”工作方式成为热潮

南京智能网联汽车先导区建设启动发布南京制造业2.0版新政策

一键接入贵州信息通信业全力推进适老化服务

信创产业正在迎来发展黄金期统信软件加快与主流芯片厂商合作

打破“只租不卖”的共享出行模式哈啰推自研智能两轮电动车

由于芯片短缺现代已经暂停IONIQ 5等电动车生产

小米宣布将于明天举行小米影像品鉴会聊聊小米影像

大众将为MEB平台加载V2G技术稳定可再生能源的波动供应

三星Galaxy Quantum 2首批谍照曝光黑色和白色

B站否认商谈收购游族网络 24% 股权及总部大楼游族网络直线拉升

消息称苹果因供应紧缺推迟MacBook和 iPad 生产苹果拒绝置评

小米电视及Redmi电视部分产品型号宣布涨价新机价格平均上涨 5-10%

小米 11 Ultra于4月8日海外开售，售价 5999 元起

联想拯救者电竞手机2 Pro正式预热拥有更出色的散热设计

微软Surface Laptop 4页面泄露将有英特尔和 AMD 两个版本

外星人推出M15 R5游戏本内含外星人高端外设

E Ink推出Spectra 3100电子纸扩大电子价签与零售广告牌应用

微信iOS版8.0.4正式版正式发布表情包上限提升到了 999 个

暴雪《暗黑破坏神 2 重制版》将开启限时技术测试持续到 4 月 12 日

2021中国（北京）国际游乐设施设备博览会在京开幕深圳市维亚环球科技有限公司受邀参加，并取得圆满成功

深入实施制造强国战略以四个方向加强制造业发展

我国神州十二号载人飞船成功发射中国人首次进入自己的空间站

我国研发人员总量连续多年居世界首位科技领军人才从哪里来？

如何打造一部更好的车？需要高性能计算平台支撑

重大科技电子枪顺利完成安装工程建设正式进入设备安装阶段