中国团队开源DragGAN，一键实现“大象转身”

本地视角记录硅谷，全球视野关注创新

别忘了给我们加星标~

2023

(资料图)

新技术追踪

BUSINESS

李白实验室抢先开源「复刻」版DragGAN

文|硅星人编辑| VickyXiao

在大家沉迷于Midjourney、Stable Diffusion 技术中无法自拔时，一时被人遗忘的GAN又带着新技术重出江湖了。现在P图，你只需要“轻轻点两下”，AI就能迅速理解你的想法，秒速生成结果图。

DragGAN是由Max Planck研究所开发的一种新的人工智能工具，它允许用户通过几个点击和拖动来真实地修改照片，目前还未对外开源。但王道控股旗下的“李白实验室”算法团队抢先重现了DragGAN的效果。

目前，可直接使用的模型能够让你轻松掌控图片中的人物和动物，通过拖拽控制点和目标点来调整他们的位置、形状、姿势等等。现在已经可以在 Hugging Face 上直接使用了。

体验入口：

/spaces/wuutiing2/DragGAN_pytorch

几个点击，轻松生成结果图

修改微笑弧度，让一张严肃的照片变成露牙甜美笑

放大图片中小哥哥的眼睛

拍照脸型不好看，一键瘦脸，毫无PS痕迹

觉得猫咪太瘦不够可爱，可以给它拉大脸庞，增加可爱度。

发际线拯救神器，这简直就是秃头星人的救命工具

轻轻一拖，在不影响美观的情况下，可以让猫咪的耳朵缩小

让狮子向右侧方向移动，是不是和“大象转身”的操作很接近

可以随意改变模特的发型，短发变长发；本来双脚分开站立的模特，可以瞬间把腿拉至并拢

原理揭秘：基于GAN的图像编辑方法

虽然上述的效果展示很多，但是其实DragGAN也就两个技术原理：

1、基于特征的运动监督，驱动手柄点向目标位置移动；

2、一个新的点追踪方法，利用鉴别性的发生器特征，不断定位手柄点的位置。

DragGAN是一种基于GAN的图像编辑方法，可以实现运动监督和精确点跟踪。任何人都可以通过DragGAN对像素进行精确的控制，进而编辑如动物、汽车、人类、风景等多种类别的姿态、形状、表情和布局。

DragGAN还允许用户选择感兴趣的区域以执行特定于区域的编辑，而不需要依赖其他网络。李白实验室复现的“DragGAN”只需要几秒就能完成效果，你可以选择不同的迭代步数，步数越多效果越夸张，其生成时间就越慢。

此外，DragGAN的无损优化功能可以让用户输入二进制掩码，指示图像中的可移动区域，从而实现更细致的控制，避免损坏图片的原属性。

与传统PS的液化功能相比，DragGAN在编辑图片时可以更好地保持图片的原始属性，并且具有更广泛的应用范围。例如，可以使用DragGAN来改变图片中车辆的位置、大小和轮胎的形状等。这种方法可以在几次鼠标拖动的时间内完成，非常方便快捷。

聚焦图像处理：从大项目到“小”工具

此次复现了DragGAN的“李白实验室”是一个年轻的人工智能技术团队，其中主创始人唐勇博士，毕业于美国宾夕法尼亚州立大学，在美国知名500强企业担任技术学科专家，高级工程师等。其他成员均毕业于国内外知名高校，清华、北大、浙大、英国皇家理工和美国常青藤范围等。

在开启创业之路之前，唐勇曾在美国的知名研究机构以及世界五百强企业工作。他主导并参与了众多社会、环境和能源的相关项目，这些项目的合作伙伴包括美国环保署，美国国家海洋和大气管理局以及全球顶尖能源公司。他专注于运用数学物理模型、高性能计算、多目标优化以及人工智能技术，解答现实世界中大尺度、多模态、多变量的复杂难题，这其中包括洪水预报、气候变化、能源管道设备优化设计以及系统安全等一系列棘手问题。

然而，现实世界的问题千丝万缕，影响因子五花八门，充满了无法预料的不确定性，完全理解其数学物理机理似乎是一项几乎无法完成的挑战。因此，在找到合伙人并得到杭州王道创投基金的支持后，唐勇还是成立了名为“李白”的人工智能实验室，投入大量精力研发计算机视觉、语音以及自然语言处理等前沿技术，希望通过人工智能技术提升模型的泛化能力，从而更有效地解决现实世界的复杂问题。

郭铭涛作为主创人员，也和在团队一起攻坚克难后，终于复现了DragGAN。郭铭涛来自四川大学图像所，目前在读博士一年级，主要研究方向就是深度生成模型，此前他还获得了CVPR 2023 工业图像缺陷生成竞赛冠军。

“李白实验室”在智能图像生成方面已经有不少积累。他们基于GAN技术实现了图像分割、图像修复增强、视频处理等实用性功能，其中图像背景分割算法模型在全球图像分割的模型评比中斩获全球第一，获得国内外近30项学术和研究成果专利，80%为发明专利。

他们还在2019年创办了“皮卡智能”项目，海外同步上线“”项目，海外月活超千万用户，海外站更是跻身图像编辑工具分类排名前十。

2023年在AIGC爆火期间，他们还推出“神采PromeAI”的项目。该项目通过算法优化升级，可直接应用于建筑、室内、产品、游戏/动漫场景设计中，不需要复杂的关键词及参数设置，就可一键生成效果图、线稿、电商产品图等，实现把AIGC从玩具到工具的实用性转变。

李白实验室告诉硅星人，自创立之初，他们便投入大量精力研发计算机视觉、语音以及自然语言处理等前沿技术。目前技术还在设计、营销、生命科学等多个领域进行了商业落地，在实际生活中也得到了广泛应用。

他们此次开源“复刻版”DragGAN，也是为了能让每一个普通用户都能简单使用这些工具，努力把AI技术革新的成功带到普通用户身边。

若将DragGAN与图像生成工具结合使用，下一代内容革新技术产品或许即将诞生，用户将能够更接近他们心目中理想图像的输入。

也许不久之后，谁都可以轻松完成甲方提出“让大象转个身”的需求了。

*参考资料：

注：封面图来自于Pexels，版权属于原作者。如果不同意使用，请尽快联系我们，我们会立即删除。

END

喜欢这篇文章？

1）点击右下角的“在看”

2）分享到你的朋友圈和微信群

3）赶快关注硅星人吧！

关注硅星人，带你用本地视角看硅谷，全球视野看创新

推荐内容

中国团队开源DragGAN，一键实现“大象转身”

消费盲返模式：拓展消费市场新方式

解析“共享购”，平台不到两个月，销售额达2亿，会员量破百万！|世界热闻

天天滚动:美克家居副总顾少军为何不公布学历？啥情况？年薪65.16万远低于赵晶

cad十字光标怎么变大快捷键_cad十字光标怎么变大 天天即时

嵌套分类汇总操作方法_嵌套分类汇总 世界看点

当前视讯！品头论足的意思是什么_品头论足是什么意思

【原】减重与减脂有何区别？3个方法让你减脂不减肌 天天热讯

需求上涨，为何猪价还在下跌 为什么猪价上涨了

2023年6月3日江苏省乙腈价格最新行情预测

广告电商模式：创新融合电商与广告，领导商业新趋势

真无线的里程碑，内置喜马拉雅DAC芯片的HIFIMAN天鹅耳机有点香

每日热议!苏大团队开发高效红外墨水

焦点讯息：魅族20系列：618双丰收

环球关注：从传统到互联网，链动2+1模式助力企业迎接数字化挑战

一嗨租车副总蔡礼洪来了十几年忠诚度高 公司多次因租车资质被罚款

亳州药都农商行首任董事长被查，该行去年营收净利均两位数下滑 IPO 申请已获上交所受理

环球速读：【原】顾客拿饮料的时候，狗狗趁机将头卡在冰箱门口，为了降温也是拼了

今日要闻!星球大战绝地幸存者比图迪图视频攻略

当前视点！星球大战绝地幸存者E3-VE3视频攻略

星球大战绝地幸存者邪恶毒喉视频攻略

不要相信“一对一”“封闭集训”等培训！郑州发布重要提醒_天天热点评

环球精选！14国宣布组建新结算系统，为啥没有中国？去美元化已成定局？

2023高考兰州送考车辆限行报备入口_今日播报

今日热议：AssemblyAI 推出新模型 LeMUR，可对录音进行处理

线上授权渠道迎来价格大跳水，iPhone14系列降价力度最大

地狱VS商用机甲，谁更强？

百度网盘被苹果下架引发热议！目前已恢复。|全球快讯

ROG玩家国度和华硕包揽618开门红主板冠亚军_每日热文

环球新动态：苹果手机串号查询官网真假_苹果手机串号查询

环球简讯:美债务上限法案将于6月3日签署 道指狂飙700点 惠誉维持美国信用评级在负面观察状态

精彩看点：阿里P9下岗再就业

小米27英寸显示器开售 100Hz高刷599元

2023年6月3日江苏省四氢呋喃价格最新行情预测

阴阳师白童子技能解析（学学隔壁黑童子吧） 快消息

小米汽车调整高管，黄振宇接管供应链

天天新资讯：入门价格旗舰体验 无感佩戴超长续航：荣耀Earbuds X5开箱简谈

当前速讯：夏日宅家，躺赢狂欢，华帝X5带你开启理想生活

日本啤酒巨头欲回中国

【时快讯】6·18销量数据公布：小米卖爆了

阳了浑身疼怎么办 肾阳虚全身酸痛_环球简讯

全球报道:星球大战绝地幸存者基普奥斯塔视频攻略

世界看点：星球大战绝地幸存者余宏视频攻略

当前观察：星球大战绝地幸存者马西菲瑙视频攻略

星球大战绝地幸存者凯基视频攻略

世界头条：nbsp含义_nbsp什么意思

天天即时：灼烧玫瑰_灼烧

环球速读：955933是什么电话_95593

泰州溱湖国家湿地公园门票价格（泰州溱湖国家湿地公园）

天天报道:故事人 | 对话七猫：短剧红利期已过，追热点不如「造新血」

苹果手柄加入面部识别

每日简讯：流行趋势｜23/24 SS 鞋履趋势报告·老爹鞋

vivo S17系列：旗舰夜景人像与设计完美结合 环球今日报

【天天播资讯】对话索尼中国总裁：我们最宝贵的资产不是其他，是索粉

宝宝树CFO高晓光是复星派来 原CFO曾举报上市做假涉及复星 但遭否认

每日热议!数学建模支撑平台你懂几分？高等教育出版社邀请专家告诉你

今日精选：智慧农机助力“三夏”生产绿色增收

世界自然遗产地可可西里卓乃湖告别通信盲区

雪纺（雪纺）

暗黑4游侠剧情加点推荐

焦点简讯:暗黑4怎么样才能骑马

霍格沃茨之遗城堡里的储藏任务视频攻略

霍格沃茨之遗皓莺教授的作业任务视频攻略_播资讯

今亮点！儿童和学生用品质量安全监管加强

尿起泡沫是什么原因_尿有泡沫怎么回事_天天滚动

无花果怎么吃剥皮吗

三星才是618“降价王”：新机大降1900元，骁龙8Gen2+100倍变焦-看点

世界微速讯：618限时特惠来袭！华为 Pocket S全系直降千元，给你时尚一夏

百事通！波音AEI参投，AR空战培训公司Red 6获7000万美元B轮融资

三星S24 Ultra：影像提升&外观优美 世界热闻

探访戴森总部后，终于知道了它全球爆火的秘密

南方基金副总经理朱运东已经当了12年 今年已50多岁

世界实时：重庆电信总经理李秀林入选了十大重庆经济年度人物 他有这个实力

全球快看：塞尔达传说王国之泪全部井位置一览

家里的宽带升级到1000兆需要更换什么？

世界今热点：国泰睿元一年定期开放债券发起式基金经理变动：增聘李铭一为基金经理

编码器的作用是 编码器的作用|今日热议

天天报道:暗黑4炼金师位置攻略

暗黑4珍品商位置攻略|天天时讯

cad十字光标怎么变大快捷键_cad十字光标怎么变大天天即时

嵌套分类汇总操作方法_嵌套分类汇总世界看点

【原】减重与减脂有何区别？3个方法让你减脂不减肌天天热讯

需求上涨，为何猪价还在下跌为什么猪价上涨了

一嗨租车副总蔡礼洪来了十几年忠诚度高公司多次因租车资质被罚款

环球简讯:美债务上限法案将于6月3日签署道指狂飙700点惠誉维持美国信用评级在负面观察状态

阴阳师白童子技能解析（学学隔壁黑童子吧）快消息

天天新资讯：入门价格旗舰体验无感佩戴超长续航：荣耀Earbuds X5开箱简谈

阳了浑身疼怎么办肾阳虚全身酸痛_环球简讯

vivo S17系列：旗舰夜景人像与设计完美结合环球今日报

宝宝树CFO高晓光是复星派来原CFO曾举报上市做假涉及复星但遭否认

三星S24 Ultra：影像提升&外观优美世界热闻

南方基金副总经理朱运东已经当了12年今年已50多岁

世界实时：重庆电信总经理李秀林入选了十大重庆经济年度人物他有这个实力

编码器的作用是编码器的作用|今日热议

独家：青海联通近期管理层变动揭秘含一把手及多位副总经理消息

重点聚焦!哈尔滨银行行长助理孙伟超从柜员干起第一学历未披露原行长已出事

猎聘CFO田歌年龄很小升职快被公司夸赞为“出色的财务领导者”