自ChatGPT走红以来,以“聊天”为核心的人工智能协作工具们受到了各行各业的关注,让AI写首诗、发封邮件,或是做一份计划书,这些工作已经成为AI聊天机器人的“日常需求”。
但似乎,人们遗忘了AI还具有创作文字以外的内容,比如,一幅画。
(图源:Jason Allen)
2022年8月,美国科罗拉多州博览会艺术比赛宣布了一名令人惊喜的获奖者,这位获奖者名为杰森·艾伦,他既不是专业的画家,也不是自由艺术家,而是一款桌面游戏的CEO。他的获奖作品《太空歌剧院》,由新型AI绘画工具“Midjourney”创作而成。
《太空歌剧院》是一幅神奇的画作,它结合了古典与科幻的元素,将17世纪欧洲的歌剧院场景与极具科幻的太空相融,画中身穿华丽服饰的贵妇们站立于穹顶之上,漫游于太空之间,极具魔幻色彩。这样一副“神奇”的画作,竟是出自AI之手。
(图源:Midjourney)
没错,Midjourney,这款完成度极高的AI绘画工具,正在开启AIGC(人工智能生成内容)的新世代。
Midjourney为何突然走红?
在《太空歌剧院》获奖之前,Midjourney其实一直处于不温不火的状态,即便它拥有不俗的内容创作能力,但依然只在AIGC爱好者的小众圈子里流行。可以说,美国科罗拉多州博览会,让Midjourney走进了大众的视线。
2021年,OpenAI发布了第一代AI绘图工具DALL E,使用文字描述,即可生成一张图像,打开了AI绘图的新世代。由于是初代工具,DALL E的表现并不完美,很多场景都没法真实呈现,或者说,这个工具创作的作品,看起来依旧是一张来自人工智能生成的图片。
这样的结果并不让人意外。自2020年以来,不少小众AI绘图工具走红,基本遵循了“临摹”、“描述生成”和“参考生成”这三种工作模式,早些时候在短视频平台“抖音”上很火的“AI一件变装”,正是基于参考生成实现。即使是有参照物、有一定的描述,这些AI工具依然很难令人满意。
(图源:Twitter@weplash)
AI绘图之所以“一眼假”,主要还是两个部分:光影和手指。
与人类作画不同,AI绘图工具没法了解到用户所描述的场景里光源的正确走向,以Stable-Diffusion、Lora这样的热门绘图工具为例,它们处理光影的方式往往具有一定的随机性,左右光源不分,导致产出的作品不够真实。同理,手指的几何形状十分复杂,没有一定的规律,AI工具很难有针对性的处理。
这些问题,在V5版本的Midjourney上全都被解决了。
上周,有网友利用Midjourney制作了一系列“情侣合照”,因过于真实的场景塑造和人物表情,走红网络。不少网友表示,在得知它是由AI工具创作之前,只觉得是一张平平无奇的照片。像“一张照片”,在某种意义上,诠释了Midjourney的成功。
网友们大开脑洞地将马斯克与炼铁工厂组合到了一起、把爱因斯坦带到了热闹非凡的音乐节、甚至帮中国男足“拿下”了卡塔尔世界杯的冠军。天马行空的想法,如今只需文字描述就能做到。
Midjourney,真正智能的AI绘图工具
Midjourney能够大获成功,除了对细枝末节的精准把控之外,更重要的还是对场景的还原。
前面提到,AI制图之所以能被人们快速识别,细节的成败是关键,但实际上,作品的风格十分重要。从网友的一些作品中不难看出,Midjourney拥有根据场景自动调色的能力。
(图源:微博@藤原小直)
举个例子,当你尝试生产一张90年代的照片时,你是否会对照片的质量有所顾虑,毕竟在那个年代,胶卷相机才是主流。而胶卷相机往往没有那么清晰的画质,对曝光的控制也比较差劲,这样的风格被摄影玩家称为“胶片感”。Midjourney在接到关于年份的描述时,会主动匹配用户的需求,不会让一张高清图片出现在“90年代”的场景描述之下。
这正是Midjourney的精妙之处。
当然,匹配风格对于V5版本的Midjourney来说,还算不上什么真正的主菜。Midjourney现在可以按照用户的需求,模拟不同摄影设备的摄影效果,例如“shot on Canon R6 with 50mm f1.4”,此处包含了相机型号为佳能R6,50mm焦段与f1.4光圈等信息。Midjourney可以根据用户提供的信息,模拟出所需的效果。
(图源:微博@甘信尧)
不得不说,Midjourney这项功能不仅是“惹”到了绘画创作者,还同时“惹”到了光学设备制造商,同时让两个领域的专业人士失业,很难不让人感到担忧。
AI绘图越来越逼真,真的没问题吗?
当人们还在讨论人工智能作为辅助工具,会不会一步一步抢走大部分基础从业者饭碗的时候,AI绘图暴露了巨大的问题。
3月28日,Midjourney正式宣布关闭所有免费账户通道,并通过官方平台发布公告称,将对由Midjourney生成的图像进行严格监管。为何势头正盛的Midjourney会做出这样的决定呢?原来,有人利用它生成的照片,制造了假新闻。
(图源:Instagram@blastmagazine)
此前,有新闻平台发布了一则“美国前任总统特朗普被捕”的快讯,图片上,特朗普被美国警察挽住双臂前行,配合文字描述,不少网友真的以为特朗普被捕了。随后,经证实,这张图片由AI生成,且文字描述也为虚假消息。
事实上,越发逼真的AI制图工具,必然会遇到这样的问题。仔细研究这张“假新闻图”,不难发现,无论是光影、构图还是人物神态,几乎已经达到了以假乱真的程度。这样的图片制作简单,造假成本极低,且能引起的舆论空间深远,对新闻业界造成的影响巨大。
(图源:Instagram@blastmagazine)
另一方面,AI绘图的数据也不是凭空而来,训练其数据模型需要用都大量图片,而这些图片的来源也存在不小的版权争议。早些时候,Stability AI的母公司Stable Diffusion被全球最大的图库公司Getty Images告上法庭,指责其使用不正当手法训练旗下的AI制图工具,涉及商业侵权。同样地,这些AIGC创造的图片,版权可以来自于拥有独立版权的作品,归属权难以辨别。
尽管人工智能正在快速发展,其背后存在的问题还有非常大的讨论空间,版权、道德和职业素养等方面争议不断。AI制图距离被广泛应用,还差临门一脚。
写在最后
可以预见,在人工智能辅助工具的加持下,人们的生活会变得更加方便,AI生成文字、AI制图,这一切都变得更加简单化。但愈发真实Midjourney也拉响了人工智能“入侵”生活的警报。
现阶段的Midjourney,已经可以做到“以假乱真”,这是一件好事,同时也是一件坏事。好的方面,我们可以利用自己的想象力与文字描述,创作更加真实的画作,即便自己在绘画方面没有掌握任何一项技能,这也并不是难事;而坏处是,这些看似真实的作品,拥有极高的可信度,影响着人们的判断能力。
(图源:Twitter@techhalla)
无论如何,人工智能的快速发展让创作变得不再有门槛,但创作的核心其实一直没有变,那就是想法与创意。Midjourney看似强大,但无法脱离用户提供的描述,自主地创作作品,这就是为何自AIGC诞生以来,不少利用AI工具创作作品的用户,依然可以被称为艺术家。
所以说,只要创意不断,强如Midjourney也抢不走你的饭碗。
原文地址:https://36kr.com/p/2196711705446784