英国国王查理三世

人工智能艺术的迅速崛起

图片来源:MidJourney

人类是否在不知不觉中进入了一个全新的艺术和艺术表现时代?这是创意社区和在线论坛上流传的一种建议,因为一种新型强大的人工智能正在从阴影中浮现。

生成式人工智能艺术在过去的几个月里通过先进的在线平台如DALL-E2, Midjourney和Stable Diffusion爆炸了,这些平台使任何有智能手机或PC的人都可以通过输入简单的文本指令来创建高度精致的艺术。

复杂的算法已经学会了模仿著名艺术家的特定风格、颜色和笔触,使用户能够瞬间创作出自己独特版本的梵高、达利、特纳或莫奈等大师的杰作。

这项技术可以以超逼真的细节将奇异和超凡脱俗的创作变成现实。输入“饼干怪物爬上碎片”,你会看到这个儿童电视角色不协调地爬上了塔。输入“泰勒·斯威夫特指挥不死军团”,就会出现这位流行歌手令人不安的图像,就好像是从地狱里变出来的一样。

无限的可能性在社交媒体上引发了大量的表情符号,将生成式人工智能的话题推到了聚光灯下,并在这个过程中提出了一些基本的问题:如果机器创造了艺术,那它是真正的艺术还是只是复杂计算的结果?这项技术对从事电子游戏、音乐、电影或电视工作的人类艺术家意味着什么?他们来之不易的创造技能是否正在贬值,他们的工作是否岌岌可危?

这幅画是我做的。工程。

如果一台机器创造了艺术,它是真正的艺术还是复杂计算的结果?

图片来源:MidJourney

这一困境击中了艺术行业的核心,因为人工智能被“训练”了数百万张图像,其中许多是真正的艺术家的版权作品,他们没有能力选择退出。虽然一些艺术家准备接受这种牺牲,以换取技术开辟的创作途径,但另一些艺术家则声称这与盗窃无异。

概念艺术协会(CAA)的插画家和董事会成员Karla Ortiz告诉E&T:“我第一次听说这些工具时,实际上我很好奇。但当我发现它们是如何被创造出来的,它们不仅使用什么样的数据,而且需要什么样的数据来产生结果时,我开始变得更加犹豫,以至于现在我不能凭良心或善意地建议我的行业中的任何人使用这些工具,无论他们是概念艺术家还是艺术总监;不是任何人。”

用人工智能来创作艺术的概念似乎是革命性的,但事实上,通过编程让计算机模仿人类创造力的实验可以追溯到几十年前。

1973年,艺术家哈罗德·科恩(Harold Cohen)发明了最早的自主图片创作者。“亚伦”系统使用算法指导计算机以徒手画的不规则方式绘制特定物体。一些命令生成了艺术家说他不可能想出的形式,模仿真正的艺术决策。

快进到21世纪,创新加速了,这要归功于为艺术家开发的计算机编码资源、开源项目以及海量数据集的公开可用性,比如ImageNet,这些数据集可用于训练算法,对照片进行分类和识别。

人工智能(特别是一类被称为生成式人工智能(generative AI)的技术)的最新改进,通过将模拟人脑工作的复杂深度学习技术与强大的计算能力相结合,改变了方向。

像DALL-E 2、Midjourney和Stable Diffusion这样的平台利用在巨大图像数据集上训练的神经网络来检测潜在的特征和模式,并根据用户文本提示创建类似的内容,而不是翻版。例如,在Midjourney中输入“工程和技术”文本提示,生成了一组图像,其中一幅你可以看到对面。

生成式人工智能仍处于早期阶段,系统有时难以令人信服地呈现某些特征,如人类或动物身体部位,或书写内容,这些内容通常是乱写的。尽管如此,它们已经证明了自己与人类艺术匹敌的能力,甚至骗过了经验丰富的艺术评论家。

去年夏天,一件名为“Théâtre D 'opéra Spatial”的人工智能创作作品在科罗拉多州博览会上赢得了数字艺术类别的冠军,尽管艺术家杰森·M·艾伦(Jason M Allen)没有透露他的创作背后是机器学习。

“艺术已经死了,伙计,”他在获奖后告诉《纽约时报》,并坚称自己没有违反任何规则,尽管许多艺术家对此感到愤怒。

利物浦约翰摩尔斯大学艺术与创意技术基金会主任马克·赖特博士告诉E&T:“人工智能艺术有一些历史,但这些惊人的深度学习系统和卷积网络似乎在能力上产生了一步变化,这真的很了不起。以前,艺术家必须与科学家或技术人员合作才能利用人工智能实现任何目标,而今天,任何人都可以实现目标。”

尽管这项技术还处于起步阶段,但许多艺术家都在用它来增强他们的作品,并为插图和概念艺术提供灵感。一些人甚至采用了“AI合作者”的绰号来描述他们与软件的相互依赖关系。

比利时艺术家、机器学习研究员Xander Steenbrugge就是其中一位支持者,他的艺术视频《穿越时间》(Voyage through Time)是用36个连续的短语在《稳定传播》(Stable Diffusion)中定义了想象中的史前恐龙景观。

Steenbrugge说,他不是简单地采用平台的“普通”版本,而是“破解”开源代码来改变逻辑,并引入细微的变化。

他解释道:“我通常都有自己想要创造的东西的意图,当我开始探索,AI模型进入这个循环时,基于它所产生的内容,我就会进行迭代,采用某些运行良好的内容并调整代码。我觉得当我在创作的时候,在这个过程中有第二个创作代理。这是我们在这里看到的一个新的有趣的范式。”

对代码的修补突出了如何使用文本到图像生成器并不一定是零努力;它需要天赋、练习和时间。艾伦在制作“Théâtre D 'opéra Spatial”的漫长艺术过程中,探索了一个特殊的提示,创作了数百幅图像。他在聊天论坛Discord上的一篇帖子中说:“经过数周的微调和策划,我选择了我的前三名,并在使用十亿像素人工智能升级后将它们打印在画布上。”

美国专业插画家基思·兰金承认,他对《Midjourney》的最新更新所带来的质量飞跃感到“震惊”,包括准确复制现有人类艺术的能力。他使用该工具的实验包括受萨尔瓦多·达利(Salvador Dali)和René马格利特(Magritte)等人启发的黑暗艺术作品。

他说:“现在,我认为人工智能是一种创造参考或产生想法的工具,但这种情况可能很快就会改变。”他预测,在不久的将来,人工智能将被用于自动填充动画中的大部分帧,或者艺术家们能够自己制作整部电影,每一帧都像一幅高度精细的绘画。他补充说:“把这种想法投射到越来越远的未来,可能性就会越来越大。”

如果人工智能可以作为催化剂,帮助加速某些艺术进程,那么它也可以完成通常只有人类艺术家才能完成的任务,这可能会对这个行业产生破坏性影响。人工智能已经证明了自己在许多任务上优于人类,那么艺术世界又有什么不同呢?

蒙特利尔人工智能伦理研究所创始人兼首席研究员Abhishek Gupta说:“这对艺术家的生计有明显的影响,尤其是那些严重依赖于通过委托艺术(如书籍封面、插图和平面设计)来资助他们的创作追求的人。他们的辛勤工作获得商业利益的渠道被削弱,肯定会产生双重影响,一方面降低现有艺术家的经济能力,另一方面打击那些想把这一领域作为全职职业的新艺术家。”

在加州工作的资深电子游戏角色美术师丹•埃德尔补充道:“人们不禁会觉得,我们辛苦挣来的技能迟早不再被需要,这只是个时间问题。”他说,他的许多同行都对这种新趋势表示不屑。然而,埃德尔认为,艺术家们将不得不适应变化,并“找到方法,以机器根本无法实现的方式,将他们独特的才能发挥出来”。

超人处理数字的能力是一回事,但人工智能艺术平台被训练来识别和复制真实艺术家(无论是在世的还是已故的)作品的方式,在设计师中引发了愤怒的反弹。

数以百万计,有时甚至是数十亿张图片被从网络和其他来源中抓取,以训练模型识别和复制数据中的模式,其中许多是由人制作的,并以这样或那样的方式受到版权保护。

如果基本上任何人都可以制作出“真正”艺术的精确仿制品,而公司可以制作并销售对在世设计师的仿制品,这就引发了严重的法律和道德问题。

现在,潜在的损害更大了,因为开发者可以访问api,将这些图像生成器嵌入到应用程序和网站中,并根据客户制作的图像数量和大小向平台支付费用。

“这种类型的AI不只是训练成为艺术家的替代品;更糟糕的是,它想用你自己的作品取代你,”CAA的奥尔蒂斯说。“当人们称之为艺术民主化时,我认为这是将艺术盗窃带给大众。这是一个大胆的声明,但这些新技术一直在改进。”

从法律的角度来看,这些系统是否会侵犯版权,艺术家是否对模特或他们创作的内容有任何法律主张,目前还没有定论。在美国,人工智能研究人员、初创企业和科技巨头通常声称,图像使用受到“合理使用”原则的保护,该原则旨在鼓励使用受版权保护的作品,以促进言论自由。

虽然这在使用他人数据训练模型时可能成立,但如果生成的内容威胁到原始艺术的市场,这可能就不成立了。例如,让一个接受过达米恩·赫斯特艺术训练的人工智能“创作一幅达米恩·赫斯特的画作”,然后在拍卖会上出售这幅作品,显然有与艺术家竞争的意图。

针对GitHub Copilot背后的人工智能系统的首次集体诉讼,可能会为生成式人工智能的未来法律前景提供一些急需的清晰度。GitHub Copilot是微软和OpenAI设计的一项功能,旨在帮助程序员更快地编写代码。

除了法律上的困境,怀疑自己被抄袭的艺术家的一个出发点是找出他们的作品是否被用来训练人工智能。OpenAI拒绝分享训练DALL-E 2的图像数据,但Stable Diffusion的代码是开源的,它分享了用于训练模型的图像数据库的细节。

富有表现力的色彩鲜艳

这种“艺术”的提示是“工程、技术、表现力、色彩丰富、细节丰富、天空、卫星、空间、建筑、人工智能创造了这一切”

图片来源:MidJourney

这是我画的。BAME。

对于这幅超现实主义作品,提示是“AI画了这个,BAME,工程,技术,极端细节”

图片来源:MidJourney

人工智能创造了这种绘画技术

这幅图包括提示“人工智能创造了这幅画,技术,世界,抽象,详细”。

图片来源:MidJourney

为了推动更大的透明度和控制权,艺术家团体Spawning推出了网站“我受过训练吗?”该软件允许艺术家搜索用于训练模型的约58亿张图像,包括Stable Diffusion和Imagen。

用户可以选择参加或不参加培训,设置如何使用他们的风格和肖像的权限,并向公众提供他们自己的培训模型。Stable Diffusion背后的公司Stability AI表示,他们现在正在使用这款工具让艺术家选择加入/退出,并与内容真实性倡议组织(Content Authenticity Initiative)合作,后者正试图推动采用一个关于内容真实性和出处的开放行业标准。

Stability AI负责市场营销和公关的内森•利勒(Nathan Lile)表示:“我们目前的立场是,transformer架构(神经网络架构)学习的是第一性原理,不会复制任何培训材料。”

E&T还为此联系了Midjourney和OpenAI。

Steenbrugge认为自己是那些愿意“选择加入”并分享自己作品集以换取潜在创意利益的艺术家之一。他说:“我觉得反对这是一个糟糕的策略,最大的好处是人们可以更快地迭代,并对其他人的作品进行变化和混合。与其对版权问题视而不见,它的好处也非常大。”

另一位设计师兰金表示,提高透明度“是正确的一步”,可以看到人工智能训练是如何工作的,以及图像是从哪里提取的。他说,下一步将是,当一幅图像来自特定的作品时,以某种方式赞扬或补偿艺术家。在未来,他设想引入“更精心策划的数据集,或社区数据集”,承认艺术家的担忧。

对生成式AI的批评还延伸到生成内容的潜在危害性。粗略浏览一下Midjourney Discord频道(制作艺术作品的地方),就会发现用户非常喜欢衣着暴露的年轻女性照片。这是无害的,但利用这些平台制作更多暴力或辱骂图像,或深度造假的可能性呢?Midjourney的规则规定,用户不应该“创建本质上不尊重、具有攻击性或侮辱性的图像或文字提示”,并且有一个审核员团队对内容进行审查。

人工智能模型被训练做出决策和产生预期输出的方式也可能导致它们加强或放大社会偏见和刻板印象,如种族主义、性别歧视和残疾歧视。

OpenAI及其外部研究团队的早期测试发现,dall - e2在默认情况下倾向于生成白人男性的图像,过度性化的女性图像,并强化种族刻板印象。

此后,该公司实施了新的缓解技术,旨在生成更多样化的图像。一项内部评估发现,用户认为图片中包含不同背景的人的可能性增加了12倍,进一步的改变正在进行中。

当研究人员、立法者和创意产业继续努力应对这个快速发展领域的复杂影响时,一些人正在形成这样的想法:平台应该如何发展,对艺术家更“公平”,更道德,产生更安全的输出。

Gupta认为,通过三管齐下的方法,人工智能艺术平台应该就潜在的版权问题向用户提供强有力的免责声明,并“采用追索机制,以便希望删除作品的艺术家有机会这样做”。他还认为,他们应该投资内容审核和安全团队,以应对用户投诉,并对产生的任何有害内容进行标记。他补充说,在制定指导开发者和用户行为的案例法或法规之前,“与艺术界共同制定规范和实践对于维持道德方法至关重要”。

考虑到机器生成艺术令人惊叹的潜力,即使在这个早期阶段,我们在不久的将来能期待什么——人类艺术会变得不那么有趣,消失在背景中吗?如果无法区分两者,会有什么影响呢?

艾伦·图灵研究所(Alan Turing Institute)专门从事数字创新的伦理研究员Mhairi Aitken解释说:“随着这些工具变得无处不在,而且它们生成逼真图像的能力变得越来越先进,准确可靠地识别哪些图像是‘真实的’,哪些是人工智能生成的,将变得越来越困难。”这给民主带来了重大风险,一方面是因为虚假图像有可能被报道为真实图像,另一方面是因为人们越来越怀疑真实图像的真实性。”

生成式人工智能不仅仅是一个传播模因的智能工具,它提高了创造力和整个社会的风险。

艺术与人工智能-贾尔斯·汉森·萨瑟兰博士

当有人找我写这篇关于人工智能艺术作品的简短评论时,我的第一反应是说“不”。毕竟,我对人工智能、算法、基础模型和不断增加的参数大小的了解可以写在邮票的背面。我感到力不从心。

毕竟,这不就像在写绘画作品时,对用来创作它的材料或围绕它的漫长而复杂的历史一无所知吗:艺术家、模特、灵感、赞助、象征主义,政治、文化和社会的复杂交织;法典和惯例?

但好奇心战胜了我。在向委托编辑明确表示我的专业领域在别处之后,她慷慨地同意了一份公开简报。“就像它是由人创作的一样对待工作,你喜欢多挑剔就多挑剔。但如果你想把人工智能元素融入你的评论中,那就太好了,”她告诉我。

我花了一点时间看了看发给我评论的图片。我的第一印象(作为艺术评论家,我在工作中经常依赖这种反应)是对图像的预期可预测性。就好像用于创建图像的技术在AI系统用于创建图像的参考领域中是隐含的。所以,未来主义AI技术被用来创造未来主义,超现实主义的科幻世界中的世界;或者是半机器半人的复制人拥有不可思议的匀称身材,不可思议的美丽女性面孔。我不太喜欢这些类型的电影,尽管《银翼杀手》无疑是有史以来最好的电影之一。《终结者》系列也有很多精彩时刻。

但让我们先回顾一下。在批评人类创造的视觉艺术时,我总是能敏锐地意识到它背后的人,即使他们已经死了。我告诉自己,这个人有或曾经有敏感和感情。我必须尽可能地友善和有建设性。但是没有人会被冒犯的评论的参数是什么呢?

我回头再看一遍这些图片,再看一遍往往会得到一个更深思熟虑的回答。对于一项处于相对初级阶段的技术来说,这些图像是相当了不起的,因为在构成图像的最后阶段没有人手参与。它们复杂、迷人,而且不可避免地具有原创性,尽管它们的图形来源是在网上找到的数十亿或数万亿幅图像排列(包括人类艺术家创作的图像)的结果。

这些特殊的图像是使用midjourney.com AI在Discord(这是一个文本到图像模型)使用提示和关键字创建的,如“工程”“笔触”“超现实”“AI”

据《经济学人》(在2022年6月7日版中使用了人工智能生成的图像)报道,新一代人工智能“具有早期人工智能所不具备的适应性,这可能是因为在绘画、创意写作和计算机编程等不同学科中,操纵符号的规则在某种程度上存在相似性。”这是否预示着我们创造性的未来?在每一场这样的辩论中,观点都是微妙的,结果也是不可预测的。一些人认为越来越复杂的基金会模式对人类创造力是一种有益的帮助,而另一些人则认为它是一种全面的威胁,使人类的意义黯然失色。

将我们与近亲哺乳动物区分开来的一个定义是我们创造艺术的能力,因为所有其他的区分因素都像一堆彩虹糖一样被移除了。如今,人类创造力这一明显独特的品质受到了挑战。

给我看一些下一代人工智能的图像,我敢肯定,我无法区分人类生物神经网络的输出和基于芯片技术的输出之间的区别,后者的运算速度为每秒数万亿次。

但这样的进步会给我们带来另一个莎士比亚、詹姆斯·乔伊斯、莫扎特或米开朗基罗吗?

AI艺术的平庸——JJ Charlesworth

人工智能平台如此容易生成的图像,比任何东西都更能告诉我们,这些机器很容易就能从中获得营养的人造图像文化。绘画是一种古老的媒介,但如果这些例子具有代表性的话,《中途之旅》对绘画并不了解。它了解真实感绘画,高端幻想插画家和艺术家使用的那种,比如在BAME和非常详细和复杂的。它学会了一些只有在丙烯酸颜料中才能真正实现的松散、扁平的分层技术,因为(我怀疑)这是一种由成千上万的业余和训练有素的插画家和艺术家学习和传播的风格,他们在网上推广他们的作品,包括在新兴的NFT空间。它甚至学会了用小刀涂上油画颜料的那种笔触,就像“工程-技术-表现力-笔触”

但它们真的好吗?要回答这个问题,我们可能需要回顾一下我们是如何形成今天的视觉文化的。21世纪的大众文化在视觉幻想的生产方面是无与伦比的。回到20世纪80年代,像我这样的青少年必须去书店看“幻想艺术家”的奇怪而难以置信的想象——罗杰·迪恩(Roger Dean)的怪异而奇妙的外星世界,或者鲍里斯·巴列霍(Boris Vallejo)等画家的耸人听闻的超现实主义“剑与魔法”幻想,或者克里斯·弗斯(Chris Foss)史诗般的科幻封面艺术。但现在,通过photoshop和CGI,互联网以及奇幻和科幻小说市场的无情增长,这种文化已经爆发了。有一个巨大的视觉幻想的海洋,在那里,立即可用,当它曾经是内省青少年和书呆子亚文化痴迷者的保护。

巨大的背景图像资源——你几乎可以称之为我们的视觉“无意识”——支撑着我们在这些旅途中产生的图像中所看到的东西。但我们也发现他们的视觉想象力是有限的。例如,自从Yul Brinner在《西部世界》中透露了他的机器人内部结构,或者《星际迷航》的艺术部门想出了博格人,这些半机械人女性的形象就一直是科幻文化中不断重复的“比喻”。(人-机器人混血儿总是只有一只机器人眼,而不是两只!)在《艺术与技术》中,占据女性形象头部的一束束屏幕和电缆,可以追溯到冢本信也1989年的cult经典《铁人》(Testuo: The Iron Man)中怪异的科技恐怖。

这些比喻——无论是在技术上还是在视觉内容上——都是普遍存在的。他们很能干,也很平庸。但讽刺的是,人类创造的艺术同样是通用的和重复的。在艺术中,无论是人类还是其他方面,想象力都是通过反思已经存在的东西来想出不同事物的能力。

最糟糕的是什么?幸运的是,你不能伤害人工智能的感情(至少现在还不行),因为这些引人注目、色彩鲜艳的查尔斯国王肖像看起来就像你有时在百货商店里看到的那些画廊里出售的画作。可怕的不是笔触的模仿或渲染(至少他是可以辨认出来的),而是没有意识到这位君主看起来有多荒谬;他的王冠摇摇欲坠地倾斜着,他的五官被染红了,就好像他的孙子们刚刚用面部彩绘工具把他弄到了一样。人工智能可以清楚地学习绘画应该是什么样子。但它仍然需要人类教会它看,思考,(只是可能)学会判断好坏。

富有表现力的笔触

1

图片来源:MidJourney

英国国王查理三世

2

图片来源:MidJourney

科技与艺术

3.

图片来源:MidJourney

工程与技术世界

4

图片来源:MidJourney

科技与艺术

5

图片来源:MidJourney

艺术与AI

6

图片来源:MidJourney

非常精细复杂

7

图片来源:MidJourney

富有表现力的笔触

8

图片来源:MidJourney

夏洛特马林斯

评论家的观点

世界中的世界;有玻璃眼睛的男人;看着这些图片,我感觉自己好像在评判一场毫无生气的学校艺术展览。在人物和建筑的渲染,明暗的应用方面,艺术家有一定的能力,但艺术家每次都被融化的脸或歪鼻子绊倒。也许这就是问题的症结所在,因为这些图像背后根本不是艺术家,而是一个名为Midjourney的人工智能程序。

数字艺术并不是什么新鲜事。20世纪60年代的艺术家们用计算机算法进行实验,创造出了现在被称为生成艺术的东西。但曾经艺术家和机器之间的合作现在变成了机器自己“思考”和“绘画”。如果最伟大的艺术家向我们展示深刻的真理,并与我们的情感对话,人工智能能复制这一点吗?像Midjourney这样的项目会让艺术家变得多余吗?看看这组由委托编辑器输入几个定向关键字生成的图像,答案是明确的“不”。

最不成功的是那些过于努力地让自己看起来像手势画的图像。工厂[1]上方湍流天空的“笔触”并不流动,光线遍布整个地方。如果太阳正在落山,为什么云的顶部是白色的?至于国王查理三世的形象,他似乎继承了他母亲的灰色卷发,所以最好的办法就是掩盖它。

这些看起来像反乌托邦电影插图的图片有更多的好处。我喜欢螺旋桨[3]的意想不到的羽毛性质,光源准确地捕捉到沿着机器的右边缘闪烁。冒出蒸汽云的球状工厂[4]可能是新电影《银翼侠》的分镜图。

有几张图片将女性与机器部件拼接在一起[5,6],但这幅托尔金式花饰的金线圈双联画[6]在情感联系方面完全没有提供任何东西。带着浑浊的机器眼的老人[7]似乎是一个更好的选择,直到我们仔细检查鼻子,当现实主义崩溃时。

也许最成功的形象是世界中的世界[8]。你可以把它印在格拉斯顿伯里音乐节的t恤上,或者酷玩乐队演唱会的海报上。一个站着的人的剪影映衬着远处的天际线,云层在他们周围形成了一个世界,至少有一些东西可以让你咬牙切齿。但这更像是无限的猴子定理,而不是威廉·布莱克(William Blake)在他的诗《天真的预兆》(augury of Innocence)中所描绘的那种把无限握在掌心的能力。

这些图片都比不上专业艺术家的小作品。人工智能还没有掌握艺术融合时间和空间、压缩情感和揭示隐藏的普遍真理的能力。机器人艺术家Ai-Da也没有解决这个问题。也许我们应该注意与她同名的数学家阿达·洛芙莱斯在1843年说过的话:“分析机并不自命能产生任何东西。我们让它做什么,它就能做什么。”

每个程序都可以通过处理数十亿张图像来训练,但却缺少了创造力和原创性的火花。现在。

报名参加E&T新闻电子邮件让像这样的精彩故事每天都发送到你的收件箱。

最近的文章

Baidu
map