- 邮箱:
- www.kf818.com
- 电话:
- 0898-66156089
- 传真:
- 手机:
- 13883807169
- 地址:
- 海南省海口市
杏彩体育app下载今年早些时候,我向摄影师劳里·西蒙斯(Laurie Simmons)询问,为什么她要将人工智能用作一种创造性工具。她的回答让我深受启发:“因为人工智能已经成为我们现实中不可或缺的一部分!”然而,由于新冠疫情的影响,线下活动(如出游和聚会等)受到了限制,这也引发了西蒙斯对人工智能的兴趣。最近,她开始尝试运用流行的文本图像生成器DALL-E(2021)进行新的创作。但在整个2022年,人工智能也引发了有关版权和独创性的争议。西蒙斯与越来越多的摄影师一起,致力于探索这项技术本身的潜力和问题。
在摄影领域,人工智能技术最近引起了许多担忧,其中一个关键问题在于文本图像生成器缺乏明确的结构和问责制。这让版权问题成为争议的焦点,因为生成器的数据库是通过在互联网上抓取数十亿张带有相关文本描述和标签的图像而构成的。在其中,开源人工智能公司Stability AI 受到了艺术家的集体侵权指控,Getty图库也备受诟病。尽管当代艺术的每一个新发展都伴随着艺术之死的焦虑,但许多艺术家仍在实践中积极适应新工具。近期,西蒙斯在Web3团体组织的在线合集In and Around the House II中展示了她的一些新作品,也为人们呈现了这一领域的发展和探索。
有时候,我们谈到人工智能这个词时,它的含义太过广泛,囊括了自动驾驶汽车、电子邮件语言提示、个性化医疗建议、谷歌搜索以及Photoshop的工具等领域。对于许多艺术家来说,人工智能为他们提供了更为广泛的创作可能性,但同时也预示着许多创意劳动将会被自动化,这使得他们对于自己的工作前景感到担忧。
GANS (生成对抗性网络) 是一种早期的人工智能形式,它引起了许多艺术家的极大兴趣。艺术家可以使用GANS从现有数据中(包括图像)创建出合成的视觉效果,以此来编译个性化的数据集。例如,摄影师可以使用自己的图像档案来创作新颖的作品。与之相比,文本到图像生成器需要使用大量数据集,而这些数据集往往是任何一个艺术家都无法编译的,甚至艺术家们还需要开发人员的邀请才能访问这些生成器。然而,随着这项技术的逐渐普及,到了2022年,越来越多的艺术家开始分享他们使用文本-图像生成器的创作过程与作品,他们探索了生成器的局限性和可能性,挑战了算法的创造力和想象力,并让人们见证了这些系统是如何从一系列简单的单词中创造出令人惊叹的作品的。
西蒙斯对使用DALLE生成器的体验与胶片摄影的显影过程进行了对比。使用生成器生成照片非常迅速,西蒙斯能够快速生成展现家庭生活与内在情感的图像,就像她最知名的关于玩偶的摄影系列作品那样。即使DALLE为她生成的人物处于户外场景,比如在田野漫步或坐在露台上,这些图像也会营造出一种人物被环境所包含或约束的感觉。其中一幅“自画像”描绘了一名妇女在乡间小路上遛狗的景象,而这幅图片中的狗与乡间小路,与西蒙斯自己的狗,甚至她家附近的道路都惊人地相似。
然而,西蒙斯在接触DALLE不久后显得更为谨慎。她开始深究文字描述与所生成图片之间的微妙联系,并且一次比一次更精心设计她对生成器输入的文字描述。文字和图片之间的对应关系目前是个秘密,这也让她感到充满惊喜。西蒙斯的自我感觉颇为复杂,当她的文字描述成功让生成器创造出令人满意的作品时,杏彩体育官方网站她仿佛成为了人工智能专家,当她的文字描述生成了令人失望的图片时,她又觉得自己对DALLE一无所知。
这些图像生成器从各种来源获取数据,包括历史照片、新闻图片、社交媒体帖子和个人网站等等。这样的数据来源导致生成的结果可能非常写实,也可能十分抽象。纽约的摄影师查理·英格曼(Charlie Engman)认为,人工智能对人类身体的理解是有限的,因为它主要是通过图像而不是具身体验来感知身体。作为一名有着舞蹈和表演背景的摄影师,英格曼的作品涵盖了时尚摄影和与他母亲的合作肖像。他的人工智能实验进一步探索了这项技术对于表现身体运动的局限性。
身体语言能够传达内在的心理状态,但是人工智能很难处理情感。人工智能生成的脸部图像可以表现出悲伤或愉悦的情绪,但并不一定能够表达出相应的身体姿势或手势。英格曼指出,在舞蹈表演中,肢体语言是被创造出来用于表达想法和感受的。这证明了身体语言和特定情感存在某种联系,然而这种联系很少被解读、编码到人工智能数据中。与图像相关的标签通常不能指定情感和特定姿势之间的关系。例如,一个情感可能被定义为快乐,因为许多带微笑的图像都被标记为“快乐”,但人工智能可能无法识别其他微妙的姿态,例如放松的肩膀。这正是英格曼继续探索人工智能图像生成的原因。
最近,英格曼利用Midjourney这种文本到图像生成器,制作了一系列令人惊叹的作品。如果是通过真实的摄影来创作,由于道德原因和身体限制,他可能永远无法完成这样的作品。其中包括将人体形象融入椅子中,用幽默的方式嘲讽现代办公室生活。此外,他还以时尚传播的视觉语言为基础,创造出一些不真实的高瘦模特。英格曼表示,对于任何对图像制作感兴趣的人,“至少应该对它充满好奇心”。
随着DALL-E和Midjourney的广泛使用,人们开始好奇这些数据集如何诠释不同身份和生活方式。明妮·艾泰路(Minne Atairu)是一位跨学科艺术家和研究员,她在2020年攻读哥伦比亚大学博士学位期间,对人工智能产生了强烈的兴趣。她的工作主要关注于如何利用技术重新呈现文化历史中的缺失,特别是关注尼日利亚的后殖民时期。
刚开始,艾泰路使用从Instagram上下载的一些图片来训练一个GAN数据集,并制作了一组黑人模特的肖像照片。然而,她发现当使用Midjourney进行图像生成时,系统会反复出现刻板印象,尽管她已经尽力克服这个问题。例如,当她在生成器中输入“绿色的衣服”这样的描述时,系统生成了一个黑人穿着绿色衣服的图像,而这些细节与她在哈林黑人社区看到的景象非常相似。经过一系列尝试,艾泰路推断出Midjourney将明亮的颜色与黑人肤色联系起来,从而形成了这样的社会经济条件的刻板印象。
此外,Mid journey的限制促使艾泰路对文本到图像生成器如何描绘黑人的某些特征进行了深入调查。她的系列作品《金发辫》(Blonde Braids,2023年—)正在解决这一问题和相关的刻板印象校正工作。输入了“金发”的文本提示后,该系列作品生成了一个中产阶级郊区的环境,既再现了广泛的文化刻板印象,又强化了种族主义的想象。同时,当数据集对于某些群体的信息收录受限时,生成器也会遇到困难。例如,艾泰路的文字描述中解释了美拉尼西亚人,即斐济、印度尼西亚和巴布亚新几内亚的原住民,是如何拥有自然的浅色头发的,但生成器却很难生成这样的图像,杏彩体育官方网站这表明它对这种身份并不熟悉。当她要求生成两个人的图像并指定黑色素色调时,生成图像中的两个人都是金发,但肤色总是不一样,其中一个总是比另一个更白一些。
眼下,要想从根本上解决人工智能生成图像的问题还为时过早。艾泰路认为,仅仅通过调整文本提示和精心策划的选择是无法根除编码的偏见和刻板印象的。要想解决这些推理问题,开发人员需要仔细审查用于训练模型的基本数据结构。尽管艾泰路的照片并不能真实地再现人物形象,但它们却体现了一种深层而长久的信息偏见。尽管我们使用最先进的技术,但我们仍无法完全消除数据偏见和刻板印象,这些问题可能会导致生成的图像存在某些不符实际的地方。正如艾泰路所言:“无论多么超现实,总会有小故障。”
现在,对于人工智能图像生成功能下定论还为时过早。虽然许多人认为我们现在正处于人工智能生成图像的婴儿时期,但仅仅基于图像质量或真实性来评价这些系统是短视的。杏彩体育官方网站因为更值得关注的是社会习俗和网络数据方面的不平等。对这些系统进行实验是要求它们变得更具包容性的第一步。英格曼和西蒙斯正在将他们的工作推向新的美学方向,同时,艾泰路提醒我们人工智能数据库背后存在不公平的假设。
人工智能正在从根本上改变我们对摄影的看法。但这样的讨论一直以来都是媒介进化的一部分。在这个新的背景下,关于作者身份和创造力的争论将会再次出现,而那些注重图像美学和伦理的艺术家们,要求更认真地收集数据,这也是正确的做法。随着人工智能与摄影的关系不断被挑战与重新定义定义,那些有趣、富有创造性和批判性的艺术家们将不断探索技术的极限,为它们的关系开拓更多的可能性。
夏洛特·肯特(Charlotte Kent),艺术撰稿人,蒙特克莱尔州立大学视觉文化助理教授。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。