| 黄 石 刘依凡:新质生产力工具的交互艺术创新路径的探讨_中国工艺美术学会
一、新质生产力与传统艺术模式革新
新质与旧质(或原质)的概念具有相对性,而从旧质到新质的转变实际上是一个从量变到质变的过程。新质的本质在于其在结构、内容、素材和基数等方面产生的全新变化。
艺术与科技之间存在一个关键的区别:科技具有显著的积累性,随着时间的推移,人们可以逐步掌握和应用新的技术;然而,艺术家的创造力却似乎与生俱来,并不因历史的发展而有所增减。尽管不同时代的艺术家在技巧和风格上有所差异,但他们的核心创造力却始终如一。由于艺术创作易受物质因素的制约,受限于可用的艺术材料和媒介,因此无论是远古还是现代,无论是口头艺术、文学艺术、影像艺术还是当代的数字媒体艺术,艺术家往往受技术和媒体特质的制约,需借助现有的客观物质资源来构建主观艺术世界。
而现今,随着人工智能技术的发展,多种新的艺术媒介,如智能媒体、新媒体、未来媒体等应运而生,相对独立的传统艺术格局被打破,各种艺术媒介之间相互渗透、彼此影响,不断催生出新的艺术形式。其中,以虚拟现实、视频游戏为代表的交互艺术发展迅速,有望成为继电影这一“第八艺术”之后的“第九艺术”。
交互媒介具有其他艺术形式所不具备的开放性和智能维度,相较于电影或书籍中相对固定和线性的故事流程,可以更加生动和直观地呈现非线性的开放故事,展现交互性强、维度丰富的艺术空间。游戏设计师克里斯 ·克劳福德认为,游戏由多个互相连接的情节节点组成,为玩家提供了跃出传统时间和空间轨迹的可能性,并有机会为游戏网络创造新的分支和结局[2]。然而,在通往元宇宙艺术的道路上还面临着诸多技术挑战。当前的交互艺术往往采用网状或树状故事结构,并非完全的开放性叙事。只有当人工智能技术真正成熟时,才能够实现真正开放、自由和沙盒式的艺术形式。
二、AI与交互艺术的应用着力点
科技进步对艺术创新具有深远的影响,艺术媒介的发展决定了艺术的维度。在计算机技术快速发展的今天,沉浸和交互作为新的艺术维度,与人工智能、虚拟现实等新质生产力工具密切相关,是艺术发展和创新的重要着力点。
(一)艺术创作范式的转变
托马斯 ·库恩在其著作《科学革命的结构》中曾提出科学发展不是线性递进的,而是通过一系列“范式转变”进行的[3]。当一个新的、更有效的科学范式出现时,便会引发一场“科学革命”。AI生产方式便是对已有的艺术创作范式的颠覆性突破,也是一个从量变到质变的过程。
回顾人类艺术的发展不难发现,当今所面临的AI冲击与摄影兴起时的情景十分类似。1839年,达盖尔摄影法(银版摄影术)的出现导致大量以肖像画为生的画家失业。但当时的艺术家并未放弃思考,而是以睿智的方式进行应对。他们注意到,摄影虽然具有客观精确性,却缺少色彩表现,于是放弃传统的古典绘画技法,转而使用主观色彩和模糊的轮廓以与摄影形成对比。这一创作思想的转变使艺术家找到了新的突破口,也促使印象派、抽象主义、观念主义等流派诞生,形成了现代艺术史上的重要转折。
从历史的角度看,每个时代都有其主流的艺术形态。例如石器时代的岩画、青铜器时代的雕塑、铁器时代的宗教艺术、蒸汽时代的油画、电气时代的电影,各自代表了当时的主流艺术。在“八大艺术”的体系中,各艺术门类的媒介具有不同的时空维度。其中音乐和文学可以被归类为一维艺术,主要通过线性的声音和文字来传达情感和讲述故事;绘画和雕塑可以被归类为二维或三维的静态艺术,通过静态的图像来表达创作意图;舞蹈、戏剧和电影则是四维艺术,融合了时间和空间的概念,通过动态的表演来传达情感和讲述故事。电影之所以被视为第八艺术,是因为它综合了绘画、音乐、戏剧等多种艺术形式,具有高度的内在技术复杂性,又表现出直观的艺术亲和力,成为代表20世纪的主流艺术。由此推断,未来的主流艺术将进一步综合包括电影在内的艺术表现形式,并引入新的维度。笔者认为,这一新的维度是交互性和人工智能。当电影具备交互性时,将会催生出全新的艺术形态,成为第九艺术。当前,这一艺术形态尚未成熟,仍处于酝酿期和萌芽状态。相信随着时代的发展,这一新的艺术形式将在技术创新和艺术创新的双重打磨下逐步成型。
在AI技术不可阻挡的发展背景下,如何把握AI新质生产力工具与艺术内容高质量发展的内在关联,如何在 AI造物的黑箱中掌握艺术创作的主动权,是广大艺术工作者需要重点关注和思考的内容。
(二)基于 AI智能体的艺术体验
科技并非艺术的辅助手段,而是决定性的核心要素。自GAN(生成对抗网络)模型诞生之初,创作者便开始利用这类生成式模型来合成文本、图像和语音,其在艺术领域所带来的革命性创新日益显现。
在游戏设计领域,AI智能体正在带来新的艺术体验。Inworld AI利用ChatGPT-3 等大型语言模型,允许开发者和创作者通过自然语言描述快速创建 NPC(non-player character,非玩家角色),用户可以为角色定义各种特征,如性格、情感、记忆、目标和动机,甚至是特定的说话方式和声音。更高级的智能NPC甚至具备自主学习和适应能力,不仅限于预定义的脚本,而是能够根据玩家行为和环境变化自主做出响应,增强游戏可玩性和沉浸感。这些生成的NPC还可以被集成到各种流行的游戏开发平台和引擎中,如虚幻引擎(Unreal Engine)、Unity、罗布勒思 (Roblox)和 Minecraft等,使游戏开发者能够打造独特的游戏角色和情境。正如马歇尔 ·麦克卢汉在其著名论断“媒介即讯息”中表达的核心观点——媒介本身的形式和特性比它传递的具体内容更加重要[4],技术作为承载内容的容器决定了内容可被形塑的范围。
一直以来,NPC都是游戏等交互艺术创作中的关键要素。在早期的游戏中,NPC通常基于简单的算法和预设规则运作,如《吃豆人》(Pacman,1980)中的幽灵。这些 NPC的行为模式相对固定,交互能力有限,需要通过使用复杂的编程和规则系统实现其多样的行为模式,但也因此增加了开发者的工作量。近年来,随着机器学习和人工智能技术的进步,游戏开发者开始集成这些技术以创建更智能的NPC,这些智能体能够通过学习玩家的行为,做出更自然的反应,并在游戏环境中表现出更高级别的自主性。例如,游戏《逆水寒》中引入的基于ChatGPT的“游戏GPT”模型,显著提升了 NPC随机对话的质量和自由交互的能力。其可以根据不同的游戏情境,提供适应性强、情感丰富的对话选项,使NPC呈现与环境和情景相符的反应。结合语音驱动的型动画和 AI策略生成技术,智能体能够呈现个性化的表情和行为,发布专属任务,为玩家提供更真实的游戏体验。以AI为驱动的智能NPC不仅提升了游戏的交互性和可玩性,还为玩家带来了更真实、“千人千面”的体验。以AI技术构建的智能NPC从创意到开发,再到玩家体验,为游戏创新提供了一些洞见和发展空间。可见,新质生产力的核心优势不仅在于提高艺术创作的效率,更在于其为新媒体艺术和用户体验打开全新的维度。
(三) 视觉内容生产力的增值
AI的兴起为我们带来了全新的艺术体验,仅需要输入提示词(Prompt),Midjourney等绘画工具就能瞬间生成与毕加索、萨金特或梵高的风格高度相似的作品,Sora、Pika等视频工具甚至能生成堪比电影质量的稳定视频。
在传统的游戏开发和制作过程中,游戏美术生产环节占研发支出的比例较高。AI等人工智能技术在当前的应用环境中的贡献远远超出简单的生产效率提升, OpenAI公司在ChatGPT-4版本中接入了DALL·E3,可生成指定风格的图像,例如 AI可以将好莱坞风格的《星球大战》与宝莱坞风格的印度歌舞片结合,产生出其不意的滑稽效果。再如,游戏引擎Unity推出Unity Muse平台,通过输入文本创建角色动画,为艺术创作带来了更大的灵活性。
图像生成技术早期由GAN(生成对抗网络)生成拟真图像,随着技术的迭代,扩散模型以“去噪”方式逐步成为主流的 AI生产工具,不少开发者也借助AI创作交互艺术。例如,英国艺术家 Hackmans借助扩散模型和ChatGPT创作出一款视频游戏《塞恩传说》(Tales of Syn),该游戏发生在一个名为Giga Bloc C的赛博朋克世界,美术素材均由Stable Difusion和 Photoshop配合完成[5]。近期,OpenAI发布了文生视频模型Sora,该工具不仅可以扩展生成视频,并兼具文生图和图生视频等功能,这将减少视觉研发环节的“沟通障碍”和“探索与试错”的成本,提升艺术的创作效率和质量。
整体来看,AI技术可大幅度减少重复劳动和低效沟通,确保创作团队更专注于思想表达和艺术本体,进而创作出更具思想性、表达性和创新性的作品。
三、基于AI的交互艺术创新路径
AI能够结合人类心智模式赋予创作更大的自由度。《纽约时报》科技专栏作家凯文 ·鲁斯和科技网站Stratechery的创始人本·汤普森发现,人们对AI的期待不仅局限于其搜集信息和事实的能力,更在于 AI所展现的“人格”。人们习惯将人工智能拟人化,这背后是人类中心主义思想,以确保人作为创意主体的地位不被削弱[6]。AI以分身的形式,同时兼顾生成多种形态的内容,创作观念也从传统的造型、色彩、细节等重复技法转向审美、情感深度和文化意义,这可以为艺术家展示出任何所能想象的游戏造物蓝图,也为玩家带来了超越传统边界的游戏体验。
(一) 基于人工智能的非线性艺术维度
巴赫金的对话理论强调了不同观点、声音和文化语境间的对话和互动,认为这些元素共同构建了文本的意义[7]。在非线性艺术中,故事通过多个视角、时间线和情节线索展开,不遵循传统的直线或顺序方式。这种艺术方式创造了一种对话空间,使得读者或观众能够在不同的艺术元素之间“对话”,从而构建个人理解和意义。游戏是一种综合了多种交互形式的活动,在MDA(机制、动态、美学)框架内,机制定义了游戏的规则和类型,动态通过变量创造交互的可能性,而美感则承载了机制和动态以外的元素,直观地影响玩家的体验。其早期形式可见于《摩诃婆罗多》等印度史诗的嵌入式艺术结构。HBO推出史蒂文 ·索德伯格执导的《马赛克》(Mosaic,2018)则是非线性艺术发展的一个重要里程碑,它允许观众通过选择影响故事走向。
早期人工智能遵循既定逻辑,缺乏情感互动能力,但随着技术进步,新的人工智能已能融入不同类型的情感表达。依照保罗·莱文森提出的补偿性媒介理论,新型人工智能程序是对非智能网络媒介与早期人工智能技术难以满足用户情感需求的一种补偿[8]。通过模拟用户思维和语言习惯,人机交互体验逐渐获得了情感的双向认知与表达能力,与用户建立了更密切的联系,这为非线性体验设计提供了“温床”。斯坦福大学与谷歌合作的“Smallville虚拟小镇”项目,通过结合外部记忆数据库和ChatGPT-3.5等大型语言模型,成功实现了智能体行为的动态生成和非线性的互动体验 [9]。虽然这并不意味着像ChatGPT这样的大型语言模型具备真实的“自我意识”,智能体的“决策”过程也仍然在严格的参数控制之下进行,需要依赖特定的指导性提示来维持逻辑的连贯性,但的确在某种程度上展示了大型语言模型在模拟复杂社会互动方面的潜力,代表了理论上的一大飞跃。此外,AI bot通过大语言模型和深度学习算法,能够理解用户指令和意图,模仿现实世界中人的游戏决策和操作,从而提供类似真实用户的反应和行为。玩家作为游戏世界的主导者,可以选择从“上帝视角”去观察这个世界的所有事物,也可以亲身体验这个“类人世界”,甚至可以切换到某个生成型智能体的视角,近距离地观察和感受他者的生活和思考,这种多维的体验方式为用户提供情感需求层面的满足感。
(二) 关键性技术创新助力艺术创新
Open AI在其首届开发者大会上不仅公布了最新版本 GPT-4 Turbo的升级功能,还引入了自定义GPT(GPTs)、推出了GPT Store和GPT Assistant API服务。自定义GPT为游戏编程、游戏文本、游戏角色设计、游戏音效等应用场景提供物质技术基础,简化个性化任务的完成。玩家可以将自己训练的游戏 GPTs发布到 GPT Store,这意味着普通艺术受众也能在某种程度上定制专属模型,在人机闭环系统内应用 AI设计出“算法原创”的游戏。GPT Assistant API主要面向开发者设计,使用自然语言构建方式,辅助设计师在游戏客户端中构建智能 Agent。例如,通过简单问答自动提供游戏环境最佳攻略并进行地图标注,或上传玩家能力图谱和关卡难度设置后自动计算通关概率,有效促进了不同模态和应用程序间的互动,为未来多模态AI生态矩阵开启了新的可能性。
从当前游戏产业发展出发,其颠覆性技术突破已经提供了新的增长点。实时渲染为游戏和未来的交互艺术提供了强有力的技术支持,虚幻引擎5所采用的 Nanite技术能够在一秒内渲染60帧以上的图像。同时,单帧内可渲染高达160亿个面,并实现真实的光照效果,使得游戏场景看起来如同真实的现实照片,成为游戏行业未来发展的基础。Hidden Door通过AI技术,串联起各式各样的科幻与奇幻世界。玩家可以在 AI叙述者的指引下,将现有的公共IP小说作品,改编为在线社交角色扮演游戏。游戏故事、角色、物品和场景等内容均由AI生成,且基于原作进行,为玩家提供了更具动态和参与性的体验。在线文字冒险游戏《AI 地牢》(AI Dungeon)采用了 Open AI的GPT-3自回归语言模型来动态生成游戏艺术,游戏的 AI故事讲述者会根据玩家的输入即兴创作,努力满足玩家设定的不同情境。AI技术的迅速迭代和体系的升维正在打破不同模态和应用之间的传统范式,不仅展现了几乎所有可想象的 AI造物蓝图,还为用户带来了超越传统边界的AI体验。随着新技术进一步渗透和拓展游戏实践场域,它有望重新定义数字生态的诗和远方,未来AI的想象空间或只受我们想象力的限制。
(三)构建价值观新格局
回顾人类艺术的发展历程,艺术家在造物过程中始终遵循基本的原则,即“以人为本”。艺术的尺度即人的尺度。无论是古希腊的桌椅、房屋还是现代的建筑,其尺度都与人相契合。尽管艺术在创作过程中借助了各种技术工具,但其衡量标准从未改变。
在人工智能技术成功赋予科技载体以实体的过程中,我们始终处在固有创作课题和情感认知下。人与人工智能之间在幻觉意义上的同构性,揭示了人类与科技之间复杂且微妙的关系。这种科技美学带来的审美价值偏向,引发了关于创造性、原创性的新思考,促使审美个体反思在内容生产中对客体的感受性。但艺术发展的驱动力在很大程度上来源于科技进步,这一点在“国际克莱因蓝”的案例中得到了充分体现。伊夫 ·克莱因不仅在色彩选择上独具匠心,更通过创新将蓝色作为一种品牌标志,并应用于自己的作品中。在威尼斯双年展上,他将整个房子漆成蓝色,体现了技术进步与艺术创新的结合。艺术家的角色从技术执行者转变为故事讲述者和情感传达者。然而,这一转化并非一路顺利。
技术的跨越使得人工智能介入数字内容生产中,为内容创作带来更大的自由度和个性化体验,但同时可能导致侵犯隐私、职业道德问题、人类角色的边缘化等问题。这一悖论性质的现象要求不能单纯沉迷于这种新技术的魅力,而忽视其背后可能带来的问题。在2023年的索尼世界摄影奖颁奖典礼上,一幅由人工智能生成的作品《虚假记忆:电工》获得了创意类大奖。其实该摄影作品中的人物和场景并不真实存在,因此被命名为“虚假记忆”。该作品的作者拒绝接受奖项,原因是该作品具有争议性,打破了摄影的基本原则——现实性原则。AI技术正在挑战艺术创作的边界和相关的伦理道德。一些批评者担忧, AI技术带来的生产力“危机”可能削弱人类的创造力,降低原创内容的价值。AI生成的内容虽看似正确,实则可能在本质上是失焦的。在文本生成中,AI的神经网络大量学习词元(token)规律,解码器根据前文和语言逻辑生成下一个token。当输出倾向语言逻辑时,匹配结果还算“一本正经”,但与前文标注的精准度就会下降。在图像生成中, AI瞬间便可生成大量具有精美细节和创意延展的游戏概念图,其构图、色彩、角色和风格美轮美奂,但实际上却是拼贴构图和图生图,这加速了堆砌形式感和强调冲击力的绘画的贬值。大量看似精美却风格雷同的 AI设计图泛滥于市,使玩家对徒具形式美的游戏风格产生“恐怖谷效应”和审美疲劳。
从韦伯“价值无涉”的逻辑出发,我们可能混淆了价值评判的标准,误将AI技术下概念性的逻辑思维的产物上升到价值判断并用以度量现实[10]。透过韦伯的视野,在理论和实践标准面临既有体系挑战的时刻,为避免陷入画地为牢的困境,需要对思维模式进行反思与范式突破。正如哲学家海德格尔所言,“技术是时代的座架”,如何操作技术本身才是决定 AI以及未来应用发展的关键。从底层逻辑来看,AI模型的创作能力实际上是一种概率推断,而非逻辑演绎。AI生产的内容看似是经过“思考”的,实则还是一种“提示词”激发的机制。设计师将创作指令融入AI算法中,两者不断地对抗、修正、融合与转换,人类主观能动性与AIGC精准高效协同,使创作内容更具创新性与预判性,构建人机协同良性可持续的生态模式[11]。从弱人工智能到强人工智能尚有漫长的过程,重要的是以因时而变的人机社会新秩序,引导人工智能在科技伦理和科技审美视域内发展,尊重其发展规律的同时强调人类在人机共生环境下的具身感质。
结语
观察AI的发展轨迹可见,AI最初作为辅助工具被集成在艺术创作流程中,然而随着技术的不断进步,以ChatGPT为代表的AI工具给艺术领域带来“转基因”式的内容生产,计算机只需极短时间便可以精准且高效地完成从学习到创作的闭环。在此背景下,AI的角色将不再局限于工具的层面,而是逐渐演变为一种智能化的创作主体,以新的方式赋能艺术创作和艺术体验。同时,AI在艺术领域的渗透已经从最初的提升效率扩展至对内容和风格的掌控,这一进程在带来无限创作潜能的同时,也引入了新的焦虑和危机。
在当代文化的丰富画卷中,交互艺术不仅占据着关键节点和前沿位置,更是承载个体情感与集体记忆的重要媒介。随着时代的发展,交互艺术将超越单纯娱乐的范畴,深度融入人类的日常生活,成为表达情感的主流艺术形式。在技术变革和时代转折的历史坐标点,我们应以自觉的文化意识贯穿于技术应用之中,借助新质生产力工具为大众创造更加丰富的艺术体验,探索属于中国模式的AI艺术创新道路。
黄 石:中国传媒大学动画与数字艺术学院教授。
刘依凡:中国传媒大学动画与数字艺术学院硕士研究生。