计算创造力
维基教科书认为此页面应该分割成更小的页面,包含更窄的子主题。 您可以通过将此大页面分割成更小的页面来提供帮助。请确保遵循命名规范。将书籍分成更小的部分可以提供更多关注,并允许每个部分做好一件事,这对每个人都有利。 |
本教科书探讨了人工智能系统在视觉艺术、音乐、故事创作、非虚构叙事、建筑、产品设计和计算机编程等领域表现出可被视为创造性的行为的方式。这些系统是人类推动人类创造力的工具,但这些系统正越来越多地被视为人类在混合人类-机器创作中的合作者。创造力也将在人类和机器的大型代理群体中体现,并且创造力也将在通用 AI 中体现。
本教材旨在支持独立的计算创造力本科课程,或补充人工智能、机器学习、认知科学和其他学科的课程。本书还可与维基百科关于计算创造力和相关页面的条目一起使用,以及其他大量资源,例如 Veale 等人 (2020)[1]。但是,作为教科书,这些页面包括项目和练习、示例教学大纲以及其他与计算创造力的教学和学习相关的材料和经验。该书也可以用于自学或其他由有动力的学习者进行的非正式教育。
教科书背后的理念包括接受 AI 系统作为人类创造力的工具。最值得注意的是,像 chatGPT 和 Midjourney 这样的 AI 已经在一眨眼之间改变了 AI 和社会格局。本教科书试图提供材料,将这些技术作为工具和合作者,用于促进学生在其他创造力领域中的学习,并解决计算创造力的社会影响。我们的目的是让练习和项目包括 AI 开放地帮助设计、实施、记录和评估具有学生提示的计算创造力系统或其他创造力领域的工件,例如视觉艺术、音乐、舞蹈或叙事。我们还包括旨在限制 AI 帮助的练习和项目版本,就像讲师可能会限制来自他人的帮助一样。
一个示例练习,可能是针对计算创造力、AI 或软件工程课程,如下所示。
背景:阅读“增强 ChatGPT 提示工程的提示模式目录”(https://arxiv.org/abs/2302.11382)或收听讲师关于其内容的讲座。作业:与大型语言模型合作,指定、设计、实现和记录使用布尔运算知识的逻辑游戏。实现可以使用选择的编程语言。该游戏的目的是让玩家练习所有布尔运算,以及表达所有布尔函数的最小连接符集等概念。提交(a)游戏及其规则的段落描述,(b)涉及主要功能(例如,移动、显示、输赢)和这些功能的标题注释的游戏程序的架构设计,(c)有良好注释的代码列表,(d)用户和 AI 之间的示例游戏,或两个人类,或两个 AI,(e)在整个开发过程中使用的关键提示的摘要列表及其与阅读中发现的提示模式的关系,以及(f)对感兴趣问题的评论,例如 AI 出现的任何明显误解的外观和影响。
在深入研究计算创造力相关的各个领域之前,我们简要介绍了这个范围广泛的领域。
创造力,各种类型和程度,是创造过程的特征。创造力是在一个多维空间中的特征,与过程(如由某种代理体现)通过思考和行动探索替代方案、评估这些替代方案、想象行动的可能结果以及设身处地地理解其他代理的目标、能力和感受的程度有关。我们不会将创造力视为二进制值,但我们经常会隐式地将创造力的多个维度缩减为一个维度,以谈论创造过程或多或少具有创造力。
创造力的结果可能是物体或思想,这些结果通常以不同类型和程度的新颖性和价值为特征——与具有相似功能的其他物体和想象力的集合相比,结果有多么独特,以及结果的实用性、美观性或有趣性如何。有时你会听到无生命物体被称为有创造力的,比如“那是一个有创造力的花瓶”。您可以假设这是指该花瓶具有很高的新颖性或价值;或者创造那个花瓶的过程进行了大量的探索或使用了新颖的评估指标,等等。如果我们称一个代理是有创造力的,这意味着该代理,无论是人类还是 AI 艺术家或工程师,经常执行有创造力的创作过程,或产生具有高度新颖性和价值的结果。这就是你听到“创意人”作为创造者的人的意义。
创造性过程是否可能产生平凡的结果?当然,这在很大程度上是因为创造力存在于旁观者和创造者的眼中,以及观众根据新颖性和价值来评估创作的物体空间可能比创造者的经验更广阔。创造者可能已经执行了对他们来说非常独特但对更大的社会来说并不独特的过程。这种区别被称为个人创造力和历史创造力,当然,它在个人和社会之间形成了一个连续体。
创造力发生在不同时间和活动尺度上,以及代理尺度上。它发生在装配线工作站的操作中,无论我们认为它有多小(请记住,创造力不是二进制的),以及在整个装配线或整体建设的替代范式的水平上。非人类动物是有创造力的,无论是作为个体还是群体,AI 也是如此,或者说这是本文的假设。这里提到的主题——探索(搜索)与开发、使用新颖性和价值等指标进行评估、投射或想象以及代理、时间和空间的尺度——都是可以进行计算处理的。
计算创造力是人工智能 (AI) 的一个领域,尽管有人可能会说它没有得到足够的重视。如今大多数 AI 系统,包括计算创造力系统,都是非常专注的、狭窄的应用,例如从叙述提示中创建视觉艺术、故事写作和音乐创作。原则上,这些功能在人类事务中非常广泛,借鉴了人类创造者的丰富经验,但可以说模仿人类艺术家的 AI 系统可能会在创作步骤中采取“捷径”,提取创造性处理的最终结果的特征,并在 AI 的创作中使用这些特征。尽管如此,计算创造力系统的处理仍然令人印象深刻,通常是在处理通常是人类创造结果的大量数据集时。有些系统是多模态的(例如,以叙述提示作为输入并生成视觉艺术,反之亦然,从图像到字幕),这使它们朝着系统级 AI 迈进了一步。系统级 AI 包括“智能”车辆、沃森以及 Alexa 等家庭助手。在自主性的维度上更进一步的是与人相当的 AI,而这些仍然是科幻小说的素材。
在创意和计算创意项目中,经常被提及的一个原因是,当你进行思考时,你将对完成每个项目以及生活中其他部分类似任务所使用的和协调的组成过程有更深入的了解。每个组成过程本身都可以进一步分解,并至少部分地由现有的 AI 工具实现。当然,我们希望你能想象出以计算方式实现子过程和完整过程的方法,这样你就可以成为领导者,并成为将要到来的系统级和个人级创意 AI 的浪潮中的智慧之源。
我们假设创造力渗透于人类系统中各种智能过程,我们也将讨论它如何渗透到 AI 系统中。学习与创造力一样,也是人类系统和 AI 系统中的一种普遍能力,但即使是现在(机器学习自 20 世纪 50 年代以来一直在探索),大多数机器学习都处于普遍性维度的狭窄端。但人类和 AI 中的学习是一个过程,尽管它跨越了更长的时间尺度,但它是一个代理探索和评估替代方案的过程。认知架构和认知系统是 AI 研究系统级 AI 过程的领域。我们经常会通过考虑认知架构阅读中概述的必要能力来构建对系统级 AI 中创造力的讨论。本书的目标是描述计算创造力的计算基础,以及描述计算创造力的丰富应用领域。
现在让我们来看看计算创意的领域!
我们将“策展”的含义广义地解释为,无论新手还是专家,都涉及到对各种类型事物的收藏。策展包括选择、展示和教育收藏的组成活动。策展是一项创造行为,例如创建展览,并且需要一定程度的创造力。因为策展涉及到离散事物的集合,所以它是一个很好的活动类别,可以用来介绍计算方法的实用性。我们的目标不仅仅是讨论现有的用于执行策展的计算工具(如果有的话),而是要想象如何将计算工具应用于策展子任务。这个讨论“是什么”和“可能是什么”的主题也将贯穿其他主题,尽管我们可能不太可能知道如何想象其他媒体的“可能是什么”,但你可能知道的更多,并鼓励你在这里在维基教科书上“大声说出来”。
假设已经创建了一座用于收藏艺术品的建筑,比如国家艺术馆的西馆,并且已经有一批绘画和雕塑在现场。策展人知道房间的尺寸、墙壁的高度、绘画和雕塑的尺寸,以及艺术家、年份、地区等许多元数据。如何组织这个收藏?同样的方法和指标可以用来展示花园、动物园、自然历史博物馆等吗?
一个可能对计算策展人有用的基本 AI 功能是状态空间搜索,其中状态可以是显式图(如道路网络)中的顶点,或者状态可以是按需从隐式图中生成的节点或顶点(也称为状态)。在 AI 问题中,“顶点”或状态通常是隐式图的一部分非常复杂的知识结构。状态空间搜索最常用于探索“问题解决和规划”和“推理和信念维护”功能类别中认知架构的替代方案。
另一个基本 AI 策略是使用人工神经网络 (ANN)进行表示和学习,人工神经网络通常是大量简单互连处理单元(类似于单个神经元)的集合。强大的计算能力源于这些单元的互连及其协调活动。在我们对 ANN 的首次处理中,我们讨论的功能最适合三个认知架构功能类别:“识别和分类”、“感知和情境评估”以及“预测和监控”。
Mark O. Riedl 和 Vadim Bulitko (2013)。互动叙事:一种智能系统方法,AI 杂志,春季刊,67—77。
“Facade 的故事:AI 互动戏剧”
“人工智能和音乐生成系统:一种关于当前技术的介绍”(2020 年),人工智能前沿,第 3 卷。(这篇文章很长,所以要尽早开始,这也是你本周星期三没有实际测验的原因之一。)
音乐领域的 DALL-E?
Shimon 即兴鼓手视频
AI 编舞:学习使用 AIST++ 音乐条件 3D 舞蹈生成进行舞蹈
基于可供性的虚构物体交互变体生成,用于人机即兴剧,第 10 届国际计算创造力会议论文集,第 140-147 页
- ↑ Veale, T.,Pérez y Pérez, R. "飞跃与进步:计算创造力领域的介绍。"新一代计算。38:551–563。 https://doi.org/10.1007/s00354-020-00116-w