认知科学:导论/创造力、计划和想象力
文化随着时间的推移而演变。这种演变独立于人类随着时间推移同时发生的基因演变。这种文化演变导致了对问题的令人惊讶的创造性解决方案。
正如我们在上一节中看到的,个人能够完成令人印象深刻的创造性行为。但事实证明,如果这些创新没有与社会群体分享,随着时间的推移,创新就会停滞不前。更多的人能发现更多错误,以更多的方式重新组合事物,甚至从幸运的事故中获益。如果由于战争或其他灾难导致一代到下一代的学习中断,文化往往会失去它可能享受几个世纪的创新,例如如何制造皮划艇。 [1]
但独立于其中的个人谈论一种文化具有创造力有什么意义呢?许多对生存至关重要的文化习俗涉及复杂的行为模式(例如,参见关于人类如何变得如此聪明部分中的关于如何准备木薯的部分),而文化中的人们通常不知道每个步骤的作用。没有人想出这种行为模式,甚至没有人理解它。因此,当我们有一个像食物准备这样复杂而有效的创新时,我们把功劳归于什么创造过程呢?随着时间的推移,文化本身发展了这种创新。这就是为什么我们可以将文化视为一个可以具有创造力的实体。
正如文化演变可以产生创造性的结果一样,物种面临的问题的解决方案可以通过演变中产生的解决方案来解决,而这些解决方案在许多人眼中是创造性的。反荫蔽就是一个例子。
回溯足够远,人工智能的历史就等同于计算机的历史。当艾伦·图灵发明了 Bombe(一种能够破译二战期间德国军队使用的 Enigma 密码的机器)时,关于计算机展示智能行为的潜力的疑问就出现了。他的流行的“图灵测试”至今仍被用作衡量人工智能程序智能的基准。 [2].
第一个 AI 计算机程序被普遍认为是 ELIZA,该程序是在 1964 年至 1966 年之间在麻省理工学院开发的。该程序是一种自然语言处理工具,能够模拟与人类的对话。 [2].
然而,在千年结束之前,人们很少采取步骤在人工智能程序中开发机器学习,而机器学习是衡量当代人工智能中任何类型创造能力的基础。
《剑桥词典》将“创造力”定义为“产生新颖和非凡想法的能力,或创造新事物或想象事物的能力”[3]。Boden 声称创造力通常是人类智能的决定性品质[4]。Avdeeff 将创造力的标志描述为个人风格的发展及其操控[5]。
根据 Dietrich 的说法,创造力代表着认知灵活性,并体现了打破模式同时保持理智的能力[6]。用于处理信息以执行非创造性任务的神经回路与执行创造性任务的神经回路相同。前额叶皮层负责以新的方式组合信息,并评估组合是否有意义,还是仅仅是新颖。洞察力是创造过程的第一步,大脑会付出有意识的努力将洞察力转化为有用的想法。创造性思维基于两种神经处理模式:刻意和自发。自发模式超出了理性,是人们普遍认为的创造性思维方式。一个例子就是化学家 Kekule 在梦中看到一条蛇呈环状,从而发现了苯的结构。在这种模式下,洞察力是直接有用的,并适合任务。
有意识的工作记忆不会根据逻辑结构、信念和价值观选择信息的组合,并忽略哪些“从”无意识处理模式中“溜出来”的产品。在刻意的处理模式中,创造性是严谨的有意识努力的结果。对信息的组合给予关注,因此洞察力符合外部和内部结构、信念、价值观和期望。常见的例子包括巴赫的交响曲、爱因斯坦的相对论和 DNA 的发现,所有这些都涉及将洞察力小心地转化为有用的产品[6]。
如 Dietrich 所述,随机组合过程是一种发人深省的心理协议,它突出了人类创造性思维和人工创造性思维之间的区别。当思维不受诸如规范和逻辑结构之类的注意力限制的指导时,在意识中显现的组合想法和思维序列松散地由任何连贯的结构连接在一起,并混乱地组合在一起。这些通常被有意识的工作记忆过程忽略,并在注意力不那么活跃时“溜过”。这表明创造力在神经层面上包含高度不可预测性。这可能是真正的人工创造力难以实现的原因,也是为什么创造力的参数难以量化和算法化。
有四种基本的创造性洞察力类型[6]
1. 故意模式 - 认知结构
这些结构由前额叶皮层启动,几乎总是与任务相关。这个过程的特点是前额叶脑区和后叶脑区之间的结构化反应。
2. 故意模式 - 情感结构
这些结构由前额叶注意网络启动,符合个人的价值观和信念,但不一定特定于某个领域。在这个过程中,大多数时候,情感记忆是从情感结构而不是认知结构中提取的。
3. 自发模式 - 认知结构
这类洞察力源于联想无意识思维。它们是由大脑后叶而不是前额叶皮层启动的。洞察力在没有意识努力的情况下出现在工作记忆中,并自行获得注意力,或者作为对工作记忆中已有信息的增强。
4. 自发模式 - 情感结构
在这个过程中,主要控制情感反应的生物结构会产生一个“响亮”的信号,要求意识工作记忆的注意力。如果没有这个信号,就无法获得洞察力。以这种方式产生的洞察力主要包括艺术表达,并产生深刻的情感影响。
根据 Boden 的说法,人工智能可以使用三种技术来创造新想法:产生熟悉想法的新组合;探索概念空间的潜力;以及以一种能够生成以前不可能的想法的方式转换数据。第一种技术与诗歌意象和类比形式密切相关,而计算机在这些方面正变得越来越灵活。第二种技术在人工智能模型中被广泛研究。这种技术首先需要定义概念空间的参数,即使对于某个领域的专业人士来说也很难。然后,必须将对概念空间的充分了解转录成可计算的知识库或语义网络,才能对其进行探索。然而,现代研究越来越重视第三种技术。大多数人会用这种方式来定义跨职业和学科的创造力。Boden 还声称,例如,当创造力在爵士音乐家或科学家身上得到认可时,通常是对个人能够转换数据以开拓新颖且以前不可能的想法的能力的认可 [4]。
关于人工智能的主流观点相信哲学家拉普拉斯关于智力的决定论论点的版本。拉普拉斯认为,一个真正智能的个体将能够推导出宇宙的公式,该公式可以根据宇宙中每个粒子的轨迹预测其未来并记录其过去。该个体将完美地了解宇宙各个方面的所有信息,并且能够从一开始就讲述宇宙的“故事”,一直延续到无穷无尽 [7]。
人工智能计算创造力研究的一个重要部分是认识到人类创造领域中存在着系统模式,而这些模式在历史上被认为是不可预测和无序的 [3]。这些系统模式成为人工智能程序产生与计算机数据库中存在的项目不完全相同的新颖性的基础。
此外,在考虑组合创造力时,人工智能还可以产生语义网络中项目之间的新联系。这是从 2000 年代后期开始的人工智能创造力研究的特征目标。在此之前,人工智能创造力的创新是使用相同的预编程连接在数据库中生成新项目,例如 ELIZA [2]。
在人工智能创造力研究取得成功的大多数情况下,人工智能程序和人类程序员互相帮助,而不是其中一方单独开发项目或制品。这种互补工作方式主要有两种方式:人类程序员编辑和调整人工智能软件生成的成果,称为内容创作;人工智能软件增强和提升人类生成的已完成制品,称为内容增强。
对于一般的人工智能来说,Ong & Gupta 概述了五个研究支柱:合理性、弹性、可重复性、现实性和责任性。总的来说,这些支柱旨在支持人工智能研究在不同领域和应用中的发展。许多支柱旨在解决机器学习方法的透明性问题,并鼓励在实施方法之前构建明确的目标和策略 [8]。
“春日”(Sunspring)是一部电影,其剧本几乎完全由一个名为 Benjamin 的人工智能程序编写。这部电影于 2016 年推出,是真人电影,其后期制作流程使用基于人工智能的决策和监控进行执行。2016 年,IBM 的沃森平台创建了首部由人工智能制作的电影预告片。该预告片是为 20 世纪福克斯的恐怖电影《摩根》(Morgan)设计的,该项目由 IBM 研究院多媒体和视觉部门经理约翰·史密斯领导 [9]。
在电子游戏叙事中,创造性人工智能的进展速度明显快于大多数行业。AI Dungeon 是一款基于网络的游戏,它实时生成故事情节并与玩家输入进行交互。该算法经过 10,000 多个标签贡献的训练,以确保流畅的用户交互。程序生成随机化内容,为每个游戏添加可变性和独特性 [3]。
在视觉艺术的创造性人工智能研究内容创作领域,已经进行了一些尝试。
“下一幅伦勃朗”(The Next Rembrandt)是一幅 3D 打印的画作,于 2016 年制作,由人工智能软件完全基于从著名荷兰画家伦勃朗的作品集中获取数据,并使用深度学习算法和面部识别技术进行训练。第一幅完全由人工智能创作的画作于 2018 年拍卖 [3]。
现代人工智能研究中的音乐创造力基于一个名为“长短期记忆” (Long Short-Term Memory) 的模型,该模型将转录的音乐想法作为输入,并使用转换创造力以有意义的方式对其进行操作。在过去十年中,已经出现了几个重要的创新,这些创新证明了真正的由人工智能生成的音乐的可行性和质量 [3]。
Amper 是世界上第一个人工智能音乐作曲家,它于 2014 年发布了其测试版软件。它具有更人性化的情绪和风格,包括优化,这些优化会施加微小的变化,而不是严格的“机器人式”地遵守时间。这种技术使它更接近于拥有“人的精神”。Amper 之类的软件主要用于加速免版税背景音乐的制作,对于播客和 YouTube 视频等内容创作很有用。为此目的,人工智能创作的音乐不需要具有情感上的吸引力,甚至不需要具有音乐上的趣味性,它只需营造一种能够增强某个内容的中心内容的气氛 [5]。人工智能创作并由人类内容创作者使用的音乐可以被视为人工智能机器进行的一种内容创作,但其主要功能是内容增强。由于此功能影响了对创造性人工智能的参数和期望,因此将其标记为内容增强而不是内容创作是合适的。
索尼 CSL 研究实验室开发了一款类似的软件,称为 Flow Machines。这些被称为“增强创造力”,它们本身无法生成有意义的曲目,但可以帮助人类创作者增强自己的音乐并获得灵感 [5]。Flow Machines 与 Amper 的不同之处在于,它们在音乐制作和创新过程中发挥着积极作用。2018 年,Flow Machines 发布了他们的第一张专辑“你好世界”(Hello World),在作曲方面得到了被称为“SKYGGE”的贝努瓦·卡雷的帮助 [3]。
随着人工智能生成的音乐越来越接近人类创作的音乐,它进入了软件工程师所称的“音频恐怖谷”。这种音乐的特点是令人不安,听起来“不对劲”,因为它不符合人类创作的标准音乐作品。大脑似乎拒绝将技术上类似的人工智能生成的曲目视为真实的。Avdeeff 声称,造成这种情况的原因在于弗洛伊德的观点,即人们如果观察到某个事物背后存在一种更大的或不熟悉 的创造力量的痕迹,就会感到不安 [5]。
人类可以立即判断出音乐是否缺少人类的创作。在 SKYGGE 首张专辑《Hello World》于 2018 年举办的首场音乐会中,它的吸引力主要集中在制作的设计和机械特性上,而不是它可能具有的任何美学价值。人们对音乐本身的质量褒贬不一,一些人说它“根本不对劲”或“听起来不对劲” [5]。
图像和动画
[edit | edit source]人工智能在增强或改变图像和视频方面的创造力大部分可以被认为是内容增强,因为系统并非在做出创造性决定,而只是根据大量输入和特定的目标导向操作来执行协议。
三星 AI 会从现有肖像中提取图像,使它看起来像脸在说话。Adobe 已经创建了 Character Animator 软件,该软件通过从网络摄像头和麦克风获取输入,可以实时实现唇形同步、眼睛追踪和手势控制。该软件已被好莱坞和一些在线创作者采用。Facebook 的 Oculus Insight 使用“SLAM”(意指“同步定位与建图”)实时生成地图和用户的定位追踪 [3]。
2018 年,彼得·杰克逊的电影《他们不会变老》使用了人工智能软件对 90 分钟的第一次世界大战档案片段进行着色。该软件以第一次世界大战装备和制服的输入研究数据库为参考,将片段转换为逼真的彩色电影。其他架构,如 NesNet 和 DenseNet,在从灰度图像转换为具有自然色彩的图像方面非常有效 [3]。
虚构表现
[edit | edit source]几个世纪以来,人工智能一直是虚构叙述的一部分。从玛丽·雪莱的《科学怪人》开始,人工生产的有知觉或“智能”自动机一直是科幻文化的一部分,并且最近开始出现在其他类型中。艾萨克·阿西莫夫的短篇故事《环舞》是科幻作品的奠基之作,它启发了世界上一些领先的人工智能研究人员,故事中两位工程师根据机器人三大定律开发了一种智能机器人。最近的例子是斯派克·琼斯执导的 2013 年电影《她》。这部电影是一部浪漫喜剧,讲述的是一种具有创造能力的超级智能人工智能软件,主角爱上了它 [2]。
流行小说中对人工智能的大多数描述都描绘了具有创造力的 AI。摩根和科学怪人的怪物等角色表现出符合博登的一种或多种创造力类型的特征。它们不仅仅是以复杂的方式进行观察,还可以评估其观察结果,以便根据认知边界 的灵活性产生非平凡的行为。造成这种情况的原因可能是,创造性的 AI 比仅仅充当虚拟助手而没有任何新颖 和生产力 的 AI 更具娱乐价值 [10]。来自漫威影业的《钢铁侠》和《复仇者联盟》系列电影中的托尼·斯塔克的贾维斯展示了产生新数据组合的创造能力 ,例如在斯塔克的战衣在飞行中出现故障时找到最佳着陆点,并提供适应变化参数的相关创造性信息,例如剖析莫比乌斯带模型来帮助斯塔克发明时间旅行。
未来展望
[edit | edit source]挑战
[edit | edit source]目前,AI 在内容增强 方面最有效,因为人类的效率 很低,后期制作任务需要越来越多的劳动力。创意 AI 可以帮助增强 和恢复从获取中获得的数据,还可以接受训练,从相对较低的输入中扩展 数据。
最先进的机器学习技术旨在利用递归编码 - 解码 ,从而实现迭代式内容增强 ,但同样的技术很少能够转化到创意 AI 研究的内容创作领域。
道德
[edit | edit source]目前,AI 具有智能 ,但不具备对更广泛 背景的认识 。人工智能尚未被编程 以平衡执行任务 所涉及的道德因素。深度伪造技术 质量越来越高,可以被用于恶意目的,AI 在视觉艺术和音乐中的应用 可能会让艺术家和设计师 面临剥削和欺诈 的风险。Anantrasirichai & Bull 认为,在开发创意 AI 技术 方面,未来的考虑因素 应包括将更广泛 的背景含义的道德考虑因素 作为参数 [3]。
Dignum 对将道德与 AI 联系起来的三个类别 进行了分类:设计中的道德 ,指的是将道德纳入编程方法 的做法;设计中的道德 ,指的是评估 AI 系统在架构 中 的道德含义的方法;设计中的道德 ,指的是考虑并确保保护艺术家和开发人员权利 的协议 [11]。
参考文献
[edit | edit source]- ↑ Henrich, J. (2017). The Secret of Our Success: How Culture is Driving Human Evolution, Domesticating our Species, and Making Us Smarter. Princeton, NJ: Princeton University Press. Page 212.
- ↑ a b c d Haenlein, M., & Kaplan, A. (2019). A brief history of artificial intelligence: On the past, present, and future of artificial intelligence. California management review, 61(4), 5-14.
- ↑ a b c d e f g h i Anantrasirichai, N., & Bull, D. (2021). Artificial intelligence in the creative industries: a review. Artificial Intelligence Review, 1-68.
- ↑ a b Boden, M. A. (1998). Creativity and artificial intelligence. Artificial intelligence, 103(1-2), 347-356.
- ↑ a b c d e Avdeeff, M. (2019, December). Artificial intelligence & popular music: SKYGGE, flow machines, and the audio uncanny valley. In Arts (Vol. 8, No. 4, p. 130). Multidisciplinary Digital Publishing Institute.
- ↑ a b c Dietrich, A. (2004). The cognitive neuroscience of creativity. Psychonomic bulletin & review, 11(6), 1011-1026.
- ↑ De Miranda, L. (2020). Artificial intelligence and philosophical creativity: From analytics to crealectics. Human Affairs, 30(4), 597-607.
- ↑ Ong, Y. S. 和 Gupta, A. (2019)。人工智能研究的五个支柱。IEEE 计算智能新兴主题汇刊, 3(5), 411-415。
- ↑ IBM。 (2016 年 9 月 11 日)。人工智能创造力的追求。IBM 认知 - 人工智能的未来。检索于 2022 年 2 月 4 日,来自 https://www.ibm.com/watson/advantage-reports/future-of-artificial-intelligence/ai-creativity.html
- ↑ Hermann, I. (2021)。科幻中的 AI:叙事与隐喻之间。AI & 社会, 1-11。
- ↑ Dignum, V. (2018)。人工智能中的伦理学:特刊介绍。伦理学与信息技术, 20(1), 1-3。