Lentis/Ellie、微软Kinect和心理治疗
Ellie是SimSensei系统中使用的虚拟心理治疗师的名称,SimSensei系统是一个人工智能 (AI)平台,可以采访病人并收集信息以评估他们的心理健康。Ellie正在由多所大学的研究人员开发,并由国防高级研究计划局 (DARPA)资助,以调查自动化技术在心理筛查中的潜力。该系统目前正在阿富汗国民警卫队成员中进行测试,研究人员认为它可能对军队的心理健康护理特别有帮助,因为它可以提高可及性并消除与精神障碍相关的污名。由于Ellie仅在少数小群体中进行了测试,因此很少有人对Ellie表达强烈意见。然而,对其他医疗诊断工具和自动化技术出现的研究所表明,有些人可能会反对使用Ellie,因为他们担心该系统的准确性或心理学家工作保障问题。
精神障碍的临床诊断在过去一个世纪中发生了重大变化。在20世纪初,心理学和精神病学这些新兴领域的专业人士主要集中在描述精神疾病的可观察症状。弗洛伊德在20世纪20年代和30年代改变了这一领域,他研究了精神障碍的原因;然而,这一时期的心理治疗师往往将精神疾病归因于故意的不良行为或个人弱点。直到1980年,《精神障碍诊断与统计手册》(DSM-III)第三版出版,精神障碍才开始被视为可以通过循证科学体系进行诊断的合法医学状况。[1]
Ellie由卡内基梅隆大学的计算机科学家路易斯-菲利普·莫伦西和南加州大学创意技术研究所 (ICT) 的心理学家阿尔伯特“斯基普”里佐以及其他工作人员开发。SimSensei项目由DARPA资助,旨在研究一个基于虚拟人的心理治疗系统。这最终可能创建一个平台,帮助诊断军人和其家人中的创伤后应激障碍 (PTSD)、焦虑和抑郁。[2] 美国退伍军人事务部估计,PTSD和抑郁症影响着很大一部分退伍军人,包括五分之一的伊拉克和阿富汗战争老兵。现役和退役军人担心接受这些疾病的专业帮助会带来污名,并导致职业和个人后果。[3] 开发人员目前将Ellie归类为临床决策支持工具,可以补充问卷或用作筛选平台。
该系统使用连接到人工智能虚拟人 (Ellie) 的微软Kinect平台,可以与病人实时互动并进行15到20分钟的访谈。Ellie收集并处理大量信息。[4] 使用一个集成平台,以每秒30次的速度跟踪60种不同的动作,Ellie分析语音模式、姿势和面部表情。痛苦、抑郁和其他心理障碍与某些行为和言语模式有关。综合测量结果,以提供注意力和坐立不安、回避目光接触、说话频率、微笑水平和上半身活动的指标,这些指标为SimSensei的反应提供信息。在一项初步研究中,科学家仅使用Ellie收集的信息就能区分抑郁症患者和非抑郁症患者。[5]
Ellie使用机器学习和自然语言处理算法来积极倾听并融入模仿和肢体语言线索。当前版本的Ellie被编程为在对话暂停后以预先录制的音频片段进行回应,这将可能的回应数量限制在约100个单词或短语和20个非语言动作。这些按其在系统中的功能进行分类:访谈问题、中性回馈语(“嗯哼”)、积极同理心、消极同理心、惊讶反应和继续提示。[4] Ellie被编程为建立融洽关系,然后在对话中提出心理问题。开发人员认为,Ellie可以提高提问(和解读)的一致性,防止病人感到被评判,并避免人为评估者引入的偏差。[5]
患者可能不会透露非法、不道德或带有污名的个人信息。但是,治疗师需要这些信息才能有效地治疗患者。与人工控制系统相比,Ellie已被发现可以提高患者的披露意愿[6]。研究表明,有两个因素可以提高患者的披露意愿:融洽关系和匿名性。
融洽关系是指各方相互理解并良好沟通的关系。建立融洽关系后,患者会向治疗师透露更多个人细节,例如恐惧和焦虑[7]。在沟通过程中,言语和非言语行为会影响融洽关系。例如,提出后续问题的访谈者比不提出后续问题的访谈者获得更多披露[8]。肢体语言,如面部表情、手势、眼神和姿势,也会影响融洽关系[9]。这可以解释为什么当被无法表达言语线索和肢体语言的非人类代理人访谈时,融洽关系会受到影响,人们会感到缺乏联系[10]。
Ellie的功能仍在评估中。用户认为Ellie的倾听能力不如人工控制的界面,这很可能是因为人工智能技术尚不成熟。但是,用户给Ellie和面对面访谈者的融洽关系评分相似[5]。
1970年,森政弘提出,随着机器人变得越来越像人类,在它们看起来完全像人类之前,有一个点会让人感到恐惧[11]。他将这种效应称为恐怖谷效应。试图使艾莉看起来栩栩如生可能会导致她陷入恐怖谷,使与用户的建立联系变得更加困难,并降低他们透露信息的意愿。
如果一个人感到自己的身份受到保护,就会出现匿名性。当通过电脑接受采访时,患者感到更加匿名,并且比面对面接受采访时透露的信息更多[12]。艾莉可以帮助患者感到更加匿名,因为她允许他们在没有人类精神科医生在场的情况下做出回应。然而,如果艾莉收集的数据与精神科医生共享,患者可能会感到匿名性降低。研究人员正在调查是否知道他们特定的回应将来会被查看会改变患者透露信息的意愿。初步结果表明,即使参与者知道他们的回应稍后会被查看,他们透露的信息也比面对面访谈中多[13]。
艾莉目前尚未在临床上使用,也不打算作为诊断或治疗的主要方法,因此基于Skype的心理治疗和远程医疗咨询可能会表明对未来计算机辅助诊断方法的反应和可能的益处。在线系统提供了更广泛的护理人员选择,允许患者可以接受针对非常具体的患者群体和需求的护理。[14]与艾莉一样,患者可以在他们自己的时间表和舒适的环境中与治疗师互动,从而提高便利性。在医疗资源稀缺的地区,远程医疗大大降低了获取医疗服务的障碍。由于从业人员需要持有患者所在州的执照,因此许多人改为宣传他们的服务为精神分析或人生指导——类似地,艾莉也很难进行分类。[15]如果患者处于紧急危险之中,远程咨询师需要有办法为患者在当地获得帮助。[14]与艾莉一样,建立融洽关系和透露个人信息的舒适度可能会受到系统技术能力和缺乏面对面互动的影响。
尽管一些研究量化了心理诊断的一致性,但许多研究表明诊断仍然不够可靠。研究人员认为,许多因素导致诊断不一致,包括精神病学命名法的不足、临床医生的偏见以及完成全面评估的时间不足[16]。DSM-III 的主要作者罗伯特·斯皮策认为,心理学领域仍然面临着可靠性问题[17]。
一些研究人员认为,计算机可以帮助提高精神病学和医学诊断的可靠性。在一项对 163 项研究的回顾中,Grove 等人发现机械预测技术(使用统计数据和数据处理算法)的准确率平均比临床判断(使用来自非正式和主观方法的数据,如个人访谈)高 10%[18]。其他人认为,像艾莉这样的计算机系统将使临床医生不太容易受到锚定效应的影响,这种现象会导致他们在做出诊断时过分重视最初观察到的症状[19][20]。其他计算机辅助诊断工具的开发人员认为,它们将提高诊断准确性,因为计算机可以存储比单个人类临床医生所能知道的信息多得多。IBM 的科学家正在将人工智能平台沃森应用于医学诊断,他们断言医生每周需要花费多达 160 个小时才能了解最新的医学文献[21]。作为一个包含大量最新医学信息的客观系统,计算机算法可以通过为临床医生提供需要考虑的鉴别诊断来提高诊断准确性。
由于艾莉只在少数几个地方进行了测试,因此很少有心理学家对该系统足够熟悉以表达反对意见。然而,1895 年 X 射线成像发明后提出的反对意见可以为可能的投诉提供洞察。虽然大多数人认为 X 射线会改善手术,但耶鲁大学的一位医学教授担心医生会过分依赖 X 射线图像,而忽略人类判断和与患者面对面互动的重要性。“我们必须回到训练学生观察患者,而不仅仅是数据库,”他说道[22]。如关于床边礼仪章节所述,阿布拉罕·维尔吉斯博士表达了类似的观点。他批评过分依赖数据,并认为人际接触和个人互动对于防止医生忽视简单的诊断以及建立患者与医生之间的信任至关重要。最后,计算机科学家约瑟夫·魏泽鲍姆认为计算机辅助心理治疗是不道德和没有人性的,因为计算机不可能提供真正的温暖和同理心[23]。魏泽鲍姆在创建伊丽莎(最早的粗糙的计算机治疗师模拟器之一)后发表了这些评论。艾莉和 SimSensei 系统可能比早期技术提供更全面的信息,并且更像人类,但耶鲁大学教授、维尔吉斯和魏泽鲍姆等人的批评意见可能仍然存在。
制造业和其他蓝领行业的工作岗位在最近几十年中占美国就业总量的比例越来越小,一些分析人士将这一趋势归因于自动化技术的增长[24]。自 20 世纪 70 年代以来,制造业产出增长而制造业就业岗位减少的事实支持了这样一个观点,即自动化技术通过提供更高的生产力取代了某些蓝领工作中的人类。现在,白领工作也可能受到 SimSensei 等技术进步的威胁。尽管艾莉的当前版本仍然需要人类来分析收集到的数据并做出诊断,但艾莉实际上消除了他们需要花费在进行面对面访谈上的时间,从而减少了为相同数量的患者提供服务的所需心理学家数量。计算机系统也开始具备记者、律师和其他白领工作者的能力。例如,叙事科学开发了一个系统,当给定离散的数据和事实时,该系统可以生成体育文章[25],并且计算机算法正被用于筛选数千份法律文件,并仅选择与律师审查案件最相关的文件[26]。在对人工智能、互联网、信息技术和其他领域专家的调查中,皮尤研究中心发现,在 1896 名受访者中,“绝大多数”人认为机器人和人工智能将在 2025 年“渗透到日常生活的各个领域”。然而,大约一半的专家认为,机器人和人工智能的兴起将导致白领行业规模的整体缩小,因为它们会取代人类劳动,而另一半专家则认为,机器人和人工智能将通过创造更多全新的工作类型导致白领工作岗位的净增加[27]。
Ellie 的设计目的并非完全取代心理诊断中的人为因素,尽管其他医疗技术和人机界面可能证明 Ellie 对心理护理的潜在影响。目前的研究仍在探索基于计算机的方法如何影响患者的信息披露,以及 Ellie 如何减少与寻求心理健康护理相关的污名化。需要更多的研究来了解转向日益自动化的诊断技术带来的风险,以及 Ellie 将如何影响患者的匿名感和披露意愿,如果个人的结果随后被透露给精神科医生。Ellie 提出了一个关键问题:技术如何影响患者和临床医生的医疗保健?
- ↑ Mayes, R. & Horwitz, A.V. (2005)。DSM‐III 与精神疾病分类的革命。行为科学史杂志,41(3),249-267。https://facultystaff.richmond.edu/~bmayes/pdf/dsmiii.pdf
- ↑ 南加州大学创意技术研究所。(2014)。SimSensei。http://ict.usc.edu/prototypes/simsensei/
- ↑ 兰德公司。(2008)。五分之一的伊拉克和阿富汗退伍军人患有 PTSD 或重度抑郁症。http://www.rand.org/news/press/2008/04/17.html
- ↑ a b Morbini, F.,DeVault, D.,Georgila, K.,Artstein, R.,Traum, D. & Morency, L.-P. (2014)。SimSensei 信息亭中对话处理的演示。第 15 届话语与对话特别兴趣小组年会论文集(第 254 页)。http://www.aclweb.org/anthology/W/W14/W14-43.pdf#page=274
- ↑ a b c DeVault, D.,Artstein, R.,Benn, G.,Dey, T.,Fast, E.,Gainer, A. … (2014)。SimSensei 信息亭:用于医疗保健决策支持的虚拟人类访谈员。2014 年国际自主代理和多代理系统会议论文集(第 1061-1068 页)。国际自主代理和多代理系统基金会。http://dl.acm.org/citation.cfm?id=2617415
- ↑ Lucas, G. M.,Gratch, J.,King, A. & Morency, L. P. (2014)。这只是一台电脑:虚拟人类增加了披露意愿。人机行为,37,94-100。
- ↑ Dijkstra, W. (1987)。访谈风格与受访者行为 调查访谈的实验研究。社会学方法与研究,16(2),309-334。doi:10.1177/0049124187016002006
- ↑ Miller, L. C.,Berg, J. H. & Archer, R. L. (1983)。开启者:引发亲密自我披露的个人。人格与社会心理学杂志,44(6),1234-1244。doi:10.1037/0022-3514.44.6.1234
- ↑ Hall, J. A.,Harrigan, J. A. & Rosenthal, R. (1995)。临床医生-患者互动中的非语言行为。应用与预防心理学,4(1),21-37。doi:10.1016/S0962-1849(05)80049-6
- ↑ Gratch, J.,Kang, S.-H. & Wang, N. (2013)。利用社交代理探索融洽感和情感共鸣理论。在 J. Gratch & S. Marsella(编),自然与人工制品中的社会情感(第 181-197 页)。牛津大学出版社。http://www.oxfordscholarship.com/view/10.1093/acprof:oso/9780195387643.001.0001/acprof-9780195387643-chapter-12
- ↑ 恐怖谷 - IEEE 光谱。(未注明日期)。http://spectrum.ieee.org/automaton/robotics/humanoids/the-uncanny-valley
- ↑ Weisband, S. & Kiesler, S. (1996)。电脑表格上的自我披露:元分析和意义。在人机交互系统SIGCHI会议论文集(第 3-10 页)。纽约,纽约,美国:ACM。doi:10.1145/238386.238387
- ↑ G. Lucas,个人交流(电子邮件),2014 年 12 月 4 日。
- ↑ a b Novotney, A. (2011)。远程医疗的新重点。http://www.apa.org/monitor/2011/06/telehealth.aspx
- ↑ Burgo, J. (2014)。Skype 心理学家。http://www.theatlantic.com/health/archive/2014/12/the-skype-psychologist/382910/
- ↑ Aboraya, A.,Rankin, E.,France, C.,El-Missiry, A. & John, C. (2006)。精神科诊断的可靠性重访:临床医生提高精神科诊断可靠性的指南。精神病学(Edgmont),3(1),41。
- ↑ Spiegel, Alix (2005 年 1 月 3 日)。疾病词典。纽约客。
- ↑ Grove, W. M.,Zald, D. H.,Lebow, B. S.,Snitz, B. E. & Nelson, C. (2000)。临床预测与机械预测:荟萃分析。心理评估,12(1),19。
- ↑ Cohn, Jonathan。(2013 年 2 月 20 日)。机器人将为您服务。大西洋月刊。
- ↑ Ofri, Danielle。(2012 年 7 月 19 日)。陷入诊断陷阱。纽约时报。检索自http://well.blogs.nytimes.com/
- ↑ Kohn, Martin。(2013 年 4 月 22 日)。创新者聊天:沃森如何改变医疗保健。大西洋月刊。
- ↑ Blume, S. S. (1992)。洞察力和行业:论医学技术变革的动力。麻省理工学院出版社。
- ↑ Ford, B. D. (1994)。计算机辅助治疗中的伦理和专业问题。人机行为,9(4),387-400。
- ↑ Sherk, J. (2010)。技术解释了制造业就业岗位下降的原因。传统基金会。检索自 www.heritage.org。
- ↑ Fassler, Joe。(2012 年 4 月 12 日)。叙事科学的计算机能否取代付费作家?大西洋月刊。
- ↑ Palazzolo, Joe。(2012 年 6 月 18 日)。为什么要聘请律师?电脑更便宜。华尔街日报。
- ↑ (2014 年 8 月 6 日)。2025 年的数字生活:人工智能、机器人技术和未来的工作。皮尤研究中心。检索自 www.pewinternet.org。