认知科学:入门/分类
分类的概念被定义为将物体、想法和事件组织成具有相似属性的组的过程,这些组被称为类别。[1] 它是人类用来帮助他们互动和感知环境的最基本认知过程之一。[2] 多年来,人们已经开发了许多理论来阐明这个过程是如何在脑中建模的,以及它如何影响其他认知概念,例如感知处理、学习[3] 和决策。[4] 分类也是人工智能和计算机视觉中的一个主要研究领域,通过使用软件来创建认知模型。
认知分类的工作方式不是确定的,因为目前存在许多理论。这个概念的最古老理论被称为经典分类。在这个模型中,为了使一个物体或想法被认为属于一个类别,必须满足一组特定的属性。[5] 例如,为了使一个物体被认为是鸟类,它必须有羽毛、产卵并有喙。如果它不满足类别的任何标准,那么它就不属于该类别。
心理学家埃莉诺·罗施在 1970 年代发展了更现代的分类理论。[6] 这个理论被称为原型理论,被定义为一个物体或想法如果类似于某个表示或原型,那么它就属于某个类别。[6] 这与经典观点不同,因为一个物体不需要满足类别的所有规则,这些原型或模型可以随着时间的推移而改变。该理论还指出,存在三个分类层次。最顶层,也称为上位类别,包含高度的概括性和包容性。[5] 例如,狗的上位类别是哺乳动物。下一级是基本级分类,其中上位类别的实体是相似的,但仍然可以通过重要特征轻松区分。[5] 这就是狗和猫属于不同类别的层次。下位类别是最低级的类别,具有较低的概括性和包容性。[5] 犬种的区分就处于这个层次。
视觉分类从很小的时候就表现出来了。研究表明,婴儿在理解语言之前就能对基本颜色进行分类。[7] 习惯化被用来研究婴儿的感知,使用这种技术,Bornstein、Kessen 和 Weiskopf 发现,在四个月大的时候,人类就能区分蓝色、红色、黄色和绿色。[7]
除了颜色,婴儿也能出色地对视觉物体进行分类。研究表明,分类过程在二维和三维刺激之间有所不同,十八个月大的婴儿能够比二维刺激更好地对三维物体进行分类。[8] Booth、Schuler 和 Zajicek[9] 表明,物体功能有助于十六个月大的婴儿形成类别。当物体执行的动作与之前向他们展示的动作不同时,婴儿无法对物体进行分类。据推测,母体气味和多感官输入会增强婴儿的视觉分类能力。然而,在一项研究中,发现母体气味并不能增强四个月大的婴儿使用头皮脑电图 (EEG) 对汽车和其他物体进行分类的能力。[10]
衰老会影响认知能力,老年人会受到认知能力下降的影响。在 2016 年的一项研究中,十七名年轻受试者和十名老年受试者被要求将视觉图像分类成两个抽象类别。[3] 老年受试者在对不符合所呈现类别的例外情况进行分类时遇到了困难,但由于对视觉特征的注视率更高,对原型刺激进行分类的表现保持不变。[3] 这表明老年受试者具有更高的感知能力,可以弥补他们的认知能力下降。[3]
在孩子进入正规教育体系之前,他们已经发展出了隐性和显性的社会偏好和分类。构成这些社会类别的因素包括性别、种族和语言。[11] 从小,人类就倾向于与社会中与自己属于同一社会类别的人互动。孩子根据社会类别做出社会推断,并期望群体成员共享信念、特征和规范。[11] 在一项近期研究中,研究人员让不同年龄段的孩子判断哪些人可能违反社会习俗。研究表明,三到十一岁的孩子认为只有群体内部成员会遵循社会规范,而七到十一岁的孩子则使用社会群体成员身份来判断谁会或不会遵循社会规范。因此,年幼的孩子对社会类别有一个基本的认知,这种认知在童年后期逐渐发展。[12]
孩子们对群体外成员的分类也比对群体内部成员更强。Woo、Quinn、Méary、Lee 和 Pascalis[13] 进行了一项研究,让 59 名和 10 名年龄的马来人和马来华裔儿童以及 40 名马来人和马来华裔成年人(他们对白人接触较少)对白人、马来西亚人和中国人面孔进行分类。结果表明,孩子们能够轻松地区分白人面孔,但在对中国人与马来西亚人面孔进行分类时遇到了困难。另一方面,成年人能够以不同的速度(从最快到最慢:白人、中国人、马来西亚人)区分不同的面孔。[13] 这说明孩子们对种族有一个基本的认知,但也具有社会类别的概念,其中群体内部成员是其社会成员(马来人和中国人)。另一方面,由于“异族分类优势”,成年人能够区分除自己以外的其他人种,即他们更容易区分自己种族的面孔和其他种族的面孔。[13]
人工智能领域的分类技术
[edit | edit source]视频分类
[edit | edit source]软件和计算机系统在分类工作中大量使用原型理论和概念聚类。在 2018 年的一项研究中,研究人员创建了一种新的方法,将视频分类到不同的类型中。[14] 这些类型包括:动画、节目、体育、电子学习、医疗、天气、国防、经济、动物星球和科技。[14] 这种方法结合了一种新的模糊属性集来研究视频输入的形状。特定类型可能在视频输入帧中检测到特定形状的组合。然后从每个类别中提取相关特征,并转换为特征矩阵。该特征矩阵经过神经网络处理,以确定视频所属的类型或类别。[14]
文本分类
[edit | edit source]除了视频分类之外,文本分类对于搜索引擎、垃圾邮件过滤以及文档索引至关重要。[15] 文本分类被定义为将未标记的文本文件组织到预定义的类别中的过程。[16] 许多机器学习算法已经创建,使用了许多技术,例如朴素贝叶斯、k 最近邻、神经网络和支持向量机。[17]
在训练模型以预测哪些文档被组织到哪些类别之前,训练数据通常会进行预处理。这个阶段包括突出显示文本中的关键词或短语,以区分不同的文本类别。[18] 文本文件首先进行分词,即删除单词之间的空格并用斜杠替换它们的过程。所有携带无信息量的常用词都会被删除(停用词过滤),单词的前缀和后缀也会被剥离,留下单词的词根进行处理(词干提取)。[18]
如上所述,已经使用多种算法对文本进行分类。然而,Bagging 和 Adaboost 算法在多项研究中被证明在稳定性和准确性方面表现更好。[17] Bagging 是一种从不同的训练数据集创建不同模型的技术。[17] 相反,Adaboost 根据每个模型对正确预测文档类别进行预测的准确性,对这些模型应用权重。[17]
- ↑ Yang, J., & Long, C. (2020). Common and distinctive cognitive processes between categorization and category-based induction: Evidence from event-related potentials. Brain Research, 1749, 147134.
- ↑ Győri, G. (2013). Basic level categorization and meaning in language. Argumentum 9, 149-161.
- ↑ a b c d Schenk, S., Minda, J. P., Lech, R. K., & Suchan, B. (2016). Out of sight, out of mind: Categorization learning and normal aging. Neuropsychologia, 91, 222-233.
- ↑ He, Z., & Jiang, W. (2018). An evidential dynamical model to predict the interference effect of categorization on decision making results. Knowledge-Based Systems, 150, 139-149.
- ↑ a b c d Molina, A. (2017). DEFINING THE MAP: UTILIZING CLASSICAL CATEGORIZATION AND PROTOTYPE THEORY. Greensboro, NC: University of North Carolina.
- ↑ a b Taylor, J. R. (2015). Prototype Theory in Linguistics. International Encyclopedia of the Social & Behavioral Sciences, 286-289.
- ↑ a b Maule, J., & Franklin, A. (2019). Color categorization in infants. Current Opinion in Behavioral Sciences, 30, 163-168.
- ↑ Arterberry, M. E., Bornstein, M. H., & Blumenstyka, J. B. (2013). Categorization of two-dimensional and three-dimensional stimuli by 18-month-old infants. Infant Behavior and Development, 36(4), 786-795.
- ↑ Booth, A. E., Schuler, K., &; Zajicek, R. (2010). Specifying the role of function in infant categorization. Infant Behavior and Development, 33(4), 672-684.
- ↑ Rekow, D., Leleu, A., Poncet, F., Damon, F., Rossion, B., Durand, K., Baudouin, J. (2020). Categorization of objects and faces in the infant brain and its sensitivity to maternal odor: Further evidence for the role of intersensory congruency in perceptual development. Cognitive Development, 55, 100930.
- ↑ a b Liberman, Z., Woodward, A. L., & Kinzler, K. D. (2017). The Origins of Social Categorization. Trends in cognitive sciences, 21(7), 556–568.
- ↑ Liberman, Z., Howard, L. H., Vasquez, N. M., & Woodward, A. L. (2018). Children’s expectations about conventional and moral behaviors of in-group and out-group members. Journal of Experimental Child Psychology, 165, 7-18.
- ↑ a b c Woo, P. J., Quinn, P. C., Méary, D., Lee, K., & Pascalis, O. (2020). A developmental investigation of the other-race categorization advantage in a multiracial population: Contrasting social categorization and perceptual expertise accounts. Journal of Experimental Child Psychology, 197, 104870.
- ↑ a b c Roy, S., Shivakumara, P., Jain, N., Khare, V., Dutta, A., Pal, U., & Lu, T. (2018). Rough-fuzzy based scene categorization for text detection and recognition in video. Pattern Recognition, 80, 64-82.
- ↑ Revanasiddappa, M. B., Harish, B. S., & Kumar, S. V. (2018). Meta-cognitive Neural Network based Sequential Learning Framework for Text Categorization. Procedia Computer Science, 132, 1503-1511.
- ↑ Adeleke, S. (2017). Comparative Analysis of Text Classification Algorithms for Automated Labelling of Quranic Verses. International Journal on Advanced Science, Engineering and Information Technology, 7(4), 1419.
- ↑ a b c d Rostam, N. A. & Malim, N. H. (2019).《古兰经与圣训中的文本分类:使用机器学习和词语权重克服相互关联挑战》。《沙特国王大学学报 - 计算机与信息科学》。
- ↑ a b Eler, D., Grosa, D., Pola, I., Garcia, R., Correia, R. & Teixeira, J. (2018).《文本和观点挖掘中文档预处理效果分析》。《信息》,9(4), 100。