跳转到内容

编程基础/字符串数据类型

来自维基教科书,开放书籍,开放世界

字符串数据类型通常是一系列字符,可以是字面常量,也可以是某种变量。后者可以允许其元素发生变异,并且长度可以改变,也可以是固定的(创建后)。字符串通常被认为是一种数据类型,并且经常被实现为字节(或字)的数组数据结构,它使用某种字符编码存储一系列元素,通常是字符。[1]

根据编程语言和使用的精确数据类型,声明为字符串的变量可能会导致为预定的最大长度静态分配内存,或者使用动态分配来允许它保存可变数量的元素。当字符串在源代码中字面出现时,它被称为字符串字面量或匿名字符串。[2]

字符数据类型表示单个字符。字符包含各种符号,例如字母(大写和小写)、数字(0 到 9)、标点符号等。所有计算机都将字符数据存储在一个字节字段中,作为一个整数。由于一个字节由 8 位组成,因此这个一个字节字段使用 0 到 255 的正值有 28 或 256 种可能性。

C++、C# 和 Java 使用单引号和双引号分别区分单个字符和字符串。JavaScript、Python 和 Swift 不区分字符和字符串,并使用单引号或双引号来定义字符串字面量。

语言 保留字 示例
C++ char 'A'
C++ string "Hello world!"
C# char 'A'
C# String "Hello world!"
Java char 'A'
Java String "Hello world!"
JavaScript String 'Hello world!', "Hello world!"
Python str() 'Hello world!', "Hello world!"
Swift Character "A"
Swift String "Hello world!"

大多数计算设备使用 ASCII(代表美国信息交换标准代码,发音为“ask-key”)字符集,它为 0 到 127 建立了值。对于 128 到 255 的值,它们通常使用扩展 ASCII 字符集。当我们在键盘上按下大写 A 时,键盘会发送一个字节,其位模式等于整数 65。当字节从内存发送到显示器时,显示器将 65 的整数值转换为大写 A 的符号,并在显示器上显示。

目前,我们只讨论字符串和字符作为常量的使用。大多数现代编译器(作为集成开发环境 (IDE) 的一部分)将对源代码进行颜色编码,以帮助程序员更轻松地识别不同的功能。初级程序员将使用字符串常量将消息发送到标准输出。

关键词

[编辑 | 编辑源代码]
ASCII
美国信息交换标准代码
Character
一种表示单个文本字符的数据类型,例如字母、数字、标点符号等。
双引号
用于在大多数编程语言中创建字符串类型数据。
单引号
用于在区分字符串和字符数据类型的语言中创建字符类型数据。
String
一系列或数组的字符作为单个数据。

参考文献

[编辑 | 编辑源代码]
华夏公益教科书