Visual Basic/字符串
外观
Visual Basic 有一套传统的内置字符串操作。与许多语言不同,Visual Basic 字符串始终是 Unicode,因此可以包含任何字符。它们也始终是动态分配的,并且几乎具有无限的长度(理论上最长可达 231 个字符,约 20 亿个字符)。
请注意,Unicode 使用不止一个字节来表示每个字符。就 VB 而言,Unicode 字符是两个字节,提供 216 或 65536 个可能的价值。即使是中文、日语和韩语字符集 (CJK) 也足以满足。实际上,Unicode 定义了 17 个平面,每个平面都有 216 个代码点的空间,但 VB(和 Windows)仅使用 基本多语言平面 (BMP)。
请参阅 VB 字符串是什么?,以获取对 Visual Basic Classic 字符串内部工作机制的简要说明。
Visual Basic 提供了一套合理的传统函数来操作和搜索字符串。这些函数通常足以满足大多数程序,这些程序并非主要关注文本处理。
正则表达式是字符字符串,其中某些字符具有特殊含义。这样的字符串可以用来以比内置的 InStr 函数更复杂的方式在另一个字符串中搜索子字符串。
例如,此表达式
"(dog|cat)"
将匹配 "dog" 或 "cat"。
Visual Basic 没有内置正则表达式函数,但它们可以在 VBScript 正则表达式库中使用。如果您的程序进行了大量的文本处理,那么正则表达式绝对值得学习,即使它们刚开始看起来很吓人。实际上,大多数程序员发现,很少使用更神秘的表达式,并且一遍又一遍地重复使用相同的习惯用法,所以实际上并没有像最初看起来那样需要学习的东西。
上一页:循环 | 目录 | 下一页:内置字符串函数 |