交通地理学与网络科学/小世界网络
很久以前,由于多种因素(如地形、缺乏交通选择、缺乏工具和缺乏教育),人们的活动范围有限。人员、商品和思想的流动通常依靠人力和畜力。因此,山脉、河流和海洋是流动性的重大障碍。除了这些物理障碍之外,不同国家的人民由于语言障碍而无法轻松沟通。因此,将物品和思想从源头移动到目的地需要很长时间。然而,自那些日子以来,技术已经有了很大的发展。由于发达的交通网络和交通方式(如汽车、飞机),我们可以轻松快捷地移动更长的距离。此外,由于教育的改善和少数标准化语言的传播,我们与外国人的沟通能力也有所提高。此外,我们可以通过电信和计算机网络几乎即时传递信息。世界正在变小。
我们生活在一个网络世界中,许多事物相互连接,这种连接使我们的生活方式更加有效。邓肯和斯特罗加茨指出,现实世界的网络既不是规则网络也不是随机网络,它们存在于规则网络和随机网络之间。他们称这种类型的网络为“小世界网络”。[2]
• 1929 年:匈牙利作家弗里吉斯·卡林西首次报道了小世界现象。他在他的书《一切都不同》中讨论了小世界属性的主题。
• 1967 年:斯坦利·米尔格拉姆进行了第一个关于小世界现象的实验研究。在这个实验中,他分析了当信件在两个陌生人之间传递时的平均分离程度。
• 1991 年:约翰·瓜尔写了一部戏剧《六度分离》,“六度分离”一词在世界上流行起来。
• 1998 年:邓肯·瓦茨和史蒂文·斯特罗加茨通过分析演员网络、神经网络和电力网网络对“小世界网络”进行了数学分析。他们说明了小世界属性出现在自然和技术网络以及社会网络中。
世界上任何两个人都在 6 度内相连,即使他们彼此不认识。这意味着每个人都可以通过朋友的网络在 6 度内与名人(如麦当娜、达赖喇嘛和女王)联系起来。[5] 这个想法最初由弗里吉斯·卡林西在 1929 年提出,但在 1969 年进行实验之前被认为是民间传说。1969 年,研究人员斯坦利·米尔格拉姆进行了一项关于“六度分离”想法的第一个实验研究。研究人员要求堪萨斯州威奇托、奥马哈和内布拉斯加州的居民寄一封信,信的目的地是波士顿的股票经纪人或马萨诸塞州的学生。当居民不认识目标人物时,他们必须将信寄给他们的朋友或熟人,而不是目标人物。虽然并非所有信件都送达目标人物,但平均度数为 5.5。[3] 这个结果表明卡林西的想法几乎是正确的。之后,这种现象因约翰·瓜尔的戏剧《六度分离》[6],以及客厅游戏“六度分离凯文·贝肯”[7][8] 广为流行。在米尔格拉姆的实验之后,几位研究人员通过改变网络类型来检验“六度分离”的假设。虽然米尔格拉姆的实验仅限于美国,但今天的实验分析的是全球网络。
2008 年,微软研究人员分析了微软 Messenger 的 300 亿条记录,他们发现平均分离度为 6.6。这意味着 78% 的两个人在 7 度内联系,而有些两对人之间相隔 29 度。[5] 2011 年,Facebook 科学家 Lars Backstrom 和米兰大学的研究人员分析了 7.21 亿 Facebook 用户,约占全球人口的 10%。结果显示,平均分离度为 3.74,99.6% 的两个用户在 5 度分离内联系在一起。[9] 这个结果表明 Facebook 的网络比微软 Messenger 的网络显示更小的世界。然而,两个人之间的网络连接程度是不同的,因为微软的研究是基于交换信息;另一方面,Facebook 的研究是基于“朋友”功能。[8]
表 1 显示了平均分离度 [d] 的其他结果。在十个网络中,大肠杆菌代谢网络的平均分离度最小,为 2.98。相反,电力网络的平均分离度最大,为 18.99。[3] 这意味着在电力网络中,任何两个节点之间的距离不超过 19 个节点。这个数字远大于社交网络中的平均分离度。根据这个结果,网络结构因网络类型而异。根据 Barabashi[3] 的研究,如果知道网络的总节点数 [N] 和平均出度(协调数[10])[k],就可以计算出任何网络的平均距离(平均分离度)[d]。平均距离大约为 ,这个公式表明,网络越稠密,平均距离越小。表 1 显示了该公式的结果,在某些情况下(例如,互联网、移动电话通话),估计值 [log N / log k] 与平均距离 [d] 相似;然而,它并不完美(例如,万维网、电力网络和电子邮件)。例如,在互联网中,平均距离 [d] 为 6.98,而 log N / log k 的估计值为 6.59。另一方面,在电子邮件中,平均距离为 5.88,而 log N / log k 的估计值为 18.4。[3]
网络名称 | ||||||
---|---|---|---|---|---|---|
互联网 | 192,244 | 609,066 | 6.34 | 6.98 | 26 | 6.59 |
万维网 | 325,729 | 1,497,134 | 4.60 | 11.27 | 93 | 8.32 |
电力网络 | 4,941 | 6,594 | 2.67 | 18.99 | 46 | 8.66 |
移动电话通话 | 36,595 | 91,826 | 2.51 | 11.72 | 39 | 11.42 |
电子邮件 | 57,194 | 103,731 | 1.81 | 5.88 | 18 | 18.4 |
科学合作网络 | 23,133 | 186,936 | 8.08 | 5.35 | 15 | 4.81 |
演员网络 | 212,250 | 3,054,278 | 28.78 | - | - | - |
引用网络 | 449,673 | 4,707,958 | 10.47 | 11.21 | 42 | 5.55 |
大肠杆菌代谢网络 | 1,039 | 5,802 | 5.84 | 2.98 | 8 | 4.04 |
酵母蛋白相互作用网络 | 2,018 | 2,930 | 2.90 | 5.61 | 14 | 7.14 |
Barabashi[3] 指出,总节点数 [N] 和平均距离 [d] 之间的关系因空间维度而异。Barabashi 的 图 3.10 展示了通过改变维度,它们之间的关系,结果表明,规则网络的平均距离远大于随机网络的平均距离。这是实际平均距离 [d] 与估计值 [log N / log k] 之间存在差异的原因之一。此外,Barabashi[3] 指出,平均距离 [d] 在不同规模的网络中有所不同。Barabashi 的 图 3.11 显示了 Facebook 用户在全球用户和美国用户之间的距离分布,结果表明,美国用户之间的平均距离小于全球用户之间的平均距离。
规则网络和随机网络的网络结构存在显著差异。Watts 和 Strogatz 指出,现实世界中的网络结构既不是随机网络的结构,也不是规则网络的结构。因此,他们指出,现实世界中的网络介于这两种网络之间,他们称这种类型的网络为“小世界网络”。图 1 显示了环形格子上小世界网络的图像。一个网络有 个节点,每个节点连接到 个节点,每个节点根据概率 [p] 从最近的节点随机重新连接到另一个节点。在“规则网络”中,概率为零 [p = 0],所有节点都连接到最近的邻居。随着概率的增加 [0< p < 1],一些连接以概率 [2] 随机重新连接到另一个节点,我们将这种连接称为“捷径”[11]。当所有连接都被随机重新连接时 [p=1],这个网络被称为“随机网络”。
为了解释网络结构特征,Watts 和 Strogatz 使用了两个因素:路径长度 [L] 和聚类系数 [C]。[2] 如果每个人都连接到每个人,则 C = 1。[10]
在规则网络中,路径长度 [L] 为 ,聚类系数 [C] 为 。另一方面,在随机网络中,路径长度 [L] 为 ,聚类系数 [C] 为 。因此,规则网络具有高度的聚类性,但路径长度较长。另一方面,随机网络聚类性较差,路径长度较短。[2] 存在一些方程式可以解释聚类系数 [C] 和路径长度 [L]。根据 Newman 的说法,聚类系数 [C] 可以通过 来估计。此外,在考虑维度 [m] 时,聚类系数 [C] 可以通过 来估计。[10]
Barrat 和 Weigt 提出了考虑概率 p 的聚类系数 [C] 和路径长度 [L] 的公式。路径长度 [L] 会根据 n 和 p 的变化而显著改变。[12]
是节点 i 和 j 之间的化学距离。
关于连接度分布,规则网络中每个节点都具有相同的连接度 [k];然而,随着概率 的增加,连接度分布变得不均匀,分布变得更广,而平均连接度为 。[12]
小世界效应
[edit | edit source]“小世界效应”意味着平均距离 [d] 随着节点总数 [N] 的增加而对数增长。这与规则网络中平均距离 [d] 随节点总数 [N] 线性增加的结构不同。另一方面,这与随机网络类似。但是,小世界网络与随机网络并不相同,因为它们表现出聚类性。[13] 小世界网络兼具规则网络和随机网络的特征,因为它们像规则网络一样具有高度的聚类性,并且像随机网络一样具有较小的路径长度。[2]
网络结构特征 [L 和 C] 与概率 [p] 之间的关系
[edit | edit source]图 5 显示了网络结构特征 [L 和 C] 与概率 [p] 之间的关系。当 很小时,路径长度 [L] 的值迅速下降,而聚类系数 [C] 几乎保持不变。另一方面,当 很大时,路径长度 [L] 几乎保持不变,而聚类系数 [C] 大幅下降。[2] 小世界范围是指 的值远大于随机网络的值,但 的值接近随机网络的值。[14]
Watts 和 Strogatz[2] 分析了三种不同的网络,以检验小世界网络的概念;“电影演员”、“电力网”和“神经网络 (秀丽隐杆线虫)”。在电影演员方面,顶点是演员,当两位演员在同一电影中合作时,就会创建边。在电力网方面,顶点是发电机、变压器和变电站,边是输电线路。在秀丽隐杆线虫方面,顶点是神经元,边是突触或间隙连接连接的链接。
Watts 和 Strogatz 展示了路径长度 [L] 和聚类系数 [C] 的实际值和随机值(表 2)。他们发现,路径长度 [L] 的实际值与随机网络中的值相似,但聚类系数 [C] 的实际值明显大于随机网络中的值。因此,这三种网络都显示出小世界网络的特征。此外,他们还调查了传染病的传播时间,发现传染病在小世界网络中传播速度更快,因为网络中存在捷径。此外,传染病传播时间呈现出与路径长度 [L] 相似的曲线图。[2] 所有这些实证研究表明,现实世界网络与小世界网络具有相似性。
电影演员 | 3.65 | 2.99 | 0.79 | 0.00027 |
电力网 | 18.7 | 12.4 | 0.080 | 0.005 |
秀丽隐杆线虫 | 2.65 | 2.25 | 0.28 | 0.05 |
小世界网络的类别
[edit | edit source]Prizmič[13] 指出,现实世界网络中的连通性分布遵循幂律,并以 WWW 网络为例说明。该网络显示出“小世界效应”,因为两个文档之间的最短路径随节点总数 (N) 的对数增长。这意味着,即使网络规模增加,最短路径也不会发生显著变化。这是一种小世界网络。
Amaral 等人[15] 指出,小世界网络有三种类型;1) 无标度网络,2) 广度尺度网络,3) 单尺度网络。
1) 无标度网络:“顶点连通性分布呈幂律衰减”
2) 广度尺度网络:“连通性分布呈现幂律区域,然后是急剧的截止”
3) 单尺度网络:“连通性分布具有快速衰减的尾部”
无标度网络的例子包括 WWW 和科学论文的引用网络。广度尺度网络是电影演员。单尺度网络是电力网、初中友谊、神经网络和聚合物链模型。
小世界网络在交通领域的应用
[edit | edit source]机场网络
[edit | edit source]Amaral 等人[15] 分析了机场网络的客运量和货运量。结果表明,机场网络是单尺度网络,因为连通性分布的衰减程度大于无标度网络。作者指出,容量限制是航空网络不显示无标度网络的原因。航空网络具有枢纽辐射结构,航空公司倾向于连接到枢纽机场;但是,每个机场的货运和客运处理能力是有限的。因此,连通性分布不遵循幂律模型。
波士顿地铁网络
[edit | edit source]Latora 和 Massimo[18] 分析了波士顿地铁网络,利用路径长度 [L] 和聚类系数 [C] 来确定该网络是否为小世界网络。他们计算了路径长度 (L=15.55),但由于某些节点仅连接到网络中的一个节点,因此无法计算聚类系数。因此,他们使用替代因素效率 [E] 来解释小世界网络。当最短路径长度 [d] 更长时,效率 [E] 更低。 表示“整个网络的效率”,而 表示“节点邻居子图的平均效率”。作者指出,当 和 都很高时,该网络表现为小世界网络。结果 (表 3) 表明波士顿地铁网络没有表现出小世界网络的特征,因为 较低,而 较高。另一方面,当作者将公交系统添加到地铁网络中时, 和 都很高。因此,波士顿交通网络可以建模为小规模网络。
波士顿地铁 | 0.63 | 0.03 |
波士顿地铁 + 公交 | 0.72 | 0.46 |
Xu 和 Sui[14] 介绍了一种方法,用于分析小世界属性与网络自相关统计之间的关系,从而分析“小世界效应”;Moran's 和 Getis's .
莫兰指数 () 是自相关统计量之一,莫兰指数 () 的正值说明了与邻居的相似性;另一方面, 的负值解释了与邻居的不相似性。在 Getis's 方面, 的高值表明高值可能彼此捆绑在一起,而 的低值表明低值更集中。在常规网络中,莫兰指数 () 较高,而 Getis's ) 较低;但是,随着概率 [p] 增加,莫兰指数 () 急剧下降,而 Getis's ) 逐渐增加。
此外,这两个值在小世界网络范围内相互交叉。Getis's ) 的低值说明节点连接度低可能集中,而莫兰指数 () 的低值表明全局相关性小。这解释了小世界网络的特征,因此莫兰指数 () 和 Getis's ) 的交点表明小世界网络。
他们将这种方法应用于三个交通网络:国家(美国州际和高速公路网络)、都市(休斯顿-加尔维斯顿地区的道路网络)和城市内(波士顿地铁网络)。结果表明,莫兰指数 () 和 Getis's ) 受滞后距离的影响很大。根据 Xu 和 Sui 的说法,滞后距离的含义是“邻域的大小,即在计算网络自相关统计量时要考虑多少个邻居”。随着滞后距离的增加,莫兰指数 () 降低;另一方面,Getis's ) 升高。此外,当莫兰指数 () 和 Getis's ) 较低时,它们会相互交叉。他们发现交点值在所有交通网络中都相似。
拥堵因子与网络类型之间的关系
[edit | edit source]吴等人[19]研究了三种类型的网络(小世界、无标度、随机)中拥塞因子与交通量之间的关系。为了分配交通流,使用用户均衡 (UE) 方法,并随机分配链路容量。网络规模为 ,平均协调数 [k] 为 7。
结果表明,当交通量较小时,无标度网络和小世界网络比随机网络更容易拥塞。另一方面,当交通量较大时,随机网络比无标度网络和小世界网络更容易拥塞。这是因为在无标度网络和小世界网络中,大部分流量首先集中在枢纽节点上,但随着交通量的增加,拥塞的增加速度相对较慢。另一方面,在随机网络中,随着交通量的增加,拥塞链路的数量稳定增长。与无标度网络和小世界网络相比,小世界网络更容易发生拥塞。因此,在三种类型的网络中,无标度网络可以处理最大的交通量。此外,他们还分析了拥塞因子与重连概率 [p] 和聚类系数 [C] 之间的关系,结果表明,当概率 [p] 和聚类系数 [C] 较大时,拥塞因子较小。
“小世界网络”介于完全规则网络和随机网络之间。Duncan 和 Strogatz[2]用两个特征对该网络进行了数学解释;路径长度 [L] 和聚类系数 [C]。小世界网络像规则网络一样高度聚类,路径长度像随机网络一样小。根据研究,他们表明现实世界网络在生物、技术和社会网络中具有小世界网络的特征。这是一个重大发现,因为小世界网络有可能对现实世界网络进行建模。[14]
研究人员关注这一主题,因为它对于理解交流(例如,新闻、谣言和时尚的传播)至关重要。尤其是在医疗领域,需要弄清楚疾病(例如,艾滋病毒、非典)传播的特征。[13]此外,该主题还扩展到交通研究领域。现实世界网络结构并不统一,它具有多种类型的网络[15],因此很难对现实世界网络进行建模。研究是一个正在进行的工作,研究人员试图解释这个复杂的网络。
- ↑ 小世界网络图片 作者:user:Sazaedo
- ↑ a b c d e f g h i j k Watts, D. J., & Strogatz, S. H. (1998). Collective dynamics of ‘small-world’networks. nature, 393(6684), 440-442.
- ↑ a b c d e f g h 网络科学书籍:第 3 章 (Barabasi)
- ↑ 六度分离图片 作者:Laurens van Lieshout
- ↑ a b David Smith (2008). Proof! Just six degrees of separation between us. The guardian. Retrieved April 9, 2015 from http://www.theguardian.com/technology/2008/aug/03/internet.email
- ↑ John Guare. 六度分离:一部戏剧 (Vintage Books, New York, 1990)
- ↑ 凯文·贝肯游戏
- ↑ a b John Markoff and Somini Sengupta (2011). Separating You and Me? 4.74 Degrees. The New York Times. Retrieved April 9, 2015 from http://www.nytimes.com/2011/11/22/technology/between-you-and-me-4-74-degrees.html
- ↑ BBC News (2011). Facebook users average 3.74 degrees of separation. BBC. Retrieved April 10, 2015 from http://www.bbc.com/news/technology-15844230
- ↑ a b c M. E. J. Newman (2000). Models of the small world: A Review. arXiv:cond-mat/0001118v2. Retrieved April 10, 2015 from http://arxiv.org/pdf/cond-mat/0001118v2.pdf
- ↑ Newman, M. E., & Watts, D. J. (1999). Scaling and percolation in the small-world network model. Physical Review E, 60(6), 7332.
- ↑ a b Barrat, A., & Weigt, M. (2000). On the properties of small-world network models. The European Physical Journal B-Condensed Matter and Complex Systems, 13(3), 547-560.
- ↑ a b c Prizmič, J. (2001). Models of the Small World. Maribor, Slovenia.
- ↑ a b c d Xu, Z., & Sui, D. Z. (2007). Small-world characteristics on transportation networks: a perspective from network autocorrelation. Journal of Geographical Systems, 9(2), 189-205.
- ↑ a b c Amaral, L. A. N., Scala, A., Barthelemy, M., & Stanley, H. E. (2000). Classes of small-world networks. Proceedings of the national academy of sciences, 97(21), 11149-11152.
- ↑ 世界航空航线图-2009 作者:Jpatokal
- ↑ 波士顿地铁地图 作者:Citynoise
- ↑ a b Latora, V., & Marchiori, M. (2002). Is the Boston subway a small-world network?. Physica A: Statistical Mechanics and its Applications, 314(1), 109-113.
- ↑ Wu, J. J., Gao, Z. Y., Sun, H. J., & Huang, H. J. (2006). Congestion in different topologies of traffic networks. EPL (Europhysics Letters), 74(3), 560.