计算机科学基础/互联网和万维网

互联网和万维网

互联网和万维网使我们能够连接到无数资源，并正在塑造我们的社会如何利用技术进行在线存储和服务。我们将使用之前学到的原理来考察互联网和万维网通信。我们将考察的原理是

信息可以编码成消息
协调系统是朝着共同目标相互作用的一组代理
消息可以隐藏信息

计算机网络

计算机网络被认为是一个通信子系统，它连接着一组计算机，使它们能够相互通信。在考虑计算机网络时，必须考虑使它成为可能的两个部分

硬件

网络接口卡 (NIC) - 连接到局域网所需的
电缆或天线 - 用于承载传输信号的
网络交换机 - 用于中继信号的

软件

程序 - 使用算法处理信息（位）的

网络标准

与用于位的编码过程类似，网络也必须使用标准的相同理念。为了进行通信，它需要设备、消息格式和交互过程的标准。这些标准为通信提供了有序流程。

一旦我们有了这些标准，我们就可以检查是什么真正使网络运行起来。如前所述，计算机网络由两部分组成：硬件和软件。物理硬件为通信旅行铺平了道路，但不能使网络运行起来。软件（程序）是使计算机网络能够进行软件到软件通信的组成部分。

本章的重点将放在以下三个软件标准上

互联网协议套件
软件层
用于简化的抽象

背景定义

了解所提供链接中的定义将为您提供本章材料的基础。

协议栈

在分析允许网络通信所需的协议时，我们看到不同的协议被分层以创建抽象级别。这些抽象层用于上层和下层（参见下图）。

Shows the stack of network agents used to transmit a message from one computer to another. — 显示用于将消息从一台计算机传输到另一台计算机的网络代理栈。

消息类比

假设计算机 A 要向计算机 B 发送消息。跟踪以下步骤以了解消息是如何通过两个代理栈发送的。

只有 A4 和 B4 可以访问物理邮箱以发送和接收包裹
A1 将消息放入包裹中
A2 向包裹添加序列号和跟踪号
A3 添加地址标签
A4 将包裹放在出站邮箱中
包裹到达 B4 的收件箱
B3 接受发往 B 的包裹
B2 检查使用序列号将包裹按顺序排列，并使用跟踪号向 A2 确认包裹
A2 重新发送未确认的包裹
B1 打开包裹重建原始消息

网络协议的工作方式相同，A1 到 A4 和 B1 到 B4 都是软件。A4 和 B4 之间使用的传递机制通常包括金属线、光纤电缆或空气中的无线电波。

传递机制

之前，我们已经建立了如何使用计算机 A 和计算机 B 传输信息。当今网络之间通信使用的两种传递机制是电路交换和分组交换。当您想到电话网络时，此网络需要在通信之前建立连接。例如，当您打电话给某人时，电话会响铃，直到对方接听或语音信箱启动；这种类型的通信称为同步通信。

使用分组交换的计算机网络恰恰相反。在使用分组交换时，每个分组（即一小包信息）都单独寻址和传递。该过程模拟了邮件包裹通过共享媒介（即卡车、火车、轮船和飞机）传递的方式。例如，当您寄信时，您不会等到收件人准备好。这种类型的通信称为异步通信。

互联网

我们已经看到了互联网的不同标准和/或协议。以下描述了互联网的不同特性，这在区分互联网和万维网时很重要。

通信基础设施（信息高速公路）
使用互联网协议 (IP) 的全球计算机网络连接
使用通信协议层：IP、TCP、HTTP/FTP/SSH
建立在开放标准之上：任何人都可以创建新的互联网设备
缺乏集中控制（大部分）
每个人都可以使用它，只需使用简单且常用的软件

万维网

万维网经常与互联网混淆，因为它与互联网一起使用。万维网只是互联网提供的众多服务之一。了解万维网的特征很重要（见下文）

可以使用万维网协议（HTTP-超文本传输协议）获取的分布式网页或文档的集合
使用互联网作为传递机制的服务（应用程序）
除其他服务外，运行在互联网上的服务之一：电子邮件、文件传输、远程登录等。

万维网

有两个角色共同构成万维网：Web 服务器和 Web 客户端（浏览器）。

Web 服务器

侦听网页请求并可以访问存储的网页的软件
Apache、MS Internet Information Server (IIS)

Web 客户端（浏览器）

从 Web 服务器获取/显示获取的文档的软件
Firefox、Internet Explorer、Safari、Chrome

统一资源定位符 (URL)

统一资源定位符 (URL) 是网页位置的标识符。URL 系统是分层的（见下图）。

An example of the different pieces of a URL. — URL 不同部分的示例。

edu：学校的 URL（不是 .com 或 .org）
www.sbuniv.edu：西南浸信会大学 (SBU) 网站的 URL
www.sbuniv.edu/COBACS/CIS/index.html：SBU 网站上位于以下路径的页面的 URL

超文本标记语言 (HTML)

定义网页的语言叫做 HTML。为了查看示例，请打开另一个标签页，并访问西南浸信会大学 CIS 部门网站。打开页面后，右键单击页面并选择“查看源代码”，这样你就可以看到用来创建网页的 HTML 代码。网页本身可能包含超文本（可点击的文本，充当链接）。链接只是一个指向另一个网页的定义 URL。网页和链接共同组成了万维网。

在网上查找信息

要注意如何在网上查找信息。请按照以下步骤查看此过程是如何运作的：使用分层系统（目录）查找可能包含信息的页面的 URL。

利用我们的知识进行猜测，例如，从 apple.com 开始导航到 iPhone 5s 页面。
使用搜索引擎。

   -we look for information (wherever it is located) not pages
   -we may find information we did not know existed

搜索引擎的工作原理

搜索引擎是查找资源的主要来源之一。但是，您是否想过它们是如何运作的？有一系列步骤描述了使用搜索引擎时究竟发生了什么。

收集信息：爬取网页。
保存副本：缓存网页。
建立索引。
理解查询。
确定每个可能结果与查询的相关性。
确定相关结果的排名。
展示结果。

重要页面的衡量标准

搜索完成后，会提供相关页面。但是，并非所有显示的相关页面都被视为重要页面。一个网页只有在被信誉良好的来源排名后才会获得重要性。谷歌的创新之一是页面排名——衡量页面“重要性”的指标，它考虑了指向该页面的外部引用。一个页面根据指向它的重要页面的数量来判断其重要性。例如，一篇来自《纽约时报》的电子文章的页面排名会比个人博客更高，因为指向该在线文章的重要页面更多。