跳转到内容

计算机科学基础/互联网和万维网

来自维基教科书,开放世界中的开放书籍

互联网和万维网

[编辑 | 编辑源代码]

互联网和万维网使我们能够连接到无数资源,并正在塑造我们的社会如何利用技术进行在线存储和服务。我们将使用之前学到的原理来考察互联网和万维网通信。我们将考察的原理是

  • 信息可以编码成消息
  • 协调系统是朝着共同目标相互作用的一组代理
  • 消息可以隐藏信息

计算机网络

[编辑 | 编辑源代码]

计算机网络被认为是一个通信子系统,它连接着一组计算机,使它们能够相互通信。在考虑计算机网络时,必须考虑使它成为可能的两个部分

硬件

  • 网络接口卡 (NIC) - 连接到局域网所需的
  • 电缆或天线 - 用于承载传输信号的
  • 网络交换机 - 用于中继信号的

软件

  • 程序 - 使用算法处理信息(位)的

网络标准

[编辑 | 编辑源代码]

与用于位的编码过程类似,网络也必须使用标准的相同理念。为了进行通信,它需要设备、消息格式和交互过程的标准。这些标准为通信提供了有序流程。

一旦我们有了这些标准,我们就可以检查是什么真正使网络运行起来。如前所述,计算机网络由两部分组成:硬件和软件。物理硬件为通信旅行铺平了道路,但不能使网络运行起来。软件(程序)是使计算机网络能够进行软件到软件通信的组成部分。

本章的重点将放在以下三个软件标准上

  • 互联网协议套件
  • 软件层
  • 用于简化的抽象

背景定义

[编辑 | 编辑源代码]

了解所提供链接中的定义将为您提供本章材料的基础。

协议栈

[编辑 | 编辑源代码]

在分析允许网络通信所需的协议时,我们看到不同的协议被分层以创建抽象级别。这些抽象层用于上层和下层(参见下图)。

Shows the stack of network agents used to transmit a message from one computer to another.
显示用于将消息从一台计算机传输到另一台计算机的网络代理栈。

消息类比

假设计算机 A 要向计算机 B 发送消息。跟踪以下步骤以了解消息是如何通过两个代理栈发送的。

  1. 只有 A4 和 B4 可以访问物理邮箱以发送和接收包裹
  2. A1 将消息放入包裹中
  3. A2 向包裹添加序列号和跟踪号
  4. A3 添加地址标签
  5. A4 将包裹放在出站邮箱中
  6. 包裹到达 B4 的收件箱
  7. B3 接受发往 B 的包裹
  8. B2 检查使用序列号将包裹按顺序排列,并使用跟踪号向 A2 确认包裹
  9. A2 重新发送未确认的包裹
  10. B1 打开包裹重建原始消息

网络协议的工作方式相同,A1 到 A4 和 B1 到 B4 都是软件。A4 和 B4 之间使用的传递机制通常包括金属线、光纤电缆或空气中的无线电波。

传递机制

之前,我们已经建立了如何使用计算机 A 和计算机 B 传输信息。当今网络之间通信使用的两种传递机制是电路交换和分组交换。当您想到电话网络时,此网络需要在通信之前建立连接。例如,当您打电话给某人时,电话会响铃,直到对方接听或语音信箱启动;这种类型的通信称为同步通信。

使用分组交换的计算机网络恰恰相反。在使用分组交换时,每个分组(即一小包信息)都单独寻址和传递。该过程模拟了邮件包裹通过共享媒介(即卡车、火车、轮船和飞机)传递的方式。例如,当您寄信时,您不会等到收件人准备好。这种类型的通信称为异步通信。

互联网

[编辑 | 编辑源代码]

我们已经看到了互联网的不同标准和/或协议。以下描述了互联网的不同特性,这在区分互联网和万维网时很重要。

  • 通信基础设施(信息高速公路)
  • 使用互联网协议 (IP) 的全球计算机网络连接
  • 使用通信协议层:IP、TCP、HTTP/FTP/SSH
  • 建立在开放标准之上:任何人都可以创建新的互联网设备
  • 缺乏集中控制(大部分)
  • 每个人都可以使用它,只需使用简单且常用的软件

万维网

[编辑 | 编辑源代码]

万维网经常与互联网混淆,因为它与互联网一起使用。万维网只是互联网提供的众多服务之一。了解万维网的特征很重要(见下文)

  • 可以使用万维网协议(HTTP-超文本传输协议)获取的分布式网页或文档的集合
  • 使用互联网作为传递机制的服务(应用程序)
  • 除其他服务外,运行在互联网上的服务之一:电子邮件、文件传输、远程登录等。

万维网

[编辑 | 编辑源代码]

有两个角色共同构成万维网:Web 服务器和 Web 客户端(浏览器)。

Web 服务器

  • 侦听网页请求并可以访问存储的网页的软件
  • Apache、MS Internet Information Server (IIS)

Web 客户端(浏览器)

  • 从 Web 服务器获取/显示获取的文档的软件
  • Firefox、Internet Explorer、Safari、Chrome

统一资源定位符 (URL)

[编辑 | 编辑源代码]

统一资源定位符 (URL) 是网页位置的标识符。URL 系统是分层的(见下图)。

An example of the different pieces of a URL.
URL 不同部分的示例。
  • edu:学校的 URL(不是 .com 或 .org)
  • www.sbuniv.edu:西南浸信会大学 (SBU) 网站的 URL
  • www.sbuniv.edu/COBACS/CIS/index.html:SBU 网站上位于以下路径的页面的 URL

超文本标记语言 (HTML)

[编辑 | 编辑源代码]

定义网页的语言叫做 HTML。为了查看示例,请打开另一个标签页,并访问西南浸信会大学 CIS 部门网站。打开页面后,右键单击页面并选择“查看源代码”,这样你就可以看到用来创建网页的 HTML 代码。网页本身可能包含超文本(可点击的文本,充当链接)。链接只是一个指向另一个网页的定义 URL。网页和链接共同组成了万维网。

在网上查找信息

[编辑 | 编辑源代码]

要注意如何在网上查找信息。请按照以下步骤查看此过程是如何运作的:使用分层系统(目录)查找可能包含信息的页面的 URL。

  • 利用我们的知识进行猜测,例如,从 apple.com 开始导航到 iPhone 5s 页面。
  • 使用搜索引擎。
   -we look for information (wherever it is located) not pages
   -we may find information we did not know existed

搜索引擎的工作原理

[编辑 | 编辑源代码]

搜索引擎是查找资源的主要来源之一。但是,您是否想过它们是如何运作的?有一系列步骤描述了使用搜索引擎时究竟发生了什么。

  1. 收集信息:爬取网页。
  2. 保存副本:缓存网页。
  3. 建立索引。
  4. 理解查询。
  5. 确定每个可能结果与查询的相关性。
  6. 确定相关结果的排名。
  7. 展示结果。

重要页面的衡量标准

搜索完成后,会提供相关页面。但是,并非所有显示的相关页面都被视为重要页面。一个网页只有在被信誉良好的来源排名后才会获得重要性。谷歌的创新之一是页面排名——衡量页面“重要性”的指标,它考虑了指向该页面的外部引用。一个页面根据指向它的重要页面的数量来判断其重要性。例如,一篇来自《纽约时报》的电子文章的页面排名会比个人博客更高,因为指向该在线文章的重要页面更多。

华夏公益教科书