计算机科学基础/互联网和万维网
互联网和万维网使我们能够连接到无数资源,并正在塑造我们的社会如何利用技术进行在线存储和服务。我们将使用之前学到的原理来考察互联网和万维网通信。我们将考察的原理是
- 信息可以编码成消息
- 协调系统是朝着共同目标相互作用的一组代理
- 消息可以隐藏信息
计算机网络被认为是一个通信子系统,它连接着一组计算机,使它们能够相互通信。在考虑计算机网络时,必须考虑使它成为可能的两个部分
硬件
- 网络接口卡 (NIC) - 连接到局域网所需的
- 电缆或天线 - 用于承载传输信号的
- 网络交换机 - 用于中继信号的
软件
- 程序 - 使用算法处理信息(位)的
与用于位的编码过程类似,网络也必须使用标准的相同理念。为了进行通信,它需要设备、消息格式和交互过程的标准。这些标准为通信提供了有序流程。
一旦我们有了这些标准,我们就可以检查是什么真正使网络运行起来。如前所述,计算机网络由两部分组成:硬件和软件。物理硬件为通信旅行铺平了道路,但不能使网络运行起来。软件(程序)是使计算机网络能够进行软件到软件通信的组成部分。
本章的重点将放在以下三个软件标准上
- 互联网协议套件
- 软件层
- 用于简化的抽象
了解所提供链接中的定义将为您提供本章材料的基础。
在分析允许网络通信所需的协议时,我们看到不同的协议被分层以创建抽象级别。这些抽象层用于上层和下层(参见下图)。
消息类比
假设计算机 A 要向计算机 B 发送消息。跟踪以下步骤以了解消息是如何通过两个代理栈发送的。
- 只有 A4 和 B4 可以访问物理邮箱以发送和接收包裹
- A1 将消息放入包裹中
- A2 向包裹添加序列号和跟踪号
- A3 添加地址标签
- A4 将包裹放在出站邮箱中
- 包裹到达 B4 的收件箱
- B3 接受发往 B 的包裹
- B2 检查使用序列号将包裹按顺序排列,并使用跟踪号向 A2 确认包裹
- A2 重新发送未确认的包裹
- B1 打开包裹重建原始消息
网络协议的工作方式相同,A1 到 A4 和 B1 到 B4 都是软件。A4 和 B4 之间使用的传递机制通常包括金属线、光纤电缆或空气中的无线电波。
传递机制
之前,我们已经建立了如何使用计算机 A 和计算机 B 传输信息。当今网络之间通信使用的两种传递机制是电路交换和分组交换。当您想到电话网络时,此网络需要在通信之前建立连接。例如,当您打电话给某人时,电话会响铃,直到对方接听或语音信箱启动;这种类型的通信称为同步通信。
使用分组交换的计算机网络恰恰相反。在使用分组交换时,每个分组(即一小包信息)都单独寻址和传递。该过程模拟了邮件包裹通过共享媒介(即卡车、火车、轮船和飞机)传递的方式。例如,当您寄信时,您不会等到收件人准备好。这种类型的通信称为异步通信。
我们已经看到了互联网的不同标准和/或协议。以下描述了互联网的不同特性,这在区分互联网和万维网时很重要。
- 通信基础设施(信息高速公路)
- 使用互联网协议 (IP) 的全球计算机网络连接
- 使用通信协议层:IP、TCP、HTTP/FTP/SSH
- 建立在开放标准之上:任何人都可以创建新的互联网设备
- 缺乏集中控制(大部分)
- 每个人都可以使用它,只需使用简单且常用的软件
万维网经常与互联网混淆,因为它与互联网一起使用。万维网只是互联网提供的众多服务之一。了解万维网的特征很重要(见下文)
- 可以使用万维网协议(HTTP-超文本传输协议)获取的分布式网页或文档的集合
- 使用互联网作为传递机制的服务(应用程序)
- 除其他服务外,运行在互联网上的服务之一:电子邮件、文件传输、远程登录等。
有两个角色共同构成万维网:Web 服务器和 Web 客户端(浏览器)。
Web 服务器
- 侦听网页请求并可以访问存储的网页的软件
- Apache、MS Internet Information Server (IIS)
Web 客户端(浏览器)
- 从 Web 服务器获取/显示获取的文档的软件
- Firefox、Internet Explorer、Safari、Chrome
统一资源定位符 (URL) 是网页位置的标识符。URL 系统是分层的(见下图)。
- edu:学校的 URL(不是 .com 或 .org)
- www.sbuniv.edu:西南浸信会大学 (SBU) 网站的 URL
- www.sbuniv.edu/COBACS/CIS/index.html:SBU 网站上位于以下路径的页面的 URL
定义网页的语言叫做 HTML。为了查看示例,请打开另一个标签页,并访问西南浸信会大学 CIS 部门网站。打开页面后,右键单击页面并选择“查看源代码”,这样你就可以看到用来创建网页的 HTML 代码。网页本身可能包含超文本(可点击的文本,充当链接)。链接只是一个指向另一个网页的定义 URL。网页和链接共同组成了万维网。
要注意如何在网上查找信息。请按照以下步骤查看此过程是如何运作的:使用分层系统(目录)查找可能包含信息的页面的 URL。
- 利用我们的知识进行猜测,例如,从 apple.com 开始导航到 iPhone 5s 页面。
- 使用搜索引擎。
-we look for information (wherever it is located) not pages -we may find information we did not know existed
搜索引擎是查找资源的主要来源之一。但是,您是否想过它们是如何运作的?有一系列步骤描述了使用搜索引擎时究竟发生了什么。
- 收集信息:爬取网页。
- 保存副本:缓存网页。
- 建立索引。
- 理解查询。
- 确定每个可能结果与查询的相关性。
- 确定相关结果的排名。
- 展示结果。
重要页面的衡量标准
搜索完成后,会提供相关页面。但是,并非所有显示的相关页面都被视为重要页面。一个网页只有在被信誉良好的来源排名后才会获得重要性。谷歌的创新之一是页面排名——衡量页面“重要性”的指标,它考虑了指向该页面的外部引用。一个页面根据指向它的重要页面的数量来判断其重要性。例如,一篇来自《纽约时报》的电子文章的页面排名会比个人博客更高,因为指向该在线文章的重要页面更多。