跳转到内容

构建 Beowulf 集群/安装、配置和管理

来自维基教科书,开放的书籍,开放的世界

在本章中,您将找到安装、配置和管理的基础知识。这里最重要的是:1. 使用 DHCP 设置网络,2. 使用网络文件系统 (NFS) 在网络上共享文件。在介绍完这些内容后,我们将探讨一些更通用的管理理念。

大多数 Beowulf 集群使用主节点(也称为网络头节点)和从节点的网络结构,以便将计算作业从主节点分发到从节点。集群的所有机器都连接到交换机。头节点将额外地与外部网络连接。主节点和从节点将在网络上共享用户数据。第一步,最容易只安装主节点和一个从节点(称为黄金从节点)。在后面的章节中,我们将介绍克隆,这是创建与黄金从节点相同的机器的过程。作为克隆的替代方案,可以选择进行无盘引导。

实际上,这意味着主节点(或头节点)具有两个网络接口(例如 eth0、eth1),一个连接到外部世界,另一个通过网络交换机连接到集群内部网。所有其他计算机(从节点或节点)都连接到交换机。为了在集群上启动进程,用户在主节点上登录,并从那里将进程生成到从节点。

华夏公益教科书