主要内容

使用通用计划程序界面进行配置

通用调度器接口提供了配置MATLAB交互的灵活性®客户端、MATLAB工作人员和第三方调度程序。当您希望完全自定义MATLAB与调度器设置的接口时,请使用通用调度器接口。

在以下情况下,必须使用通用计划程序界面:

  • 将MATLAB与第三方调度器接口,无需开箱即用的支持。万博1manbetx具有开箱即用支持的调度器有Slurm、PBS Pro、Torq万博1manbetxue、LSF和HPC Server。

  • 在MATLAB客户端和集群节点之间接口MATLAB和第三方调度器,这些调度器没有共享文件系统。

  • 使用没有安装第三方调度器工具的MATLAB客户机。

与第三方调度器接口

通用调度器接口提供了一种从并行计算工具箱获取任务的方法™ 与调度程序和群集节点的客户端会话。要实现这一点,您必须为MATLAB客户端提供一组插件脚本。这些脚本包含特定于群集基础结构的说明,例如如何与作业调度器通信,以及如何将作业和任务数据传输到群集节点。

万博1manbetx支持脚本

为了帮助您与调度程序交互,MathWorks®为以下第三方调度程序提供附加组件或插件,您可以从附加组件管理器下载和安装它们。

  • 并行计算工具箱插件MATLAB并行服务器™与Slurm

  • 并行计算工具箱插件MATLAB并行服务器使用IBM平台LSF

  • 并行计算工具箱插件MATLAB并行服务器使用网格引擎

  • 并行计算工具箱插件MATLAB并行服务器与PBS

  • 并行计算工具箱插件MATLAB并行服务器与神鹰

首页选项卡,环境区域,点击附加组件.在附加组件资源管理器中,搜索附加组件并安装它。安装程序包括一个向导,指导您为集群配置创建集群配置文件。

或者,你可以从以下位置下载插件:

要安装一个插件,在MATLAB中双击或拖放它。

每个安装程序为三种可能的提交模式创建脚本:

  • Shared—当客户端可以直接提交给调度程序,并且客户端和集群机器有一个共享的文件系统时。

  • 远程——当客户机和集群计算机具有共享的文件系统,但客户机计算机不能直接提交给调度程序时,例如当没有安装调度程序的客户机实用程序时。在这种情况下,远程主机使用ssh协议。

  • 非共享—当客户端和集群计算机没有共享的文件系统时。此模式使用ssh协议使用远程主机向调度程序提交命令,它使用sftp将作业和任务文件复制到集群文件系统的协议。

每个提交模式在安装文件夹中都有自己的子文件夹。这些子文件夹包含自述文件,提供关于如何使用脚本的具体说明。在使用脚本之前,请确定哪种提交模式描述您的网络设置。

如果要自定义插件脚本的行为,可以设置其他属性,例如AdditionalSubmitArgs. 有关详细信息,请参阅自定义示例插件脚本的行为

如果某个支持包不支持您的调度程序或集群配置,建议您修改其中一个包的脚本。万博1manbetx有关如何为通用调度器编写一组插件脚本的更多信息,请参见通用调度器的插件脚本(并行计算工具箱)

创建通用群集配置文件

LSF的示例设置

此示例显示如何设置群集配置文件以使用通用调度器界面。它显示了在客户端和群集计算机之间没有共享文件系统的网络中设置LSF调度程序。下图说明了群集设置:

在这种类型的配置中,作业数据从运行Windows操作系统的客户端主机复制到运行UNIX®操作系统的集群(集群登录节点)上的主机。从集群登录节点,LSFbsub命令将作业提交给调度程序。当作业完成时,它的输出被复制回客户机主机。

需求

设置必须满足以下条件:

  • 客户端节点和群集登录节点必须支持万博1manbetxsshsftp

  • 集群登录节点必须能够调用bsub命令将作业提交给LSF调度程序。你可以在自述归档非共享子文件夹。

运行LSF安装程序

  1. 从下面下载LSF的安装程序在这里

  2. 通过从MATLAB客户机中打开文件来运行安装程序。

安装程序将插件脚本下载到非共享安装文件夹中的子文件夹。安装程序向导将指导您完成创建和验证群集配置文件的步骤。

验证集群概要文件和安装

您可以指定在验证配置文件时要使用的工作人员数量。如果不指定worker的数量验证选项卡,然后验证过程尝试使用与NumWorkers财产的属性标签。您可以指定较少的工作进程来验证配置,而不占用整个集群。

  1. 从MATLAB桌面启动群集配置文件管理器。上首页选项卡,环境区域,选择平行>创建和管理集群

  2. 在清单中选择集群配置文件。

  3. 单击验证选项卡。

  4. 使用复选框选择所有测试或验证阶段的子集,并指定验证配置文件时要使用的工作人员数量。

  5. 点击验证

这个验证“结果”选项卡显示输出。下图显示了通过所有验证测试的概要文件的结果。

如果验证失败,请联系MathWorks安装支持团队万博1manbetx

如果您的验证通过,您就有了一个有效的概要文件,可以在其他并行应用程序中使用。您可以对您的配置文件进行适合您的应用程序的任何修改,例如NumWorkersRange,AttachedFiles附加路径

要为其他用户保存您的配置文件,请选择该配置文件,然后单击出口.然后将您的配置文件保存到一个文件在方便的位置。当运行群集配置文件管理器时,其他用户可以通过单击导入您的配置文件进口

要了解如何分发通用的集群配置文件和插件脚本供其他人使用,请参阅分发通用集群配置文件和插件脚本

手动配置集群配置文件

如果您想修改现有的通用集群概要文件,您可以手动配置概要文件。如果你是第一次创建配置文件,你正在使用提供的支持脚本之一,使用安装向导代替:万博1manbetx运行LSF安装程序.下面的步骤手动复制安装程序执行的配置。您可以根据您的设置修改任何这些选项。

  1. 在客户端主机上启动MATLAB会话。

  2. 从MATLAB桌面启动群集配置文件管理器。上首页选项卡,环境区域,选择平行>创建和管理集群

  3. 通过选择在集群概要文件管理器中创建一个新的概要文件添加>自定义>通用的

  4. 在列表中选择新概要文件后,选择重命名并将配置文件名称更改为InstallTest.新闻输入

  5. 属性选项卡上,选择编辑并提供以下字段的设置:

    1. 设置描述字段测试安装

    2. 设置JobStorageLocation将作业和任务数据存储在客户机机器上的位置(而不是集群位置),例如,C: \ Temp \ joblocation

      你不能分享JobStorageLocation运行不同版本的并行计算产品。s manbetx 845集群上的每个版本都必须有自己的版本JobStorageLocation

    3. 设置NumWorkers要测试安装的工作进程数。

    4. 设置NumThreads要在每个辅助线程上使用的线程数。

    5. 设置丛生根到MATLAB的安装位置,在工人机器上运行。

    6. 如果群集使用联机许可,请设置RequiresOnlineLicensing为true。

    7. 如果你设置RequiresOnlineLicensing真正的,输入您的许可证号码

    8. 设置操作转移到集群工作计算机的操作系统。

    9. 设置共享文件系统.此设置表示客户端节点和工作节点不能共享相同的数据位置。

    10. 设置PluginScriptsLocation到插件脚本的位置。在本例中,位置为非共享LSF安装文件夹中的子文件夹。作为中使用示例脚本的一部分非共享提交模式,在步骤中设置属性KL

    11. 附加属性表中,选择添加.指定一个带有名称的新属性ClusterHost价值集群主机名称,和类型一串

    12. 附加属性表中,选择添加.指定一个带有名称的新属性RemoteJobStorageLocation价值/ /分享/ joblocation网络,和类型一串

  6. 点击完成保存群集配置文件更改。该对话框如下所示:

要检查概要文件是否正常工作,请按照下面的步骤执行验证验证集群概要文件和安装

特殊配置

根据您的集群体系结构,您可能需要在连接到通用调度器之前执行额外的任务。

定制的MPI构建

您可以使用不同于“并行计算工具箱”提供的MPI构建。有关在通用调度器接口中使用此选项的详细信息,请参见在UNIX系统上使用不同的MPI构建

运行与网格引擎系列的通信作业

网格引擎系列的示例脚本依赖于matlab并行环境。并行环境是为集群中进行并行计算而设计的编程环境。运行通信作业MATLAB并行服务器和网格引擎族群集,则必须建立matlab并行环境。

创建并行环境。下面的步骤创建并行环境,然后使其在所有队列上都可运行。作为最佳实践,请在集群的头节点上执行这些步骤。有些步骤需要管理员访问。

  1. 从下面下载并运行Grid Engine的安装程序网格引擎的家庭。

  2. 导航到安装文件夹中与你的提交模式相关的插件脚本的位置。

  3. 修改matlabpe.template要使用你想要的槽数和正确的位置startmatlabpe.shstopmatlabpe.sh文件夹。这些文件可以存在于所有主机都可以访问的共享位置,也可以将它们复制到每个主机上的同一位置。您还可以更改其他值或向中添加其他值matlabpe.template适合您的集群。有关更多信息,请参阅斯古佩文档提供与您的调度程序。

  4. 添加matlab并行环境,使用shell命令,如:

    qconf-Ap matlabpe.template

  5. 使matlab并行环境可在所有队列上运行:

    qconf mq all.q
    此命令将打开一个文本编辑器,供您进行更改。搜索线路pe_列表,并加上matlab

  6. 确保您可以向PE提交一份琐碎的作业:

    $ echo "hostname" | qsub -pe matlab 1

  7. 使用qstat检查作业是否正确运行,并检查输出文件是否包含运行作业的主机的名称。输出文件的默认文件名为~/STDIN.o###,在那里# # #是网格引擎作业号。

如果您将并行环境的名称改为matlab,也改变提交函数。

在Windows集群上配置防火墙

如果您在集群节点上使用Windows防火墙,可以将MATLAB添加为允许的程序。

在以下说明中,matlabroot指MATLAB安装位置。

  1. 以具有管理权限的用户登录。

  2. 在DOS命令窗口中执行以下脚本:

    matlabroot \工具箱\ \ bin \ addMatlabToWindowsFirewall.bat平行

如果您正在使用其他防火墙,则必须单独配置这些防火墙,以将MATLAB添加为允许的程序。

相关的话题