为什么我无法验证我的LSF配置并行计算工具箱?

2视图(30天)

接受的答案

MathWorks支万博1manbetx持团队
编辑:MathWorks支万博1manbetx持团队 2023年2月6日
有几个问题,可以防止集群的验证。运行以下下面的测试,以确保正确配置设置。如果在任何时候你收到一个错误消息,您可以提交请求安装支持使用链接在页面的底部。万博1manbetx当提交一个请求时,一定要包括以下几点:
——你的许可证号码
——MATLAB在客户机上的释放和集群
——你的输出验证(点击细节得到完整信息)
——下面的测试结果
1)测试MATLAB平行的许可服务器
第一步是确保许可MATLAB并行集群服务器工作。这也将在启动时测试看看MATLAB崩溃在你的集群。为了验证这一点,去一个集群节点,打开Windows命令提示符点击开始菜单,所有程序,附件,然后单击命令提示符。在命令提示符运行以下命令:
cd MATLAB \ bin美元(美元MATLAB是MATLAB在集群上的安装文件夹)
。/ matlab -dmlworker -nodisplay日志文件/var/tmp/output.txt - r“版本;退出”
这将生成一个输出。txt文件包含版本在/ var / tmp输出在集群上。如果日志文件中包含一个网络许可管理器错误,这是问题。在这种情况下,检查支持网站的许可管理器错误数和采万博1manbetx取适当的行动来解决授权错误在继续之前。
2)检查MATLAB在集群上的版本和客户端验证
如果你得到“版本”命令的输出日志文件,检查所有产品的版本在列表中。s manbetx 845每个产品的发布应该为所有的产品相匹配。s manbetx 845此外,释放应该匹配的版本,安装在客户机上运行验证。检查客户端的版本,运行版本命令在MATLAB命令窗口。如果并行计算工具箱的释放和MATLAB不匹配的释放MATLAB和MATLAB并行服务器集群,您将无法使用此配置,直到安装在同一版本。
3)检查以确保您的配置符合调度程序的要求
为了使用MATLAB与LSF并行服务器,有一些额外的要求设置。检查调度器需求页面在这里更多的细节:
此外,这种配置要求如下:
——LSF二进制文件需要从MATLAB访问客户端运行并行计算工具。如果客户机没有二进制文件,建议远程访问的一个集群节点MATLAB运行客户端。
——你的集群应该完全均匀。混合不同的平台或分布不推荐尤其是对并行计算。
——这种配置要求工作的数据被存储在一个共享文件空间和客户之间的集群节点。在创建配置,设置“DataLocation”变量是一个可以访问所有计算机的路径。
——因为“DataLocation”变量需要访问相同的路径从所有计算机,您不能使用不同平台的客户机(例:运行Windows客户端访问Linux集群)。
如果上面的4个需求没有得到满足,不支持默认LSF配置。万博1manbetx在这种情况下,仍然可以提交到集群的工作。这个设置,请参阅相关的解决方案:1-34TP79——“我怎样才能与LSF调度器使用MATLAB分布计算产品的非共享文件系统?”s manbetx 845
4)检查,以确保您已经正确配置客户端配置
在您的客户端MATLAB,去平行管理配置菜单。右键单击您的LSF配置并选择Properties。ClusterMatlabRoot必须设置适当的值(MATLAB在集群上安装的目录),DataLocation(将存储的数据,注意:这一定是可以从相同的路径从所有电脑),ClusterOsType(基于unix或PC),和HasSharedFilesystem(应该设置为True)。
如果你有一个集群的混合不同的操作系统,您必须使用“SubmitArguments”领域的目标只有一个类型的操作系统。例如:
“- r”类型= = NTX86””——目标32位Windows
“- r”类型= = NTX64””——目标64位Windows
“- r”类型= = LINUX86””——目标32位Linux
“- r”类型= = LINUX64””——目标64位Linux
注意:在集群上运行“lshosts”命令,并使用“类型”列的类型,你应该目标。
如果你有确认上面所有的设置,所有在验证阶段失败,或者只是平行和Matlabpool吗?如果你能通过分布式工作阶段,验证可能报告虚假错误。确认您可以手动验证您的集群。这样做:

1。分布式的工作:

运行一个简单的分布式工作,运行以下:
lsf = findResource (“调度”,“配置”,“< ConfigurationName >”)
其中< ConfigurationName >是您创建的配置的名字吗
工作= createJob (lsf);
createTask(工作,@sum 1 {[1]});
createTask(工作,@sum 1 {[2 2]});
createTask(工作,@sum 1 {[3 3]});
提交(工作)
waitForState(工作,“完成”、60)
确认工作完成后,运行以下:
结果= getAllOutputArguments(工作)
如果您将得到下面的输出,您的集群配置和操作正确。
结果=
[2]
[4]
[6]

2。并行作业:

在完成分布式工作,运行以下:
pj = createParallelJob (lsf);
createTask (pj @labindex 1, {});
集(pj,“MaximumNumberOfWorkers”3);
集(pj,“MinimumNumberOfWorkers”3);
提交(pj)
waitForState (pj,“完成”、60)
确认工作完成后,运行以下:
结果= getAllOutputArguments (pj)
如果您将得到下面的输出,您的集群配置和操作正确。
结果=
[1]
[2]
[3]

3所示。MATLAB池工作:

要测试MATLABPool或PMODE,只需运行该命令:
matlabpool打开< ConfigName > < #实验室>
其中< Configname >是配置的名称和< #实验室>是集群中的节点使用的数量。
如果你返回提示,您的配置工作。戒烟MATLAB池,只需输入“退出”。
如果MATLAB池没有开始和你没有收到一个错误消息,试着运行:
setSchedulerMessageHandler (@disp)
然后上面的MATLAB池的命令。这应该捕获错误消息,转发给MATLAB命令窗口。
如果手动测试通过,您的配置工作,您应该能够提交工作。
如果你仍然有一个问题,联系安装支持:万博1manbetx
请注意
:从R2019a以下名称发生变化:
  • MATLAB分布式计算服务器改名为MATLAB并行服务器
  • mdce_def mjs_def改名为
  • mdce二进制改名为乔丹

更多的答案(0)

标签

没有标签了。

s manbetx 845


释放

R2009b

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!