LSF简易使用手册Word格式.docx
- 文档编号:371616
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:9
- 大小:17.11KB
LSF简易使用手册Word格式.docx
《LSF简易使用手册Word格式.docx》由会员分享,可在线阅读,更多相关《LSF简易使用手册Word格式.docx(9页珍藏版)》请在冰点文库上搜索。
创建时间:
2006-12-1215:
54:
001
如果不采用–q选项,系统把作业提交到默认作业队列(作业队列详细介绍请看下一节)。
inputfile代表程序需要读入的文件名(例如namelist等),outputfile代表一个文件,作业提交后标准输出的信息将会保存到这个文件中。
COMMAND是用户要运行的程序。
(1)对于串行程序COMMAND可以直接使用用户的程序名
例如,对一个运行时间12小时内完成的串行作业mytest,提交方式为:
bsub–n1–qQS_Norm–omytest.out./mytest
(2)对于并行作业COMMAND为“–ampich_gmmpirun.lsf程序名”
因为并行作业必须用到MyriNET库,所以提交的时候必须使用
–ampich_gmmpirun.lsf
例如对于一个12个小时内完成,使用16个cpu的并行作业mytest,提交方式为:
bsub–n16–qQN_Norm–omytest.out–ampich_gmmpirun.lsf./mytest
目前,系统规定每个用户最多只能使用16个cpu。
3、使用脚本提交作业
bsub命令可以使用输入脚本多次提交具有相同参数的作业,格式为:
2006-12-1215:
002
#BSUB–nZ#BSUB–qQUENAME#BSUB–oOUTPUTFILECOMMAND
该脚本的参数与命令行
“bsub–nZ–qQUENAME–ooutputfileCOMMAND”参数相同。
提交时为bsub<
脚本名
例如要提交一个12小时内完成,需要16个cpu的并行作业mytest,可以编写作业脚本bsub.scriptfile
#BSUB–n16
#BSUB–qQN_Norm
#BSUB–omytest.out
–ampich_gmmpirun.lsf./mytest
作业提交方法为:
bsub<
bsub.scriptfile
二、LSF队列状况
LSF分了如下几个作业组:
1、长时间并行作业组(LSF管理)
(1)QL_Norm队列创建时间:
003
该队列用于运行长时间并行作业,作业不限执行时间。
作业规模限制为:
最多使用16个CPU。
2、串行作业组(LSF管理)
(1)QS_Norm队列该队列用于串行短时间作业,最长作业执行时间为12小时。
(2)QS_Long该队列专用于长时间串行作业,作业不限执行时间。
3、短时间并行作业组(LSF管理)
(1)QN_Norm队列该队列用于运行短时间并行作业,最长作业执行时间为12小时。
(2)QN_Debug队列
该队列用于调试或试算,最长作业执行时间为5分钟。
请用户根据自己的需求,选择适当的作业组进行作业提交。
附:
队列命名潜规则
新的队列命名遵循一定的潜规则,下面详细解释队列名中各字母的含义:
QL_Norm:
Q代表ques;
L代表long,表示该队列运行长时间并行作业;
QN_Norm:
N代表normal,表示该队列运行短时间
并行作业;
QS_Norm:
S代表serial,表示该队列运行短时间串行作业;
QS_Long:
S代表serial,表示该队列运行串行作业;
Long表示长时间运行;
(同中科院网络中心深腾6800)
三查看作业状态和删除作业等
几个常用的指令:
bjobs检查提交作业状态
bjobs
bjobs-w
bjobs–r显示正在运行的作业
bjobs–a显示正在运行的和最近完成的作业
bjobs-p显示等待运行的作业和等待原因
bjobs–s显示正在挂起的作业和挂起的原因
bjobs-l显示该作业的所有信息
bhist显示最近完成作业或正在运行作业的历史情况
bhist<
jobid>
bkill删除不需要的作业
bkill<
bkill–r<
bpeek当作业正在运行时显示它的标准输出,监视作业运行
bpeek<
bques显示队列信息
bques
bques–l<
quename>
bhosts显示各节点作业相关情况
bhosts
bhosts<
hostname>
lsload显示各节点负载信息
lsload
lsload<
lshosts处理各节点静态资源信息
lshosts
lshosts<
hostaname>
作业提交(命令行方式)
l队列设置(bques命令查看):
Parallel:
此队列有64个节点,计算网络是infiniband(40G),每个节点有12个计算核心,24G内存;
适合跨节点并行计算。
smp_high:
此队列有40个节点,计算网络是以太网,每个节点有12个计算核心,24G内存;
适合单节点内并行,或少量节点间通信的跨节点并行计算。
smp:
此队列有48个节点,计算网络是以太网,每个节点有8个计算核心,24G内存;
l应用设置(bapp命令查看):
amber
g03
gaussian(g09)
gromacs
ms
l脚本范例
Amber(把下面内容编写成脚本)
#BSUB-qsmp(选择队列)
#BSUB-appamber(应用)
#BSUB-o%J.out(结果输出文件,以作业号为文件名)
#BSUB-o%J.err(错误输出文件,以作业号为文件名)
#BSUB-aopenmpi(编译器)
#BSUB-n8(计算核心的数量)
mpirun.lsfsander.MPI-O-imin_2ojn.in-omin_2ojn.out-p2ojn.top-c2ojn.crd
-rmin_2ojn.rst-infmin_2ojn.inf
G03(把下面内容编写成脚本)
#BSUB-appg03(应用)
#BSUB-k"
/lustre/home/wangxj60"
(保存断点,作业停了可以继续运行)
g031reo6T-
3.gjf
G09(把下面内容编写成脚本)
#BSUB-qsmp_high(选择队列)
#BSUB-appgaussian(应用)
#BSUB-e%J.err(错误输出文件,以作业号为文件名)
#BSUB-n12(计算核心的数量)
#BSUB-R"
span[hosts=1]"
(12个计算核心在一台机器上)
g09TS3-4_
Gromacs(把下面内容编写成脚本)
#BSUB-qparallel(选择队列)
#BSUB-appgromacs(应用)
#BSUB-aintelmpi(MPI)
span[ptile=6]"
(每个节点用6个计算核心)
mpirun.lsfmdrun-v-smd.tpr-cmd.gro-emd.edr-omd.trr-gmd.log
MS
5.5(把下面内容编写成脚本)
#!
/bin/sh
#BSUB-qparallel
#BSUB-appms
#BSUB-o%J.out
#BSUB-e%J.err
#BSUB-n12
rusage[mslic=1]"
(判断模块license是否被占用)
/home/msi/Accelrys/MS55_IB/etc/DMol3/bin/RunDMol
3.sh-np2A
或者
/home/MS55/Accelrys/etc/DMol3/bin/RunDMol
Fluent(把下面内容编写成脚本)
#BSUB-appfluent
fluent3d-itest.jou-t8-gIB网络)((不限网络)
Matlab(把下面内容编写成脚本)
#BSUB-appmatlab
#BSUB-n1
matlab-nodisplay-rexample(example--->
example.m文件)
并行程序(自编)
自己编写程序提交方式,在配置文件中添加:
source/home/apps/intel/ictce/
4.0.
0.020/ictvars.sh
脚本样例:
#BSUB-qsmp
#BSUB-n8
#BSUB-aintelmpi
mpirun.lsf./并行可执行文件
作业提交
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- LSF 简易 使用手册