HPUX系统维护手册.docx
- 文档编号:16330427
- 上传时间:2023-07-12
- 格式:DOCX
- 页数:87
- 大小:366.26KB
HPUX系统维护手册.docx
《HPUX系统维护手册.docx》由会员分享,可在线阅读,更多相关《HPUX系统维护手册.docx(87页珍藏版)》请在冰点文库上搜索。
HPUX系统维护手册
HP-UX系統维护手册
第一章、故障诊断
一、硬件故障诊断
1.电缆连接
注意计算机及各外设之间连线接触良好,不要无故拔插电缆;如果发生计算机不能识别某个设备,有可能是电缆的接触问题。
2.硬件状态指示灯
如果发现系统工作不正常,可以观察硬件状态指示灯的情况。
开机后系统将自动完成自测试,诊断及引导启动代码。
检测顺序大致为:
高速缓存,中央处理器,总线,内存,I/O设备。
当检测到相关的硬件时,对应的显示灯会亮。
硬盘,软盘,磁带机及光盘驱动器自检时,能从前面板上看到相应的灯亮一下,表明系统已经识别到上述设备。
相反,如果某驱动器的自检灯没亮,很可能是该设备有问题。
另外,主机背后的SCSI接口卡及网络接口卡上的自检指示灯亮为正常状态。
否则,可能该接口卡有问题。
发现这种问题,请马上与HP联系,考虑更换备件。
3.错误代码
每次开机后,系统都会自动进行硬件自检及初始化,假如系统出现硬件故障,一般都不能正常启动,并在液晶显示屏及控制台上相应的显示出错误代码及出错信息。
若屏幕上出现ERROR且液晶显示上出现FLT,表明有故障发生,应根据上述提示确定故障点。
绝大部分硬件错误都能在自检时暴露出来,在液晶显示及控制台的左下角都有四位错误代码,格式:
FLTxxxx.
分析这四位代码可以进一步检测出故障的情况。
如下表列出了K系列计算机的错误代码,相应的故障原因及解决方案。
二、软件故障诊断
常用命令来查看系统状态。
1.#ioscan-fn
列出各I/O卡及设备的所有相关信息:
如逻辑单元号,硬件地址及设备文件名等。
2.#ps-ef
列出正在运行的所有进程的各种信息:
如进程号及进程名等。
3.#netstat-rn
列出网卡状态及路由信息等。
4.#lanscan
列出网卡状态及网络配置信息。
5.#bdf
列出已加载的逻辑卷及其大小信息。
6.#mount
列出已加载的逻辑卷及其加载位置。
7.#uname-a
列出系统ID号,OS版本及用户权限等信息。
8.#hostname
列出系统网络名称。
9.#pvdisplay-v/dev/dsk/c*t*d*
显示磁盘各种信息,如磁盘大小,包含的逻辑卷,设备名称等。
10.#vgdisplay-v/dev/vg00
显示逻辑卷组信息,如包含哪些物理盘及逻辑卷等。
11.#lvdisplay-v/dev/vg00/lvol1
显示逻辑卷各种信息,如包含哪些盘,是否有镜像等。
三、网络故障
1.如需修改网络地址、主机名等,一定要用set_parms命令
#set_parmshostname
#set_parmsip_address
2.查看网卡状态:
lanscan
HardwareStationCrdHardwareNet-Interface
PathAddressIn#statenameunitstate
8/20/5/10x0800097843FB0uplan0up
3.确认网络地址:
#ifconfiglan0
4.启动网卡:
#ifconfiglan0up
5.网络不通的诊断过程:
lanscan查看网卡是否启动(up)
ping自己网卡地址(ip地址)
ping其它机器地址,如不通,在其机器上用lanscan命令得知stationaddress,然后linkloopstation_address来确认网线及集成器是否有问题。
在同一网中,subnetmask应一致。
6.配置网关
手动加网关:
/usr/sbin/routeadddefault20.08.28.981
把网关自动加入系统中
vi/etc/rc.config.d/netconf:
ROUTE_DESTINATION[0]=default
ROUTE_GATEWAY[0]=20.08.28.98
ROUTE_COUNT[0]=1
:
/sbin/init.d/net将执行:
/usr/sbin/routeadddefault20.08.28.981
命令netstat-rn查看路由表
另外也可用set_parmsaddl_netwrk来设缺省路由。
第二章、系统维护
注:
日常基本维护
1.开关机步骤
关机:
(在HP1或hp2机上做都可)
1、运行cmhaltcl–v–f关闭mc
2、shutdown–h–0关闭主机hp1,hp2
3、关闭电源:
①主机②磁盘阵列③磁带库
开机:
1、电源:
①磁带库②磁盘阵列③主机
2、启动mc:
root注册
运行cmruncl–v
检查mc状态:
注册root
运行cmviewcl-v
2.用户组及用户管理
参见手册HP-UXSystemAdministrationTasks
3.文件系统维护
发现文件系统已满,应及时删除无用文件或扩大文件系统。
4.系统日常管理
系统管理员最好用sam(SystemAdministratorManager)来进行系统管理。
sam是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。
5.系统备份
备份是保护用户数据不丢失的重要手段。
一般系统备份的要求如下:
A.每一台机器的操作系统至少有一个全备份。
B.每天备份用户数据。
C.操作系统配置修改后重新备份操作系统。
6.定时清洗磁带机
7.定时检查设备指示灯状态
8.简单故障的判断
9.熟悉HP-UX操作系统
一、关于HP-UX的硬盘资源的逻辑卷管理
HP-UX管理硬盘存储资源是采用逻辑卷方式来进行管理的,要说清整个机制,先要介绍几个概念:
物理卷PhysicalVolume,称为PV:
指物理上硬盘,一个硬盘就是一个PV
逻辑卷组LogicalVolumeGroup,称为VG:
一个VG包含整数个PV,可理解为一个大硬盘。
逻辑卷LogicalVolume,称为LV:
相当于对大硬盘进行逻辑分区,一个VG里可有若干个LV。
文件系统FileSystem:
在逻辑卷的基础上,可建立文件系统,然后MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。
当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。
根据以上介绍,在HPUX下正确使用硬盘的顺序及相应命令如下:
#diskinfo/dev/rdsk/cCdDtT
#insf-e
1.先建物理卷:
#pvcreate–f/dev/rdsk/cCdDtT
这里必须使用硬盘的字符设备文件
2.再建逻辑卷组:
#mkdir/dev/vg0XX:
0~f,逻辑卷组名
#mknod/dev/vg0X/groupc640x0X0000
#vgcreatevg0X/dev/dsk/cCdDtT
3.然后划分逻辑卷:
#lvcreate–Lsizevg0Xsize:
该逻辑卷大小
4.在LV上建文件系统:
#newfs–Ffile_system_type/dev/vg0X/rlvolY
file_system_type:
文件系统类型,包括hfs和vxfs,注意此时用该逻辑卷的字符设备文件。
5.将此文件系统Mount到一个目录下:
#mkdir/directory
#mount/dev/vg0X/lvolY/directory
到此为止,您已经可以使用这个硬盘了。
有时您可能在现有的环境下,需要添加、删除逻辑卷,或者是需要扩大文件系统。
我们可以这样做:
6.添加逻辑卷
添加文件系统卷。
例如:
在卷组vg01上添加一个200M的文件系统逻辑卷,逻辑卷名为data,mount到目录/sample上。
A、创建逻辑卷,在系统提示符下键入命令:
#lvcreate–L200–ndata/dev/vg01
B、在逻辑卷data上创建文件系统:
#newfs–Fhfs/dev/vg01/rdata
注:
如果是vxfs文件系统,则用
#newfs–Fvxfs/dev/vg01/rdata
C、创建目录/sample,并将逻辑卷datamount到/sample上.
#mkdirsample”
#mount/dev/vg01/data/sample
D、用bdf命令,将会看到/dev/vg01/datamount到/sample上。
7.删除逻辑卷
例如:
删除卷组vg01中名为data的逻辑卷,mount到/sample。
1)卸载所要删除的逻辑卷:
A、首先用umount命令将逻辑卷data从/sample上卸载下来:
#umount/sample
B、若系统提示设备忙,不能卸载;则在根目录系统提示符下,键入以下命令,进入单用户:
#shutdown-y0
在单用户模式下,先将所有逻辑卷mount上,键入命令:
#mount-a
用bdf命令看该逻辑卷是否已经mount上,如果mount上,键入以下命令:
#umount/sample
2)删除逻辑卷/dev/vg01/data,用命令:
#lvremove/dev/vg01/data
8.扩大文件系统
1)扩大文件系统,首先要找到这个文件系统所对应的逻辑卷,只有首先扩大逻辑卷,给文件系统以扩大的空间,才能扩大文件系统。
2)为扩大逻辑卷,先进入单用户模式,在根目录系统提示符下,键入命令:
#shutdown-y0
3)进入单用户后,先将所有文件系统mount上,键入命令:
#mount-a
4)用bdf命令看该文件系统是否已经mount上,如果mount上,用命令umount该文件系统,键入命令:
#umount/usr
5)想要扩大“/usr”到500M,就键入命令:
#lvextend-L500/dev/vg00/lvol4
这里,假定/usr对应/dev/vg00/lvol4
6)用命令:
#extendfs/dev/vg00/lvol4扩大文件系统。
注:
如果是vxfs文件系统,则用
#extendfs-Fvxfs/dev/vg00/lvol4
7)用命令:
#mount/dev/vg00/lvol4/usr
将文件系统mount到/usr
这样,文件系统“/usr”就被扩大了,
8)用命令:
#init3进入原来多用户运行级。
9.unix的文件系统
1)UNIX的文件系统是树状结构,从根开始,从表面上看,文件系统好象是一个整体,但实际上,文件系统可以分成不同的部分,单独占据一块逻辑卷,就是一个文件系统。
2)UNIX的文件系统可以分为四种类型:
HFS
VXFS
CDFS
LOFS
3)在HPUX中,有下列文件系统:
“/”根文件系统
“/usr”,“/sbin”操作系统的一部分。
“/opt”和Application有关的文件系统。
“/etc”mount到此目录下的文件系统包含系统配置文件
“/var”mount到此目录下的文件系统,其中的文件为系统启动,运行
等等产生的报告文件。
“/stand”包含操作系统核心(Kernel)的有关文件。
“/tmp”包含系统临时文件。
“/dev”包含所有的设备文件,但它不是一个单独的文件系统,
它只是在根目录下的一个目录。
二、关于系统主控台Console的说明与设置
如果将我们诊断用户的故障电话进行分类,其中相当一部分的问题是出在Console的设置上。
通常的现象是Console上没有系统显示,或是键盘被锁住等。
用户往往认为是主机的问题,其实不然。
下面我们简单介绍一下:
小型机控制台能正常运行的缺省配置是:
REMOTEMODEON(带*号)
MEMORYLOCKOFF(不带*号)
LINEMODIFYOFF(不带*号)
MODIFYALLOFF(不带*号)
BLOCKMODEOFF(不带*号)
查看上述配置的方法,如下:
在小型机控制台的键盘上方有一排功能键F1-F8,在功能键F4与F5之间有Menu和UserSystem两个键。
当要查看小型机控制台的参数配置时,首先按UserSystem键,这时在小型机控制台屏幕的最下面一行显示出8个高亮度的方块,每个方块从左到右分别对应功能键F1到F8;
再按功能键F4,表示选择Modes,依然是8个亮方块,但是方块上的文字改变了。
依照上述5个参数的名称检查相应的方块,看是否正确地配置了。
如果没有,按与方块对应的功能键进行改变,直到所有参数正确地配置好。
最后按Menu键退出。
此外,这里介绍一种快速解决Console故障的方法:
1.关闭Console电源
2.摁住CTL+D键,开Console电源,直到听到“笛”声,松开按键。
3.稍等片刻,在屏幕左下角将出现“Defaultconfigsused,Pressenterclear”字样,按enter后一切恢复正常。
4.如果F4键位置的RemoteMode没有*号,摁F4加上*
以上做法实质上是为了恢复Console缺省设置。
三、系统的开关机和PDC简介
系统启动阶段的操作可用下述流程图来概括:
所以,一般地说,系统开关机应遵循以下步骤:
开机
1)打开总电源。
2)打开计算机机柜电源
3)打开外部设备电源.(如磁盘阵列,磁盘柜等)
4)打开主机电源.
关机
1)进行操作系统的关闭(shutdown-h-y0)
2)关闭主机电源.
3)关闭外设电源(对于Autoraid的磁盘阵列,需要对其进行软件关闭,才可关闭电源)
4)关闭其他设备电源和总电源.
在启机过程中,当Console上出现10秒中断时,若敲击任一键,则启动过程将停在如下状态下:
mainmenu>
这就是所谓的PDC(ProcessorDependentCode)。
在该状态下,系统管理员可完成如下管理工作:
1.查看Primary,AlternateBootPath
mainmenu>pa
就会列出Primary,AlternatePath。
2.搜寻硬盘等可Boot机设备
mainmenu>sea
系统会列出所有可由它控制的硬盘的硬件地址及CD-ROM、DDS和Build-inLan的硬件地址。
所以,有时可用此方式判断系统不能boot机是否与根盘有关。
3.进单用户
mainmenu>bopri
interactwithISL?
yes
ISL>hpux–is
4.检查HPMC代码
象诸如CPU、内存、总线等的硬件故障,都会产生HPMC(highpriorityMechineCheck)Code,那么查看的方法是:
MainMenu>ser
ServiceMenu>pim
如遇硬件问题,您打电话到惠普响应中心,硬件工程师极有可能请您帮助获得HPMCCode。
5.继续启动过程
MainMenu>bopri
InteractwithISL?
no
6.CtrlB进管理界面
7.此外,再介绍一下如何观察系统启动时行自检的相应信息
a、系统启动时的自检信息反映出自检的过程和结果,在主机的液晶屏上可以看到这些信息,比如“7XXX”,一般表示和内存有关的信息。
这些信息都可以查阅有关的手册得知其具体的意义。
如果自检失败,相应的信息就会停留在主机的液晶屏上,根据这个信息就可以知道失败的原因。
b、机器启动之后,在CTRL+B的SL命令可以看到最后50个信息,但是,随着CHASSIS信息的不断显示,自检信息就会被冲掉。
因此,系统启动之后,这些信息就看不到了。
c、引导过程到硬盘时,会有配置硬件的信息,这些信息可以通过“#desg”命令和/usr/adm/syslog/syslog.log文件看到,相应运行级调用的shell程序过程可以在“/etc/rc.log”中看到。
四、HPSecureWebConsole的配置与维护
HP的SecureWebConsole为系统管理员提供了一个基于Web的、更为方便的接入Console的手段。
系统管理员只需在任意一台能够ping通WebCon-sole的PC上,启动网络浏览器,输入WebConsole的IP,即可得到服务器Console的界面。
配置WebConsole,应按以下步骤:
1.初始化WebConsole:
1)将WebConsole接入局网。
其预设置的IP地址为192.0.0.192。
2)在您的PC上,运行以下命令:
routeadd192.0.0.192Local_IP_address
3)确保能够ping192.0.0.192。
4)在PC上运行网络浏览器,输入URL:
http:
//192.0.0.192,得到WebConsole配置菜单。
按菜单提示输入AdminAccount用户名和密码,将其IP改为本局网IP地址(确保IP不要重复)和子网掩码。
2.使用WebConsole
1)用普通Console的串口线,一端接服务器LocalConsole口,另一端接WebConsole的串行口。
2)在PC的浏览器上,输入WebConsole当前的IP地址。
即进入其LOGIN窗口,按要求输入在配置时创立的AdminAccount用户名和密码;则进入服务器Console界面,用鼠标点击AccessConsole,黑色的Console窗口出现在屏幕右方;点击In/Out可放大Console窗口。
五、有关存储设备维护
磁带机磁带库磁盘阵列
8.DDS-3磁带机
9.磁带机设备文件命名简介
由于磁带机的设备文件有不止一个,而多数系统管理员对其不甚了解,所以在此举几个例子来逐一说明之:
/dev/rmt/c1t3d0BESTBEST=使用可能的最高密度方式存储
/dev/rmt/c1t3d0sQIC150nbQIC-150格式,不倒带,Berkeley
/dev/rmt/c1t3d0D8MM8500C(Namescanbequitedescriptive)
/dev/rmt/0m最通用的方式
设备文件"dev/rmt/c1t0d0BESTnb"的意义
dev=devicefile设备文件
rmt=rawmagnetictape磁介质磁带
c1=该磁带机连接在instancenumber为1的bus上
t0=该磁带机的scsiid为0
d0=该磁带机的unitaddress为0,
BEST=该磁带将以最大容量方式写数据
(meaning"packasmuchontothistapeasispossible")
n=当退带时,不倒带
b=该设备将使用Berkeley形式
六、日常设备维护检查
序号
项目
检查及服务内容说明
结果
备注
1
系统硬件
2
文件系统
3
系统日志
4
网络状况
5
启动过程
6
卷管理
7
性能分析
8
数据库系统应用
9
MC/SG群集
.
10
应用系统
11
其他
1.系统及网络状态的监测
主要监测以下几个方面:
v面板指示灯
v硬件在系统中的配置
v文件系统
v日志文件
2.面板指示灯的监测
v液晶显示屏
如果系统启动时或运行中down机时,液晶显示停在某一非正常运行状态,如FLTXXXX,或INITXXX,则表明可能有硬件错误(CONSOLE上出现ERROR)
v前面板指示灯有:
a、磁带机驱动器、
b、光盘驱动器状态灯。
c、电源指示灯、
d、软(硬)驱动器指示灯。
一般情况下,黄色指示灯不停闪烁,无法终止时表明可能有硬件故障。
此时应尽快联系HP硬件工程师帮助诊断并维修。
v后面板指示灯有:
a、F/WSCSI接口卡终结器(TERMPOWER-F/WDIFFSCSI)指示灯
ON:
表示F/WSCSI卡配置的终结器工作正常
OFF:
表示F/WSCSI卡配置的终结器保险丝损坏
b、SCSI接口卡自检灯(Self-TestLED)当硬件自检时灯闪烁,自检完成(超过5秒钟)后灯灭,表示工作正常。
当自检完成后灯仍亮则说明该卡有故障。
c、调制解调器:
Transmit灯:
有信号发出时发光
Receive灯:
接收信号时发光
d、网络接口卡:
K系列(如K210、K410)Transmit灯:
信号发出时发光
LinkBeat灯:
接收信号时发光
D系列(如D350)LinkBeat灯:
ON:
表示网络通信正常
OFF:
网络通信可能有故障
e、HP服务支持MODEM各LED的含义:
TR:
传输状态CD:
载波检测
OH:
在线连接RD:
读入信号
AA:
自动应答SD:
发出信号
3.在系统中查找设备配置
#dmesg
内存
CPU
外设(I/O接口卡,磁盘设备etc.)
root,swap,dump设备分配信息
注:
dmesg是从Kernel缓冲区里读出的数据
#ioscan-fn(扫描实际硬件)
#ioscan-kf(扫描KernelI/Osystem)
内存
CPU
外设(I/O接口卡,磁盘设备etc.)
4.检查文件系统使用情况
#bdf
Filesystemkbytesusedavail%usedMountedon
/dev/vg00/lvol167733355612539858%/
/dev/vg01/lvol12048011675824759%/home
各列的含义:
Filesystem:
文件系统名
kbytes:
字节数,以k为单位
used:
已使用空间
avail:
尚可使用空间
%used:
已使用空间占本文件系统全部空间比率。
Mountedon:
安装目录
在下列两种情况下,系统管理员应考虑做必要的文件清理工作:
v%used达到90%以上时
vavail显示字节数较小时(如小于10K)
5.日志文件的监测
文件名文件内容监测方法
/etc/rc.log/etc/rc运行记录用读取文本文件的方法
/var/adm/syslog/syslog.log一般系统日志注意提示信息及对应的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HPUX 系统维护 手册
![提示](https://static.bingdoc.com/images/bang_tan.gif)