AIX操作系统维护详解 联系客服

发布时间 : 星期二 文章AIX操作系统维护详解更新完毕开始阅读028ba33d5727a5e9856a61cc

查找出当前目录下占空间最大的子目录,逐层往下直到找出占空间最大的文件(要区分哪些目录是文件系统的 mount point,哪些是文件系统的子目录)。删除文件,释放空间。有时删除文件后空间并不马上释放,这是由于删除的文件正被某个程序打开。只有当这个程序停止 后,空间才释放,有时甚至需要重启系统。

处理方法2:增加文件系统大小 # smitty chjfs

只要卷组?VG?中有剩余空间,文件系统可以在任何时候加大。 (2)检查文件系统的完整性 # umount filesystem_name # fsck -y filesystem_name

注意:文件系统必须先umount,再做检查和修复,否则将导致未知的后果。 (3)查看卷组信息

查看是否有“stale”状态的逻辑卷。若有,用syncvg命令修复。 (4)检查内存交换区使用率

检查使用率是否超过70%,若超过则用chps-sX pgname增加X个PP或用 mkps -a -n -sX myvg在myvg上增加一个PP数为X的内存交换区。 (5)小型机内存泄漏问题

小型机出现内存泄漏,即系统或应用进程无法将使用过的内存释放,使可用内存的容量逐渐减少。如果可用内存降到某最小值将造成系统或应用程序无法 FORK子进程,就会造成系统瘫痪。通常我们可以用ps和sar命令来查看小型机内存和CPU占用率的大概情况以及各进程的内存和CPU占用率的发展趋 势。使用ps命令,可查看内存和CPU占用率的基本情况。找出其中占用内存数不断变大的进程,这个进程可能就已经发生了内存泄漏。 4.IBM HACMP 双机热备系统的管理和维护 (1)HACMP 双机系统的启动

以root用户身份分别进入系统各节点,执行# smit clstart命令。 (2)HACMP 双机系统的关闭

以root用户身份分别进入系统各节点,执行# smit clstop命令。 (3)查询HACMP 双机系统的状态

在双机系统的运行中,操作员只有知道双机系统的当前状态,才有可能对双机系统出现的异常情况进行恢复处理,保证双机系统的高可用性和高容错性。 查询HACMP双机系统的状态,以root用户身份进入需要查询的节点,用# lssrc -g cluster命令检查HACMP双机软件在该节点是否已启动,系统显示3个active的信息,则说明HACMP 双机软件已正常启动。

在确认双机软件HACMP 正常启动的情况下,在命令行执行# /usr/sbin/cluster/clstat -a命令查看双机系统的当前状态。 5.网络故障处理 (1)网络不通的诊断过程

ifconfig 查看网卡是否启动(up);netstat-i查看网卡状态;Ierrs/Ipkts和Oerrs/Opkts是否>1%;ping本机网卡地址;ping其他机器地址,如不通,在其机器上用diag检测网卡是否有问题。 在同一网中,子网掩码应一致。 (2)网络配置的基本方法

①如需修改网络地址、主机名等,一定要用chdev 命令。 # chdev -l inet0 -a hostname=myhost

# chdev -l en0 -a netaddr='112.0.15.1' -a netmask=255.255.255.0' ②查看网卡状态:# lsdev -Cc-if ③确认网络地址:# ifconfig en0 ④启动网卡:# ifconfig en0 up ⑤配置路由,有两种方式加入路由: a.永久路由

# chdev -l inet0 -a route='112.1.15.2','112.0.15.254' b.临时路由

# route add 112.1.15.2 112.0.15.254

用命令 netstat -rn 查看路由表 6.IBM公司的巡检流程

IBM公司的巡检流程,对我们日常维护应重点关注的事项有所帮助,大家可以借鉴一下。

(1)检查系统硬件情况:设备故障灯是否亮。 (2)系统错误报告。

(3)检查是否有发给root用户的错误报告。 (4)检查hacmp.out,smit.log,boot.log。 (5)关键系统的文件使用率不大于80%。 (6)逻辑卷有否stale。

(7)内存交换区使用率是否超过70%。

(8)内存交换区的大小是否为物理内存的1.5倍。

(9)检查备份情况(是否有系统备份、用户数据备份,磁带机是否需要清洗)。 (10)检查通信设置(网卡、IP、路由表、ping、/etc/hosts、DNS设置等)。 (11)是否有数据保护方式如RAID10/RAID5?是否有Hot Spare。 (12)系统DUMP设置是否正确。 (13)检查系统参数是否正确。 (14)检查rootvg是否镜像。

(15)检查errdemon?srcmstr是否正常运行。 (16)检查机房环境(电压、湿度)。

(17)检查系统性能:是否存在性能瓶颈?topas?vmstat?。 (18)检查补丁程序(PTF)、微码(是否需要升级)。 (19)进行HACMP测试:Cluster Verification。

(20)进行系统硬件诊断:运行故障诊断程序(Diagnostic)。

三、AIX系统参数优化

AIX内核属于动态内核,核心参数基本上可以自动调整,因此当系统安装完毕后?应考虑修改的参数一般包括以下内容。 1.系统用户的最大登录数maxlogin

maxlogin的具体大小可根据用户数设定,可以通过smitty chlicense命令修改,该参数记录在/etc/security/login.cfg文件中,修改在系统重新启动后生效。

2.系统用户的limits参数

这些参数位于/etc/security/limits文件中,可以把这些参数设为-1?即无限制,可以用vi修改/etc/security/limits文件,所有修改在用户重新登录后生效。

3.Paging Space

检查Paging Space的大小,在物理内存<2G时,应至少设定为物理内存的1.5倍,若物理内存>2G,可作适当调整。同时在创建Paging Space时? 应尽量分配在不同的硬盘上,提高其性能。利用smitty chps修改原有Paging Space的大小或利用smitty mkps增加一块Paging Space。 4.系统核心参数配置

利用lsattr -Elsys0检查maxuproc,minpout,maxpout等参数的大小。maxuproc为每个用户的最大进程数?通常如果系统运行 Oracle?应调整

maxuproc,将Default:128调整到500,maxuproc增加可以马上生效。当应用涉及大量的顺序读写而影响前台 程序响应时间时,可考虑将maxpout设为33?minpout设为16,用smitty chgsys命令设置。 5.文件系统空间的设定

一般来说,文件系统/、/usr、/var、/tmp的使用率不应超过80%,/tmp建议至少为300M,文件系统满将导致系统不能正常工 作,尤其是AIX的基本文件系统,如/?根文件系统?满则会导致用户不能登录。用df 查看:#df-k(查看AIX的基本文件系统),利用smitty chfs扩展文件系统的空间。 6.激活SSA Fast-Write Cache

利用smitty ssafastw激活每一个逻辑盘hdiskn的Fast-Write Cache:选择硬盘后,把Enable Fast-Write改为Yes后,回车即可。

7.High water mark for pending write I/Os per file?maxpout?和Low water mark for pending write I/Os per file配置