灾备理论:可靠的异地灾备 - Unix系统
引言
内存子系统中最重要的优化部分并不涉及到实际的优化工作。在对您的系统进行优化之前,必须弄清楚主机系统的实际运行情况。要做到这一点,AIX? 管理员必须知道应该使用何种工具,以及如何对他或她将要捕获的数据进行分析。再次说明近期发表的一些其他优化文章(请参见 参考资料)中所介绍的内容,您在对系统进行正确地优化之前,必须首先监视主机,无论它是在逻辑分区 (LPAR) 运行还是在自己的物理服务器上运行。您可以使用许多命令来捕获和分析数据,所以您需要了解这些命令,以及其中的哪个命令最适合于将要进行的工作。在捕获了相关的数据之后,您需要对结果进行分析。有些问题乍看起来像是一个中央处理单元 (CPU) 的问题,而经过分析之后,可以正确地诊断为内存或 I/O 问题,前提是您使用了合适的工具捕获数据 ,并且知道如何进行分析工作。仅当正确地完成了这些工作之后,您才可以考虑对系统进行实际的更改。如果医生不了解您的病史和目前的症状,就无法诊治疾病,同样地,您也需要在优化子系统之前对其进行诊断。如果在出现 CPU 或者 I/O 瓶颈的情况下,对内存子系统进行优化,这将是毫无帮助的,甚至可能会影响主机的正常运行。 本文将帮助您了解正确地实施诊断工作的重要性。您将看到,性能优化并不仅仅只是进行实际的优化工作。在您将要学习的工具中,有一些是通用的监视工具,所有版本的 UNIX 都提供了这些工具,另外还有一些工具是专门为 AIX 编写的。有些工具为 AIX Version 5.3 进行了优化,同时还专门为 AIX 5.3 系统开发了一些新的工具。 生成基准数据是非常重要的,这一点无论重申多少次都不为过。不要等到用户开始抱怨糟糕的性能时,才开始监视您的系统。应该在将服务器投入生产环境中后,尽快地捕获其中的数据。如果您做到了这一点,那么您就可以积极主动地进行优化工作,其目标是在用户指出存在的问题之前找到它。如果您不了解系统正常运行时的相关数据,那么就无法确定所查看的数据是否表示存在性能问题。所有这些都是适当的性能优化方法中的一部分,有效地捕获数据,并正确地分析其结果和趋势。让我们来进行仔细地研究。 UNIX 通用的内存监视 在这个部分中,我为在所有 UNIX 分发版都可以使用的一些通用 UNIX 工具提供了概述,包括 ps、sar 和 vmstat。其中的大多数工具都允许您快速地对性能问题进行故障排除,但是它们并不适合用于进行历史趋势研究和分析。 大多数管理员都不善于使用 ps 命令对可能的内存瓶颈进行故障排除。事实上,许多 UNIX 管理员甚至不知道可以使用 ps 帮助确定内存问题的原因。ps 最常用的功能是查看系统中运行的进程(请参见清单 1)。 清单 1. 使用 ps 查看系统中运行的进程 . # ps gv | head -n 1; ps gv | egrep -v "RSS" | sort +6b -7 -n -r PID TTY STAT TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND 15256 - A 64:15 755 2572 2888 xx 2356 316 0.9 0.0 /usr/lpp/ 22752 - A 0:08 261 1960 1980 32768 465 20 0.0 0.0 dtwm 14654 - A 0:00 324 1932 1932 xx 198 0 0.0 0.0 /usr/sbin 20700 - A 0:07 271 1868 1896 32768 95 28 0.0 0.0 /usr/dt/b 20444 - A 0:03 203 1736 1824 32768 551 88 0.0 0.0 dtfile 17602 - A 0:00 274 948 1644 32768 817 696 0.0 0.0 sendmail: 13218 - A 0:00 74 1620 1620 xx 116 0 0.0 0.0 /usr/sbin 让我们首先来说明这些列所表示的含义: 内存数据: avm——您所使用的活动虚拟内存量(单位为 4k 大小的页面),不包括文件页面。 fre——内存空闲列表的大小。在大多数情况下,我并不担心这个值什么时候变得很小,因为 AIX 总是会充分地使用内存,并且不会像您希望的那样尽早地释放内存。这个设置由 vmo 命令的 minfree 参数来确定。归根结底,分页的信息更加重要。 pi——从分页空间调入的页面。 po——调出到分页空间的页面。 CPU 和 I/O: r——在您指定的时间间隔内,可运行内核线程的平均数量。 b——在您指定的时间间隔内,位于虚拟内存等待队列中的内核线程的平均数量。如果 r 不大于 b,通常是 CPU 问题的症状,这可能是由于 I/O 或者内存瓶颈造成的。 us——用户时间。 sy——系统时间。 id——空闲时间。 wa——等待 I/O。
(编辑:佛山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |