Linux系统故障诊断与排除

Linux系统故障诊断与排除
作 者: James Kirkland David Carmichael Christopher Tinker Gregory Tinker 周良忠
出版社: 人民邮电出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: Linux
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  本书提供作译者介绍James Kirkland是Racemi的一名高级顾问。他以前是惠普公司的一名高级系统管理员,拥有10多年的UNIX类系统的使用经验。James是一名Red Hat认证工程师、HP-UX认证系统管理员,且获得了Linux LPIC一级认证。他使用Linux已有7年,使用HP-UX已有8年。他是HP World、Linux World和无数美国国内惠普论坛的积极撰稿人和发言人。.David Carmiehael就职于惠普公司,为乔治亚州Alpharetta的技术故障管理人员。他于1987年获得了西弗吉尼亚大学计算机科学学士学位。David为惠普的IT资源中心(htt...

内容简介

本书详细介绍了Linux系统故障的诊断与排除技巧,是作者长期实践经验的结晶。全书共分15章:第1章介绍系统引导、启动和关闭问题,这是所有Linux用户都会碰到的基本问题;第2章介绍系统运行中可能出现的错误;第3章、第4章介绍性能与性能相关的工具;第5章至第7章介绍主要存储硬件及其故障诊断;第8章介绍Linux进程及其故障诊断;第9章讲解了系统备份与恢复中如何诊断常见问题的知识;第10章至第15章介绍了Linux系统其他方面的故障诊断与排除技巧,包括打印问题、安全问题、网络问题、登录问题等。本书适用于Linux系统管理员及高级用户,对Linux系统感兴趣的用户也可将此书作为参考书。Linux是一种迅速发展的操作系统,拥有强大的功能和无穷的魅力,已被全世界越来越多的企业采用。但是,与所有操作系统一样,性能问题会耗费系统管理员大量的时间和精力。本书为Linux故障诊断提供了完全参考,帮助系统管理员查找和解决Red Hat Linux和Novell SUSE Linux系统中的问题并维护系统的高性能。本书在讲授如何诊断、排除Linux故障的同时,也揭示了系统的工作原理,帮助系统管理员直击问题的根源。如果Linux不能引导,是否应该重新安装系统?或者诊断和排除故障会比重装更省时间?当Linux挂起或运行缓慢时有没有办法提升系统性能?能否解决打印或网络访问的问题?本书提供了简单实用的示例,介绍了大量工具、命令和脚本,它们能使Linux运行更平稳。...

图书目录

第1章

系统引导、启动和关闭问题

引导加载程序

21.1.1

GRUB

21.1.2

LILO

101.1.3

当GRUB或者LILO不工作时进行引导

init进程和/etc/inittab文件

141.2.1

以多用户模式启动

171.2.2

init错误

rc脚本

201.3.1

确认模式

241.3.2

rc脚本中的启动问题

解决root文件系统的问题

271.4.1

从第二个硬盘引导

281.4.2

从援救CD引导

281.4.3

使用Knoppix

CD重置丢失的root密码

301.4.4

使用Knoppix

CD重新安装GRUB

301.4.5

从援救软盘引导

小结

附注

32第2章

系统挂起和严重错误

操作系统挂起

342.1.1

诊断可中断挂起故障

342.1.2

诊断不可中断挂起故障

操作系统严重错误

442.2.1

诊断操作系统严重错误

442.2.2

诊断oops导致的严重错误

硬件机器检查

小结

50第3章

性能工具

top

533.1.1

添加和移除字段

533.1.2

解释输出

553.1.3

保存自定义

563.1.4

批处理模式

sar

583.2.1

sar数据收集器

583.2.2

CPU统计数据

593.2.3

磁盘I/O统计数据

623.2.4

网络统计数据

vmstat

iostat

free

小结

尾注

69第4章

性能

在可能的最低层开始故障诊断

704.1.1

使用raw命令将原始设备绑定到块设备

714.1.2

原始设备性能

724.1.3

使用dd命令确定连续I/O速度

734.1.4

使用sar和iostat测量磁盘性能

744.1.5

理解测试性能时I/O块大小的重要性

754.1.6

时间的重要性

764.1.7

确定块大小

774.1.8

队列的重要性

784.1.9

磁盘的多线程(进程)I/O

794.1.10

使用条带化lvol减少磁盘I/O紧张

804.1.11

条带化lvol与单磁盘性能的比较

824.1.12

多路径I/O

文件系统

864.2.1

将日志记录到单独磁盘

864.2.2

确定文件系统请求的I/O大小

884.2.3

用小块I/O传输加载文件系统

884.2.4

利用文件系统的关键优势

914.2.5

Linux和Windows性能以及调整扇区对齐

924.2.6

使用bonnie++进行调整性能和基准测试

934.2.7

评估应用程序的CPU利用率问题

954.2.8

使用Oracle

statspak

984.2.9

分配共享内存时“设备上无剩余空间”错误的故障诊断

1014.2.10

其他性能工具

小结

103第5章

针对PCMCIA和USB通过SAN添加新存储

配置

内核模块

通过PCI添加LUN

通过PCMCIA/USB添加存储

小结

122第6章

磁盘分区与文件系统

背景

1236.1.1

IDE和SCSI

1246.1.2

位计算

分区表/主引导记录:定位

分区表/主引导记录:CHS寻址

1276.3.1

定义主分区

1286.3.2

确定能否创建附加分区

分区表/主引导记录:逻辑分区/扩展分区

分区表/主引导记录:逻辑块寻址(LBA)

分区表/主引导记录:引导加载器

1376.6.1

在使用过的驱动器上审查字节

1396.6.2

BIOS初始化引导加载器

分区表/主引导记录:备份

1416.7.1

分区恢复过程

1426.7.2

演示故障

1436.7.3

挂载分区

1446.7.4

在ext文件系统中恢复超级块和信息结点表

更多案例

小结

153第7章

设备故障与置换

支持的设备

到哪里寻找错误

确定故障设备

故障设备的置换

小结

170第8章

Linux进程:结构、挂起与核心转储

进程结构和生命周期

1718.1.1

进程/任务概述

1718.1.2

进程关系

1728.1.3

Linux进程创建

1728.1.4

Linux进程创建的示例

1738.1.5

进程创建小结

1748.1.6

Linux进程终止

Linux线程

确定进程挂起

进程核心

1868.4.1

信号

1878.4.2

限制

1898.4.3

核心文件

小结

192第9章

备份与恢复

备份介质

1949.1.1

磁带

1959.1.2

光盘存储

2029.1.3

硬盘存储

备份范围

基本备份和恢复命令

2049.3.1

tar

2049.3.2

cpio

2069.3.3

dump和恢复

2089.3.4

dd

2099.3.5

mkisofs

2099.3.6

rsync命令

裸机恢复

确定磁带的内容

怎样辨别磁带的问题出自硬件还是软件

小结

213第10章

cron与at

cron

21510.1.1

cron守护程序

22010.1.2

kcron

anacron

at

诊断cron

小结

233第11章

打印与打印机

什么是假脱机程序

23411.1.1

使用假脱机程序命令

23511.1.2

假脱机程序“管道工程”

23711.1.3

术语定义

打印机类型

连接类型

24311.3.1

本地串行打印

24411.3.2

本地USB打印

24611.3.3

本地并行打印

24911.3.4

远程打印

24911.3.5

原始网络套接字打印

页面描述语言

通用打印诊断

25611.5.1

映射假脱机环境

25611.5.2

断点

小结

257第12章

系统安全

什么是系统安全

25812.1.1

主机安全与网络安全的比较

25812.1.2

什么是安全漏洞

25912.1.3

主机安全漏洞分类

25912.1.4

安全漏洞和暴露类型

26112.1.5

增强主机安全的一般步骤

预防

26212.2.1

SSH加密

26212.2.2

诊断典型SSH问题

26612.2.3

连接和登录失败

26612.2.4

使用netfilter/iptables强化系统

27112.2.5

什么是NAT

27312.2.6

MANGLE表

27312.2.7

使用iptables进行配置

27312.2.8

iptables命令示例

27712.2.9

保存配置

27712.2.10

终止、验证状态和启动iptables

27812.2.11

问题诊断示例

27912.2.12

打补丁

28312.2.13

遭受入侵后的恢复

小结

284第13章

网络问题

OSI和TCP/IP层简介

诊断网络层问题

28613.2.1

TCP/IP物理网络访问层的诊断

28613.2.2

诊断网络层问题(OSI第三层、TCP/IP第二层)

29713.2.3

诊断传输层(TCP和UDP)问题

31413.2.4

诊断应用程序级的问题:TCP/IP模型的最后一层

小结

329第14章

登录问题

/etc/password,/etc/shadow和密码时效

33114.1.1

/etc/password和/etc/shadow

33114.1.2

chage、passwd和usermod

33214.1.3

/etc/passwd和/etc/shadow损坏

33714.1.4

pwck

Linux配置造成的登录失败

33814.2.1

/etc/securetty

33814.2.2

/etc/nologin

PAM

33914.3.1

功能

34014.3.2

优先级

34014.3.3

模块名

34114.3.4

参数

34114.3.5

/etc/pam.d

34114.3.6

/etc/pam.conf

34214.3.7

/lib/security

34214.3.8

Linux-PAM资源

34314.3.9

诊断PAM故障

34314.3.10

验证模块

34514.3.11

PAM中的漏洞

shell问题

密码问题

小结

尾注

350第15章

X

Windows问题

X背景

X组件

35215.2.1

X

Server组件

35215.2.2

X客户端组件

X显示管理器

X桌面管理器(环境)

X故障诊断案例

小结

尾注