제품별매뉴얼 (T series) 2016-08 - C&Thoth H/W Team -
1. System 시작 2. 정상기동여부세부 Check 방법 3. 주요증상별긴급복구절차 4. System Shutdown 5. System Hang 일경우 Dump 받는법
1. System 시작 A. Run Level Run Level Milestone 기능 0 PROM Monitor 동작 s Single User 중요한 File System Mount / 접근가능 2 Multi User 다중사용자접속가능 / 일부 Service 불가 3 Multi User Server 다중사용자접속가능 / 모든 Service 가능 5 Shutdown 후 Power Off 6 Shutdown 후 Reboot B. System 구동 1) 시스템전원을 ON 하면 POST(HW 진단프로그램 ) 이수행이되고검사가완료되면 OK Mode 가나오게된다. A) Sun SPARC Enterprise T5220 B) Sun SPARC Enterprise T5240 C) Netra T5440
C. T series 장비 booting 1) 장비앞면의 power button 버튼으로눌러서부팅하는방법장점 : 누르기만하면되니간편하다. 단점 : poweron 이제대로진행되는지 log 를알수없다. 2) Console로접속후 ALOM 모드를통해수동 booting Alom 모드접속 SUNSPxxxxxxxxxxxx login:admin ---------> admin 입력 Password:changeme -----------------------> changeme 입력 Waiting for daemons to initialize... Daemons ready Sun(TM) Integrated Lights Out Manager Version 2.0.0.0 Copyright 2007 Sun Microsystems, Inc. All rights reserved. Use is subject to license terms. sc> poweron -> booting sc> console -> OS mode 로전환한다. Enter #. to return to ALOM. 2008-10-07 4:37:52.418 0:0:0>CPU =: 0-31 3) ok Mode에서자동부팅설정 A) 자동부팅 : - ok Mode에서자동부팅설정 - booting 시 OK 모드에서정지하지않고바로 OS까지진행된다. ok printenv auto-boot? true true auto-boot 를위와같이 true 로부여할수있다. 설정방법 : ok> setenv auto-boot? true
B) T5220, T5240, T5440 수동부팅 - ok Mode에서수동부팅설정 booting 시바로 OS까지진행되지않고 OK 모드에서정지한다. - ok printenv auto-boot? false true auto-boot 를위와같이 false 로부여할수있다. 설정방법 : ok>setenv auto-boot? false C) ok Mode 부팅 3} ok printenv Variable Name Value Default Value. boot-device /pci@9,600000/sunw,qlc@2... disk net. boot-device 를위와같이물리적인 path 로부여할수있다. 설정방법 : ok>setenv boot-device? disk disk1 net ok 모드의 OBP 환경설정변수는아래와같이두가지방법으로확인가능. OBP:ok>printenv // OS:# eeprom {3} ok probe-scsi-all 현재인식되어있는 scsi 장치확인 /pci@9,600000/sunw,qlc@2 LiD HA LUN --- Port WWN --- ----- Disk description ----- 0 0 0 21000011c69640e2 SEAGATE ST373207FSUN72G 0354 1 1 0 21000004cfaa17ec SEAGATE ST373405FSUN72G 0638 /pci@8,700000/pci@2/sunw,qlc@5 *************************** Local Loop Devices *************************** Adapter loopid - 7 Device AL-PA d2 loopid d Hard-addr d Port WWN 508002000007b431 Lun 0 SUN SENA 1.09 Device AL-PA ef loopid 0 Hard-addr 0 Port WWN 21000020372b972f Lun 0 DISK SEAGATE ST39102FCSUN9.0G0728 {3} ok devalias 현재인식되어있는 scsi 장치의 alias( 별칭 ) disk1 /pci@9,600000/sunw,qlc@2/fp@0,0/disk@1,0 disk0 /pci@9,600000/sunw,qlc@2/fp@0,0/disk@0,0 disk /pci@9,600000/sunw,qlc@2/fp@0,0/disk@0,0 ide /pci@8,700000/ide@6 scsi /pci@9,600000/sunw,qlc@2 cdrom /pci@8,700000/ide@6/cdrom@0,0:f net /pci@9,700000/network@2
net1 /pci@9,600000/network@1 net0 /pci@9,700000/network@2. {3} ok boot disk devalias 에서이미별칭된 disk 의 PATH 로 booting 됨. Boot device: /pci@9,600000/sunw,qlc@2/fp@0,0/disk@0,0 File and args: SunOS Release 5.10 Version Generic_139555-08 64-bit Copyright 1983-2009 Sun Microsystems, Inc. All rights reserved. Use is subject to license terms. Reading ZFS config: done. CNTHOTH console login: root 2. 정상기동여부세부 Check 방법 점검항목 File system 점검 Disk 점검 # who r 런레벨확인 ( 정상적인레벨 : 3) 점검내용. run-level 3 2 월 16 일 18:27 3 0 S # df h 각파일시스템의용량및마운트상태를확인 파일시스템크기사용가용용량설치지점 /dev/dsk/c0t0d0s0 24G 13G 11G 55% / # dmesg 시스템의운영로그를확인 2012 년 2 월 27 일월요일오후 09 시 37 분 23 초 Feb 18 23:58:45 CNTHOTH inetd[508]: [ID 317013 daemon.notice] ftp[24961] from 192.168.50.87 56601 # format 현재시스템에디스크인식확인 ( 만일 unknown 이있는지확인 ) AVAILABLE DISK SELECTIONS: 0. c0t0d0 <LSILOGIC-LogicalVolume-3000 cyl 65533 alt 2 hd 32 sec 279> /pci@400/pci@0/pci@8/scsi@0/sd@0,0 1. c0t2d0 <LSILOGIC-LogicalVolume-3000 cyl 65533 alt 2 hd 32 sec 279> /pci@400/pci@0/pci@8/scsi@0/sd@2,0 # iostat En 디스크의인식상태확인 # metastat SVM raid 로볼륨이구성되어진경우, d4: 이중화각 metadevice 의상태를확인 서브미러 0: d40 상태 : 확인 서브미러 1: d41 상태 : 확인 ok 나확인이면정상 # raidctl H/W raid 로볼륨이구성되어진경우, 각 raid 볼륨의상태를확인 # raidctl -l c0t0d0 (format 상에서 c#t#d# 확인후해당명령입력 ) Volume Size Stripe Status Cache RAID Sub Size Level Disk
Hardware 상태점검운영성능점검 Device 점검 Network 점검 ---------------------------------------------------------------- c0t0d0 279.3G 해당없음최적 OFF RAID1 0.1.0 279.3G 좋음 0.0.0 279.3G 좋음 # fmdump 시스템의 fault 난 fru 상태점검명령어 TIME UUID SUNW-MSG-ID fmdump: /var/fm/fmd/fltlog is empty 시스템의 fault fru 가발견되지않을때 # fmadm faulty fault 리스트출력 # vmstat 현재 CPU 와 memory(physical memory 및 swap memory) 의사용률및상태확인 # iostat 시스템의현재 IO 상태를확인 # prstat 각프로세스들의 Resource 사용률을확인 # mpstat 각프로세스당사용률및상태를확인 # prtdiag v 각디바이스의인식및현재의운영상태확인 (cpu, 메모리사양, firmware 정보등환경정보확인가능 ) # ifconfig a 현재사용되고있는 interface 의상태확인 nxge0: flags=1000843<up,broadcast,running,multicast,ipv4> mtu 1500 index 2. inet 192.168.50.32 netmask ffffff00 broadcast 192.168.50.255 # netstat rn 현재사용되고있는라우팅테이블확인 Routing Table: IPv4 Destination Gateway Flags Ref Use Interface -------------------- -------------------- ----- ----- ---------- --------- default 192.168.50.1 UG 1 99 # dladm show-dev 현재 link up 된 interface 의속도를확인 nxge0 링크 : up 속도 : 100 Mbps 이중 : full nxge1 링크 : unknown 속도 : 0 Mbps 이중 : unknown # ping 네트워크가정상적으로망에연결되었는지를확인 # ping -s 192.168.50.1 PING 192.168.50.1: 56 data bytes 64 bytes from 192.168.50.1: icmp_seq=0. time=0.621 ms 3. 주요증상별긴급복구절차 장애상황 S Y S T 증상 장애요인 장애대책 세부조치사항 CPU CPU Fail 로 CPU system booting 후 log 분석, 해당 CPU 파악하여 Failure 인한 Reboot Replacement 교체 Memory Memory Fail 로 Memory System booting 후 log 분석, 해당메모리를파악 Failure 인한 Reboot Replacement 하여교체
E H/W mirror 일경우 M # Disk LED 확인 # raidctl l c0t0d0 D * SVM mirror 일경우 O # metastat W N Disk Failure OS Disk Fail Mirror 되어 있는 경우 Disk 교체 * H/W mirror 일경우 # cfgadm al -> 장애디스크확인 # cfgadm c unconfigure c:xxxxx ( 장애디스크타겟 ) * S/W mirror 일경우 # metadetach d0 d10 # metaclear d10 Mirror 되어있지 DAT72 tape 을넣은후 않은경우 -cdrom 부팅하여 tape device 의데이터를복구 S Y S T E M Power Fail OS fail Power Supply 장애 Kernel 장애 Power Supply 교체 Power Backplane 교체 Kernel backup 으로 booting system 이 down 된후 reboot 을시켜도되지않는경우 system 의어떤 LED 도동작하지않으며이러한경우 Power Supply 교체함 power Supply 까지 power 는들어오지만 system 에 power 가공급되지않는경우 power monitor board 교체예비 disk 로부팅하는경우 # init 0 -> OK 모드로들어가서백업디스크로 boot # boot disk1 실패시 cdrom 부팅후, # fsck -> 파일시스템체크로이상유무확인 D O W N System board fail System dump System board fail OS 장애 System board 교체 Dump 분석후조치 System booting 후 log 분석후 System Board 를교체 # system reboot after panic # cd /var/crash -> dump directory 로이동 # dump 가있는 directory 로이동후해당 dump file 을수집후 log 분석 *** dump 분석후필요한 patch 등을적용함. N 인접서버간 ping test 실패시 E # netstat in 으로해당 interface 확인 T W O R LAN card fail LAN card 장애 LAN card 교체 network Config 확인 # 육안으로 link up 상태확인 # dladm show-dev -> 속도 halt or full duplex 여부확인 # ifconfig a K -> 사용되는 interface 상태확인 # LAN card 교체 / ping test 실시
D Network IP 설정방법 O # vi /etc/hosts 를수정한다. W N 네트워크 연동불가 IP 설정오류 Routing Table 오류 IP 재설정 Routing Table 메모리에재등록 # vi /etc/hostname.(interface0) -> IP 설정 # vi /etc/netmasks -> 넷마스크설정 # vi /etc/defaultrouter -> 게이트웨이설정 Routing Table 재등록 # vi /etc/rc2.d/s69route 를수정한다. 4. System Shutdown 구분 전원 Off Rebooting ok Mode 명령어 init 5 init 6 reboot init 0 5. System Hang 일경우 Dump 받는법 Console 로접속후 OS 모드에서 LOM 모드로 switching System Hang 일경우 OS 모드상에서 LOM 모드로전환 key 말고는아무명령도적용되지않음 #. 명을치면 sc> 로 alom 모드나 ilom 모드로전환이된다. Alom 모드이면 sc> logout 하고빠져나간다. ilom 모드접속 SUNSPxxxxxxxxxxxx login:admin ---------> root 입력 Password:changeme -----------------------> changeme 입력 Waiting for daemons to initialize... Daemons ready Sun(TM) Integrated Lights Out Manager Version 2.0.0.0 Copyright 2007 Sun Microsystems, Inc. All rights reserved. Use is subject to license terms. -> set /HOST send_break_action=break Set send_break_action to break -> start /SP/console Are you sure you want to start /SP/console (y/n)? y console started. To stop, type #.
2) ok 모드에서 dump 파일생성 ok> sync