Hey all.<br><br>So i'm looking through some logs and e-mails and come across an e-mail telling me my raid is degraded.&nbsp; *sigh*, ok, time to fix that problem.<br><br>So, looking at /proc/mdstat I get the following:<br><br>/proc/mdstat
<br>----------------------------------------------------<br>Personalities : [raid1]<br>md0 : active raid1 hdi1[1]<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 117218176 blocks [2/1] [_U]<br><br>unused devices: &lt;none&gt;<br>-----------------------------------------------------
<br><br>Well, sure enough [_U] my first drive seems no longer to be in the raid...oddly enough tho, it's not being reported for a device on the md0 line (typically i'd expect to see md0: active raid1 hdg1[0] hdi1[1] or something like that).
<br><br>FYI, before I go farther here's the cuts from the various important logs:<br><br>/proc/devices<br>------------------------------<br>Block devices:<br>&nbsp; 1 ramdisk<br>&nbsp; 2 fd<br>&nbsp; 3 ide0<br>&nbsp; 9 md<br>&nbsp;33 ide2<br>&nbsp;34 ide3
<br>&nbsp;56 ide4<br>253 device-mapper<br>254 mdp<br>-------------------------------<br><br>/proc/partitions<br>--------------------------------<br>major minor&nbsp; #blocks&nbsp; name<br><br>&nbsp; 33&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp; 40021632 hde<br>&nbsp; 33&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp; 104391 hde1
<br>&nbsp; 33&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1020127 hde2<br>&nbsp; 33&nbsp;&nbsp;&nbsp;&nbsp; 3&nbsp;&nbsp; 38893365 hde3<br>&nbsp; 34&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; 117220824 hdg<br>&nbsp; 56&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; 117220824 hdi<br>&nbsp; 56&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp; 117218241 hdi1<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; 117220823 dm-0<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp; 117218241 dm-1<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1015808 dm-2
<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 3&nbsp;&nbsp;&nbsp; 5111808 dm-3<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 4&nbsp;&nbsp;&nbsp; 2031616 dm-4<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 5&nbsp;&nbsp;&nbsp;&nbsp; 491520 dm-5<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 6&nbsp;&nbsp;&nbsp; 7143424 dm-6<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 7&nbsp;&nbsp; 10223616 dm-7<br>&nbsp;253&nbsp;&nbsp;&nbsp;&nbsp; 8&nbsp;&nbsp;&nbsp;&nbsp; 491520 dm-8<br>&nbsp;&nbsp; 9&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp; 117218176 md0<br>---------------------------------
<br><br>/var/log/messages<br>---------------------------------<br>Jun&nbsp; 9 15:45:53 mail kernel: ide0 at 0x1f0-0x1f7,0x3f6 on irq 14<br>Jun&nbsp; 9 15:45:53 mail kernel: HPT374: IDE controller at PCI slot 0000:00:0f.0<br>Jun&nbsp; 9 15:45:53 mail kernel: PCI: Found IRQ 5 for device 0000:00:
0f.0<br>Jun&nbsp; 9 15:45:53 mail kernel: PCI: Sharing IRQ 5 with 0000:00:0f.1<br>Jun&nbsp; 9 15:45:53 mail kernel: HPT374: chipset revision 7<br>Jun&nbsp; 9 15:45:53 mail kernel: HPT374: 100% native mode on irq 5<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp;&nbsp;&nbsp;&nbsp; ide2: BM-DMA at 0x1400-0x1407, BIOS settings: h
<br>de:pio, hdf:pio<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp;&nbsp;&nbsp;&nbsp; ide3: BM-DMA at 0x1408-0x140f, BIOS settings: h<br>dg:DMA, hdh:pio<br>Jun&nbsp; 9 15:45:53 mail kernel: PCI: Found IRQ 5 for device 0000:00:0f.1<br>Jun&nbsp; 9 15:45:53 mail kernel: PCI: Sharing IRQ 5 with 0000:00:
0f.0<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp;&nbsp;&nbsp;&nbsp; ide4: BM-DMA at 0x1800-0x1807, BIOS settings: h<br>di:DMA, hdj:pio<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp;&nbsp;&nbsp;&nbsp; ide5: BM-DMA at 0x1808-0x180f, BIOS settings: h<br>dk:pio, hdl:pio<br>Jun&nbsp; 9 15:45:53 mail kernel: hde: Maxtor 4D040H2, ATA DISK drive
<br>Jun&nbsp; 9 15:45:53 mail kernel: ide2 at 0x1c88-0x1c8f,0x1c76 on irq 5<br>Jun&nbsp; 9 15:45:53 mail kernel: hdg: ST3120026A, ATA DISK drive<br>Jun&nbsp; 9 15:45:53 mail kernel: ide3 at 0x1c78-0x1c7f,0x1c72 on irq 5<br>Jun&nbsp; 9 15:45:53 mail kernel: hdi: ST3120026A, ATA DISK drive
<br>Jun&nbsp; 9 15:45:53 mail kernel: ide4 at 0x1ca0-0x1ca7,0x1c96 on irq 5<br>Jun&nbsp; 9 15:45:53 mail kernel: hde: max request size: 128KiB<br>Jun&nbsp; 9 15:45:53 mail kernel: hde: 80043264 sectors (40982 MB) w/2048KiB Cache, C<br>HS=65535/16/63, UDMA(100)
<br>Jun&nbsp; 9 15:45:53 mail kernel: hde: cache flushes not supported<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp; hde: hde1 hde2 hde3<br>Jun&nbsp; 9 15:45:53 mail kernel: hdg: max request size: 512KiB<br>Jun&nbsp; 9 15:45:53 mail kernel: hdg: 234441648 sectors (120034 MB) w/8192KiB Cache,
<br>&nbsp;CHS=16383/255/63, UDMA(100)<br>Jun&nbsp; 9 15:45:53 mail kernel: hdg: cache flushes supported<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp; hdg: hdg1<br>Jun&nbsp; 9 15:45:53 mail kernel: hdi: max request size: 512KiB<br>Jun&nbsp; 9 15:45:53 mail kernel: hdi: 234441648 sectors (120034 MB) w/8192KiB Cache,
<br>&nbsp;CHS=16383/255/63, UDMA(100)<br>Jun&nbsp; 9 15:45:53 mail kernel: hdi: cache flushes supported<br>Jun&nbsp; 9 15:45:53 mail kernel:&nbsp; hdi: hdi1<br>&lt;snip&gt;<br>Jun&nbsp; 9 15:45:53 mail kernel: md: md driver 0.90.3 MAX_MD_DEVS=256, MD_SB_DISKS=2
<br>7<br>Jun&nbsp; 9 15:45:54 mail kernel: md: bitmap version 4.39<br>&lt;snip&gt;<br>Jun&nbsp; 9 15:45:54 mail kernel: md: Autodetecting RAID arrays.<br>Jun&nbsp; 9 15:45:54 mail kernel: md: could not open unknown-block(34,1).<br>Jun&nbsp; 9 15:45:54 mail kernel: md: autorun ...
<br>Jun&nbsp; 9 15:45:54 mail kernel: md: considering hdi1 ...<br>Jun&nbsp; 9 15:45:54 mail kernel: md:&nbsp; adding hdi1 ...<br>Jun&nbsp; 9 15:45:54 mail kernel: md: created md0<br>Jun&nbsp; 9 15:45:54 mail kernel: md: bind&lt;hdi1&gt;<br>Jun&nbsp; 9 15:45:54 mail kernel: md: running: &lt;hdi1&gt;
<br>Jun&nbsp; 9 15:45:54 mail kernel: md: raid1 personality registered for level 1<br>Jun&nbsp; 9 15:45:54 mail kernel: raid1: raid set md0 active with 1 out of 2 mirrors<br>Jun&nbsp; 9 15:45:54 mail kernel: md: ... autorun DONE.<br>-------------------------------
<br><br>Ok, so what we have here is that HDG is a valid device, it was detected by the kernel and an HDG1 was recognized (/dev/hdg1 does exist)<br>/proc/devices shows that ide3 (Mapped to hdg in messages) is a valid block device recognzied by the system.
<br><br>And here's where it gets wierd: <br><br>/proc/filesystems seems to have NO KNOWLEDGE of /dev/hdg1 even though the kernel does.&nbsp; Running fdisk /dev/hdg in fact pulls up the following:<br><br>Command (m for help): p
<br><br>Disk /dev/hdg: 120.0 GB, 120034123776 bytes<br>255 heads, 63 sectors/track, 14593 cylinders<br>Units = cylinders of 16065 * 512 = 8225280 bytes<br><br>&nbsp;&nbsp; Device Boot&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Start&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; End&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Blocks&nbsp;&nbsp; Id&nbsp; System
<br>/dev/hdg1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 14593&nbsp;&nbsp; 117218241&nbsp;&nbsp; fd&nbsp; Linux raid autodetect<br><br>Command (m for help):<br><br>So we seem to have an ok partition created.<br><br>Note also that the partition type is RAID Autodetect, meaning, by everything I read, that the device SHOULD be listed in MDSTAT.&nbsp; 
<br><br>Jun&nbsp; 9 15:45:54 mail kernel: md: Autodetecting RAID arrays.<br>
Jun&nbsp; 9 15:45:54 mail kernel: md: could not open unknown-block(34,1).<br><br>Is the obvious culpret to that and doing an ls -las on /dev/hdg1 provides: <br><br>[root@mail log]# ls -las /dev/hdg1<br>0 brwx------ 1 root root 34, 1 Jun&nbsp; 9 10:45 /dev/hdg1
<br><br>Sure enough, Major = 34, Minor = 1, same device that MD says it can't open.<br><br>Not surprisingly when I try to run a device add via mdadm I get: <br><br>[root@mail log]# mdadm /dev/md0 -a /dev/hdg1<br>mdadm: Cannot open /dev/hdg1: No such device or address
<br><br>And now we come to the REALLY strange part of this whole thing:<br><br>[root@mail log]# mdadm --detail /dev/md0<br>/dev/md0:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Version : 00.90.03<br>&nbsp; Creation Time : Fri Apr&nbsp; 2 03:08:31 2004<br>&nbsp;&nbsp;&nbsp;&nbsp; Raid Level : raid1
<br>&nbsp;&nbsp;&nbsp;&nbsp; Array Size : 117218176 (111.79 GiB 120.03 GB)<br>&nbsp;&nbsp;&nbsp; Device Size : 117218176 (111.79 GiB 120.03 GB)<br>&nbsp;&nbsp; Raid Devices : 2<br>&nbsp; Total Devices : 1<br>Preferred Minor : 0<br>&nbsp;&nbsp;&nbsp; Persistence : Superblock is persistent
<br><br>&nbsp;&nbsp;&nbsp; Update Time : Fri Jun&nbsp; 9 17:28:23 2006<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; State : clean, degraded<br>&nbsp;Active Devices : 1<br>Working Devices : 1<br>&nbsp;Failed Devices : 0<br>&nbsp; Spare Devices : 0<br><br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; UUID : b39d534f:977aecb1:d2120e72:f24e4eb3
<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Events : 0.6390132<br><br>&nbsp;&nbsp;&nbsp; Number&nbsp;&nbsp; Major&nbsp;&nbsp; Minor&nbsp;&nbsp; RaidDevice State<br>&nbsp;&nbsp; 12395432&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; removed<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 56&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; active sync&nbsp;&nbsp; /dev/hdi1<br><br><br>Removed?&nbsp; It does note that there should be 2 raid devices, only one of which seems to be active.&nbsp; Raid is marked as degraded, tho there's no &quot;failed&quot; disks listed in mdstat.
<br><br>None of this makes sense to me.&nbsp; If the drive had just dissappeared I shouldn't be able to access it via FDISK, If FDISK can read and write to it, why the heck can't md?&nbsp; Why can't MD obviously find a major/minor device that is very obviously there?
<br><br>I've been playing with this thing this afternoon all afternoon, and have gone so far as to stop the array, delete the partition on hdg (the missing drive) and re-create it...to no avail.<br><br>Help?&nbsp; I'd hate to have the one disk crash on me and not be in a mirrored state...that would be BAD Egon.&nbsp; No matter what I do I can't seem to get mdadm to re-create or re-sync the array.
<br><br>As a final, my /etc/mdadm.conf file looks like the following:<br><br>DEVICE&nbsp; /dev/hdi1 /dev/hdg1<br>ARRAY&nbsp;&nbsp; /dev/md0 level=raid1 num-devices=2 uuid=b39d534f:977aecb1:d2120e72:f24e4eb3<br><br>A small note on hardware: I have a Highpoint RocketRaid card in there.&nbsp; Is there anyway to simply NOT use software mirroring and just use hardware mirroring?&nbsp; Everything I try to setup with this card always still reports both disks to the operating system which seems wrong to me.&nbsp; I'm used to once the array is created through the controller, only seeing one drive on the OS side, not both...and in fact i'm guessing this is what i'd see in the windows side of things...am I missing a driver?&nbsp; Do I need to re-compile the kernel for correct support?
<br><br>--Douglas Wagner<br><br><br><br>