posted by 퍼스트 희망봉 2026. 1. 9. 09:24

 

하드웨어 RAID와 소프트웨어 RAID 중 어떤 게 더 안전할까요?

저는 방금 두 개의 중고 바라쿠다 3TB 드라이브를 샀고, 이를 아키티오 RAID 인클로저에 넣었습니다. RAID를 하거나 어떤 형태로든 중복성을 구현하는 건 이번이 처음이에요 (으악). 하드웨어 RAID 컨트롤러가 어떻게 작동하는지 테스트해본 결과, 매우 기본적인 것 같고, 두 개의 HDD 상태나 RAID1에서의 건강을 모니터링할 수 있는 관리 소프트웨어나 방법이 없습니다.

  1. HDD 하나를 제거해도 시스템은 다르게 표시되거나 작동하지 않았습니다. 제 파일은 여전히 거기 있었지만, 드라이브가 고장났다는 표시가 없었습니다.
  2. RAID1 상태에서 파일을 복사하고 JBOD로 전환하면 두 개의 동일한 디스크가 표시되며 RAID가 작동 중임을 의미합니다. RAID1으로 다시 전환해도 오류가 발생하지 않았습니다.
  3. 같은 작업을 수행했지만 RAID1으로 다시 전환하기 전에 하나의 HDD에서 파일을 변경했을 경우, 그 파일은 나타나지만 열 때 손상되고 자동으로 삭제됩니다.

또한, 하드웨어 RAID1 상태에서 나타나는 단일 드라이브는 CrystalDiskInfo와 같은 SMART 프로그램으로 점검할 수 없어, 시스템의 건강 상태를 전혀 알 수 없습니다. JBOD로 전환할 때만 개별적으로 디스크 건강을 확인/테스트할 수 있습니다.

이로 인해 하드웨어 RAID/HDD가 언제든지 고장날 수 있을까봐 상당히 걱정됩니다. 다른 드라이브가 고장날 때까지 아무것도 모른 채 있을 것 같거든요. 디스크를 확인하기 위해 자주 JBOD로 전환하는 게 그리 안전하지 않다고 생각합니다. 그래서 JBOD 상태로 두고 소프트웨어 RAID 솔루션을 사용하는 게 더 안전한 선택인 것 같아요. 저는 이 분야가 상당히 새롭기 때문에, 제가 놓친 부분이 있다면 어떤 조언이나 의견이라도 감사하겠습니다. 고마워요!

저는 소프트웨어를 선호하는 편인데, 드라이브에 접근할 수 있는 모든 하드웨어를 사용하여 소프트웨어를 통해 문제를 해결할 수 있는 가능성이 훨씬 더 많기 때문입니다. 하드웨어 RAID의 하드웨어가 고장나면, 최소한 호환되는 것으로 교체해야 하고, 어떤 종류의 알 수 없는 오류가 발생하면 공급업체가 도와주기를 바라야 할 수도 있습니다 (상당한 비용이 들 수 있습니다).

 

ㅇㅇ 맞아. 하드웨어 레이드 망가지면, 고치려고 로우 레벨 접근도 안 되고, 똑같은 카드 또 사서 문제 해결해야 할 수도 있어. 소프트웨어는 그럴 필요 없고.

하드웨어 RAID는 사실 없는 거 알지? 우리가 하드웨어 RAID라고 부르는 건 그냥 RAID 하려고 만들어진 작은 컴퓨터가 내장된 PCIe 카드일 뿐이야. 그리고 걔네는 종종 좀 블랙박스 같지. 예전에는 PC가 이 "RAID PC"보다 별로 안 빨랐을 때는 유용했는데, 요즘에는 RAID 어레이 돌리는 게 CPU한테 그렇게 어려운 일도 아니잖아. 그리고 우리가 개발한 소프트웨어가 RAID 카드보다 훨씬 좋고 유연하고.

 

나는 20년 동안 윈도우랑 리눅스에서 HW, BIOS, SW RAID를 써봤어. 다음은 내 경험상 규칙이야:

 

BIOS RAID는 절대 쓰지 마

HW RAID는 Adaptec, LSI, Areca 제품만 써

가동 시간이나 성능이 필요 없으면 드라이브 풀링 써

 

특히 예전에 쓰던 3ware RAID 컨트롤러가 좋았어. 그냥 꽂으면 바로 되고, 모든 게 자동이었지. 매주 어레이 스캔을 예약하고, 문제 있으면 이메일도 보내줘. 어레이를 다시 만들어야 하면, 케이스에서 고장난 드라이브 빼고 새 드라이브 꽂은 다음에, GUI 들어가서 컨트롤러한테 새 드라이브로 다시 만들라고 하면 돼. 진짜 편했어. 그 엔터프라이즈급 컨트롤러들은 탱크처럼 튼튼했고, 10년 동안 쓰면서 딱 하나(ECC RAM 에러)만 고장났어. 고장나면 예비 카드(똑같은 거 아니어도 됨) 하나 구해서 메인보드 슬롯에 꽂으면 어레이가 바로 다시 살아나. 그리고 이 카드들은 배터리 백업이 있어서, 젠장, 다시 만드는 중에 서버 리셋 버튼을 눌러도 아무 일 없다는 듯이 계속 돌아가.

 

저는 Areca 카드를 정말 좋아해요. 지난 15년 정도 동안 사용해 온 2세대 SATA 2 카드가 있습니다. 업그레이드하려고 했을 때, 두 번째 하드 4세대 SATA3/SAS 6gb를 얻었습니다. 카드를 교체하고 케이블을 교체하기만 하면 RAID 어레이가 즉시 인식되었고, 아무런 문제도, 재구성도 필요 없었습니다. 그냥 작동하고, 새 카드에 문제가 생기면 그냥 옛날 카드를 바꿔 끼우면 돼요 ㅋㅋㅋ.

 

저는 Areca의 웹 관리를 좋아하고, 볼륨 검사가 실행될 때와 콘솔에 로그인할 때 이메일을 받습니다. 그리고 Areca는 LSI 칩을 사용하므로, 신뢰할 수 있다는 것을 알 수 있습니다.

 

나는 개인적으로 "안전한" 것보다 성능을 더 중요하게 생각해. 만약에 나중에 실패한 RAID에서 데이터를 복구할 계획이라면, 더 나은 백업 솔루션을 다시 생각해 보는 게 좋을 것 같아 (빠른 복구를 위한 로컬 1개 + 재해 복구를 위한 원격 1개)

 

이 비디오는 구식 RAID의 한계에 대해 잘 설명해 줘요. Level 1의 Wendell은 항상 좋은 일을 하죠.

 

하드웨어 RAID의 주요 장점은 배터리 백업(또는 플래시) 쓰기 백 캐시를 갖는 것입니다. 이것은 대부분의 경우 RAID 쓰기 페널티를 거의 없애줍니다. 소프트웨어 RAID를 사용하면 이제 SSD와 LVM 캐시 또는 Bcache(Linux에서)와 같은 것을 사용하여 유사한 결과를 얻을 수 있으며, Windows에서도 유사한 솔루션이 있을 것입니다.

 

개인적으로 저는 수백 대의 서버에서 둘 다 사용해 봤는데, 대부분의 경우 주요 서버 공급업체가 제공하는 하드웨어 RAID를 선호합니다(현재 직장에서는 HP 하드웨어를 사용하는데, 큰 문제는 없었습니다). 집에서 사용하는 설정의 경우, 쓰기 백 모드로 구성된 LVM 캐시를 사용하여 소프트웨어 RAID를 사용하는데, 예상대로 작동하는 것 같습니다.

 

솔직히 말해서, 어려운 질문이네. 여기서 떠드는 쓰레기 같은 소프트웨어 솔루션들 보면 눈살이 찌푸려지거든. 그렇긴 한데, SaaS(때로는 STaaS라고도 함)도 쓸 데가 있긴 해.

내 서버 중에는 6개월 된 것도 있고, 10년 넘은 것도 있는데, 전부 하드웨어 RAID 카드로 돌아가. 몇 년마다 배터리 교체하는 거 빼고는 문제 없었어. 소프트웨어 RAID로 똑같은 문제를 해결하는 서버에서도 문제는 없었지만, 그 서버들이 IBM이나 EMC(지금은 Dell이라고 불림)에서 FC를 통해 제공되는 스토리지를 백엔드로 사용한다는 걸 감안하면, 그게 얼마나 관련이 있는지는 잘 모르겠네.

 

어떤 종류의 소프트웨어 RAID를 사용하느냐에 따라 달라요.

 

RAID 카드에서 RAID1으로 데이터가 손상되는 경우, 카드는 어떤 드라이브가 정상적인 데이터를 내보내고 있는지, 손상된 데이터를 내보내고 있는지 판단할 수 없다는 점을 기억하세요.

zfs 같은 건 미러링된 데이터에 체크섬을 사용해서 개별 드라이브에서 나오는 데이터의 유효성을 끊임없이 확인해요. 보통 zfs는 드라이브 중 하나가 손상된 데이터를 내보내고 있는지 판단해서 자동으로 수정할 수 있어요.

결국 소프트웨어 측면에서 어떤 파일 시스템을 사용하느냐에 달려 있어요. RAID 컨트롤러의 경우 데이터 손상과 관련해서는 많은 카드에서 자동 수정을 위해 세 개의 드라이브 중 두 개가 최고여야 해요.

 

이상적으로? 솔직히 말해서 둘 다. 성능을 위해 프로덕션 시스템에 HW RAID, 백업을 위해 SW RAID 그리고 HW RAID를 선택한다면, 캐시와 배터리 백업이 있는 고급 카드를 꼭 사용하세요. 제발요.

RAID는 백업이 아닙니다!!!