본문 바로가기
조회 수 473 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

2023년 2분기 드라이브 통계라는 제목의 장식 이미지.

2023년 2분기 말에 Backblaze는 전 세계 데이터 센터에서 245,757개의 하드 드라이브와 SSD를 모니터링하고 있었습니다. 그 중 4,460개는 부팅 드라이브이고, 3,144개는 SSD이고 1,316개는 HDD입니다. SSD의 고장률은 SSD 에디션: 2022 드라이브 통계 검토에서 분석됩니다.

오늘은 관리 중인 241,297개의 데이터 드라이브에 중점을 두고 2023년 2분기 말 현재 분기별 및 수명주기 오류율을 검토하겠습니다. 그 과정에서 제시된 데이터에 대한 관찰 및 통찰력을 공유하고 다음 사항에 대해 알려드리겠습니다. 현재 우리가 포함하고 있는 몇 가지 추가 데이터 필드 등이 있습니다.

2023년 2분기 하드 드라이브 고장률

2023년 2분기 말에 우리는 데이터 저장에 사용되는 241,297개의 하드 드라이브를 관리하고 있었습니다. 검토를 위해 테스트 목적으로 사용되었거나 최소 60개의 드라이브가 없는 드라이브 모델로 사용된 드라이브 357개를 고려 대상에서 제외했습니다. 이로써 240,940개의 하드 드라이브가 31개의 서로 다른 모델로 그룹화되었습니다. 아래 표에서는 2023년 2분기 해당 드라이브 모델의 연간 고장률(AFR)을 검토합니다.

2023년 2분기 드라이브 통계에 대한 참고 사항 및 관찰 사항

  • 무고장 : 아래 표와 같이 2023년 2분기에 무고장을 기록한 드라이브 모델은 6개였습니다.


테이블은 해당 분기 동안 각 모델의 누적 주행 일수를 기준으로 정렬됩니다. 일반적으로 주행 모델은 통계적으로 관련성이 있으려면 해당 분기에 최소 50,000일의 주행 일수가 있어야 합니다. 상위 3개 드라이브는 모두 해당 기준을 충족하며, 3개 드라이브의 수명 AFR이 0.13%~0.45% 범위에 있다는 점을 고려하면 분기에 오류가 전혀 발생하지 않는 것은 놀라운 일이 아닙니다. 하위 3개 드라이브 중 해당 분기에 50,000일의 드라이브 일수를 누적한 드라이브는 없지만 Seagate 드라이브 2개는 좋은 출발을 보였습니다. 그리고 8년 이상 서비스를 제공한 4TB Toshiba(모델: MD04ABA400V)가 해당 분기에 제로 오류를 기록하는 것을 보는 것은 항상 좋은 일입니다.

  • 가장 오래된 드라이브? 평균 수명이 가장 오래된 드라이브 모델은 여전히 ​​98.3개월(8.2년)의 6TB Seagate(모델: ST6000DX000)이며, 이 집단 중 가장 오래된 드라이브는 104개월(8.7년)입니다.

    제품군에서 가장 오래된 작동 데이터 드라이브는 105.2개월(8.8년)의 4TB Seagate(모델: ST4000DM000)입니다. 이는 특히 데이터 센터 환경에서 상당히 인상적이지만, 우리 회사에서 가장 오래된 운영 드라이브의 승자는 실제로 부팅 드라이브입니다. 즉, 122개월(10.2년)의 지속적인 서비스를 제공하는 WDC 500GB 드라이브(모델: WD5000BPKT)입니다.
     
  • 상향 AFR : 2023년 2분기 AFR은 2023년 1분기 1.54%에서 증가한 2.28%였습니다. 분기별 AFR 수치는 변동이 심할 수 있지만 추가 조사가 필요한 추세를 식별하는 데 유용할 수도 있습니다. 이 경우에도 우리 선단의 노령화가 계속해서 증가함에 따라 상승이 예상되었습니다. 하지만 그게 진짜 이유였나요?

    아래 표에 표시된 대로 드라이브 크기별로 그룹화된 드라이브의 연간 고장률과 평균 수명부터 자세히 살펴보겠습니다.

우리의 목적을 위해 드라이브가 5년 이상이면 오래된 드라이브로 정의하겠습니다. 왜? 이것이 오늘 우리가 구매하는 드라이브의 보증 기간입니다. 물론 4TB 및 6TB 드라이브와 일부 8TB 드라이브에는 2년 보증만 제공되지만 일관성을 위해 드라이브를 "오래된" 것으로 표시하는 시점을 5년으로 유지하겠습니다. 

기존 드라이브에 대한 정의를 사용하면 12TB, 14TB 및 16TB 드라이브가 제거됩니다. 이에 따라 각 구형 드라이브 집단(4TB, 6TB, 8TB 및 10TB 모델)에 대한 지난 3년간의 분기별 AFR 차트가 아래에 표시됩니다.

흥미롭게도 가장 오래된 드라이브인 4TB와 6TB 드라이브가 자체적인 드라이브를 보유하고 있습니다. 예, 작년 정도에 비해 증가가 있었지만 나이를 고려하면 잘 지내고 있습니다.

반면 평균 사용 기간이 각각 5년, 6년인 8TB와 10TB 드라이브는 더욱 주의가 필요하다. 우리는 결론이 타당한지 알아보기 위해 이 보고서 뒷부분에서 평생 데이터를 살펴볼 것입니다.

드라이브 통계 데이터의 새로운 기능은 무엇입니까?

지난 10년 동안 우리는 드라이브 통계 데이터를 캡처하고 저장해 왔으며 2015년부터 드라이브 통계 보고서를 생성하는 데 사용한 데이터 파일을 오픈 소스로 공개 했습니다. 새로운 SMART 속성 세트를 보고하는 새로운 드라이브 모델을 설치할 때 때때로 새로운 SMART 속성 쌍이 스키마에 추가되었습니다. 이번 분기에 우리는 드라이브와 드라이브가 작동하는 환경에 대한 일부 추가 데이터 필드를 캡처하고 저장하기로 결정했으며, 이를 매 분기마다 게시하는  공개적으로 사용 가능한 드라이브 통계 파일 에 추가했습니다 .

새로운 데이터 필드

2023년 2분기 드라이브 통계 데이터부터 각 드라이브 기록에 3개의 새로운 데이터 필드가 채워집니다.

  1. Vault_id : 모든 데이터 드라이브는 Backblaze Vault의 구성원입니다. 각 저장소는 20개의 스토리지 서버에 균등하게 나누어진 900개 또는 1,200개의 하드 드라이브로 구성됩니다. 볼트는 1,000부터 시작하는 숫자 값입니다.
  2. Pod_id : 각 Backblaze Vault에는 20개의 스토리지 서버가 있습니다. Pod_id는 20개의 스토리지 서버 중 하나에 할당된 0부터 19까지의 값을 갖는 숫자 필드입니다.
  3. Is_legacy_format : 현재는 0이지만 더 많은 필드가 추가되면 향후 분기에 유용할 것입니다.

새 스키마는 다음과 같습니다.

  • 날짜
  • 일련번호
  • 모델
  • 용량_바이트
  • 실패
  • 볼트_ID
  • pod_id
  • is_legacy_format
  • smart_1_normalized
  • smart_1_raw
  • 나머지 SMART 값 쌍(각 드라이브 모델에서 보고됨)

때때로 독자들은 드라이브가 어디에 살았는지, 그리고 더 중요하게는 그것이 죽은 곳과 관련하여 우리가 제공할 수 있는 추가 정보가 있는지 묻곤 했습니다. 위에 새로 추가된 데이터 필드는 우리가 매일 수집하는 내부 드라이브 데이터의 일부이지만 드라이브 통계 보고서를 생성하는 데 사용하는 드라이브 통계 데이터에는 포함되지 않았습니다. 인프라 소프트웨어 팀의 David의 도움으로 이제 드라이브 통계 데이터에서 이러한 필드를 사용할 수 있습니다.

Vault 및 Pod 정보를 어떻게 사용할 수 있나요?

먼저 주의할 점: 우리는 이 새 데이터의 정확히 4분의 1에 해당하는 데이터를 보유하고 있습니다. 차트와 테이블을 만들고 싶은 유혹이 있었지만 이를 더 잘 이해하기 위해 몇 분기 분량의 데이터를 확인하고 싶습니다. 올해 말에 초기 분석을 찾아보십시오.

즉, 이 데이터가 우리에게 제공하는 것은 스토리지 서버와 모든 드라이브의 저장소입니다. 거꾸로 작업하면 "특정 스토리지 서버가 드라이브 오류에 더 취약한가요?"와 같은 질문을 할 수 있어야 합니다. 또는 "특정 스토리지 서버에서 특정 드라이브 모델이 더 잘 작동합니까, 아니면 더 나쁘게 작동합니까?" 또한 멀티 엑사바이트 클라우드 스토리지 플랫폼에 대한 추가 통찰력을 제공하기 위해 스토리지 서버 유형 및 데이터 센터와 같은 데이터 요소를 혼합에 추가하기를 희망합니다.

수년에 걸쳐 우리는 내부적으로 Drive Stats 데이터를 활용하여 운영 효율성과 내구성을 개선해 왔습니다. 드라이브 통계 보고서 와 데이터 다운로드를 통해 모든 사람에게 이러한 새로운 데이터 요소를 제공하는 것은 옳은 일입니다.

마을에 새로운 드라이브가 생겼어요

2023년 2분기 드라이브 통계 데이터를 다운로드하기로 결정하셨다면 놀라운 소식이 있을 것입니다. 바로 새로운 드라이브 모델입니다. 이러한 드라이브는 4개만 있으므로 놓치기 쉬우며 현재 "테스트" 드라이브로 간주되므로 우리가 게시하는 표와 차트에는 나열되어 있지 않습니다. 하지만 데이터를 보는 경우 모델 "WDC WUH722222ALE6L4"를 검색하면 새로 설치된 22TB WDC 드라이브를 찾을 수 있습니다. 그들은 2분기 말에 테스트에 들어갔고 우리가 말하는 동안 속도를 내고 있습니다. 계속 지켜봐 주시기 바랍니다. (참고로 7월 28일 기준으로 실패한 사례는 없습니다.)

평생 하드 드라이브 오류율

2023년 6월 30일 현재, 우리는 고객 데이터를 저장하는 데 사용되는 241,297개의 하드 드라이브를 추적하고 있었습니다. 수명 분석을 위해 테스트 목적으로만 사용되었거나 전체 데이터 세트에 최소 60개의 드라이브가 표시되지 않은 357개의 드라이브를 제거했습니다. 이로써 아래의 수명 표를 분석하기 위해 31개의 서로 다른 모델로 그룹화된 240,940개의 하드 드라이브가 남게 되었습니다.

평생 통계에 대한 참고 사항 및 관찰

평생 AFR도 상승합니다 . 위에 나열된 모든 드라이브의 연간 수명 실패율은 1.45%입니다. 이는 전분기 1.40%보다 0.05% 증가한 수치다. 이 보고서 앞부분에서 2023년 2분기 데이터를 조사하여 8TB 및 10TB 드라이브가 증가율의 주요 용의자로 확인되었습니다. 크기별로 그룹화된 다양한 드라이브의 수명 AFR 비율 변화를 조사하여 이를 확인할 수 있는지 살펴보겠습니다.

빨간색 선은 모든 드라이브에 대한 수명 AFR의 Q1에서 Q2(0.05%)까지의 차이이므로 우리의 기준선입니다. 빨간색 선 위의 드라이브는 증가를 지지하고, 선 아래의 드라이브는 증가에서 뺍니다. 증가된 수명 연간 고장률을 "추진"하는 기본 드라이브(크기별)는 8TB 및 10TB 드라이브입니다. 이것은 우리가 이전에 발견한 것을 확인시켜 줍니다. 8TB 드라이브(24,891)에 비해 10TB 드라이브(1,124)가 상대적으로 적다는 점을 고려하여 8TB 드라이브 모델을 더 자세히 살펴보겠습니다.

모든 8TB 드라이브의 수명 AFR은 1분기 1.42%에서 2분기 1.59%로 증가했습니다. 12% 증가. 6개의 8TB 드라이브 모델이 작동 중이지만 이 모델 중 3개가 8TB 드라이브 집단의 드라이브 오류의 99.5%를 차지하므로 이들 모델에 중점을 두겠습니다. 아래에 나열되어 있습니다.

세 가지 모델 모두 1분기에서 2분기까지 수명 연간 고장률의 증가는 10% 이상이며 이는 모든 8TB 드라이브 모델의 12% 증가와 통계적으로 유사합니다. 마이그레이션에 집중할 하나의 드라이브 모델을 선택해야 한다면 세 가지 중 하나가 좋은 후보가 될 것입니다. 그러나 Seagate 드라이브인 ST8000DM002 모델은 문제의 다른 드라이브 모델보다 평균적으로 거의 1년 더 오래되었습니다.

  • 평생이 아니겠습니까? 위 표는 2013년 4월 20일부터 2023년 6월 30일까지, 즉 10년 2개월 10일 동안의 데이터를 분석한 것입니다. 앞서 언급했듯이, 우리가 가지고 있는 가장 오래된 드라이브는 10년 2개월 정도 된 것으로, 하루나 이틀 정도 걸립니다. 테이블 헤더를 변경해야 할 것 같지만 아직은 아닙니다. 2013년 2분기에 설치되어 현재까지 계속 작동 중인 드라이브는 해당 모델의 수명 데이터의 일부로 드라이브 일수를 보고합니다. 2013년 2분기에 설치된 모든 드라이브가 사라지면 이에 따라 테이블과 차트의 시작 날짜를 변경할 수 있습니다.

드라이브 오류에 대한 한마디

드라이브 고장률 증가가 걱정됩니까? 물론 우리는 그 수치가 낮아지기를 바라지만, 클라우드 스토리지 사업의 피할 수 없는 현실은 드라이브가 실패한다는 것입니다. 수년에 걸쳐 우리는 다양한 제조업체, 드라이브 모델 및 드라이브 크기에 걸쳐 다양한 오류율을 확인했습니다. 이에 대한 준비가 되어 있지 않으면 실패하게 됩니다. 준비의 일환으로 우리는 드라이브 통계 데이터를 환경을 이해하기 위한 많은 입력 중 하나로 사용하여 필요할 때 필요한 대로 조정할 수 있습니다.

그렇다면 드라이브 고장률 증가가 걱정되는 걸까요? 아니요, 하지만 우리도 오만하지는 않습니다. 우리는 계속해서 시스템을 모니터링하고 필요한 경우 조치를 취하며 그 과정에서 가능한 내용을 여러분과 공유할 것입니다. 




List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 덕질 공통 이용규칙 및 안내 (업데이트중+ 2024-04-13) 😀컴덕824 5111 2024.04.14
공지 1000P를 모으면 다이소 상품권 1000원을 신청할 수 있습니다. file Private 5108 2024.02.14
4773 일반 노트북 랜선과 와이파이중 어느쪽이 더 전력소비가 심할까?? 😀익명666 4539 2023.01.25
4772 일반 usb 메모리 수명 관련 질문입니다 3 😀익명510 4131 2023.01.24
4771 일반 USB는 외장하드보다 수명이 짧나요? 😀익명404 4085 2023.01.24
4770 일반 HDD 어느 회사 것으로 사야 하나요?? 1 😀익명942 3984 2023.01.24
4769 일반 USB 꽂아두고 작업해도 괜찮나요? 2 😀익명010 3746 2023.01.24
4768 일반 저사양컴퓨터에 최적화 되어 있는 OS 윈도우 11 X Lite file 😀58852953 3488 2022.09.23
4767 일반 리눅스마스터 1급 자격증 딴 사람 있어? 😀55308247 3366 2022.09.21
4766 일반 라자 코두리의 AI 기업, 인텔의 엔드게임 라이센스를 계약 😀컴덕171 3200 2023.10.22
4765 일반 영상작업용은 7800x3d vs 13700k ?? 2 😀익명968 3189 2023.05.01
4764 일반 지포스 RTX 4070 슈퍼, AD!03+16GB 조합 😀컴덕084 3131 2023.10.22
4763 일반 Phytium, 제재에도 불구하고 데이터 센터용 64코어 프로세서 공개 😀컴덕747 3076 2023.10.22
4762 일반 i9-14900K 뚜따 후 온도 file 😀컴덕421 2991 2023.10.22
4761 일반 노트북 CPU i5-1235U vs i5-1240P 차이 있을까요? 2 😀익명617 2935 2023.02.16
4760 일반 Best Practices for MySQL with SSD,NVME innodb file 😀익명167 2807 2023.01.09
4759 일반 추천 가성비 마우스 정리글 😀익명035 2683 2023.01.16
4758 일반 토렌트 사용시 ip차단해놔 file 😀컴덕627 2569 2023.10.19
4757 일반 14900K 게이밍 벤치마크 file 😀컴덕697 2394 2023.10.18
4756 일반 해외직구 할인 세일기간을 알아봅시다 file 😀익명161 2377 2023.01.10
4755 일반 VMware 리믹스 OS 설치 방법 😀익명630 2277 2016.02.08
4754 일반 14900K 공식 프레젠테이션 게임 성능 file 😀컴덕577 2228 2023.10.18
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 239 Next
/ 239