본문 바로가기
조회 수 473 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

2023년 2분기 드라이브 통계라는 제목의 장식 이미지.

2023년 2분기 말에 Backblaze는 전 세계 데이터 센터에서 245,757개의 하드 드라이브와 SSD를 모니터링하고 있었습니다. 그 중 4,460개는 부팅 드라이브이고, 3,144개는 SSD이고 1,316개는 HDD입니다. SSD의 고장률은 SSD 에디션: 2022 드라이브 통계 검토에서 분석됩니다.

오늘은 관리 중인 241,297개의 데이터 드라이브에 중점을 두고 2023년 2분기 말 현재 분기별 및 수명주기 오류율을 검토하겠습니다. 그 과정에서 제시된 데이터에 대한 관찰 및 통찰력을 공유하고 다음 사항에 대해 알려드리겠습니다. 현재 우리가 포함하고 있는 몇 가지 추가 데이터 필드 등이 있습니다.

2023년 2분기 하드 드라이브 고장률

2023년 2분기 말에 우리는 데이터 저장에 사용되는 241,297개의 하드 드라이브를 관리하고 있었습니다. 검토를 위해 테스트 목적으로 사용되었거나 최소 60개의 드라이브가 없는 드라이브 모델로 사용된 드라이브 357개를 고려 대상에서 제외했습니다. 이로써 240,940개의 하드 드라이브가 31개의 서로 다른 모델로 그룹화되었습니다. 아래 표에서는 2023년 2분기 해당 드라이브 모델의 연간 고장률(AFR)을 검토합니다.

2023년 2분기 드라이브 통계에 대한 참고 사항 및 관찰 사항

  • 무고장 : 아래 표와 같이 2023년 2분기에 무고장을 기록한 드라이브 모델은 6개였습니다.


테이블은 해당 분기 동안 각 모델의 누적 주행 일수를 기준으로 정렬됩니다. 일반적으로 주행 모델은 통계적으로 관련성이 있으려면 해당 분기에 최소 50,000일의 주행 일수가 있어야 합니다. 상위 3개 드라이브는 모두 해당 기준을 충족하며, 3개 드라이브의 수명 AFR이 0.13%~0.45% 범위에 있다는 점을 고려하면 분기에 오류가 전혀 발생하지 않는 것은 놀라운 일이 아닙니다. 하위 3개 드라이브 중 해당 분기에 50,000일의 드라이브 일수를 누적한 드라이브는 없지만 Seagate 드라이브 2개는 좋은 출발을 보였습니다. 그리고 8년 이상 서비스를 제공한 4TB Toshiba(모델: MD04ABA400V)가 해당 분기에 제로 오류를 기록하는 것을 보는 것은 항상 좋은 일입니다.

  • 가장 오래된 드라이브? 평균 수명이 가장 오래된 드라이브 모델은 여전히 ​​98.3개월(8.2년)의 6TB Seagate(모델: ST6000DX000)이며, 이 집단 중 가장 오래된 드라이브는 104개월(8.7년)입니다.

    제품군에서 가장 오래된 작동 데이터 드라이브는 105.2개월(8.8년)의 4TB Seagate(모델: ST4000DM000)입니다. 이는 특히 데이터 센터 환경에서 상당히 인상적이지만, 우리 회사에서 가장 오래된 운영 드라이브의 승자는 실제로 부팅 드라이브입니다. 즉, 122개월(10.2년)의 지속적인 서비스를 제공하는 WDC 500GB 드라이브(모델: WD5000BPKT)입니다.
     
  • 상향 AFR : 2023년 2분기 AFR은 2023년 1분기 1.54%에서 증가한 2.28%였습니다. 분기별 AFR 수치는 변동이 심할 수 있지만 추가 조사가 필요한 추세를 식별하는 데 유용할 수도 있습니다. 이 경우에도 우리 선단의 노령화가 계속해서 증가함에 따라 상승이 예상되었습니다. 하지만 그게 진짜 이유였나요?

    아래 표에 표시된 대로 드라이브 크기별로 그룹화된 드라이브의 연간 고장률과 평균 수명부터 자세히 살펴보겠습니다.

우리의 목적을 위해 드라이브가 5년 이상이면 오래된 드라이브로 정의하겠습니다. 왜? 이것이 오늘 우리가 구매하는 드라이브의 보증 기간입니다. 물론 4TB 및 6TB 드라이브와 일부 8TB 드라이브에는 2년 보증만 제공되지만 일관성을 위해 드라이브를 "오래된" 것으로 표시하는 시점을 5년으로 유지하겠습니다. 

기존 드라이브에 대한 정의를 사용하면 12TB, 14TB 및 16TB 드라이브가 제거됩니다. 이에 따라 각 구형 드라이브 집단(4TB, 6TB, 8TB 및 10TB 모델)에 대한 지난 3년간의 분기별 AFR 차트가 아래에 표시됩니다.

흥미롭게도 가장 오래된 드라이브인 4TB와 6TB 드라이브가 자체적인 드라이브를 보유하고 있습니다. 예, 작년 정도에 비해 증가가 있었지만 나이를 고려하면 잘 지내고 있습니다.

반면 평균 사용 기간이 각각 5년, 6년인 8TB와 10TB 드라이브는 더욱 주의가 필요하다. 우리는 결론이 타당한지 알아보기 위해 이 보고서 뒷부분에서 평생 데이터를 살펴볼 것입니다.

드라이브 통계 데이터의 새로운 기능은 무엇입니까?

지난 10년 동안 우리는 드라이브 통계 데이터를 캡처하고 저장해 왔으며 2015년부터 드라이브 통계 보고서를 생성하는 데 사용한 데이터 파일을 오픈 소스로 공개 했습니다. 새로운 SMART 속성 세트를 보고하는 새로운 드라이브 모델을 설치할 때 때때로 새로운 SMART 속성 쌍이 스키마에 추가되었습니다. 이번 분기에 우리는 드라이브와 드라이브가 작동하는 환경에 대한 일부 추가 데이터 필드를 캡처하고 저장하기로 결정했으며, 이를 매 분기마다 게시하는  공개적으로 사용 가능한 드라이브 통계 파일 에 추가했습니다 .

새로운 데이터 필드

2023년 2분기 드라이브 통계 데이터부터 각 드라이브 기록에 3개의 새로운 데이터 필드가 채워집니다.

  1. Vault_id : 모든 데이터 드라이브는 Backblaze Vault의 구성원입니다. 각 저장소는 20개의 스토리지 서버에 균등하게 나누어진 900개 또는 1,200개의 하드 드라이브로 구성됩니다. 볼트는 1,000부터 시작하는 숫자 값입니다.
  2. Pod_id : 각 Backblaze Vault에는 20개의 스토리지 서버가 있습니다. Pod_id는 20개의 스토리지 서버 중 하나에 할당된 0부터 19까지의 값을 갖는 숫자 필드입니다.
  3. Is_legacy_format : 현재는 0이지만 더 많은 필드가 추가되면 향후 분기에 유용할 것입니다.

새 스키마는 다음과 같습니다.

  • 날짜
  • 일련번호
  • 모델
  • 용량_바이트
  • 실패
  • 볼트_ID
  • pod_id
  • is_legacy_format
  • smart_1_normalized
  • smart_1_raw
  • 나머지 SMART 값 쌍(각 드라이브 모델에서 보고됨)

때때로 독자들은 드라이브가 어디에 살았는지, 그리고 더 중요하게는 그것이 죽은 곳과 관련하여 우리가 제공할 수 있는 추가 정보가 있는지 묻곤 했습니다. 위에 새로 추가된 데이터 필드는 우리가 매일 수집하는 내부 드라이브 데이터의 일부이지만 드라이브 통계 보고서를 생성하는 데 사용하는 드라이브 통계 데이터에는 포함되지 않았습니다. 인프라 소프트웨어 팀의 David의 도움으로 이제 드라이브 통계 데이터에서 이러한 필드를 사용할 수 있습니다.

Vault 및 Pod 정보를 어떻게 사용할 수 있나요?

먼저 주의할 점: 우리는 이 새 데이터의 정확히 4분의 1에 해당하는 데이터를 보유하고 있습니다. 차트와 테이블을 만들고 싶은 유혹이 있었지만 이를 더 잘 이해하기 위해 몇 분기 분량의 데이터를 확인하고 싶습니다. 올해 말에 초기 분석을 찾아보십시오.

즉, 이 데이터가 우리에게 제공하는 것은 스토리지 서버와 모든 드라이브의 저장소입니다. 거꾸로 작업하면 "특정 스토리지 서버가 드라이브 오류에 더 취약한가요?"와 같은 질문을 할 수 있어야 합니다. 또는 "특정 스토리지 서버에서 특정 드라이브 모델이 더 잘 작동합니까, 아니면 더 나쁘게 작동합니까?" 또한 멀티 엑사바이트 클라우드 스토리지 플랫폼에 대한 추가 통찰력을 제공하기 위해 스토리지 서버 유형 및 데이터 센터와 같은 데이터 요소를 혼합에 추가하기를 희망합니다.

수년에 걸쳐 우리는 내부적으로 Drive Stats 데이터를 활용하여 운영 효율성과 내구성을 개선해 왔습니다. 드라이브 통계 보고서 와 데이터 다운로드를 통해 모든 사람에게 이러한 새로운 데이터 요소를 제공하는 것은 옳은 일입니다.

마을에 새로운 드라이브가 생겼어요

2023년 2분기 드라이브 통계 데이터를 다운로드하기로 결정하셨다면 놀라운 소식이 있을 것입니다. 바로 새로운 드라이브 모델입니다. 이러한 드라이브는 4개만 있으므로 놓치기 쉬우며 현재 "테스트" 드라이브로 간주되므로 우리가 게시하는 표와 차트에는 나열되어 있지 않습니다. 하지만 데이터를 보는 경우 모델 "WDC WUH722222ALE6L4"를 검색하면 새로 설치된 22TB WDC 드라이브를 찾을 수 있습니다. 그들은 2분기 말에 테스트에 들어갔고 우리가 말하는 동안 속도를 내고 있습니다. 계속 지켜봐 주시기 바랍니다. (참고로 7월 28일 기준으로 실패한 사례는 없습니다.)

평생 하드 드라이브 오류율

2023년 6월 30일 현재, 우리는 고객 데이터를 저장하는 데 사용되는 241,297개의 하드 드라이브를 추적하고 있었습니다. 수명 분석을 위해 테스트 목적으로만 사용되었거나 전체 데이터 세트에 최소 60개의 드라이브가 표시되지 않은 357개의 드라이브를 제거했습니다. 이로써 아래의 수명 표를 분석하기 위해 31개의 서로 다른 모델로 그룹화된 240,940개의 하드 드라이브가 남게 되었습니다.

평생 통계에 대한 참고 사항 및 관찰

평생 AFR도 상승합니다 . 위에 나열된 모든 드라이브의 연간 수명 실패율은 1.45%입니다. 이는 전분기 1.40%보다 0.05% 증가한 수치다. 이 보고서 앞부분에서 2023년 2분기 데이터를 조사하여 8TB 및 10TB 드라이브가 증가율의 주요 용의자로 확인되었습니다. 크기별로 그룹화된 다양한 드라이브의 수명 AFR 비율 변화를 조사하여 이를 확인할 수 있는지 살펴보겠습니다.

빨간색 선은 모든 드라이브에 대한 수명 AFR의 Q1에서 Q2(0.05%)까지의 차이이므로 우리의 기준선입니다. 빨간색 선 위의 드라이브는 증가를 지지하고, 선 아래의 드라이브는 증가에서 뺍니다. 증가된 수명 연간 고장률을 "추진"하는 기본 드라이브(크기별)는 8TB 및 10TB 드라이브입니다. 이것은 우리가 이전에 발견한 것을 확인시켜 줍니다. 8TB 드라이브(24,891)에 비해 10TB 드라이브(1,124)가 상대적으로 적다는 점을 고려하여 8TB 드라이브 모델을 더 자세히 살펴보겠습니다.

모든 8TB 드라이브의 수명 AFR은 1분기 1.42%에서 2분기 1.59%로 증가했습니다. 12% 증가. 6개의 8TB 드라이브 모델이 작동 중이지만 이 모델 중 3개가 8TB 드라이브 집단의 드라이브 오류의 99.5%를 차지하므로 이들 모델에 중점을 두겠습니다. 아래에 나열되어 있습니다.

세 가지 모델 모두 1분기에서 2분기까지 수명 연간 고장률의 증가는 10% 이상이며 이는 모든 8TB 드라이브 모델의 12% 증가와 통계적으로 유사합니다. 마이그레이션에 집중할 하나의 드라이브 모델을 선택해야 한다면 세 가지 중 하나가 좋은 후보가 될 것입니다. 그러나 Seagate 드라이브인 ST8000DM002 모델은 문제의 다른 드라이브 모델보다 평균적으로 거의 1년 더 오래되었습니다.

  • 평생이 아니겠습니까? 위 표는 2013년 4월 20일부터 2023년 6월 30일까지, 즉 10년 2개월 10일 동안의 데이터를 분석한 것입니다. 앞서 언급했듯이, 우리가 가지고 있는 가장 오래된 드라이브는 10년 2개월 정도 된 것으로, 하루나 이틀 정도 걸립니다. 테이블 헤더를 변경해야 할 것 같지만 아직은 아닙니다. 2013년 2분기에 설치되어 현재까지 계속 작동 중인 드라이브는 해당 모델의 수명 데이터의 일부로 드라이브 일수를 보고합니다. 2013년 2분기에 설치된 모든 드라이브가 사라지면 이에 따라 테이블과 차트의 시작 날짜를 변경할 수 있습니다.

드라이브 오류에 대한 한마디

드라이브 고장률 증가가 걱정됩니까? 물론 우리는 그 수치가 낮아지기를 바라지만, 클라우드 스토리지 사업의 피할 수 없는 현실은 드라이브가 실패한다는 것입니다. 수년에 걸쳐 우리는 다양한 제조업체, 드라이브 모델 및 드라이브 크기에 걸쳐 다양한 오류율을 확인했습니다. 이에 대한 준비가 되어 있지 않으면 실패하게 됩니다. 준비의 일환으로 우리는 드라이브 통계 데이터를 환경을 이해하기 위한 많은 입력 중 하나로 사용하여 필요할 때 필요한 대로 조정할 수 있습니다.

그렇다면 드라이브 고장률 증가가 걱정되는 걸까요? 아니요, 하지만 우리도 오만하지는 않습니다. 우리는 계속해서 시스템을 모니터링하고 필요한 경우 조치를 취하며 그 과정에서 가능한 내용을 여러분과 공유할 것입니다. 




List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 에디터 업데이트+) GPT AI 기능을 포함하여 강력한 도구들을 사용해보세요 ⬆️ file 🍀플로버404 1386 2024.04.16
공지 덕질 공통 이용규칙 및 안내 (업데이트중+ 2024-04-13) 😀컴덕824 1557 2024.04.14
공지 1000P를 모으면 다이소 상품권 1000원을 신청할 수 있습니다. file Private 3130 2024.02.14
5309 일반 희비 엇갈린 LG-SK…이제 공은 특허소송으로 😀익명587 54 2023.03.27
5308 일반 흠 윈도업뎃후 다운 😀30614271 55 2022.03.03
5307 일반 흠 윈도11 문제인가 크롬문제인가 file 😀09960349 477 2022.03.29
5306 일반 흠 블투스피커 다 고장났네 😀37885824 60 2022.03.08
5305 일반 흑흑 결국 2테라 하드를 구해야 한다니 😀컴덕253 55 2022.02.10
5304 일반 흑자예상하며 기다린보람이 있군 😀익명123 382 2016.02.28
5303 일반 흐린 날씨에 7월 첫째 날이자 금요일이네요. 😀익명258 506 2022.12.31
5302 일반 휴대폰에서 이상한 소리 (삐-삐-)가 납니다 😀익명483 1486 2023.03.27
5301 일반 휴대폰 전체 다 그대로 다른 휴대폰으로 😀컴덕014 11 2022.01.01
5300 질문 휴대폰 기종 뭔지 아시는 선생님 계실까요 1 file 😀익명393 374 2023.05.05
5299 일반 휴대폰 교체시 문자 백업은 어떻게 하면 될까요? 😀익명651 1478 2023.03.27
5298 일반 휴대용 컴프레셔 😀익명683 243 2022.12.31
5297 일반 휴대용 에어컨🆒대우 네오아미코 개봉기 [4K] file 😀컴덕570 59 2023.03.27
5296 일반 훌랄라 vs bhc 양념반 후라이드반 😀82400122 286 2022.03.09
5295 일반 훈수 듣고 성공한 bj 😀익명794 509 2022.12.31
5294 일반 후쿠시마 앞바다에서 규모 7.2 지진 발생 😀익명898 508 2022.12.31
5293 일반 후 삿다...... file 😀컴덕후846 38 2022.02.14
5292 일반 효정님께 file 😀컴덕019 37 2022.01.04
5291 일반 효도컴 이륙가능..? file 😀84112305 440 2022.04.12
5290 일반 회사에서 차를 지원해줘서!! 😀컴덕377 22 2022.01.07
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 266 Next
/ 266