본문 바로가기
조회 수 472 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

2023년 2분기 드라이브 통계라는 제목의 장식 이미지.

2023년 2분기 말에 Backblaze는 전 세계 데이터 센터에서 245,757개의 하드 드라이브와 SSD를 모니터링하고 있었습니다. 그 중 4,460개는 부팅 드라이브이고, 3,144개는 SSD이고 1,316개는 HDD입니다. SSD의 고장률은 SSD 에디션: 2022 드라이브 통계 검토에서 분석됩니다.

오늘은 관리 중인 241,297개의 데이터 드라이브에 중점을 두고 2023년 2분기 말 현재 분기별 및 수명주기 오류율을 검토하겠습니다. 그 과정에서 제시된 데이터에 대한 관찰 및 통찰력을 공유하고 다음 사항에 대해 알려드리겠습니다. 현재 우리가 포함하고 있는 몇 가지 추가 데이터 필드 등이 있습니다.

2023년 2분기 하드 드라이브 고장률

2023년 2분기 말에 우리는 데이터 저장에 사용되는 241,297개의 하드 드라이브를 관리하고 있었습니다. 검토를 위해 테스트 목적으로 사용되었거나 최소 60개의 드라이브가 없는 드라이브 모델로 사용된 드라이브 357개를 고려 대상에서 제외했습니다. 이로써 240,940개의 하드 드라이브가 31개의 서로 다른 모델로 그룹화되었습니다. 아래 표에서는 2023년 2분기 해당 드라이브 모델의 연간 고장률(AFR)을 검토합니다.

2023년 2분기 드라이브 통계에 대한 참고 사항 및 관찰 사항

  • 무고장 : 아래 표와 같이 2023년 2분기에 무고장을 기록한 드라이브 모델은 6개였습니다.


테이블은 해당 분기 동안 각 모델의 누적 주행 일수를 기준으로 정렬됩니다. 일반적으로 주행 모델은 통계적으로 관련성이 있으려면 해당 분기에 최소 50,000일의 주행 일수가 있어야 합니다. 상위 3개 드라이브는 모두 해당 기준을 충족하며, 3개 드라이브의 수명 AFR이 0.13%~0.45% 범위에 있다는 점을 고려하면 분기에 오류가 전혀 발생하지 않는 것은 놀라운 일이 아닙니다. 하위 3개 드라이브 중 해당 분기에 50,000일의 드라이브 일수를 누적한 드라이브는 없지만 Seagate 드라이브 2개는 좋은 출발을 보였습니다. 그리고 8년 이상 서비스를 제공한 4TB Toshiba(모델: MD04ABA400V)가 해당 분기에 제로 오류를 기록하는 것을 보는 것은 항상 좋은 일입니다.

  • 가장 오래된 드라이브? 평균 수명이 가장 오래된 드라이브 모델은 여전히 ​​98.3개월(8.2년)의 6TB Seagate(모델: ST6000DX000)이며, 이 집단 중 가장 오래된 드라이브는 104개월(8.7년)입니다.

    제품군에서 가장 오래된 작동 데이터 드라이브는 105.2개월(8.8년)의 4TB Seagate(모델: ST4000DM000)입니다. 이는 특히 데이터 센터 환경에서 상당히 인상적이지만, 우리 회사에서 가장 오래된 운영 드라이브의 승자는 실제로 부팅 드라이브입니다. 즉, 122개월(10.2년)의 지속적인 서비스를 제공하는 WDC 500GB 드라이브(모델: WD5000BPKT)입니다.
     
  • 상향 AFR : 2023년 2분기 AFR은 2023년 1분기 1.54%에서 증가한 2.28%였습니다. 분기별 AFR 수치는 변동이 심할 수 있지만 추가 조사가 필요한 추세를 식별하는 데 유용할 수도 있습니다. 이 경우에도 우리 선단의 노령화가 계속해서 증가함에 따라 상승이 예상되었습니다. 하지만 그게 진짜 이유였나요?

    아래 표에 표시된 대로 드라이브 크기별로 그룹화된 드라이브의 연간 고장률과 평균 수명부터 자세히 살펴보겠습니다.

우리의 목적을 위해 드라이브가 5년 이상이면 오래된 드라이브로 정의하겠습니다. 왜? 이것이 오늘 우리가 구매하는 드라이브의 보증 기간입니다. 물론 4TB 및 6TB 드라이브와 일부 8TB 드라이브에는 2년 보증만 제공되지만 일관성을 위해 드라이브를 "오래된" 것으로 표시하는 시점을 5년으로 유지하겠습니다. 

기존 드라이브에 대한 정의를 사용하면 12TB, 14TB 및 16TB 드라이브가 제거됩니다. 이에 따라 각 구형 드라이브 집단(4TB, 6TB, 8TB 및 10TB 모델)에 대한 지난 3년간의 분기별 AFR 차트가 아래에 표시됩니다.

흥미롭게도 가장 오래된 드라이브인 4TB와 6TB 드라이브가 자체적인 드라이브를 보유하고 있습니다. 예, 작년 정도에 비해 증가가 있었지만 나이를 고려하면 잘 지내고 있습니다.

반면 평균 사용 기간이 각각 5년, 6년인 8TB와 10TB 드라이브는 더욱 주의가 필요하다. 우리는 결론이 타당한지 알아보기 위해 이 보고서 뒷부분에서 평생 데이터를 살펴볼 것입니다.

드라이브 통계 데이터의 새로운 기능은 무엇입니까?

지난 10년 동안 우리는 드라이브 통계 데이터를 캡처하고 저장해 왔으며 2015년부터 드라이브 통계 보고서를 생성하는 데 사용한 데이터 파일을 오픈 소스로 공개 했습니다. 새로운 SMART 속성 세트를 보고하는 새로운 드라이브 모델을 설치할 때 때때로 새로운 SMART 속성 쌍이 스키마에 추가되었습니다. 이번 분기에 우리는 드라이브와 드라이브가 작동하는 환경에 대한 일부 추가 데이터 필드를 캡처하고 저장하기로 결정했으며, 이를 매 분기마다 게시하는  공개적으로 사용 가능한 드라이브 통계 파일 에 추가했습니다 .

새로운 데이터 필드

2023년 2분기 드라이브 통계 데이터부터 각 드라이브 기록에 3개의 새로운 데이터 필드가 채워집니다.

  1. Vault_id : 모든 데이터 드라이브는 Backblaze Vault의 구성원입니다. 각 저장소는 20개의 스토리지 서버에 균등하게 나누어진 900개 또는 1,200개의 하드 드라이브로 구성됩니다. 볼트는 1,000부터 시작하는 숫자 값입니다.
  2. Pod_id : 각 Backblaze Vault에는 20개의 스토리지 서버가 있습니다. Pod_id는 20개의 스토리지 서버 중 하나에 할당된 0부터 19까지의 값을 갖는 숫자 필드입니다.
  3. Is_legacy_format : 현재는 0이지만 더 많은 필드가 추가되면 향후 분기에 유용할 것입니다.

새 스키마는 다음과 같습니다.

  • 날짜
  • 일련번호
  • 모델
  • 용량_바이트
  • 실패
  • 볼트_ID
  • pod_id
  • is_legacy_format
  • smart_1_normalized
  • smart_1_raw
  • 나머지 SMART 값 쌍(각 드라이브 모델에서 보고됨)

때때로 독자들은 드라이브가 어디에 살았는지, 그리고 더 중요하게는 그것이 죽은 곳과 관련하여 우리가 제공할 수 있는 추가 정보가 있는지 묻곤 했습니다. 위에 새로 추가된 데이터 필드는 우리가 매일 수집하는 내부 드라이브 데이터의 일부이지만 드라이브 통계 보고서를 생성하는 데 사용하는 드라이브 통계 데이터에는 포함되지 않았습니다. 인프라 소프트웨어 팀의 David의 도움으로 이제 드라이브 통계 데이터에서 이러한 필드를 사용할 수 있습니다.

Vault 및 Pod 정보를 어떻게 사용할 수 있나요?

먼저 주의할 점: 우리는 이 새 데이터의 정확히 4분의 1에 해당하는 데이터를 보유하고 있습니다. 차트와 테이블을 만들고 싶은 유혹이 있었지만 이를 더 잘 이해하기 위해 몇 분기 분량의 데이터를 확인하고 싶습니다. 올해 말에 초기 분석을 찾아보십시오.

즉, 이 데이터가 우리에게 제공하는 것은 스토리지 서버와 모든 드라이브의 저장소입니다. 거꾸로 작업하면 "특정 스토리지 서버가 드라이브 오류에 더 취약한가요?"와 같은 질문을 할 수 있어야 합니다. 또는 "특정 스토리지 서버에서 특정 드라이브 모델이 더 잘 작동합니까, 아니면 더 나쁘게 작동합니까?" 또한 멀티 엑사바이트 클라우드 스토리지 플랫폼에 대한 추가 통찰력을 제공하기 위해 스토리지 서버 유형 및 데이터 센터와 같은 데이터 요소를 혼합에 추가하기를 희망합니다.

수년에 걸쳐 우리는 내부적으로 Drive Stats 데이터를 활용하여 운영 효율성과 내구성을 개선해 왔습니다. 드라이브 통계 보고서 와 데이터 다운로드를 통해 모든 사람에게 이러한 새로운 데이터 요소를 제공하는 것은 옳은 일입니다.

마을에 새로운 드라이브가 생겼어요

2023년 2분기 드라이브 통계 데이터를 다운로드하기로 결정하셨다면 놀라운 소식이 있을 것입니다. 바로 새로운 드라이브 모델입니다. 이러한 드라이브는 4개만 있으므로 놓치기 쉬우며 현재 "테스트" 드라이브로 간주되므로 우리가 게시하는 표와 차트에는 나열되어 있지 않습니다. 하지만 데이터를 보는 경우 모델 "WDC WUH722222ALE6L4"를 검색하면 새로 설치된 22TB WDC 드라이브를 찾을 수 있습니다. 그들은 2분기 말에 테스트에 들어갔고 우리가 말하는 동안 속도를 내고 있습니다. 계속 지켜봐 주시기 바랍니다. (참고로 7월 28일 기준으로 실패한 사례는 없습니다.)

평생 하드 드라이브 오류율

2023년 6월 30일 현재, 우리는 고객 데이터를 저장하는 데 사용되는 241,297개의 하드 드라이브를 추적하고 있었습니다. 수명 분석을 위해 테스트 목적으로만 사용되었거나 전체 데이터 세트에 최소 60개의 드라이브가 표시되지 않은 357개의 드라이브를 제거했습니다. 이로써 아래의 수명 표를 분석하기 위해 31개의 서로 다른 모델로 그룹화된 240,940개의 하드 드라이브가 남게 되었습니다.

평생 통계에 대한 참고 사항 및 관찰

평생 AFR도 상승합니다 . 위에 나열된 모든 드라이브의 연간 수명 실패율은 1.45%입니다. 이는 전분기 1.40%보다 0.05% 증가한 수치다. 이 보고서 앞부분에서 2023년 2분기 데이터를 조사하여 8TB 및 10TB 드라이브가 증가율의 주요 용의자로 확인되었습니다. 크기별로 그룹화된 다양한 드라이브의 수명 AFR 비율 변화를 조사하여 이를 확인할 수 있는지 살펴보겠습니다.

빨간색 선은 모든 드라이브에 대한 수명 AFR의 Q1에서 Q2(0.05%)까지의 차이이므로 우리의 기준선입니다. 빨간색 선 위의 드라이브는 증가를 지지하고, 선 아래의 드라이브는 증가에서 뺍니다. 증가된 수명 연간 고장률을 "추진"하는 기본 드라이브(크기별)는 8TB 및 10TB 드라이브입니다. 이것은 우리가 이전에 발견한 것을 확인시켜 줍니다. 8TB 드라이브(24,891)에 비해 10TB 드라이브(1,124)가 상대적으로 적다는 점을 고려하여 8TB 드라이브 모델을 더 자세히 살펴보겠습니다.

모든 8TB 드라이브의 수명 AFR은 1분기 1.42%에서 2분기 1.59%로 증가했습니다. 12% 증가. 6개의 8TB 드라이브 모델이 작동 중이지만 이 모델 중 3개가 8TB 드라이브 집단의 드라이브 오류의 99.5%를 차지하므로 이들 모델에 중점을 두겠습니다. 아래에 나열되어 있습니다.

세 가지 모델 모두 1분기에서 2분기까지 수명 연간 고장률의 증가는 10% 이상이며 이는 모든 8TB 드라이브 모델의 12% 증가와 통계적으로 유사합니다. 마이그레이션에 집중할 하나의 드라이브 모델을 선택해야 한다면 세 가지 중 하나가 좋은 후보가 될 것입니다. 그러나 Seagate 드라이브인 ST8000DM002 모델은 문제의 다른 드라이브 모델보다 평균적으로 거의 1년 더 오래되었습니다.

  • 평생이 아니겠습니까? 위 표는 2013년 4월 20일부터 2023년 6월 30일까지, 즉 10년 2개월 10일 동안의 데이터를 분석한 것입니다. 앞서 언급했듯이, 우리가 가지고 있는 가장 오래된 드라이브는 10년 2개월 정도 된 것으로, 하루나 이틀 정도 걸립니다. 테이블 헤더를 변경해야 할 것 같지만 아직은 아닙니다. 2013년 2분기에 설치되어 현재까지 계속 작동 중인 드라이브는 해당 모델의 수명 데이터의 일부로 드라이브 일수를 보고합니다. 2013년 2분기에 설치된 모든 드라이브가 사라지면 이에 따라 테이블과 차트의 시작 날짜를 변경할 수 있습니다.

드라이브 오류에 대한 한마디

드라이브 고장률 증가가 걱정됩니까? 물론 우리는 그 수치가 낮아지기를 바라지만, 클라우드 스토리지 사업의 피할 수 없는 현실은 드라이브가 실패한다는 것입니다. 수년에 걸쳐 우리는 다양한 제조업체, 드라이브 모델 및 드라이브 크기에 걸쳐 다양한 오류율을 확인했습니다. 이에 대한 준비가 되어 있지 않으면 실패하게 됩니다. 준비의 일환으로 우리는 드라이브 통계 데이터를 환경을 이해하기 위한 많은 입력 중 하나로 사용하여 필요할 때 필요한 대로 조정할 수 있습니다.

그렇다면 드라이브 고장률 증가가 걱정되는 걸까요? 아니요, 하지만 우리도 오만하지는 않습니다. 우리는 계속해서 시스템을 모니터링하고 필요한 경우 조치를 취하며 그 과정에서 가능한 내용을 여러분과 공유할 것입니다. 




List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 에디터 업데이트+) GPT AI 기능을 포함하여 강력한 도구들을 사용해보세요 ⬆️ file 🍀플로버404 360 2024.04.16
공지 덕질 공통 이용규칙 및 안내 (업데이트중+ 2024-04-13) 😀컴덕824 670 2024.04.14
공지 1000P를 모으면 다이소 상품권 1000원을 신청할 수 있습니다. file Private 2571 2024.02.14
5280 일반 클리어 키캡 + 투명 축 (아이스실버 리니어) 교체 후기 file 😀컴덕034 276 2024.04.17
5279 일반 직구한 독거미 99배열 드디어 왔다!!! file 😀컴덕703 283 2024.04.17
5278 일반 그램 +뷰 2세대 샀어 file 😀컴덕610 258 2024.04.17
5277 일반 S24울 발열심한데 처음이라그래? 😀컴덕557 288 2024.04.17
5276 일반 공유기 추천 해줄 덬 !! 😀컴덕380 242 2024.04.17
5275 일반 인간을 가스라이팅 하고 자살 방법까지 알려주는 AI의 위험성 file 😀컴덕830 361 2024.04.16
5274 Lec 2 | MIT 6.00 Introduction to Computer Science and Programming, Fall 2008 file 😀컴덕213 445 2024.04.06
5273 일반 프로그래머 진짜 사라질 수도… 우려하던 세계 최초 AI 프로그래머 탄생… 😀컴덕518 337 2024.04.06
5272 정보/소식 중국산 미니PC 주의 비밀번호 터는 '악성코드' 심어 판매 역시 중국은 의심해봐야 돼 file 😀컴덕510 309 2024.04.06
5271 정보/소식 펌) 점보 프레임뽕이 와서 과연 유용한가 테스트를 해보았습니다 😀컴덕814 405 2024.04.06
5270 일반 클리앙 대체 사이트로 여기가 딱인듯 😀컴덕354 427 2024.03.31
5269 일반 21세기 국운 걸린 '반도체 3차 전쟁' (뉴스토리) / SBS file 😀컴덕864 540 2024.03.16
5268 일반 컴고수님들께 질문 2 😀컴덕321 685 2024.03.15
5267 질문 gstatic 이 사이트 무슨사이트인줄 알아??? 1 😀컴덕444 698 2024.03.13
5266 일반 일부러 컴퓨터 수리 사기당해본 유튜버 😀컴덕670 245 2024.02.21
5265 전문지식 wifi5 vs wifi6 와이파이5,6 차이점을 알아보자 file 😀컴덕702 353 2024.02.15
5264 일반 Bluetooth 헤드폰, 이어의 오디오 대기 시간에 대해 이야기해 보겠습니다. 😀컴덕995 442 2024.02.12
5263 일반 Bluetooth 블루투스 레이턴시 및 지연 시간 참고 file 😀컴덕753 420 2024.02.12
5262 28nm로 고정된 "무어의 법칙은 죽었다"는 새로운 증거 추가: 트랜지스터 비용 하락이 10년 전에 ... file 😀컴덕686 279 2024.02.08
5261 올해 4월 출시된 우분투 24.04 LTS 장기 지원 버전은 5년간 업데이트 지원을 받게 된다. file 😀컴덕898 281 2024.02.08
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 264 Next
/ 264