본문 바로가기

단축키

Prev이전 문서

Next다음 문서

수정 삭제

단축키

Prev이전 문서

Next다음 문서

수정 삭제
Extra Form

파일이나 디렉토리의 gzip 압축을 수행할 때 1 코어 밖에 사용하지 않기 때문에 압축시간이 오래 걸린다. 
8 코어 CPU를 활용하여 병렬에서 gzip 압축을 하고 싶다. 


이런 상황에서 쓸 수 있는 좋은 방법을 소개합니다.

최근 대용량의 파일(수백기가~ 수십 테라)을 다루는 일이 많습니다..

 

1. pbzip2 설치

 

sudo apt-getinstall pbzip2

 

 

2. 멀티 코어 압축방법

 

  • c : 압축
  • z : tar 압축후 gzip압축
  • v : verbose 압축과정을 출력
  • p : 소유권등 퍼미션을 그대로 유지
  • f : 내가 지정한 파일명으로 압축

  •  
#압축
 
tar --use-compress-prog=pbzip2 -czvpf <압축 파일 이름> <압축할 폴더 또는 파일>

tar --use-compress-prog=pbzip2 -czvpf data.tar.bz2 data
# 위에 방법으로 안되면
tar --use-compress-prog=pbzip2 -czvpf <./압축 파일 이름> <./압축할 폴더 또는 파일>
tar --use-compress-prog=pbzip2 -czvpf ./data.tar.bz2 ./data

 

3. 멀티 코어 압축풀기 방법

압축풀기

 

tar --use-compress-prog=pbzip2 -xzvpf <압축 파일 이름> <압축할 파일>

 

 

 

pbzip2 는 pthread를 사용하고 SMP 시스템에서 거의 선형에 가까운 속도 향상을 달성하는 bzip2 블록 정렬 파일 압축기의 병렬 구현입니다. 이 버전의 출력은 bzip2 v1.0.2 이상과 완전히 호환됩니다(즉, pbzip2 로 압축된 모든 항목은 bzip2로 압축 해제할 수 있음).

pbzip2 는 pthreads 호환 C++ 컴파일러(예: gcc)가 있는 모든 시스템에서 작동해야 합니다. Linux, Windows(cygwin), Solaris, Tru64/OSF1, HP-UX 및 Irix에서 테스트되었습니다.

pbzip2 의 기본 설정 은 대부분의 경우 잘 작동합니다. 사용해야 할 유일한 스위치는 -d로 파일 압축을 풀고 -p가 시스템에서 자동 감지가 지원되지 않거나 특정 CPU 수를 사용하려는 경우 사용할 pbzip2 의 프로세서 수를 설정하는 것 입니다.

옵션

-b#
여기서 #은 100k 단계의 블록 크기입니다(기본값 9 = 900k).
-c, --stdout
표준 출력(stdout)으로 출력
-d,--decompress
파일 압축 해제
-f,--force
강제, 기존 출력 파일 덮어쓰기
-h,--help
이 도움말 메시지 인쇄
-k,--keep
입력 파일 유지, 삭제하지 않음
-l,--loadavg
로드 평균은 사용할 최대 프로세서 수를 결정합니다.
-m#
여기서 #은 1MB 단위의 최대 메모리 사용량입니다(기본값 100 = 100MB).
-p#
여기서 #은 프로세서 수입니다(기본값: autodetect).
-q,--quiet
저소음 모드(기본값)
-r,--read
전체 입력 파일을 RAM으로 읽고 프로세서 간에 분할
-S#
1KB 단위의 하위 스레드 스택 크기(지정되지 않은 경우 기본 스택 크기)
-t,--test
압축 파일 무결성 테스트
-v,--verbose
상세 모드
-V
pbzip2의 버전 정보를 표시 한 다음 종료
-z,--compress
파일 압축(기본값)
-1,--fast ... -9,--best
BWT 블록 크기를 100k .. 900k(기본값 900k)로 설정합니다.
--ignore-trailing-garbage=#
후행 가비지 플래그 무시(1 - 무시, 0 - 금지)

파일 이름이 지정되지 않은 경우 pbzip2는 표준 입력에서 표준 출력으로 압축하거나 압축을 해제합니다.

파일 크기

pbzip2를 사용 하여 4GB보다 큰 파일을 압축할 수 있어야 합니다 .

pbzip2 로 압축된 파일은 조각으로 분할되고 각 개별 조각이 압축됩니다. 이것은 조각을 동시에 압축할 수 있기 때문에 pbzip2 가 여러 CPU에서 더 빠르게 실행되는 방법 입니다. 최종 .bz2 파일은 이 파일 분할로 인해 일반 bzip2 프로그램으로 압축한 경우보다 약간 클 수 있습니다(보통 0.2% 미만). pbzip2 로 압축된 파일 도 pbzip2 를 사용하여 압축을 풀 때 속도가 상당히 향상됩니다 .

bzip2를 사용하여 압축된 파일은 bzip2가 프로세서 간에 분할할 수 없는 단일 청크로 데이터를 패키징하기 때문에 속도가 향상되지 않습니다.

 

예 1:

 

 

pbzip2 myfile.tar

 

 

이 예는 "myfile.tar" 파일을 압축 파일 "myfile.tar.bz2"로 압축합니다. 기본 파일 블록 크기가 900k이고 기본 BWT 블록 크기가 900k인 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 2개 프로세서)를 사용합니다.

 

예 2:

pbzip2 -b15k myfile.tar

 

 

이 예는 "myfile.tar" 파일을 압축 파일 "myfile.tar.bz2"로 압축합니다. 파일 블록 크기가 1500k이고 BWT 블록 크기가 900k인 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 2개의 프로세서)를 사용합니다. 압축이 완료된 후에도 "myfile.tar" 파일은 삭제되지 않습니다.

 

예 3:

pbzip2 -p4 -r -5 myfile.tar second*.txt

 

 

이 예는 "myfile.tar" 파일을 압축 파일 "myfile.tar.bz2"로 압축합니다. BWT 블록 크기가 500k인 프로세서 4개를 사용합니다. 파일 블록 크기는 "myfile.tar" 크기를 4(프로세서 수)로 나눈 값이 되므로 각 프로세서 간에 데이터가 고르게 분할됩니다. 이를 위해서는 pbzip2가 압축을 위해 전체 파일을 메모리로 읽을 수 있는 충분한 RAM이 필요합니다. 그런 다음 Pbzip2는 동일한 옵션을 사용하여 해당 디렉터리에서 와일드카드 "second*.txt"와 일치하는 다른 모든 파일을 압축합니다.

 

예 4

tar cf myfile.tar.bz2 --use-compress-prog=pbzip2 dir_to_compress/
tar -c directory_to_compress/ | pbzip2 -c > myfile.tar.bz2

 

 

이 예제는 TAR에서 파이프를 통해 pbzip2에 제공되는 데이터를 압축 파일 "myfile.tar.bz2"로 압축합니다. 기본 파일 블록 크기가 900k이고 기본 BWT 블록 크기가 900k인 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 2개 프로세서)를 사용합니다. TAR은 "directory_to_compress/" 디렉토리에서 모든 파일을 수집하고 작동할 때 데이터를 pbzip2에 전달합니다.

 

예 5:

pbzip2 -d -m500 myfile.tar.bz2

 

 

이 예는 "myfile.tar.bz2" 파일을 압축 해제된 파일 "myfile.tar"로 압축 해제합니다. 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 프로세서 2개)를 사용합니다. 압축 해제를 위해 최대 500MB의 메모리를 사용합니다. -b, -r 및 -1..-9 스위치는 압축 해제에 유효하지 않습니다.

 

예 6:

pbzip2 -dc myfile.tar.bz2 | tar x

 

 

이 예제는 압축 해제 pbzip2의 출력을 tar로 파이핑하는 "myfile.tar.bz2" 파일의 압축을 풀고 압축을 풉니다.

 

예 7:

pbzip2 -c  myfile.txt.bz2

 

 

이 예제는 표준 입력에서 myfile.txt를 읽어서 myfile.txt.bz2로 리디렉션되는 표준 출력으로 압축합니다.


List of Articles
번호 분류 제목 날짜 조회 수
공지 유머 🚨(뉴비필독) 전체공지 & 포인트안내 13 2024.11.04 27289
공지 이슈 URL만 붙여넣으면 끝! 임베드 기능 2025.01.21 21569
380463 10개 사이트 전부 한번에 블로그글쓰기 ******************** new 2025.06.27 27
380462 https://vqoo.net/ new 2025.06.27 26
380461 덕질사이트 게시판 리스트 목록 new 2025.06.27 20
380460 전문리뷰 "해독 한 번 하실래요?" 타임지 선정 세계 1위 해독/디톡스 식품 newfile 2025.06.27 27
380459 전문리뷰 살이 왜 안 빠질까? 답은 '병원밥 다이어트'에 있었어! (DASH 다이어트 완전 정복) newfile 2025.06.27 27
380458 전문리뷰 먹을수록 뱃살이 빠진다고?! 내장지방 완전 박살 내는 대두(콩) 비법, 이거였어! newfile 2025.06.27 34
380457 전문리뷰 방울토마토, 다이어트+피부+건강 한 번에 잡는 꿀팁 대방출! 왜 슈퍼푸드인지 알려줄게! newfile 2025.06.27 26
380456 전문리뷰 매일 먹으면 살 안 찌는 체질로 몸을 바꾸는 음식 (체지방축적기능 OFF) newfile 2025.06.27 28
380455 전문리뷰 [필수 지식] 식초, 현명하게 고르고 건강하게 활용하는 법! 종류부터 효능까지 완벽 정리 🍏🍇🍚 newfile 2025.06.27 27
380454 전문리뷰 식초 다이어트 A to Z: 혈당 감소부터 체지방 연소까지! 아무 식초나 다 된다? (Feat. 천연 식초, 애사비) 굿닥터 핵심정리 newfile 2025.06.26 34
380453 전문리뷰 맛있는 땅콩버터, 이렇게 먹으면 살도 쏙~ 염증도 쏙~ newfile 2025.06.26 28
380452 전문리뷰 글루텐 괜찮다 vs 안 괜찮다, 한 방에 쏙 정리 newfile 2025.06.26 34
380451 전문리뷰 단백질/저당 그래놀라 인기 8종 노빠꾸 비교리뷰 newfile 2025.06.26 28
380450 전문리뷰 저당시리얼 TOP 3 노빠꾸 비교리뷰 (설탕보다 더 나쁜 저당!?!?) newfile 2025.06.26 30
380449 전문리뷰 저당시리얼 TOP 3 노빠꾸 비교리뷰 (설탕보다 더 나쁜 저당!?!?) newfile 2025.06.26 40
380448 전문리뷰 저당시리얼 TOP 3 노빠꾸 비교리뷰 (설탕보다 더 나쁜 저당!?!?) newfile 2025.06.26 33
380447 전문리뷰 랩노쉬 제품 8종 전체 노빠꾸 리뷰 (6종 불합격) newfile 2025.06.26 32
380446 전문리뷰 단백질바 21종 노빠꾸 비교리뷰 (15종 탈락) newfile 2025.06.26 25
380445 전문리뷰 단백질 쉐이크 주요제품 전부 노빠꾸 비교리뷰 (13종 중 8종 탈락) newfile 2025.06.26 30
380444 전문리뷰 고품질 vs 저품질 단백질, 1초 만에 구별하는 방법! (feat. 운동인, 알레르기 보유자 필독) newfile 2025.06.26 38
380443 전문리뷰 쿠팡 저칼로리 과자, 진짜 저칼로리 맞을까? 12종 비교 리뷰 요약! newfile 2025.06.26 28
380442 전문리뷰 "무가당" 담터 핫초코, 과연 당뇨인도 안심하고 마실 수 있을까? 찐 후기! newfile 2025.06.26 32
380441 전문리뷰 "7개는 가짜 꼼수제품" 당류제로 핫초코/코코아 9종 노빠꾸 리뷰 newfile 2025.06.26 30
380440 전문리뷰 스테비아(당류제로) 커피믹스 10종 노빠꾸 리뷰 "진짜/가짜 전부 공개" newfile 2025.06.26 34
380439 이용권/상품권 G마켓 빕스 15000원 할인권 1500원 newfile 2025.06.26 34
380438 먹거리 명가삼대떡집 흑미호두설기 10+10 16,650원(체감가) 무배 newfile 2025.06.26 135
380437 밤만되면 5 new 2025.06.26 58
380436 살 빼는데 2 new 2025.06.26 57
380435 기사/뉴스 하이키, 컴백 활동 본격 시작..'엠카' 완벽 퍼포먼스 선사 newfile 2025.06.26 53
380434 기사/뉴스 뉴비트 "올해 가장 기억에 남는 순간은 데뷔 무대"[화보] newfile 2025.06.26 54
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 12683 Next
/ 12683