본문 바로가기

컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

단축키

Prev이전 문서

Next다음 문서

수정 삭제

단축키

Prev이전 문서

Next다음 문서

수정 삭제
Extra Form

파일이나 디렉토리의 gzip 압축을 수행할 때 1 코어 밖에 사용하지 않기 때문에 압축시간이 오래 걸린다. 
8 코어 CPU를 활용하여 병렬에서 gzip 압축을 하고 싶다. 


이런 상황에서 쓸 수 있는 좋은 방법을 소개합니다.

최근 대용량의 파일(수백기가~ 수십 테라)을 다루는 일이 많습니다..

 

1. pbzip2 설치

 

sudo apt-getinstall pbzip2

 

 

2. 멀티 코어 압축방법

 

  • c : 압축
  • z : tar 압축후 gzip압축
  • v : verbose 압축과정을 출력
  • p : 소유권등 퍼미션을 그대로 유지
  • f : 내가 지정한 파일명으로 압축

  •  
#압축
 
tar --use-compress-prog=pbzip2 -czvpf <압축 파일 이름> <압축할 폴더 또는 파일>

tar --use-compress-prog=pbzip2 -czvpf data.tar.bz2 data
# 위에 방법으로 안되면
tar --use-compress-prog=pbzip2 -czvpf <./압축 파일 이름> <./압축할 폴더 또는 파일>
tar --use-compress-prog=pbzip2 -czvpf ./data.tar.bz2 ./data

 

3. 멀티 코어 압축풀기 방법

압축풀기

 

tar --use-compress-prog=pbzip2 -xzvpf <압축 파일 이름> <압축할 파일>

 

 

 

pbzip2 는 pthread를 사용하고 SMP 시스템에서 거의 선형에 가까운 속도 향상을 달성하는 bzip2 블록 정렬 파일 압축기의 병렬 구현입니다. 이 버전의 출력은 bzip2 v1.0.2 이상과 완전히 호환됩니다(즉, pbzip2 로 압축된 모든 항목은 bzip2로 압축 해제할 수 있음).

pbzip2 는 pthreads 호환 C++ 컴파일러(예: gcc)가 있는 모든 시스템에서 작동해야 합니다. Linux, Windows(cygwin), Solaris, Tru64/OSF1, HP-UX 및 Irix에서 테스트되었습니다.

pbzip2 의 기본 설정 은 대부분의 경우 잘 작동합니다. 사용해야 할 유일한 스위치는 -d로 파일 압축을 풀고 -p가 시스템에서 자동 감지가 지원되지 않거나 특정 CPU 수를 사용하려는 경우 사용할 pbzip2 의 프로세서 수를 설정하는 것 입니다.

옵션

-b#
여기서 #은 100k 단계의 블록 크기입니다(기본값 9 = 900k).
-c, --stdout
표준 출력(stdout)으로 출력
-d,--decompress
파일 압축 해제
-f,--force
강제, 기존 출력 파일 덮어쓰기
-h,--help
이 도움말 메시지 인쇄
-k,--keep
입력 파일 유지, 삭제하지 않음
-l,--loadavg
로드 평균은 사용할 최대 프로세서 수를 결정합니다.
-m#
여기서 #은 1MB 단위의 최대 메모리 사용량입니다(기본값 100 = 100MB).
-p#
여기서 #은 프로세서 수입니다(기본값: autodetect).
-q,--quiet
저소음 모드(기본값)
-r,--read
전체 입력 파일을 RAM으로 읽고 프로세서 간에 분할
-S#
1KB 단위의 하위 스레드 스택 크기(지정되지 않은 경우 기본 스택 크기)
-t,--test
압축 파일 무결성 테스트
-v,--verbose
상세 모드
-V
pbzip2의 버전 정보를 표시 한 다음 종료
-z,--compress
파일 압축(기본값)
-1,--fast ... -9,--best
BWT 블록 크기를 100k .. 900k(기본값 900k)로 설정합니다.
--ignore-trailing-garbage=#
후행 가비지 플래그 무시(1 - 무시, 0 - 금지)

파일 이름이 지정되지 않은 경우 pbzip2는 표준 입력에서 표준 출력으로 압축하거나 압축을 해제합니다.

파일 크기

pbzip2를 사용 하여 4GB보다 큰 파일을 압축할 수 있어야 합니다 .

pbzip2 로 압축된 파일은 조각으로 분할되고 각 개별 조각이 압축됩니다. 이것은 조각을 동시에 압축할 수 있기 때문에 pbzip2 가 여러 CPU에서 더 빠르게 실행되는 방법 입니다. 최종 .bz2 파일은 이 파일 분할로 인해 일반 bzip2 프로그램으로 압축한 경우보다 약간 클 수 있습니다(보통 0.2% 미만). pbzip2 로 압축된 파일 도 pbzip2 를 사용하여 압축을 풀 때 속도가 상당히 향상됩니다 .

bzip2를 사용하여 압축된 파일은 bzip2가 프로세서 간에 분할할 수 없는 단일 청크로 데이터를 패키징하기 때문에 속도가 향상되지 않습니다.

 

예 1:

 

 

pbzip2 myfile.tar

 

 

이 예는 "myfile.tar" 파일을 압축 파일 "myfile.tar.bz2"로 압축합니다. 기본 파일 블록 크기가 900k이고 기본 BWT 블록 크기가 900k인 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 2개 프로세서)를 사용합니다.

 

예 2:

pbzip2 -b15k myfile.tar

 

 

이 예는 "myfile.tar" 파일을 압축 파일 "myfile.tar.bz2"로 압축합니다. 파일 블록 크기가 1500k이고 BWT 블록 크기가 900k인 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 2개의 프로세서)를 사용합니다. 압축이 완료된 후에도 "myfile.tar" 파일은 삭제되지 않습니다.

 

예 3:

pbzip2 -p4 -r -5 myfile.tar second*.txt

 

 

이 예는 "myfile.tar" 파일을 압축 파일 "myfile.tar.bz2"로 압축합니다. BWT 블록 크기가 500k인 프로세서 4개를 사용합니다. 파일 블록 크기는 "myfile.tar" 크기를 4(프로세서 수)로 나눈 값이 되므로 각 프로세서 간에 데이터가 고르게 분할됩니다. 이를 위해서는 pbzip2가 압축을 위해 전체 파일을 메모리로 읽을 수 있는 충분한 RAM이 필요합니다. 그런 다음 Pbzip2는 동일한 옵션을 사용하여 해당 디렉터리에서 와일드카드 "second*.txt"와 일치하는 다른 모든 파일을 압축합니다.

 

예 4

tar cf myfile.tar.bz2 --use-compress-prog=pbzip2 dir_to_compress/
tar -c directory_to_compress/ | pbzip2 -c > myfile.tar.bz2

 

 

이 예제는 TAR에서 파이프를 통해 pbzip2에 제공되는 데이터를 압축 파일 "myfile.tar.bz2"로 압축합니다. 기본 파일 블록 크기가 900k이고 기본 BWT 블록 크기가 900k인 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 2개 프로세서)를 사용합니다. TAR은 "directory_to_compress/" 디렉토리에서 모든 파일을 수집하고 작동할 때 데이터를 pbzip2에 전달합니다.

 

예 5:

pbzip2 -d -m500 myfile.tar.bz2

 

 

이 예는 "myfile.tar.bz2" 파일을 압축 해제된 파일 "myfile.tar"로 압축 해제합니다. 자동 감지된 프로세서 수(또는 자동 감지가 지원되지 않는 경우 프로세서 2개)를 사용합니다. 압축 해제를 위해 최대 500MB의 메모리를 사용합니다. -b, -r 및 -1..-9 스위치는 압축 해제에 유효하지 않습니다.

 

예 6:

pbzip2 -dc myfile.tar.bz2 | tar x

 

 

이 예제는 압축 해제 pbzip2의 출력을 tar로 파이핑하는 "myfile.tar.bz2" 파일의 압축을 풀고 압축을 풉니다.

 

예 7:

pbzip2 -c  myfile.txt.bz2

 

 

이 예제는 표준 입력에서 myfile.txt를 읽어서 myfile.txt.bz2로 리디렉션되는 표준 출력으로 압축합니다.


컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

List of Articles
번호 분류 제목 조회 수 날짜
공지 뉴스 구글 최신 뉴스 file 1386 2024.12.12
HOT글 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 237 2025.05.20
공지 사랑LOVE 포인트 만렙! 도전 4675 2025.03.19
공지 🚨(뉴비필독) 전체공지 & 포인트안내 2 25851 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20432 2025.01.21
10640 Intel 12세대 i3-12100YouTube 10비트 HDR 8K60 AV1 비디오를 원활하게 재생가능? 1 4540 2024.11.10
10639 블루투스 헤드셋 질문좀~ 49 2021.01.31
10638 e4000이랑 560s랑 음질차이 70 2021.01.28
10637 未检测到我的手机MTP。 1 29 2019.12.24
10636 amd 라이젠 1700 > 인텔 i5 12400f cpu 변경후 드라이브 오류 1 1122 2022.06.14
10635 윈도우 11 에러 중에 이런 종류가 있나요? 2 1085 2022.06.14
10634 마소계정에 정품인증 420 2022.06.14
10633 4k나 1080p 동영상 보면 렉이 걸리는데... 2 482 2022.06.14
10632 제가쓰던 놋북 윈도우가 리테일이래요 그러니까 fpp 윈도우라는거 맞죠?? 1 401 2022.06.14
10631 윈도우 10 왜 버벅일까요..? 1 348 2022.06.14
10630 오피스 정품 판매 맞을까요? 1 169 2022.06.14
10629 윈도우11 더 많은 옵션 항상사용하는 방법 263 2022.06.09
10628 윈도우 11 22H2 RTM 빌드 확정됨 223 2022.05.30
10627 해킹 대회에서 윈도우 11의 취약점 6개가 발견됨 235 2022.05.30
10626 ProtonMail, 통합 브랜드로 다양한 서비스를 제공 185 2022.05.30
10625 가상머신에 윈도우95 설치하기 630 2022.04.22
10624 구글 크롬 100 버전 공개 839 2022.04.04
10623 윈도우 11+다이렉트스토리지, 게임 로딩 시 CPU 부하가 최대 40% 감소 709 2022.04.04
10622 애플, 위조된 법적 증명에 속아 사용자 데이터를 제공? 639 2022.04.04
10621 윈도우 탐색기 대체 대안 프로그램 8가지 905 2022.04.04
10620 인터넷은 어떻게 작동되는지 알아보자 675 2022.04.02
10619 크롬 취약점 발견 Chrome 업데이트 빨리 해야 765 2022.03.30
10618 GPU-Z, 인텔 아크 알케미스트 그래픽 지원 147 2022.03.26
10617 아프리카 TV가 트위치보다 데이터를 훨씬 많이 쓰는군요 224 2022.03.26
10616 애플, 미국 애리조나 주에서 월렛에 신분증 기능 제공 151 2022.03.26
10615 macOS 12.3에서 외장 모니터 연결 문제, 게임 패드 연결 문제 164 2022.03.26
10614 비트코인 오브 아메리카, ATM에서 도지코인을 취급 152 2022.03.26
10613 1990년대 중후반에 나온 PowerVR PC GPU의 소스 코드 공개 158 2022.03.26
10612 NVIDIA, 삼성, MS를 해킹한 Lapsus$. 알고보니 10대 소년이 주범? 159 2022.03.26
10611 통신사 직원 수십억원 갖고 잠적 364 2022.03.26
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 355 Next
/ 355