컴퓨터/노트북/인터넷
IT 컴퓨터 기기를 좋아하는 사람들의 모임방
단축키
Prev이전 문서
Next다음 문서
단축키
Prev이전 문서
Next다음 문서
최고의 그래픽 카드는 게임만을 위한 것이 아니며, 특히 AI 기반 알고리즘이 대세인 요즘에는 더욱 그렇습니다. 데이터 센터 하드웨어에서 실행되는 ChatGPT, Bard, Bing Chat(일명 시드니) 외에도 자체 로컬 버전의 Stable Diffusion, 텍스트 생성 및 OpenAI의 Whisper와 같은 다양한 도구를 실행할 수 있습니다. 마지막 주제는 오늘 소개하는 것으로, GPU를 통해 오디오를 실시간 트랜스크립션하는 것보다 훨씬 빠른 속도를 제공하며 전체 프로세스를 로컬에서 무료로 실행할 수 있습니다. 속도가 급격히 떨어지긴 하지만 CPU에서도 실행할 수 있습니다.
또한 Whisper는 Windows 또는 Dragon NaturallySpeaking을 통해 얻을 수 있는 것과 유사하게 음성 인식을 실시간으로 수행할 수 있습니다. 저희는 성능을 확인하는 데 더 흥미가 있었기 때문에 그런 방식으로 사용하려고 시도하지 않았습니다. 실시간 음성 인식은 분당 100~150단어 정도만 인식하면 됩니다(말을 빨리 하는 사람이라면 그 이상일 수도 있습니다). 저희는 다양한 GPU가 얼마나 빨리 처리할 수 있는지 보여드리고 싶었습니다.
보기좋게 서문과 성능부분 벤치만 잘라왔습니다. 궁금하신분은 원문 링크 타고 가서 읽어보세요.
https://www.tomshardware.com/news/whisper-audio-transcription-gpus-benchmarked