리눅스, 영상에서 음성을 분리한 후 자막 넣기(whisper.cpp)

취미/Linux

soulowner 2025. 2. 14. 12:06

리눅스에서 Whisper.cpp 설치 방법

Whisper.cpp는 OpenAI의 Whisper 모델을 C/C++로 포팅한 것으로, 의존성 없이 실행 가능하며 AVX 명령어를 지원하여 빠른 속도를 자랑합니다.
리눅스에서 Whisper.cpp를 설치하는 방법은 크게 두 가지로 나뉩니다.

Snap Store를 이용하면 간단하게 Whisper.cpp를 설치할 수 있습니다.
다음 명령어를 터미널에 입력하세요.

Bash

sudo snap install whisper-cpp

snap가 설치되어 있어야 함.

GitHub에서 직접 소스를 다운로드하여 빌드하는 방법은 더 많은 유연성을 제공합니다.
다음 단계를 따르세요.

빌드에 필요한 패키지를 설치합니다.
데비안/우분투 계열 리눅스 배포판의 경우 다음 명령어를 사용하세요.

Bash

sudo apt-get install build-essential cmake git

GitHub 저장소에서 소스 코드를 다운로드합니다.

Bash

git clone https://github.com/ggerganov/whisper.cpp.git
cd whisper.cpp

다운로드한 소스 코드를 빌드합니다.

Bash

mkdir build
cd build
cmake ..
make -j$(nproc)

빌드된 whisper 실행 파일 외에 예제 실행 파일을 다운로드하려면 다음 명령어를 실행하세요.

Bash

make examples

빌드가 완료되면 whisper.cpp/build 디렉토리 안에 whisper 실행 파일이 생성됩니다.
이 파일을 이용하여 음성 파일을 텍스트로 변환할 수 있습니다.

예제 실행 파일을 다운로드한 경우, whisper.cpp/build/examples 디렉토리 안에 다양한 예제 실행 파일이 생성됩니다.

Bash

make examples

whisper-cli 파일이 생성되지 않은 경우, 다른 실행 파일이 생성되었는지 확인하고, 이를 직접 실행해 보세요.

bash

./build/bin/whisper -m models/ggml-base.bin -f /사용자계정/분리된음성.wav -o /home/soulowner/Template/자막파일.srt

위 방법으로 실행되지 않을 경우 절대 경로로 실행하세요.

Bash

/사용자계정/whisper.cpp/build/bin/whisper-cli -m /사용자계정/whisper.cpp/models/ggml-base.bin -f /사용자계정/분리된음성.wav -osrt -of /사용자계정/자막파일.srt

빌드 과정에서 오류가 발생하면, 오류 메시지를 참고하여 필요한 패키지를 추가로 설치하거나 설정을 변경해야 합니다.
Whisper 모델 파일(.bin)은 별도로 다운로드해야 합니다. 모델 파일 다운로드 및 사용 방법은 Whisper.cpp GitHub 저장소를 참고하세요.

Whisper.cpp 설치 및 사용에 대한 자세한 내용은 Whisper.cpp GitHub 저장소를 참고하시기 바랍니다.