취미/Linux

리눅스, 영상에서 음성을 분리한 후 자막 넣기(whisper.cpp)

soulowner 2025. 2. 14. 12:06
반응형

리눅스에서 Whisper.cpp 설치 방법

Whisper.cpp는 OpenAI의 Whisper 모델을 C/C++로 포팅한 것으로, 의존성 없이 실행 가능하며 AVX 명령어를 지원하여 빠른 속도를 자랑합니다.
리눅스에서 Whisper.cpp를 설치하는 방법은 크게 두 가지로 나뉩니다.

1. Snap Store를 이용한 설치 (간단)

Snap Store를 이용하면 간단하게 Whisper.cpp를 설치할 수 있습니다.
다음 명령어를 터미널에 입력하세요.

Bash
sudo snap install whisper-cpp

snap가 설치되어 있어야 함.

2. GitHub에서 직접 빌드 (상세)

GitHub에서 직접 소스를 다운로드하여 빌드하는 방법은 더 많은 유연성을 제공합니다.
다음 단계를 따르세요.

2.1. 필요 패키지 설치

빌드에 필요한 패키지를 설치합니다.
데비안/우분투 계열 리눅스 배포판의 경우 다음 명령어를 사용하세요.

Bash
sudo apt-get install build-essential cmake git

2.2. 소스 코드 다운로드

GitHub 저장소에서 소스 코드를 다운로드합니다.

Bash
git clone https://github.com/ggerganov/whisper.cpp.git
cd whisper.cpp

2.3. 빌드

다운로드한 소스 코드를 빌드합니다.

Bash
mkdir build
cd build
cmake ..
make -j$(nproc)

2.4. (선택) 예제 실행 파일 다운로드

빌드된 whisper 실행 파일 외에 예제 실행 파일을 다운로드하려면 다음 명령어를 실행하세요.

Bash
make examples

3. 실행

빌드가 완료되면 whisper.cpp/build 디렉토리 안에 whisper 실행 파일이 생성됩니다.
이 파일을 이용하여 음성 파일을 텍스트로 변환할 수 있습니다.

예제 실행 파일을 다운로드한 경우, whisper.cpp/build/examples 디렉토리 안에 다양한 예제 실행 파일이 생성됩니다.

Bash
make examples

 

4. 실행 파일 직접 실행

whisper-cli 파일이 생성되지 않은 경우, 다른 실행 파일이 생성되었는지 확인하고, 이를 직접 실행해 보세요.

bash
./build/bin/whisper -m models/ggml-base.bin -f /사용자계정/분리된음성.wav -o /home/soulowner/Template/자막파일.srt

위 방법으로 실행되지 않을 경우 절대 경로로 실행하세요.

Bash

/사용자계정/whisper.cpp/build/bin/whisper-cli -m /사용자계정/whisper.cpp/models/ggml-base.bin -f /사용자계정/분리된음성.wav -osrt -of /사용자계정/자막파일.srt

추가 정보

주의 사항

  • 빌드 과정에서 오류가 발생하면, 오류 메시지를 참고하여 필요한 패키지를 추가로 설치하거나 설정을 변경해야 합니다.
  • Whisper 모델 파일(.bin)은 별도로 다운로드해야 합니다. 모델 파일 다운로드 및 사용 방법은 Whisper.cpp GitHub 저장소를 참고하세요.

Whisper.cpp 설치 및 사용에 대한 자세한 내용은 Whisper.cpp GitHub 저장소를 참고하시기 바랍니다.

반응형