video-subtitle

동영상에서 자막을 자동 생성하고 발표자료 기반으로 교정하는 스킬. "자막 생성", "영상 자막", "STT", "subtitle" 요청에 사용. mlx-whisper로 추출 → 중복 정리 → 발표자료 기반 교정까지 자동화.

$ 安裝

git clone https://github.com/team-attention/ai-builders-meetup /tmp/ai-builders-meetup && cp -r /tmp/ai-builders-meetup/.claude/skills/video-subtitle ~/.claude/skills/ai-builders-meetup

// tip: Run this command in your terminal to install the skill


name: video-subtitle description: | 동영상에서 자막을 자동 생성하고 발표자료 기반으로 교정하는 스킬. "자막 생성", "영상 자막", "STT", "subtitle" 요청에 사용. mlx-whisper로 추출 → 중복 정리 → 발표자료 기반 교정까지 자동화. arguments:

  • name: video description: 동영상 파일 경로 required: true
  • name: reference description: 발표자료(PDF) 경로 (선택, 교정 시 필요) required: false

Video Subtitle Generator

동영상에서 자막을 생성하고 발표자료 기반으로 교정하는 스킬.

사용법

# 자막만 생성
/video-subtitle --video /path/to/video.mp4

# 자막 생성 + 발표자료 기반 교정
/video-subtitle --video /path/to/video.mp4 --reference /path/to/slides.pdf

워크플로우

┌─────────────────┐
│  동영상 입력    │
└────────┬────────┘
         ▼
┌─────────────────┐
│ subtitle-       │  mlx-whisper (large-v3)
│ generator       │  → SRT 파일 생성
└────────┬────────┘
         ▼
┌─────────────────┐
│ subtitle-       │  중복/hallucination 제거
│ cleaner         │  → 정리된 SRT
└────────┬────────┘
         ▼
┌─────────────────┐
│ subtitle-       │  발표자료 기반 STT 오류 교정
│ corrector       │  → 최종 SRT
└────────┬────────┘  (reference 있을 때만)
         ▼
┌─────────────────┐
│  최종 자막      │
└─────────────────┘

실행 단계

Step 1: 자막 생성 (subtitle-generator)

Task: video-subtitle:subtitle-generator
Prompt: |
  다음 동영상에서 한국어 자막을 생성해주세요.
  - video_path: $video
  - language: ko
  - model: large-v3

출력: {video_basename}.srt

Step 2: 중복 정리 (subtitle-cleaner)

Task: video-subtitle:subtitle-cleaner
Prompt: |
  다음 자막 파일에서 중복과 hallucination을 정리해주세요.
  - srt_path: {output_from_step1}

Step 3: STT 교정 (subtitle-corrector) - reference가 있을 때만

Task: video-subtitle:subtitle-corrector
Prompt: |
  발표자료를 참조하여 STT 오류를 찾고 수정해주세요.
  - srt_path: {output_from_step2}
  - reference_path: $reference

예시

입력

/video-subtitle --video community/ai-builders-meetup/2-echo-delta/videos/meetup_02_서진님.mp4 --reference community/ai-builders-meetup/2-echo-delta/slides/1-김서진-AI-Native.pdf

출력

## 자막 생성 완료

### 1. 자막 추출
- 입력: meetup_02_서진님.mp4 (9.8분)
- 출력: meetup_02_서진님.srt
- 세그먼트: 116개
- 소요: 4분 30초

### 2. 중복 정리
- 원본: 116개 → 정리 후: 81개
- 제거: 35개 (30%)

### 3. STT 교정
- 발견된 오류: 23개
- 수정 완료: 23개

### 최종 파일
community/ai-builders-meetup/2-echo-delta/videos/meetup_02_서진님.srt

시스템 요구사항

  • Apple Silicon Mac (M1/M2/M3)
  • Python 3.10+
  • 메모리: 16GB+ (large-v3 모델용)
  • 저장공간: 3GB+ (모델 다운로드)

지원 형식

  • 입력: mp4, mov, mkv, webm, avi
  • 출력: srt
  • 발표자료: pdf