bazarr-ai-sub-generator/auto_subtitle/main.py

import os
import warnings
import tempfile
from .utils.files import filename, write_srt
from .utils.ffmpeg import get_audio, overlay_subtitles
from .utils.whisper import WhisperAI


def process(args: dict):
    model_name: str = args.pop("model")
    output_dir: str = args.pop("output_dir")
    output_srt: bool = args.pop("output_srt")
    srt_only: bool = args.pop("srt_only")
    language: str = args.pop("language")
    sample_interval: str = args.pop("sample_interval")

    os.makedirs(output_dir, exist_ok=True)

    if model_name.endswith(".en"):
        warnings.warn(
            f"{model_name} is an English-only model, forcing English detection.")
        args["language"] = "en"
    # if translate task used and language argument is set, then use it
    elif language != "auto":
        args["language"] = language

    audios = get_audio(args.pop("video"), args.pop(
        'audio_channel'), sample_interval)

    model_args = {}
    model_args["model_size_or_path"] = model_name
    model_args["device"] = args.pop("device")
    model_args["compute_type"] = args.pop("compute_type")

    srt_output_dir = output_dir if output_srt or srt_only else tempfile.gettempdir()
    subtitles = get_subtitles(audios, srt_output_dir, model_args, args)

    if srt_only:
        return

    overlay_subtitles(subtitles, output_dir, sample_interval)


def get_subtitles(audio_paths: list, output_dir: str,
                  model_args: dict, transcribe_args: dict):
    model = WhisperAI(model_args, transcribe_args)

    subtitles_path = {}

    for path, audio_path in audio_paths.items():
        print(
            f"Generating subtitles for {filename(path)}... This might take a while."
        )
        srt_path = os.path.join(output_dir, f"{filename(path)}.srt")

        segments = model.transcribe(audio_path)

        with open(srt_path, "w", encoding="utf-8") as srt:
            write_srt(segments, file=srt)

        subtitles_path[path] = srt_path

    return subtitles_path
New version using faster-whisper with more model parameters exposed 2024-01-04 23:45:37 +01:00			`import os`
			`import warnings`
			`import tempfile`
			`from .utils.files import filename, write_srt`
			`from .utils.ffmpeg import get_audio, overlay_subtitles`
			`from .utils.whisper import WhisperAI`

Add GitHub Workflow with Pylint analyzer 2024-01-05 19:01:49 +01:00
New version using faster-whisper with more model parameters exposed 2024-01-04 23:45:37 +01:00			`def process(args: dict):`
			`model_name: str = args.pop("model")`
			`output_dir: str = args.pop("output_dir")`
			`output_srt: bool = args.pop("output_srt")`
			`srt_only: bool = args.pop("srt_only")`
			`language: str = args.pop("language")`
			`sample_interval: str = args.pop("sample_interval")`
Add GitHub Workflow with Pylint analyzer 2024-01-05 19:01:49 +01:00
New version using faster-whisper with more model parameters exposed 2024-01-04 23:45:37 +01:00			`os.makedirs(output_dir, exist_ok=True)`

			`if model_name.endswith(".en"):`
			`warnings.warn(`
			`f"{model_name} is an English-only model, forcing English detection.")`
			`args["language"] = "en"`
			`# if translate task used and language argument is set, then use it`
			`elif language != "auto":`
			`args["language"] = language`

Add GitHub Workflow with Pylint analyzer 2024-01-05 19:01:49 +01:00			`audios = get_audio(args.pop("video"), args.pop(`
			`'audio_channel'), sample_interval)`

			`model_args = {}`
			`model_args["model_size_or_path"] = model_name`
			`model_args["device"] = args.pop("device")`
			`model_args["compute_type"] = args.pop("compute_type")`

			`srt_output_dir = output_dir if output_srt or srt_only else tempfile.gettempdir()`
			`subtitles = get_subtitles(audios, srt_output_dir, model_args, args)`
New version using faster-whisper with more model parameters exposed 2024-01-04 23:45:37 +01:00
			`if srt_only:`
			`return`

			`overlay_subtitles(subtitles, output_dir, sample_interval)`

Add GitHub Workflow with Pylint analyzer 2024-01-05 19:01:49 +01:00
			`def get_subtitles(audio_paths: list, output_dir: str,`
			`model_args: dict, transcribe_args: dict):`
			`model = WhisperAI(model_args, transcribe_args)`
New version using faster-whisper with more model parameters exposed 2024-01-04 23:45:37 +01:00
			`subtitles_path = {}`

			`for path, audio_path in audio_paths.items():`
			`print(`
			`f"Generating subtitles for {filename(path)}... This might take a while."`
			`)`
Add GitHub Workflow with Pylint analyzer 2024-01-05 19:01:49 +01:00			`srt_path = os.path.join(output_dir, f"{filename(path)}.srt")`

New version using faster-whisper with more model parameters exposed 2024-01-04 23:45:37 +01:00			`segments = model.transcribe(audio_path)`

			`with open(srt_path, "w", encoding="utf-8") as srt:`
			`write_srt(segments, file=srt)`

			`subtitles_path[path] = srt_path`

Add GitHub Workflow with Pylint analyzer 2024-01-05 19:01:49 +01:00			`return subtitles_path`