make project relaease ready

2023-09-22 16:17:32 +02:00
parent 4cad14ac3e
commit 882287996a
3 changed files with 46 additions and 121 deletions
@@ -0,0 +1,31 @@
 [metadata]
 name = scraibe
 version = attr: scraibe.__version__
 author = Jacob Schmieder
 author_email = Jacob.Schmieder@dbfz.de
 description = My package description
 long_description = file: README.md, LICENSE
 platforms = Linux
 keywords = transcription speech recognition whisper pyannote audio speech-to-text speech-to-text transcription speech-to-text recognition voice-to-speech
 license = GPL-3.0
 classifiers =
    Development Status :: 3 - Alpha
    Environment :: GPU :: NVIDIA CUDA :: 11.2
    License :: OSI Approved :: Open Software License 3.0 (OSL-3.0)
    Topic :: Scientific/Engineering :: Artificial Intelligence
    Programming Language :: Python :: 3.8
    Programming Language :: Python :: 3.9
    Programming Language :: Python :: 3.10
 [options]
 zip_safe = False
 include_package_data = True
 packages = find:
 python_requires = >=3.7
 install_requires =
    requests
    importlib-metadata; python_version<"3.8"
 [options.entry_points]
 console_scripts =
    executable-name = scraibe.cli:cli
@@ -1,3 +1,4 @@
 from calendar import c
 import pkg_resources
 import os
 from setuptools import setup, find_packages
@@ -36,11 +37,24 @@ if __name__ == "__main__":
            'https://download.pytorch.org/whl/cu113',
            ],
        url= github_url,
-        license='',
+        
        license='GPL-3',
        author='Jacob Schmieder',
        author_email='Jacob.Schmieder@dbfz.de',
        description='Transcription tool for audio files based on Whisper and Pyannote',
        classifiers=[
            'Development Status :: 3 - Alpha',
            'Environment :: GPU :: NVIDIA CUDA :: 11.2',
            'License :: OSI Approved :: Open Software License 3.0 (OSL-3.0)',
            'Topic :: Scientific/Engineering :: Artificial Intelligence',
            'Programming Language :: Python :: 3.8',
            'Programming Language :: Python :: 3.9',
            'Programming Language :: Python :: 3.10'],
        keywords = ['transcription', 'speech recognition', 'whisper', 'pyannote', 'audio',
                    'speech-to-text', 'speech-to-text transcription', 'speech-to-text recognition',
                    'voice-to-speech'],
        package_data={ "header" : ["app/header.html"], "logo" : ["app/Logo_KIDA_bmel_green.svg"]},
        entry_points={'console_scripts':
            ['scraibe = scraibe.cli:cli']}
    )
@@ -1,120 +0,0 @@
 import pytest
 from scraibe import Transcriber
 from unittest.mock import patch, mock_open
 import os
 def test_load_pyannote_model():
    """
    Test load_pyannote_test
    """
    from pyannote.audio.pipelines.speaker_diarization import SpeakerDiarization
    from pyannote.audio import Pipeline
    pipeline = Pipeline.from_pretrained("models/pyannote/speaker_diarization/config.yaml")
    assert isinstance(pipeline, SpeakerDiarization)
 # Test Transcribtion class
@pytest.fixture
 def transcriber():
    """
    Prepare Transcriber for testing
    Returns: Transcriber Object
    """
    return Transcriber.load_model("medium", local=True)
 def test_Transcriber_init(transcriber):
    """
    Test Transcriber initialization with a whisper model 
    """
    assert isinstance(transcriber, Transcriber)
 def test_transcription(transcriber):
    """
    Test transcription
    """
    transcript = transcriber.transcribe("tests/test.wav") 
    assert isinstance(transcript, str)
 def test_save_transcript_to_file(transcriber):
    """
    Test save_transcript_to_file
    """
    transcript = transcriber.transcribe("tests/test.wav")
    Transcriber.save_transcript(transcript, "tests/output.txt")
    assert os.path.exists("tests/output.txt")
    os.remove("tests/output.txt")
 # Test Diaraization class
 from scraibe import Diariser
@pytest.fixture
 def diarisation():
    """
    Prepare Diarisation for testing
    Returns: Diarisation Object
    """
    return Diariser.load_model("models/pyannote/speaker_diarization/config.yaml", local=True)
 def test_Diarisation_init(diarisation):
    """
    Test Diarisation initialization with a pyannote model 
    """
    assert isinstance(diarisation, Diariser)
 def test_diarisation(diarisation):
    """
    Test diarisation
    """
    diarisation = diarisation.diarization("tests/test.wav") 
    assert isinstance(diarisation, dict)
 # Test AudioProcessor
 from scraibe import AudioProcessor , TorchAudioProcessor
 def test_AudioProcessor_init():
    """
    Test AudioProcessor initialization
    """
    audio = AudioProcessor("tests/test.wav")
    assert isinstance(audio, AudioProcessor)
 def test_AudioProcessor_convert():
    """
    Test AudioProcessor convert
    """
    audio = AudioProcessor("tests/test.wav")
    audio.convert_audio("tests/test.mp3", format="mp3")
    assert os.path.exists("tests/test.mp3")
 def test_TorchAudioProcessor_from_file():
    """
    Test TorchAudioProcessor initialization
    """
    audio = TorchAudioProcessor.from_file("tests/test.wav")
    assert isinstance(audio, TorchAudioProcessor)
    os.remove("tests/test.mp3")
 def test_TorchAudioProcessor_from_ffmpeg():
    """
    Test TorchAudioProcessor initialization
    """
    audio = TorchAudioProcessor.from_ffmpeg("tests/test.wav")
    assert isinstance(audio, TorchAudioProcessor)