automatic-speech-recognition

Star

Here are 288 public repositories matching this topic...

iammartian0 / Audio101

Star

Hugging Face Audio coursework

transformers automatic-speech-recognition audio-classification whisper audio-processing

Updated Sep 7, 2023
Jupyter Notebook

RobertoAlessandri / DataScienceTask

Star

machine-learning deep-learning automatic-speech-recognition mfcc gender-classification

Updated Oct 23, 2023
Jupyter Notebook

BScUniversityCollaborations / automatic-speech-recognition

Star

Created an ASR (Automatic Speech Recognition) system that takes in individual recordings. Each recording represents a sentence composed of 5-10 English language digits, separated by adequate pauses. The system involves segmenting the sentence using a classifier, differentiating between background and foreground sounds.

python classifier automatic-speech-recognition asr openslr mel-spectrogram recognition-algorithms

Updated Sep 12, 2023
Python

therealmolf / audaio

Star

A compilation of libraries, case studies, resources, and research papers revolving around deep learning/machine learning for audio

audio music lists list machine-learning deep-learning neural-network resources music-information-retrieval neural-networks automatic-speech-recognition music-generation audioclassification

Updated Sep 13, 2022

matiuste / DistriBlock

Star

[UAI 2024 paper] DistriBlock: Identifying adversarial audio samples by leveraging characteristics of the output distribution.

machine-learning automatic-speech-recognition uncertainty-quantification adversarial-examples

Updated May 23, 2024
Python

ksquarekumar / whisper-stream

Star

Whisper Transcription Service

deep-learning inference transformer openai automatic-speech-recognition flax speech-to-text whisper jax speech-translation speech-transcription

Updated Sep 14, 2023
Jupyter Notebook

PatrickTourniaire / ASR-Exam-Revision

Star

ASR course past paper revision work for the University of Edinburgh

automatic-speech-recognition exam-revision university-of-edinburgh

Updated Jan 19, 2024
TeX

vigneshsingrinagaraju / Speech_Recording_Tool

Star

Speech Recording Tool

angularjs jquery nginx flask data-science machine-learning natural-language-processing html5 deep-learning neural-network css3 recurrent-neural-networks dataset flask-application automatic-speech-recognition heroku-deployment pyhton3 datacollection

Updated Jul 22, 2023
CSS

jpdiazpardo / gutural_nlp

Star

Gutural and scream automatic speech recognition (ASR) system using a fine-tuned version of OpenAI's Whisper model

sentiment-analysis transformers automatic-speech-recognition gradio audio-processing huggingface spleeter

Updated Oct 25, 2023
Jupyter Notebook

huihut / BaiduSpeechDemo

Star

Baidu TTS(Text-To-Speech), ASR(Automatic-Speech-Recognition) Demo for PC

wpf tts baidu automatic-speech-recognition speech-to-text asr wpf-application baidu-api

Updated Jul 20, 2019
C#

Darveivoldavara / whisper-timestamped

Star

Timestamped ASR microservice

python docker data-science monitoring deep-learning openai data-analysis automatic-speech-recognition whisper asr resource-management timestamps mssqlserver mlops fastapi uvicorn-gunicorn audio-to-text prompt-engineering

Updated Mar 29, 2024
Jupyter Notebook

QubitPi / cmusphinx.github.io

Star

CMUSphinx Website

jekyll documentation automatic-speech-recognition cmusphinx

Updated May 9, 2024
HTML

swayam01 / ASR

Star

Trained Transformer model for Speech Recognition

transformer speech-recognition automatic-speech-recognition tensor2tensor

Updated May 16, 2020
Python

Darveivoldavara / whisper_model_evaluator

Star

WER, MER, WIL of Whisper vs Vosk vs Google transcribators comparator

visualization python evaluation data-analysis automatic-speech-recognition tuning-parameters whisper asr google-speech-recognition vosk audio-to-text

Updated Mar 29, 2024
Jupyter Notebook

iammartian0 / Audio_Tasks

Star

Different Task Guides for Audio Data

audio text-to-speech translation deep-learning audio-data automatic-speech-recognition audio-classification whisper audio-processing transcribe huggingface-transformers speecht5

Updated Jul 12, 2023
Jupyter Notebook

j-n-t / speech-recognition

Star

Speech Recognition with Neural Networks

nlp natural-language-processing speech-recognition automatic-speech-recognition

Updated Jan 28, 2020
HTML

Jamiil92 / Dendi-of-Parakou-multi-speaker-speech-dataset

Star

🎯 🇧🇯 This dataset was created for speech research purposes and contains about 676 recordings of participants reading a script in Dendi as spoken in Parakou, one sentence at a time. Each example includes the audio files and the associated text. The audio is high-quality and recorded in a quiet environment. The dataset is multi-speaker, containing…

nlp automatic-speech-recognition deeplearning asr africa-nlp