Ik bied automatische spraakherkenning, speech to text advies

D
djimenez_ml
D
djimenez_ml
David J
Sommige informatie is automatisch vertaald.

Over deze dienst

Automatische vertaling

<p Wil je spraak-naar-tekst, spraakopdrachten of conversational AI in je project integreren? Ik help je graag! Met expertise in geavanceerde spraakherkenningstechnologieën zoals Whisper, Wav2vec, Kaldi, Vosk, phi4, MMS, seamless-m4t, DeepSpeech en meer, bied ik op maat gemaakte consultaties om je door implementatie, optimalisatie en probleemoplossing te begeleiden.

Ik ben gespecialiseerd in:

  • Het ontwerpen en implementeren van spraak-naar-tekst oplossingen
  • Het kiezen van de beste APIs (Deepgram, AssemblyAI, Gemini, OpenAI, Google Speech-to-Text, enz.)
  • Training en finetuning van SOTA spraakmodellen
  • Het verbeteren van nauwkeurigheid voor specifieke talen of dialecten
  • Het aanpakken van uitdagingen in lawaaierige omgevingen
  • Speaker diarization
  • Voice Activity Detection
  • Sound Event Detection

Laten we je behoeften bespreken en je ideeën tot leven brengen!

Maak kennis met David J

David J

Speech Recognition

5,0(7)
  • Afkomstig uitSpanje
  • Lid sindsnov 2024
  • Gem. reactietijd1 dag
  • Laatste levering1 week
  • Talen

    Spaans, Engels
I have +6 year of experience working with machine learning and deep learning applied to speech recognition: - Speech to text, - Diarization, - Voice Activity Detection, - Sound Event Detection, - Denoising, - Audio Signal Processing, - Emotion... in different languages. I have been working with SOTA Automatic Speech Recognition APIs and frameworks: Whisper, Kaldi, Vosk, MMS, DeepSpeech, speechbrain and wav2vec2. I have been working to fine-tuned models to improve WER and speed inference on multiple language. Hugging Face: https://huggingface.co/deepdml Github: https://github.com/djpg

Automatische vertaling

Mijn portfolio