ChatWhole Learn

← Back to Data Science

All Topics

Advertisement

Learn/Data Science/Deep Learning

Speech Recognition

Topic: Speech

Advertisement

Automatic Speech Recognition

Convert speech to text.

Models

Wav2Vec2. Whisper. Conformer.

Architecture

Encoder-only. Encoder-decoder. CTC.

Challenges

Noise. Accents. Multi-speaker. Low-resource.

Key Takeaways

Wav2Vec2 for self-supervised
Whisper for general ASR
Transformer-based models

Advertisement

← Feature Engineering Voice Conversion →

Advertisement

Need More Practice?

Get personalized data science help from ChatWhole's AI-powered platform.

Get Expert Help →