Neural Speech Recognition Lecture – Icarus | Computer Vision

Abstract

This lecture overviews Neural Speech Recognition is a special case of Automatic Speech Recognition (ASR), i.e., the transcription of speech to text that has many applications e.g., in call centers, dictation, meeting minutes creation, Smart assistants (Apple’s Siri, Amazon’s Alexa, Google Assistant, Microsoft’s Cortana) and in Behavior /emotion recognition. It covers the following topics in detail: Neural Speech Recognition Datasets. Neural Speech Recognition Methods. Deep Neural Network (RNN, CNN, Transformer) methods.

Automatic Speech Recognition (ASR) system structure.

Speech Transformer.

Neural-Speech-Recognition-v1.0.1-Summary