Título: Avaliação de Ferramentas de Reconhecimento Automático de Fala para Língua Portuguesa
Título alternativo: Evaluation of Automatic Speech Recognition Tools for Portuguese Language
Autoria de: Aline Rodrigues Guimaraes de Oliveira
Orientação de: Luiz Henrique de Campos Merschmann
Presidente da banca: Luiz Henrique de Campos Merschmann
Primeiro membro da banca: Paula Christina Figueira Cardoso
Segundo membro da banca: Erick Galani Maziero
Terceiro membro da banca: -
Quarto membro da banca: -
Palavras-chaves: Processamento de áudio, Análise de dados, Machine learning, Reconhecimento de voz, Inteligência artificial
Data da defesa: 28/04/2022
Semestre letivo da defesa: 2021-2
Data da versão final: 07/05/2022
Data da publicação: 07/05/2022
Referência: Oliveira, A. R. G. d. Avaliação de Ferramentas de Reconhecimento Automático de Fala para Língua Portuguesa. 2022. 43 p. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação Bacharelado)-Universidade Federal de Lavras, Lavras, 2022.
Resumo: Ao longo dos anos, o reconhecimento automático de fala (ASR) tem recebido cada vez mais foco e interesse da indústria e da academia. Consequentemente, as ferramentas com o objetivo de transcrever dados de áudio, em vários idiomas e suas variantes, foram desenvolvidos. Além disso, conjuntos de dados contendo dados de áudio junto com seu texto transcrito são criados para treinar e avaliar os modelos utilizados por essas ferramentas de ASR. Este trabalho tem como objetivo comparar várias ferramentas de ASR em termos de desempenho de precisão, precificação e tempo de execução, para língua portuguesa em diferentes domínios. Além disso, mapeamos o ambiente de dados existente para a língua portuguesa e discutimos métricas para avaliação de ASR.
Abstract: Over the years, automatic speech recognition (ASR) has received increasing attention and interest from industry and academia. Consequently, tools aiming to transcribe audio data, in multiple languages and their variants, have been developed. Furthermore, datasets containing audio data along with their transcribed text are created to train and evaluate the models used by these ASR tools. This work aims to compare multiple ASR tools in terms of accuracy performance, pricing, and execution time, for Portuguese language in different domains. In addition, we map the existing data environment for the Portuguese language and discuss metrics for ASR evaluation.
URI: sip.prg.ufla.br/publico/trabalhos_conclusao_curso/acessar_tcc_por_curso/
ciencia_da_computacao/20212201810549
URI alternaviva: repositorio.ufla.br/handle/1/54915
Curso: G010 - CIÊNCIA DA COMPUTAÇÃO (BACHARELADO)
Nome da editora: Universidade Federal de Lavras
Sigla da editora: UFLA
País da editora: Brasil
Gênero textual: Trabalho de Conclusão de Curso
Nome da língua do conteúdo: Inglês
Código da língua do conteúdo: eng
Licença de acesso: Acesso aberto
Nome da licença: Licença do Repositório Institucional da Universidade Federal de Lavras
URI da licença: repositorio.ufla.br
Termos da licença: Acesso aos termos da licença em repositorio.ufla.br
Detentores dos direitos autorais: Aline Rodrigues Guimaraes de Oliveira e Universidade Federal de Lavras
Baixar arquivo