Teses e dissertações

Mestrado
Tecnologias Digitais para o Negócio
Título

Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa

Autor
Nascimento, Pedro Miguel Delgado do
Resumo
pt
A transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares.
en
The transcription of parliamentary debates is essential for transparency, accountability, and accessibility in democratic governance. Traditionally, this task is manual, time-consuming, and relies on specialized individuals. This work describes the study, design, and implementation of a transcription system for the automatic processing of parliamentary debates in the Assembly of the Republic of Portugal, through an innovative solution that uses advanced speech-to-text and speaker diarization technologies. The Automatic Transcription System (STAAR) was developed after analyzing existing technologies and the specific needs of the Assembly of the Republic, resulting in a solution that effectively integrates with existing processes and anticipates continuous technological evolution. The system proved to be of great value, not only for its efficiency and speed in transcribing parliamentary debates but also for its ability to adapt to parliamentary language and specific terms. The conclusions of this work show that STAAR exceeded expectations by presenting a very low error rate, reducing the time needed to produce the first draft of the Assembly of the Republic's Journal, and enabling the transcription of parliamentary committee meetings that weren’t previously documented, thus increasing the scope and detail in the documentation of parliamentary activities. This advancement represents a significant step in modernizing parliamentary processes, promoting greater transparency and accessibility of political information, and positions the Assembly of the Republic of Portugal at the forefront of technological innovation in the context of transcription of parliamentary debates.

Data

15-fev-2024

Palavras-chave

Debates parlamentares
Parliamentary debates
Machine learning
Processamento de linguagem natural - -- NLP Natural language processing
Speech recognition
Reconhecimento de fala
Transcrição automática
Diarização de orador
Automatic transcription
Speaker diarization

Acesso

Acesso livre

Ver no repositório  
Voltar ao topo