Título
Student data prediction
Autor
Carvalho, Nuno Miguel Soares Fialho de
Resumo
pt
Um dos grandes desafios para a educação é de ser capaz de oferecer programas de ensino
à distância onde os estudantes possam sentir que são uma mais-valia para a sua formação
académica. Embora o desenvolvimento tecnológico torne possível ultrapassar as barreiras
físicas de uma sala de aula e desta forma alcançar muito mais estudantes, há, ao mesmo
tempo, uma maior dificuldade em fazer com que a oferta tenha a qualidade espectável. A
falta de seleção de candidatos, a adequação dos programas ao ensino à distância ou a falta
de interação entre estudantes e entre estudantes e docentes são fatores que contribuem
para taxas de abandono escolar nestes cursos de ensino à distância.
O objetivo deste documento é tentar compreender quais os fatores que mais contribuem
para as taxas de abandono escolar, como identificar antecipadamente os alunos em risco
de abandono escolar, e como agir de forma a diminuir este risco.
Para tal, utilizaremos dados de programas à distância de soft skills. É feita uma
análise exploratória dos dados para compreender quais os fatores que mais contribuem
para esta taxa de abandono escolar, são aplicados algoritmos de aprendizagem automática
para classificar os estudantes em risco de abandono escolar, sendo assim possível identificar estes estudantes com antecedência e promover ações para evitar estas desistências.
en
One of the great challenges for education is to be able to offer distance learning programs
where students feel that these programs are an added value to their academic training.
Although technological development makes it possible to overcome the physical barriers
of a classroom and thus reach many more students with this distance learning offer, there
are at the same time a greater number of difficulties in reaching them with the proper
quality. The lack of selection of candidates, the suitability of the programs for distance
learning or the lack of interaction between students and between students and teachers
are factors that contribute to high dropout rates of students in these distance learning
courses.
The purpose of this dissertation is to figure out which factors contribute the most to
dropout rates, how we can identify in advance students who are at risk of dropping out,
and how we can act to decrease this risk.
To do this, we will use data from distance programs of soft skills where an exploratory
analysis of the data will be done to understand which factors contribute most to this
dropout rate and where machine learning algorithms will be applied to classify the students
at risk of dropping out, thus being possible to identify these students in advance
and promote actions to avoid these dropouts.