Acreditações
A Licenciatura em Ciência de Dados (LCD) está alicerçada na convergência das várias áreas científicas - Matemática, Estatística e Informática – com um plano construído em torno da atividade de projeto, onde se promove uma reflexão prática e teórica, no sentido de dotar o aluno para um pensamento informado, crítico e autónomo perante as várias dimensões dos dados na Sociedade do Conhecimento e em plena Revolução Digital.
A Licenciatura está bem sedimentada na apreensão, compreensão e experimentação nas áreas base de conhecimento, seguida por uma aquisição de progressiva autonomia do estudante e na capacidade de responder a problemas de complexidade crescente.
Com a síntese operada nos dois últimos semestres, consolida-se a coerência de um programa formativo de acordo com uma prática consolidada e a exigência de requisitos profissionais excecionais, de modo a responder aos desafios da sociedade moderna.
Plano de Estudos para 2025/2026
Unidades curriculares | Créditos | |
---|---|---|
Programação
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Amostragem e Fontes de Informação
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Dados na Ciência, Gestão e Sociedade
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Tópicos de Matemática II
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Fundamentos de Álgebra Linear
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Estruturas de Dados e Algoritmos
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Tópicos de Matemática I
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Optimização para Ciência de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Análise Exploratória de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Pensamento Crítico
2.0 ECTS
|
Optativas > Competências Transversais > Obrigatórias | 2.0 |
Escrita de Textos Técnicos e Científicos
2.0 ECTS
|
Optativas > Competências Transversais > Obrigatórias | 2.0 |
Métodos de Aprendizagem Não Supervisionada
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Armazenamento para Big Data
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Optimização Heurística
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Métodos de Aprendizagem Supervisionada
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Processamento de Big Data
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Segurança, Ética e Privacidade
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Projeto Aplicado em Ciência de Dados I
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Estatística Computacional
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Introdução A Modelos Dinâmicos
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Fundamentos em Gestão de Bases de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Modelação Estocástica
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Análise de Redes
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Análise da Performance em Gestão
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Projeto Aplicado em Ciência de Dados II
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Projeto Final Aplicado em Ciência dos Dados
12.0 ECTS
|
Unidades Curriculares Obrigatórias | 12.0 |
Interfaces Web para A Gestão de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Inteligência Artificial Simbólica para Ciência de Dados
6.0 ECTS
|
Unidades Curriculares Obrigatórias | 6.0 |
Programação
Após a conclusão desta unidade curricular o aluno deverá ficar apto a:
OA1. Desenvolver funções/procedimentos que implementem algoritmos simples.
OA2. Desenvolver código para manipular estruturas vetoriais e objetos.
OA3. Desenvolver classes de objetos simples.
OA4. Escrever e compreender código Python.
CP1. Funções e parâmetros
CP2. Variáveis e estruturas de controlo
CP3. Invocação e recursividade
CP4: Procedimentos e input/output
CP5. Objetos e referências
CP6. Classes de objetos
CP7. Objetos compostos
CP8. Classes de objetos compostos
CP9. Vetores
CP10. Matrizes
Esta UC é feita apenas por avaliação ao longo do semestre, não contemplando a modalidade de avaliação por exame.
Componentes da avaliação:
a) TPCs (15%): 6 mini-testes online, para fazer em casa;
b) TESTE1 (20%): Prova escrita intercalar;
c) PROJETO (25%): Projeto individual;
d) TESTE2 (40%): Prova escrita a realizar em 1º época, 2ª época ou época especial (Artº 14 do RGACC)
Requisito de aprovação: TPCs + PROJETO >= 8 valores (em 20 valores).
A nota final do PROJETO é fixada para cada estudante através de uma prova oral e dependerá do código, dos relatórios e do desempenho do estudante na oral.
A assiduidade não é requisito essencial de aprovação.
Outra informação relevante:
- As perguntas feitas nas provas escritas podem envolver aspectos relativos ao projeto.
- Não é possível obter aprovação apenas através da realização de exame final
- em caso de reprovação, o estudante poderá realizar o TESTE2 na época seguinte, mantendo a nota das restantes componentes
- Quando a melhoria de nota ocorrer num ano letivo diferente daquele em que foi feito o trabalho, a nota das componentes PROJETO, TPCs e TESTE1 é substituída por uma prova prática, a realizar em computador antes ou depois da prova escrita. Os alunos nessas condições que pretendam realizar melhoria de nota devem contactar o coordenador da UC, com uma antecedência mínima de 2 dias antes da prova da 1ª época.
Title: João P. Martins, Programação em Python: Introdução à programação com múltiplos paradigmas, 2013, IST Press, https://istpress.tecnico.ulisboa.pt/produto/programacao-em-python-introducao-a-programacao-utilizando-multiplos-paradigmas/
Authors:
Reference: null
Year:
Amostragem e Fontes de Informação
No final desta UC os estudantes deverão ser capazes de identificar tipos e fontes de informação adequados aos objetivos da investigação (OA1), avaliar de forma crítica a qualidade da informação obtida (OA2), aplicar os principais métodos de amostragem (OA3) e distinguir entre desiged data e big data (OA4).
CP1. Tipos e Fontes de Informação; Qualidade das fontes de informação
CP2. Princípios e aplicações de Amostragem
CP3. Designed Data vs Big Data
Regimes de avaliação: ao longo do semestre ou por exame
Ao longo do semestre:
- Fichas de trabalho (5%)
- Trabalho em grupo: (35%);
- Teste individual (60%); nota mínima 7,5
Por exame: Teste individual (100%)
A equipa docente poderá convocar qualquer estudante para uma prova oral no seguimento da realização de qualquer um dos elementos de avaliação.
Estudantes abrangidos pelo RIIEE deverão contactar o coordenador da UC com vista ao enquadramento dos processos de aprendizagem e avaliação na UC.
Title: Jarrett, C. (2021). Surveys That Work: A Practical Guide for Designing and Running Better Surveys. Rosenfeld Media.
Salganik, M. (2018). Bit by Bit- Social Research in the Digital Age. New Jersey: Princeton University Press.
Stebbins, L. (2005). Student Guide to Research in the Digital Age: How to Locate and Evaluate Information Sources. Libraries Unlimited.
Vicente, P., (2024) Apontamentos de apoio à UC de Amostragem e Fontes de Informação.
Authors:
Reference: null
Year:
Title: Vicente, P. (2012). Estudos de mercado e de opinião, Edições Sílabo.
Authors:
Reference: null
Year:
Dados na Ciência, Gestão e Sociedade
Após esta unidade curricular o estudante estará apto a atingir os Objetivos de Aprendizagem (OA):
OA1. Distinguir as diferentes definições e diferentes tipos de dados, bem como as diferentes estratégias de investigação ou negócio que os geram.
OA2. Distinguir quais as principais alegações que conduzem a diferentes interpretações o que são dados.
OA3. Explicar as diferenças entre aproximações quantitativas e qualitativas na geração de dados.
OA4. Examinar as implicações da recolha de dados em Ciência, Gestão e na Sociedade.
OA5. Debater as implicações dos modelos de dados em para as pessoas nas organizações e na sociedade em geral.
Conteúdos Programáticos (CP):
CP1. O que são dados e como pensar com dados.
CP2. Tipos de Problemas tratados em Ciência de Dados e especificidades nos domínios da Ciência, Gestão e Sociedade.
CP3. Diferentes tradições e metodologias de investigação e definições de aquisição de conhecimento.
CP4. Tradução de desafios reais para conceitos técnicos e de acordo com uma linguagem cientificamente orientada.
CP5. A dimensão ética das e nas estratégias de utilização de dados.
CP6. Exposição de casos práticos.
Esta UC é feita apenas por avaliação ao longo do semestre, não contemplando a modalidade de avaliação por exame.
Componentes da avaliação:
a) Mini-testes (30%): 6 mini-testes (5% cada, a grande maioria para fazer em casa)
b) Projeto (30%): trabalho de grupo
c) Teste final (40%): Prova escrita a realizar no período da 1ª época, 2ª época ou época especial (Art 14º, RGACC)
Requisito de aprovação: Teste final >= 8 valores (em 20 valores)
A nota final do Projeto dependerá do código, dos relatórios e do desempenho dos estudantes na apresentação do trabalho realizado.
Title: Cathy O'Neil, Rachel Schutt, Doing Data Science: Straight Talk from the Frontline, 2014, ISBN: 9781449358655,
Borgman, C. L., Big data, little data, no data: scholarship in the networked world, 2015, ISBN: 9780262529914,
Rob Kitchin, The data revolution: Big data, open data, data infrastructures and their consequences, 2014, https://doi.org/10.4135/9781473909472,
Authors:
Reference: null
Year:
Title: Davenport, T., Harris, J., and Morison, R., Analytics at work: smarter decisions, better results. Harvard Business Review Press, USA., 2010, ISBN: 9781422177693,
Turban, E., Sharda, R., Delen, D., Decision Support and Business Intelligence Systems (9th Eds), 2010, ISBN: 978-0136107293,
Davenport, T., Big Data at Work: Dispelling the Myths, Uncovering the Opportunities, 2014, ISBN: 978-1422168165,
Authors:
Reference: null
Year:
Tópicos de Matemática II
No final da UC, cada estudante deverá ser capaz de:
OA1. Calcular derivadas parciais e gradientes (algebricamente e numericamente).
OA2. Determinar aproximações lineares de funções de várias variáveis.
OA3. Determinar e caracterizar pontos críticos de funções de várias variáveis (algebricamente e numericamente).
OA4. Aplicar os conceitos anteriores no contexto de problemas de regressão linear.
OA5. Calcular integrais duplos (algebricamente e numericamente).
OA6. Aplicar o cálculo integral ao cálculo de áreas, volumes e probabilidades.
OA7. Interpretar geometricamente todos os conceitos estudados.
OA8. Implementar em MATLAB alguns dos métodos computacionais desenvolvidos.
CP1. Cálculo Diferencial.
1.1. Limites e continuidade
1.2. Derivadas parciais.
1.3. Plano tangente e diferenciabilidade.
1.4. Regra da cadeia.
1.5. Cálculo e classificação de pontos críticos.
1.6. Descida do gradiente.
1.7. Regressão linear.
CP2. Cálculo Integral.
2.1. Integrais duplos.
2.2. Integrais duplos em coordenadas polares.
2.3. Aplicações: áreas e volumes; densidades e massas; teoria das probabilidade.
Aprovação com classificação não inferior a 10 valores numa das modalidades:
- Avaliação ao longo do semestre: Teste Escrito (80%) + mini-projetos MATLAB (20%).
- Avaliação por Exame (100%), em qualquer uma das épocas de exame.
Title: Stewart, J. "Cálculo - Volume 2", Tradução da 8ª edição norte-americana (4ª edição brasileira), Cenage Learning, 2017.
Authors:
Reference: null
Year:
Fundamentos de Álgebra Linear
No final da UC, cada estudante deverá ser capaz de:
OA1. Definir vetores e explicar as suas propriedades. Realizar operações com vetores no espaço euclideano R^n. Definir e determinar subespaços de R^n, respetivas bases e dimensão.
OA2. Aplicar os métodos de eliminação de Gauss e Gauss-Jordan para resolver e classificar sistemas lineares. Interpretar geometricamente as suas soluções.
OA3. Dar exemplos de diferentes tipos de matrizes e realizar operações com matrizes. Formular relações de matrizes com vetores e sistemas lineares.
OA4. Reconhecer uma transformação linear. Determinar as matrizes associadas, os subespaços núcleo e imagem. Efetuar mudanças de base.
OA5. Calcular determinantes. Explicar as suas propriedades e aplicações.
OA6. Definir e determinar valores e vetores próprios. Diagonalizar matrizes. Calcular potências inteiras de matrizes diagonalizáveis.
CP1. Vetores
O espaço vetorial R^n. Produto interno e norma. Combinações lineares e independência linear. Bases e dimensão. Coordenadas.
CP2. Sistemas de equações lineares
Método de eliminação de Gauss. Classificação de sistemas lineares.
CP3. Matrizes
Soma e multiplicação escalar. Produto matricial. Transposição. Matriz inversa e propriedades.
CP4. Funções lineares
Função linear. Matriz de uma função linear. Subespaços núcleo e imagem e teorema da dimensão. Mudança de base.
CP5. Determinantes
Definição e propriedades do determinante. Determinantes e operações elementares.
CP6. Valores e vetores próprios
Valores e vetores próprios. Subespaços próprios. Diagonalização.
Os alunos podem optar por uma das seguintes modalidades de avaliação:
(AS) Avaliação ao longo do semestre:
- 3 mini-testes presenciais (20%), com as seguintes regras:
* realizados em aula, ao longo do período letivo;
* a nota final nesta componente é a média aritmética das duas melhores notas de entre os três mini-testes (contribuindo 10\% cada uma);
* nota mínima de 10.0 valores na média aritmética dos dois melhores mini-testes.
- 2 quizzes online (10%), com as seguintes regras:
* realizados no Moodle, no período letivo;
* a nota final nesta componente será a média das notas obtidas (contribuindo 5% cada)
* nota mínima de 10.0 valores na média aritmética dos dois quizzes.
- Prova escrita (70%), na 1a época de avaliação, com nota mínima de 8.5 valores.
(AE) Avaliação por Exame:
Prova escrita (100%), na 1a época ou 2º época de avaliação, incidindo sobre toda a matéria lecionada na unidade curricular.
Outras regras de avaliação:
- A Prova escrita da AS incide sobre toda a matéria lecionada e realiza-se em simultâneo com a prova da AE em 1.ª época.
- O aluno obtém aprovação à cadeira se a nota final for maior ou igual a 10 valores.
- A nota final do aluno corresponde à melhor nota obtida entre a modalidade AS e a modalidade AE;
- Os professores responsáveis reservam-se o direito de fazer orais sempre que considerem necessário.
Title: Strang, G. (2023). Introduction to Linear Algebra (sixth edition) Wellesley-Cambridge Press.
Apoio teórico fornecido pelos docentes. Caderno de exercícios fornecido pelos docentes.
Authors:
Reference: null
Year:
Title: Lay, D., Lay, S., & McDonald, J. (2016) Linear Algebra and Its Applications (fifth edition) Pearson.
Authors:
Reference: null
Year:
Estruturas de Dados e Algoritmos
No final da UC os alunos deverão ser capazes de:
OA1. Identificar, reescrever e examinar formas comuns de organização de dados e algoritmos associados (com e sem gestão dinâmica de memória, com algoritmos iterativos ou recursivos);
OA2: Saber avaliar e comparar a ordem de desempenho e eficiência de uma dada estrutura de dados e/ou algoritmo para as operações de inserção, remoção e acesso;
OA3: Identificar a estrutura de dados mais apropriada e eficiente para um determinado problema;
OA4: Perceber as vantagens e desvantagens de algoritmos recursivos, iterativos e técnicas de programação dinâmica;
OA5. Compreender diferentes algoritmos de pesquisa e ordenação apropriados a soluções computacionais.
CP1: Estruturas de Dados e Algoritmos: o que são e por que são importantes. Tipos Abstratos de Dados.
CP2: Estruturas de dados lineares: pilhas, filas, listas e listas ligadas.
CP3: Introdução à análise da complexidade (eficiência) de algoritmos.
CP4: Algoritmos de pesquisa: linear e binária.
CP5: Recursão, iteração e programação dinâmica.
CP6: Algoritmos de ordenação elementar: Selectionsort, Insertionsort.
CP7. Algoritmos de ordenação avançada: Mergesort, Quicksort.
CP8: Estruturas de dados não lineares: árvores, árvores de pesquisa binária, árvores AVL e grafos.
CP9: Algoritmos simples sobre estruturas de dados não lineares.
A aprovação nesta unidade curricular (UC) só pode ser conseguida pela modalidade de avaliação ao longo do semestre ou pela época especial (para os alunos com algum estatuto conferido pelos Serviços de Gestão do Ensino que permita aceder a Época Especial). Não existe para esta UC a modalidade de avaliação por exame.
Elementos de avaliação e respetivas ponderações na nota final:
- teste 1, escrito individual -> 30%, nota mínima de 8 valores, previsto realizar no período de avaliações do 3º trimestre;
- teste 2, escrito individual -> 30%, nota mínima de 8 valores, previsto realizar no período de avaliações da 1a época;
- trabalho 1, individual, com discussão -> 15%;
- trabalho 2, individual, com discussão (eventualmente em grupos de 2 alunos) -> 25%, nota mínima de 8 valores. Assim Nota_final = 30% x Nota_teste1 + 30% x Nota_teste2 + 15% x Nota_trabalho1 + 25% x Nota_trabalho2.
Em Época Especial, os elementos de avaliação e respetivas ponderações na nota final são:
- teste, escrito individual -> 60%, nota mínima de 8 valores, e
- dois trabalhos, individuais -> 15% + 25%, nota mínima de 8 valores em cada um dos trabalhos.
Assim Nota_final_época_especial = 60% x Nota_teste + 15% x Nota_trabalho1 + 25% x Nota_trabalho2.
Para obter aprovação na UC a Nota_final ou a Nota_final_época_especial têm que ser 10 valores em 20 valores.
Title: - J. Wengrow, A Common-Sense Guide to Data Structures and Algorithms, Second Edition. The Pragmatic Bookshelf, 2020.
- M. Goodrich, R. Tamassia, and M. Goldwasser, Data Structures & Algorithms in Python. Wiley, 2013.
Authors:
Reference: null
Year:
Title: - B. Miller and D. Ranum, Problem Solving with Algorithms and Data Structures using Python, Second Edition, Release 3.0. 2013.
- T. Cormen, C. Leiserson, R. Rivest, and C. Stein, Introduction to Algorithms, Fourth Edition. MIT Press, 2022.
- Referências adicionais a indicar durante as aulas.
Authors:
Reference: null
Year:
Tópicos de Matemática I
No final da UC o aluno deverá ser capaz de:
OA1: Calcular limites de sucessões
OA2. Calcular derivadas e interpretar o resultado obtido.
OA3. Determinar aproximações lineares e de ordem superior.
OA4. Calcular explicitamente primitivas de funções reais.
OA5. Usar o teorema fundamental do cálculo na derivação de integrais indefinidos
OA6. Utilizar a noção de integral na determinação de áreas, comprimentos, probabilidades, etc.
OA7. Integrar algumas EDOs notáveis.
OA8. Recorrer a métodos numéricos para obter soluções de alguns problemas, e utilizar ferramentas computacionais de representação gráfica.
1. Sucessões
1.1. Primeiras noções
1.2. Convergência
1.3. Alguns limites e resultados úteis
2. Cálculo diferencial em R
2.1. Breve revisão
2.2. Continuidade e limite
2.3. Diferenciabilidade e fórmula de Taylor; aplicações
2.4. Métodos numéricos
2.4.1. Método do ponto fixo
2.4.2. Método da bissecção
2.4.3. Método de Newton-Raphson
2.4.4. Derivação numérica
3. Cálculo Integral em R
3.1. Métodos gerais de primitivação
3.2. Cálculo de integrais
3.3. Teorema fundamental do Cálculo
3.4. Integração numérica
3.4.1. Método do ponto médio
3.4.2. Método dos trapézios
4. Equações diferenciais ordinárias
4.1. Equações de varáveis separáveis
4.2. Equações lineares de 1ª ordem
4.3. Métodos numéricos
4.3.1. Método de Euler
4.3.2. Método de Runge-Kutta (RK4)
Aprovação com classificação não inferior a 10 valores numa das modalidades:
- Avaliação ao longo do semestre: Frequência (75%) + dois trabalhos de grupo sobre cálculo numérico (25%).
- Avaliação por Exame (100%), em qualquer uma das épocas de exame. O exame compreende uma componente analítica (75%) e outra computacional (25%). Os alunos que tenham tido aproveitamento nos trabalhos de grupo poderão dispensar-se de realizar esta última componente.
A nota mínima é de 8 valores. As notas finais superiores a 16 valores sujeitam-se a homologação através de uma prova oral.
Title: [1] Ferreira, J.C. (2011). “Introdução à Análise Matemática”, Fundação Calouste Gulbenkian.
[2] Strang, G. (1991). “Calculus”, Wellesley-Cambridge.
[3] Caputo, H.P. (1973). “Iniciação ao Estudo das Equações Diferenciais”, Livros Técnicos e Científicos Editora, S.A.
Authors:
Reference: null
Year:
Title: [4] Suleman, A., Rocha, J., Alho, A., Apontamentos de aula. (disponível no Moodle)
[5] Suleman, A., Notas sobre cálculo numérico (disponível no Moodle).
[6] Santos, M.I.R., Matemática computacional (IST).
Authors:
Reference: null
Year:
Optimização para Ciência de Dados
Ao concluir esta Unidade Curricular o estudante deverá ser capaz de:
OA1. Desenvolver formulações em programação linear, programação linear inteira e programação não linear para a resolução eficiente de problemas complexos em contextos reais.
OA2. Utilizar programas generalistas para determinar soluções para problemas formulados em programação linear, programação linear inteira e programação não linear.
OA3. Fazer a interpretação económica e produzir recomendações baseadas nas soluções obtidas para problemas formulados em programação linear, programação linear inteira e programação não linear.
Conteúdos programáticos (CP):
CP1: Programação Linear
1.1 Modelo Geral de Programação Linear
1.2 Formulação de problemas em Programação Linear
1.3 Resolução gráfica
1.4 Resolução usando software generalista (Solver para Excel)
1.5 Interpretação de resultados e análise de sensibilidade
CP2: Programação Linear Inteira
2.1 Formulação de problemas em Programação Linear Inteira
2.2 Formulação de problemas com variáveis binárias
2.3 Resolução usando software generalista (Solver para Excel)
2.4 Interpretação de resultados
2.5 Algoritmo Branch-and-Bound
CP3: Programação Não Linear
3.1 Formulação de problemas em Programação Não Linear
3.2 Resolução usando software generalista (Solver para Excel)
3.3 Interpretação de resultados
1. Avaliação ao longo do semestre:
a) Teste escrito (60%);
b) Projecto em grupo com discussão (40%);
c) Presença em, pelo menos, 2/3 das aulas.
2. Avaliação por Exame (1.ª e 2.ª Época):
a) Teste escrito (60%);
b) Projecto com discussão (40%).
A aprovação (em ambas as modalidades de avaliação):
i) Requere classificação mínima de 8,5 no teste escrito;
ii) Pode ser exigida uma prova oral.
Escala: 0-20 valores.
Title: * Ragsdale, C.T. (2017). Spreadsheet Modeling and Decision Analysis: A Practical Introduction to Business Analytics. 8th Ed. Cengage Learning.
Authors:
Reference: null
Year:
Title: * Evans, J. (2021). Business Analytics. 3rd Ed. Global Edition. Pearson.
* Hillier, F.S and Lieberman, G.J. (2015). Introduction to Operations Research, 10th Ed., McGraw-Hill.
* Ragsdale, C.T. (2001). Spreadsheet Modeling & Decision Analysis: A Practical Introduction to management science. 3rd Ed., South-Western College Publishing.
* Wolsey, L.A. (1998). Integer Programming. Wiley.
Authors:
Reference: null
Year:
Análise Exploratória de Dados
Objetivos de aprendizagem (OA) a desenvolver em articulação com os objetivos gerais:
OA1. Organizar e preparar os dados para análise.
OA2. Saber utilizar e interpretar um conjunto de instrumentos estatísticos no domínio da estatística descritiva.
OA3. Utilizar Excel, R e Jamovi nas aplicações de preparação, análise e representação de dados.
OA4. Adequar os modelos de representação visual a diferentes objetivos, de acordo com as boas práticas de visualização.
OA5. Interpretar e redigir os resultados de uma análise descritiva de dados.
Conteúdos programáticos (CP) articulados com os objetivos de aprendizagem.
CP1. Organização, preparação e transformação de dados
CP2. Análise exploratória de dados
Valores omissos
Codificação e imputação
Gráficos exploratórios
Variáveis aleatórias
Função de distribuição empírica
Distribuição Normal
CP3. Análise descritiva dos dados
Medidas descritivas
Análise uni e bivariada
Medidas de associação
CP4. Representação visual
Introdução aos princípios de representação visual
Estruturas de representação visual
Avaliação ao longo do semestre:
- Exercício individual em R (10%)
- Trabalho de grupo (35%); nota mínima 7,5
- Teste escrito (55%); nota mínima 7,5
É necessária uma frequência mínima de 70% de horas de aulas para a realização da avaliação ao longo do semestre.
Avaliação por exame:
- Exame/trabalho prático individual (40%); nota mínima 7,5
- Exame escrito (60%); nota mínima 7,5
Title: Brown, D.S. (2022). Statistics and Data Visualization Using R. The Art and Practice of Data Analysis. Sage Publication, Inc.
Cairo, A. (2013). The Functional Art: An introduction to information graphics and visualization (Voices That Matter).
New Riders.
Carvalho, A. (2017). Métodos quantitativos com Excel, Lisboa, Lidel edições técnicas.
Chang, W. (2024) R Graphics Cookbook. 2nd ed. O’Reilly. (Disponível em: https://r-graphics.org/)
Reis, E. (1998). Estatística Descritiva, Lisboa, Sílabo,7ª ed.
Rocha, M. & Ferreira, P.G. (2017) Análise e Exploração de Dados com R. Lisboa, FCA
Authors:
Reference: null
Year:
Title: Alexandrino da Silva, A. (2006). Gráficos e mapas-representação de informação estatística. Lisboa, Lidel edições técnicas.
Barroso, M., Sampaio, E. & Ramos, M. (2003). Exercícios de Estatística Descritiva para as Ciências Sociais, Lisboa, Sílabo.
Carvalho, A. (2017). Gráficos com Excel - 95 Exercícios, Lisboa, FCA.
Dias Curto, J.J., & Gameiro, F. (2016). Excel para Economia e Gestão. Lisboa, Ed. Sílabo.
Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R. London, SAGE Publications Ltd.
Hoaglin, D.C., Mosteller, F & Tukey, J. W. (1992). Análise Exploratória de Dados. Técnicas Robustas, Ed. Salamandra, Lisboa.
Murteira, B. J. F. (1990). Análise Exploratória de Dados. Estatística Descritiva, McGraw Hill.
Wickham, H. (2015). ggplot2: Elegant Graphics for Data Analysis, Springer. (Disponível em: https://ggplot2-book.org/)
Authors:
Reference: null
Year:
Pensamento Crítico
Obj de Aprendizagem
OA1: Explorar como o PC é essencial em decisões informadas, resolução de problemas e desenvolvimento de argumentos sólidos no contexto académico e profissional. Identificar situações onde é aplicado.
OA2: Estudar os componentes básicos de um argumento e como se combinam em argumentos complexos. Distinguir entre tipos de argumentos.
OA3: Desenvolver habilidades para decompor argumentos, analisando criticamente textos e discursos, identificando pontos fortes e fracos.
OA4: Aprender a identificar falácias lógicas e erros comuns do dia a dia. Reconhecer e corrigir erros em argumentos, melhorando a precisão do discurso.
OA5: Desenvolver critérios para avaliar a qualidade de argumentos e textos argumentativos, considerando coerência, relevância, evidência e eficácia em diversos contextos.
OA6: Praticar a construção de argumentos sólidos em debates orais e textos escritos. Formular e apresentar argumentos claros e estruturados, adaptando-os ao público e contexto.
CP1. Definição e importância do pensamento crítico (PC)
• Aplicações do PC na vida académica e profissional
• Benefícios do PC para a tomada de decisões e resolução de problemas
CP2. Estrutura básica de um argumento: premissas e conclusão
• Diferença entre argumentos simples e complexos
• Ex de argumentos simples e complexos
CP3. Métodos de análise de argumentos
• Avaliação da validade das premissas
• Identificação de pressupostos e implicações
CP4. Falácias Lógicas e Erros Comuns
• Definição de falácias lógicas
• Tipos comuns de falácias (ex: apelo à autoridade, falsa dicotomia)
• Reconhecimento de falácias em discursos quotidianos
• Estratégias para evitar falácias
CP5. Critérios para avaliar a qualidade de argumentos
• Coerência, relevância e evidência
• Análise crítica de textos
CP6. Construção de Argumentos
• Criar argumentos sólidos e persuasivos
• Prática de construção de argumentos em diferentes contextos
CP7. Aplicações Práticas do PC
• Exercício de debate
A avaliação ao longo do semestre é feita através da exposição, exercícios debate, leituras, discussões de casos (em pequenos grupos).
A participação ativa nos trabalhos a realizar nas aulas práticas é expectável e obedece aos seguintes critérios:
Assiduidade/participação - Exercicios em aula + debate em grupo (com um minimo de 80% de presenças) assiduidade 5%, participação 5%, debate 15% (total 25%)
TPCs- 15% (1 TPC - 5% + 1 TPC - 10%) = 15%
Trab. Final (60%)
– Para concluir com sucesso a avaliação ao longo do semestre os estudante não podem ter menos de 7 valores em nenhuma das componentes de avaliação assinaladas
Épocas de Exames
Trabalho Escrito -100%
Ainda que não seja recomendado, é possível optar pela avaliação por exame, esta a avaliação pode ainda implicar, por decisão do/a docente, uma discussão oral (a realizar-se, esta componente oral tem um peso na avaliação final de 40%).
Title: Haber, J., (2020). Critical Thinking, MIT Press
Bowell, T., & Kemp, G. (2002). Critical thinking: a concise guide. London: Routledge.
Weston, A. (2005). A arte de argumentar. Lisboa: Gradiva
Cottrell, S. (2005). Critical Thinking Skills: Developing effective analysis and argument. New York: Palgrave McMillan.
Authors:
Reference: null
Year:
Title: Brookfield, S. (1987). Developing critical thinkers: challenging adults to explore alternative ways of thinking and acting. San Francisco: Jossey-Bass.
Morgado, P. (2003). Cem argumentos: A lógica, a retórica e o direito ao serviço da argumentação. Porto: Vida Económica.
Paul, R., & Elder, L. (2001). The miniature guide to critical thinking: concepts and tools. Foundation for Critical Thinking.
Thayer-Bacon, B.J. (2000). Transforming critical thinking: thinking constructively. New York: Teachers College Press.
Authors:
Reference: null
Year:
Escrita de Textos Técnicos e Científicos
OA1. Desenvolver competências de identificação e compreensão dos processos básicos de produção de conhecimento técnico e científico.
OA2. Conhecer, identificar e resumir, os procedimentos comuns subjacentes ao texto técnico e cientifico.
OA3. Identificar a estrutura da escrita de relatórios técnicos e textos científicos.
OA4. Saber utilizar Normas APA na escrita de textos técnicos e científicos (normas em dissertações e teses no Iscte).
Os objetivos de aprendizagem serão alcançados através de atividades práticas e reflexivas, apoiadas no método de ensino ativo e participativo que privilegia a aprendizagem experiencial. As aulas serão compostas por atividades, tais como:
• Discussões em grupo;
• Exposição e defesa oral;
• Análise de textos;
• Apresentações de projeto;
• Reflexão individual.
CP1: Introdução à investigação científica: conceitos e processos. Perguntas de Investigação. Processos: etapas (Identificação do problema; Revisão da literatura; Definição de objetivos e hipóteses; Seleção da metodologia; recolha e seleção de fontes; Análise de dados; Conclusões e recomendações).
CP2: Técnicas de resumo e análise de artigos científicos. Identificação de fontes relevantes, avaliação da literatura e síntese de informações. Ética, consentimento informado, confidencialidade e integridade na investigação. Métodos de recolha de dados.
CP3: Estrutura e organização de trabalhos de investigação: elementos pré-textuais (capa, folha de rosto, resumo, palavras-chave, índice), textuais (introdução, revisão da literatura, metodologia, resultados, discussão) e pós-textuais (conclusão, referências, apêndices, anexos). Elaboração de estrutura com base em temas fornecidos pelo docente.
CP4: Aplicação das Normas APA na escrita científica e relatórios académicos.
A avaliação da UC visa aferir a aquisição de competências dos/as estudantes em aspetos essenciais da escrita de textos, em contexto académico. A Avaliação ao Longo do Semestre contempla atividades que abrangem diferentes aspetos do processo da escrita técnica e científica, incluindo atividades de trabalho em grupo e individual:
Atividades em grupo (70%) [os estudantes são organizados em grupos de 4 elementos, constituídos de forma aleatória].
1- Discussões em grupo com estudos de caso (20%):
Descrição: cada grupo recebe um estudo de caso para analisar, devendo identificar o tipo de texto; o(s) problema(s) de investigação, as hipóteses, metodologias utilizadas e fontes de dados. Os resultados do trabalho realizado são apresentados em sala aos colegas(Tempo/grupo: apresentação- 3 min.; debate- 5 min.).
Avaliação (oral): baseada na participação ativa, na qualidade da análise e na clareza da apresentação.
2 - Exercícios de pesquisa e aplicação das normas APA (20%).
Descrição: Os estudantes realizam exercícios práticos de pesquisa em contexto (temático) de referências bibliográficas, de formatação das mesmas e citação segundo as Normas APA. Avaliação (trabalho escrito a submeter no moodle): Os exercícios serão corrigidos e avaliados com base na precisão e conformidade com as Normas APA.
3 - Simulações de Apresentações de Projetos (30%):
Descrição: os grupos elegem um tema e criam um projeto fictício seguindo a estrutura de um relatório técnico ou texto científico, fazendo uma apresentação do seu projeto em sala de aula (Tempo/grupo: apresentação 3 min.; debate: 5 min.). O trabalho é depois revisto seguindo os comentários.
Avaliação: (Componente oral e conteúdos em suporte escrito/digital a submeter no moodle): organização, conteúdo, uso correto da estrutura e procedimentos do trabalho académico, capacidade de resposta às perguntas colocadas por colegas e docente.
Atividades individuais (30%):
1 - Resumo de artigo científico (20%).
Descrição: Cada estudante deverá ler e resumir um artigo científico.
Avaliação: Os resumos realizados presencialmente em aula, serão avaliados na sua capacidade de identificação e síntese dos elementos essenciais do texto.
2 - Participação nas atividades ao longo do semestre (10%).
Descrição: esta componente visa aferir os contributos específicos de cada estudante nas atividades realizadas ao longo do semestre. Avaliação: Intervenções em sala de aula; pertinência dos contributos específicos do estudante nos debates; relação colaborativa com os colegas. Para fazer a avaliação ao longo do semestre, o estudante deve estar presente em 80% das aulas ter mais de 7 (sete) valores em cada uma das avaliações. Havendo dúvidas sobre a participação nas atividades realizadas, o docente pode solicitar uma discussão oral. Avaliação final: Teste escrito presencial (100%).
Title: American Psychological Association (2020). Publication manual of the American Psychological Association, 7 edição APA.
Macagno, F. & Rapanta, C. (2021). Escrita académica: argumentação, lógica da escrita, ideias, estilo, artigos e papers. Pactor.
Ribeiro, A. & Rosa, A. (2024). Descobrindo o potencial do CHATGPT em sala de aula: guia para professores e alunos. Atlantic Books.
Authors:
Reference: null
Year:
Title: Cottrell, S. (2005). Critical thinking skills: developing effective analysis and argument. Palgrave McMillan.
Creswell, J. W., & Creswell, J. D. (2018). Research design: qualitative, quantitative, and mixed methods approaches. SAGE Publications.
D'Alte, P., & D'Alte, L. (2023). Para uma avaliação do ChatGPT como ferramenta auxiliar de escrita de textos académicos. Revista Bibliomar, 22 (1), 122-138. DOI: 10.18764/2526-6160v22n1.2023.6.
Duarte, N. (2008). The art and science of creating great presentations. O'Reilly Media.Creswell, J. W., & Creswell, J. D. (2018). Research design: qualitative, quantitative, and mixed methods approaches. SAGE Publications.
Hofmann, A. (2016). Scientific writing and communication: papers, proposals, and presentations. Oxford University Press.
Kuhn, Deanna (1991). The skills of argument. Cambridge University Press.
Marcos, I.(2016). Citar e referenciar: o uso ético da informação. http://hdl.handle.net/10400.2/3929
Martínez, J. (2016). Cómo buscar y usar información científica: Guía para estudiantes universitários. Santander. http://hdl.handle.net/10760/29934
OIT. (2021). Ajustar as competências e a aprendizagem ao longo da vida para o futuro do trabalho. OIT Genebra.
OIT. (2020). Guia sobre como e porquê recolher e utilizar dados sobre as relações laborais. OIT Genebra.
Rapanta, C., Garcia-Mila, M., & Gilabert, S. (2013). What is meant by argumentative competence? An integrative review of methods of analysis and assessment in education. Review of Educational Research, 83(4), 483-520.
Rodrigues, A. (2022). A Natureza da Atividade Comunicativa. LisbonPress.
Rodrigues, A. D. (2005). A Partitura invisível. Para uma abordagem interacional da linguagem. Colibri.
Swales, J. M., & Feak, C. B. (2012). Academic writing for graduate students: essential tasks and skills. University of Michigan Press.
Umberto, E. (2016). Como se faz uma Tese em Ciências Humanas. Editorial Presença.
Manuais: http://www.apastyle.org/ http://www.apastyle.org/learn/tutorials/index.aspx
Authors:
Reference: null
Year:
Métodos de Aprendizagem Não Supervisionada
OA1: Caracterizar os principais métodos analíticos não supervisionados
OA2: Utilizar R no contexto dos métodos não supervisionados
OA3: Avaliar, validar e interpretar os resultados
CP1: Introdução aos métodos de aprendizagem não supervisionada
CP2: Técnicas de redução da dimensionalidade dos dados
- Análise em componentes principais (ACP)
- Aplicações com R
CP3: Técnicas de clustering:
- Métodos hierárquicos
- Métodos partitivos
- Mapas self-organizing
- Métodos probabilísticos
- Qualidade e validação de soluções de clustering
- Aplicações com R
CP4: Estudos de caso
Os estudantes podem optar por Avaliação ao longo do semestre ou Exame Final.
AVALIAÇÃO AO LONGO DO SEMESTRE:
- trabalho de grupo com nota mínima de 8 valores (50%)
- teste individual com nota mínima 8 valores (50%)
A aprovação requer uma frequência mínima de 80% das aulas e nota mínima de 10.
EXAME:
O Exame Final corresponde a um exame escrito. Os alunos devem obter uma nota mínima de 10 para passar.
Title: Nwanganga, F., M. Chapple (2020), Practical Machine Learning in R, 1st Edition, Wiley.
Bouveyron, C., G. Celeux, T. B. Murphy, A. E. Raftery (2019), Model-Based Clustering and Classification for Data Science: With Applications in R, 1st Edition, Cambridge University Press.
James, G., Witten, D., Hastie, T., Tibshirani, R. (2013), An Introduction to Statistical Learning: with applications in R, New York: Springer.
Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E. (2014), Multivariate Data Analysis, 7th Edition, Essex, UK: Pearson Education.
Authors:
Reference: null
Year:
Title: Wedel, M., Kamakura, W. A. (2000), Market Segmentation. Conceptual and Methodological Foundations (2nd edition), International Series in Quantitative Marketing. Boston: Kluwer Academic Publishers.
Lattin, J., D. Carroll e P. Green (2003), Analyzing Multivariate Data, Pacific Grove, CA: Thomson Learning.
Kohonen, T. (2001). Self-Organizing Maps. Third edition, Springer.
Hennig, C., Meila, M., Murtagh, F., Rocci, R. (eds.) (2016), Handbook of Cluster Analysis, Handbooks of Modern Statistical Methods. Boca Raton: Chapman & Hall/CRC.
Aggarwal, C. C., Reddy, C. K. (eds.) (2014), Data Clustering: Algorithms and Applications. Boca Raton: CRC Press.
Authors:
Reference: null
Year:
Armazenamento para Big Data
1. Implementar soluções de armazenamento de dados em suporte distribuído e tolerantes a falhas;
2. Manipulação e extracção de grandes quantidades de informação de bases de dados não estruturadas;
3. Desenvolver aptidões sociais (soft skills), nomeadamente Resolução de Problemas, Trabalho de Equipe e Colaboração e Observação Crítica
1. Introdução às Bases de Dados Não Relacionais;
2. Redundância para gerir tolerância a falhas;
3. Distribuição de Dados para gerir grandes volumes de informação;
4. Introdução ao MongoDB;.
5. Desenho de Bases de Dados no MongoDB;
6. Manipulação de estruturas JSON;
7. Extracção de dados no MongoDB.
A avaliação ao longo do semestre é feita através de teste escrito (nota mínima 7.5 valores) que ocorre na mesma data do exame de 1.ª época e que vale 70% da nota e um trabalho de grupo, 30% da nota ((nota mínima 7.5 valores)), a entregar na última semana de aulas. Alternativamente existe a avaliação por exame. (época 1, época 2 e época especial).
BibliografiaTitle: NoSQL Database: New Era of Databases for Big data Analytics - Classification, Characteristics and Comparison, A B M Moniruzzaman, Syed Akhter Hossain, 2013 (https://arxiv.org/abs/1307.0191)
MongoDb Homepage
Authors:
Reference: null
Year:
Optimização Heurística
Objectivos de aprendizagem (OA):
OA1- Discutir os desafios enfrentados em problemas reais de otimização, nomeadamente nos de grande dimensão
OA2 - Explicar e discutir as metodologias disponíveis para resolver problemas de otimização difíceis
OA3 - Formular e especificar métodos de solução eficazes para resolver problemas de otimização
OA4 - Usar ferramentas avançadas para resolver problemas de otimização
Conteúdos programáticos (CP):
CP1. OTIMIZAÇÃO MULTIOBJETIVO
1.1. Conceitos básicos
1.2. Metodologias
CP2. METAHEURÍSTICAS
2.1. Conceitos e terminologia
2.2. Algoritmos com uma única solução inicial
2.3. Algoritmos Genéticos
AVALIAÇÃO de 1ª ÉPOCA
Na 1ª Época, a avaliação da Unidade Curricular pode ser feita recorrendo à Avaliação ao Longo do Semestre ou à realização de um Projeto Individual.
--> AVALIAÇÃO AO LONGO DO SEMESTRE
- Trabalho Individual (30%): nota mínima igual a 8 valores;
- Projeto de Grupo (70%) : escrita de relatório e código (45%) + apresentação oral (10%) + teste individual (15%).
CONDIÇÕES ASSOCIADAS À AVALIAÇÃO AO LONGO DO SEMESTRE:
(i) Número máximo de estudantes que podem constituir um grupo de trabalho: 5;
(ii) O estudante tem de participar em todos os momentos da avaliação ao longo do semestre.
--> AVALIAÇÃO ATRAVÉS DA REALIZAÇÃO DE UM PROJETO INDIVIDUAL (100%)
AVALIAÇÃO de 2ª ÉPOCA
Na 2ª Época, a avaliação da Unidade Curricular é feita através da realização de um Projeto Individual (100%).
Em ambas as épocas, o aluno pode ser sujeito a exame oral mesmo que classificação final >= 9,5 valores.
Escala 0-20
Title: - Ke-Lin Du; M. N. S. Swamy (2018). Search and Optimization by Metaheuristics: Techniques and and Algorithms Inspired by Nature. Birkhäuser.
- Gutierrez, A. M; Ramirez-Mendoza, R. A.; Flores, E. M.; Ponce-Cruz, P; Espinoza, A.A. O.; Silva, D. C. B. (Eds.) (2020). A Practical Approach to Metaheuristics using LabVIEW and MATLAB (R). Taylor & Francis Ltd.
- Lobato, F. S.; Valder, S. Jr. (2017). Multi-Objective Optimization Problems: Concepts and Self-Adaptive Parameters with Mathematical and Engineering Applications. Springer Cham.
- Ragsdale, C.T. (2017). Spreadsheet Modeling and Decision Analysis: A Practical Introduction to Business Analytics. 8th Ed. Cemgage Learning.
- Burke, E. K.; Kendall, G. (Eds.) (2014). Search Methodologies: Introductory Tutorials in Optimization and Decision Support, 2nd edition, Springer.
- Siarry, P. (Ed.) (2016). Metaheuristics, Springer.
- Ehrgott, M. (2005). Multicriteria Optimization, 2nd edition, Springer.
Authors:
Reference: null
Year:
Title: - Open Access documents such as instructor notes, book chapters, research articles, and tutorials that will be provided via Moodle.
Authors:
Reference: null
Year:
Métodos de Aprendizagem Supervisionada
OA1: Compreender os métodos de aprendizagem supervisionada: âmbitos de aplicação e procedimentos
OA2: Utilizar software R para realizar as análises de dados
OA3: Avaliar e interpretar os resultados das análises de dados
CP1: Sobre Aprendizagem Supervisionada
Tipologias
Dados para aprendizagem
Funções objetivo
Avaliação e seleção de modelos
Notas sobre inferência estatística
CP2: Métodos de Regressão
K- Nearest Neighbor
Árvores de Regressão (algoritmo CART)
CP3: Métodos de Classificação
Naive Bayes
K-Nearest-Neighbor
Regressão Logística
Árvores de Classificação (algoritmo CART)
A avaliação da Unidade Curricular pode ser feita recorrendo à Avaliação ao Longo do Semestre ou à Avaliação por Exame.
AVALIAÇÃO AO LONGO DO SEMESTRE:
- quiz online realizado em grupo (40%) com nota mínima de 9 valores
- teste individual (60%) com nota mínima 9 valores.
A aprovação requer nota mínima de 10 valores.
AVALIAÇÃO POR EXAME:
1ª parte - teste individual (60%)
2ª parte - teste individual online com análises de dados efetuadas com a ferramenta de software R usada nas aulas (40%).
Os alunos devem obter uma nota mínima de 9 valores em cada parte do exame e nota mínima (ponderada) de 10 valores para aprovação.
Escala 0-20
Title: Gareth, J., Daniela, W., Trevor, H., & Robert, T. (2013). An introduction to statistical learning: with applications in R. Springer.
Hastie, T., Tibshirani, R., Friedman, J. H., & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction (Vol. 2, pp. 1-758). New York: Springer.
Lantz, B. (2023). Machine Learning with R: Learn techniques for building and improving machine learning models, from data preparation to model tuning, evaluation, and working with big data. 4th Edition. Packt Publishing.
Larose, D., Larose, C. (2015). Data Mining and Predictive Analytics. John Wiley & Sons.
Authors:
Reference: null
Year:
Title: Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (2012). Great Britain: Sage Publications, Ltd, 958.
Authors:
Reference: null
Year:
Processamento de Big Data
No final da UC os alunos deverão ser capazes de:
OA1: compreender e conhecer as principais plataformas para processamento de grandes quantidades de informação
OA2: compreender e saber aplicar os modelos de programação/computação distribuídos
OA3: compreender as etapas associadas a um projeto de machine learning para grandes quantidades de informação
OA4: saber aplicar técnicas de redução de dimensionalidade
OA5: aplicar técnicas de aprendizagem supervisionada ou não supervisionada em problemas de grande dimensão
CP1: Plataformas computacionais para big data
CP2: Pipeline de machine learning para big data
CP3: Redução de dimensionalidade
CP4: Aprendizagem supervisionada/não supervisionada para larga escala
CP5: Casos de estudo: PageRank e Sistemas de Recomendação
Esta UC contempla as seguintes modalidades de avaliação: (1) avaliação ao longo do semestre; (2) avaliação por exame.
(1) Avaliação ao longo do semestre
A nota final é composta por:
• Teste escrito individual (70%), com nota mínima de 8,0;
• Trabalho de grupo (30%).
O trabalho de grupo tem uma entrega intercalar que contará 30% e uma entrega no final do semestre que contará 70%. Quem não entregar a parte correspondente à entrega intercalar passa automaticamente para a modalidade de avaliação por exame.
O trabalho terá uma apresentação/discussão oral sendo a nota final individual.
(2) avaliação por exame
A nota final será a obtida num único exame escrito, incluindo o exame de época especial.
Title: - Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale, Ofer Mendelevitch, Casey Stella and Douglas Eadline, Addison-wesley, 2016.
- Advanced Analytics with Spark: Patterns for Learning from Data at Scale, Sandy Ryza et al., O'Reilly Media, 2017.
- Learning Spark: Lightning-Fast Big Data Analysis, Holden Karau, A. Konwinski, P. Wendell and M. Zaharia, O'Reilly Media, 2015.
- Big Data: Algorithms, Analytics, and Applications, Kuan-Ching Li et al., Chapman and Hall/CRC, 2015.
- Mining of Massive Datasets, A. Rajaraman, J. Ullman, 2011, Cambridge University Press.
Authors:
Reference: null
Year:
Title: - The elements of statistical learning, Trevor Hastie, Robert Tibshirani, and Jerome Friedman. Springer, 2001
- All of Statistics: A concise course in Statistical Inference, L.Wasserman, Springer, 2003.
Authors:
Reference: null
Year:
Segurança, Ética e Privacidade
OA1. Reconhecer os principais problemas de segurança em sistemas baseados em software, respetivas causas e consequências.
OA2. Identificar e descrever os serviços de segurança necessários para implementar uma determinada política de proteção da informação com base em análise de risco.
OA3. Conhecer os quadros regulatórios nos domínios da proteção de dados pessoais e da vida privada, com especial foco no Regulamento Geral de Proteção de Dados.
OA4. Refletir ética e criticamente sobre as implicações das tecnologias e do tratamento de dados nos indivíduos e na sociedade, abordando os decorrentes desafios que se colocam nos domínios da segurança da informação, da proteção de dados pessoais e da privacidade.
CP1. Segurança da Informação: Fundamentos de segurança – segurança dos dados; Vulnerabilidades e ameaças em segurança; IRM – Information Risk Management; Criptografia e PKI.
CP2. Privacidade e proteção de dados pessoais: O RGPD e a Lei 58/2019; Técnicas de anonimização e pseudonimização.
CP3. Ética: A ética e o desenvolvimento tecnológico; Ética na computação; Ética normativa e estudo de caso: Os desafios da IA e o Regulamento de Inteligência Artificial.
A avaliação é ao longo do semestre ou por exame.
A avaliação ao longo do semestre inclui:
- 1º teste individual (33,5%) [CP1]
- 2º teste individual (33,5%) [CP2]
- Trabalho em grupo (31,0%) [CP3]
- A assiduidade do aluno nas aulas (2%) [CP3]. Para obter 100% na componente de assiduidade, o aluno deve frequentar um mínimo de 70% das aulas do módulo de ética [CP3].
Cada um dos testes e o trabalho em grupo tem classificação mínima de 7 valores.
Exame final em 1º e 2º época para quem não for aprovado por avaliação ao longo do semestre [CP1, CP2, CP3]
Title: Andress, J. (2014). The Basics of Information Security: Understanding the Fundamentals of InfoSec in Theory and Practice. Syngress.
Kim, D., Solomon, M. (2016). Fundamentals of Information Systems Security. Jones & Bartlett Learning.
Cannon, J.C. Privacy in Technology: Standards and Practices for Engineers and Security and IT Professionals. Portsmouth: AN IAPP Publication, 2014.
Breaux, Travis. Introduction to IT Privacy: A Handbook for Technologists. Portsmouth: An IAPP Publication, 2014.
Whitman, M., & Mattord, H. (2013). Management of information security. Nelson Education.
Katz, J., & Lindell, Y. (2014). Introduction to modern cryptography. CRC press.
Ethics, Technology, and Engineering: An Introduction (2011). Ibo van de Poel, Lamber Royakkers, Wiley-Blackwell.
European Union Agency for Fundamental Rights, The Handbook on European data protection law, 2018:, 2019, http://fra.europa.eu/sites/default/files/fra_uploads/fra-coe-edps-2018-handbook-data-protection_en.pdf, http://fra.europa.eu/sites/default/files/fra_uploads/fra-coe-edps-2018-handbook-data-protection_en.pdf
Authors:
Reference: null
Year:
Title: A. Barreto Menezes Cordeiro, Direito da Proteção de Dados à luz do RGPD e da Lei n.º 58/2019, Edições Almedina., 2020, Cordeiro (2020)
Sara Baase, A gift of fire : social, legal, and ethical issues for computing technology, 2013, -
Whitman, M., Mattord, H. (2017). Principles of Information Security. Course Technology.
Bowman, Courtney. The Architecture of Privacy: On Engineering Technologies that Can Deliver Trustworthy Safeguards. O?Reilly Media, 2015.
Anderson, R. J. (2010). Security engineering: a guide to building dependable distributed systems. John Wiley & Sons.
Zúquete, A. (2018). Segurança em redes informáticas. FCA-Editora de Informática.
Regulamentos e orientações da Comissão Europeia relativos à Proteção de Dados, https://ec.europa.eu/info/law/law-topic/data-protection_en
Bynum, Terrell Ward, and Simon Rogerson, (2004), Computer Ethics and Professional Responsibility: Introductory Text and Readings. Oxford: Blackwell, 2004.
Grupo do Artigo 29, Parecer 05/2014 sobre técnicas de anonimização do grupo de trabalho de proteção de dados do artigo 29.º, de 10 de Abril de 2014, 2014, -, https://ec.europa.eu/justice/article-29/documentation/opinion-recommendation/files/2014/wp216_pt.pdf
Enisa, Orientações da Enisa sobre técnicas de pseudonimização e boas práticas, 2019, -, https://www.enisa.europa.eu/publications/pseudonymisation-techniques-and-best-practices
UE, Proposta do regulamento do parlamento europeu e do conselho que estabelece regras harmonizadas em matéria de inteligência artificial (regulamento inteligência artificial) e altera determinados atos legislativos da União, 2023, -, https://eur-lex.europa.eu/legal-content/PT/TXT/?uri=CELEX%3A52021PC0206
Outros textos a indicar e distribuídos pelo docente ao longo do semestre.
Authors:
Reference: null
Year:
Projeto Aplicado em Ciência de Dados I
OA1 - Aprender técnicas de limpeza, pré-processamento, engenharia e integração de dados
OA2 - Identificar a metodologia apropriada para o problema a resolver.
OA3 - Compreender e interpretar os resultados.
OA4 - Comunicar os resultados de forma correta (relatório e apresentação oral)
CP 1 Metodologia para desenvolvimento de um projeto com enfâse em Ciência de Dados.
CP 2 Bibliotecas (Python) para manipulação, visualização e tratamento de dados.
CP 3 Feature Engineering e compreensão das variáveis/dados
CP 4 Metodologias para comunicação e disseminação de resultados.
CP 5 Desenvolvimento do projeto.
Dada a natureza aplicada deste unidade curricular, não existirá avaliação por exame.
A avaliação será composta por:
1 - Um teste intercalar: 25%;
2 - Apresentações orais: 25%.;
3 - Projeto com relatório final e apresentação em workshop: 50%.
A aprovação requer uma nota mínima ponderada de 10 valores
Title: (1) Artigos científicos em conformidade com os temas específicos aos problemas em que os alunos vão desenvolver o seu projeto
(2) Ficheiros (slides, scripts e notebooks) da UC a disponibilizar no Moodle
(3) Wes McKinney (2022), Python for Data Analysis, 3rd Edition, O'Reilly Media, Inc. (https://wesmckinney.com/book/, https://github.com/wesm/pydata-book)
(4) Marek Gagolewski (2023), Minimalist Data Wrangling with Python, CC BY-NC-ND 4.0. (https://datawranglingpy.gagolewski.com/)
Authors:
Reference: null
Year:
Title: (1) Matt Harrison and Theodore Petrou (2020), Pandas 1.x Cookbook, Second Edition, Packt>.
(2) Suresh Kumar Mukhiya and Usman Ahmed (2020), Hands-On Exploratory Data Analysis with Python, Packt>. (https://github. com/PacktPublishing/hands-on-exploratory-data-analysis-with-python)
Authors:
Reference: null
Year:
Estatística Computacional
Objetivos de aprendizagem (OA) a desenvolver
OA1: Consolidar a utilização do software R, em ambiente Rstudio
OA2: Saber calcular probabilidades em vários contextos, incluindo por simulação
OA3: Conhecer os modelos de comportamento probabilístico mais usuais
OA4: Saber ajustar modelos probabilísticos
OA5: Compreender os princípios da inferência estatística
OA6: Saber escolher o método inferencial mais apropriado a cada situação
CP1. Teoria das probabilidades: definições, axiomas, probabilidade condicional, probabilidade total e fórmula de Bayes.
CP2. Variáveis aleatórias (VA) univariadas: f.de probabilidade e densidade, f. distribuição, parâmetros caracterizadores.
CP3. VA univariadas comummente utilizadas: características, propriedades e cálculo de probabilidades. Simulação de observações de v.a. com diferentes distribuições.
CP4. VA bi e multivariadas: f. probabilidade e densidade conjunta, f.de distribuição conjunta, covariância, correlação. Independência entre variáveis aleatórias. Distribuição conjunta de uma amostra aleatória simples.
CP5. Distribuições de amostragem: teorema do limite central e distribuições derivadas da Normal
CP6. Estimação de parâmetros: estimação pontual, propriedades dos estimadores, método de máxima verosimilhança, estimação por intervalos.
CP7. Ensaios de hipóteses: racional, probabilidade de significância. Teste para uma e duas médias; teste do qui-quadrado de independência.
Avaliação ao longo do semestre
Trabalhos de casa: 10 pequenos exercícios (um por semana de aulas, aproximadamente). Consideram-se para a nota os 8 melhores, que valem no total 15% da nota final
Um TPC não entregue é cotado com 0. Nota final do instrumento: média simples das cotações (em %) de cada TPC * 20
2. Um teste teórico-interpretativo intermédio, peso 30%, sem nota mínima
3. Um teste teórico-interpretativo final, peso 30%, nota mínima 9 em 20
4. Um teste pratico em R final, peso 25%, nota minima 7
Avaliação por exame: dois instrumentos
Um teste teórico interpretativo final, peso 60%, nota mínima 9
Um teste pratico em R final, peso 40%, nota minima 7
Dispensa de realização de algum dos instrumentos de exame: ver observações
Condição de aprovação (qualquer um dos regimes): Média final ponderada, arredondada à unidades, de pelo menos 10
Title: Speegle, D., & Clair, B. (2021). Probability, Statistics, and Data: A Fresh Approach Using R (1st ed.). Chapman and Hall/CRC. Free access at https://mathstat.slu.edu/~speegled/_book/
Reis, E., Andrade, M., Calapez, T. & Melo, P., Estatística Aplicada, volume 1. 6ª edição. Lisboa. Edições Sílabo., 2015, ISBN 978-972-618-819-3.
Reis, E., Andrade, M., Calapez, T. & Melo, P., Estatística Aplicada volume 2, 6ª edição, Lisboa. Edições Sílabo., 2016, ISBN 978-972-618-986-2.
Authors:
Reference: null
Year:
Title: Verzani, J., Using R for Introductory Statistics, 2nd Edition, Chapman & Hall/CRC, 2014, eBook ISBN 9781315373089, https://cran.r-project.org/doc/contrib/Verzani-SimpleR.pdf
Reis, E., Andrade, M., Calapez, T. & Melo, P., Exercícios de Estatística Aplicada volume 1. 2ª edição, Lisboa. Edições Sílabo., 2012, ISBN 978-972-618-688-5
Reis, E., Andrade, M., Calapez, T. & Melo, P., Exercícios de Estatística Aplicada volume 2. 2ª edição, Lisboa. Edições Sílabo., 2014, ISBN 978-972-618-747-9
Authors:
Reference: null
Year:
Introdução A Modelos Dinâmicos
OA1. Entender a correlação entre variáveis, o modelo de regressão linear simples e múltipla
OA2. Métodos de estimação dos parâmetros (OLS e ML)
OA3. Análise dos pressupostos do modelo de regressão, testes de hipótese e diagnóstico.
OA4. Operador lag, estacionaridade, teste de raiz unitária, outliers e variáveis dummy, modelos ARIMA.
OA5. Extensões do modelo de regressão linear: modelos não-lineares e dinâmicos.
OA6. Programação básica e computação com R e Python.
OA7. Aplicação dos conceitos estudados; conjunto de treino/teste e previsão, extracção de informação e valor para dados do mundo real.
P1. Modelos de Regressão
P1.1. Correlação
P1.2. Regressão linear simples
P1.3. Regressão linear múltipla
P2. Estimação e inferência, OLS e ML
P3. Pressupostos dos resíduos
P3.1. Testes de hipótese e diagnóstico
P3.2. Casos práticos
P4. Modelos ARMA/ARIMA/SARIMAX
P4.1. Operador lag, estacionaridade, teste de raiz unitária, outliers, variáveis dummy
P4.2. Ruído Branco, Modelos ARMA, ARIMA, SARIMAX
P4.3. Metodologia de Box-Jenkins, Previsão
P5. Extensões do modelo clássico de regressão
P5.1. Regressão não-linear
P5.2. Casos práticos
P6. Programação básica e computação com R
P7. Aplicações para dados e situações reais
P7.1. Conjunto treino/teste, previsão e forecasting
P7.2. Casos práticos
A avaliação ao longo do semestre inclui a realização de:
a) Trabalho de grupo com ponderação de 40%, com possibilidade de discussão caso os docentes considerem necessário. A nota mínima do trabalho é de 10 valores.
b)Teste individual com ponderação de 60% com nota mínima de 8,5 valores
Avaliação por exame: exame individual que inclui a matéria toda com nota mínima de 10 valores (nota arredondada às unidades).
O teste individual e o exame serão realizados sem consulta de folhas de apoio, livros ou outros materiais, não sendo permitida a utilização de calculadoras gráficas nem de telemóveis; apenas podem consultar o formulário e tabelas disponibilizados no Moodle para o efeito.
Title: - Rob J Hyndman and George Athanasopoulos, (2018), Forecasting: principles and practice, 2nd Edition, OTexts Melbourne ("fpp2" package CRAN)
- Tom Alby, (2024), Data Science in Practice, CRC Press.
- Bruce P., Bruce A., and Gedeck P., (2020), Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd Edition, O' Reilly Media, Inc.
- Robert I. Kabacoff, (2022), R in Action: Data analysis and graphics with R, Third Edition, Manning Publications Co.
Authors:
Reference: null
Year:
Title: - Ficheiros (slides e scripts) da UC a disponibilizar no Moodle.
Eric Goh Ming Hui, (2019), Learn R for Applied Statistics, Apress.
Daniel J. Denis, (2020), Univariate, Bivariate, and Multivariate Statistics Using R: Quantitative Tools for Data Analysis and Data Science, JohnWiley & Sons, Inc.
Authors:
Reference: null
Year:
Fundamentos em Gestão de Bases de Dados
O1: Desenvolver mecanismos de Abstracção;
O2: Desenvolver estruturação de informação;
O3: Desenvolver capacidade de utilizar eficazmente extrair informação de bases de dados.
P1 - Desenho de esquemas relacionais
P1.2 Modelo relacional;
P1.2.1 Relações e chaves primárias
P1.2.2 Chaves estrangeiras e regras de integridade
P1.2.3 Optimizações e índices
P1.2.5 Transacções e concorrência
P2 Linguagem S.Q.L
P2.1 Querys Simples;
P2.2 Funções de Agregação;
P2.3 SubQuerys;
P2.4 Triggers e Stored Procedures;
A avaliação é feita através exame escrito: 1ªépoca , ou 2ª época 2 ou época especial.
BibliografiaTitle: -Ramos, P, Desenhar Bases de Dados com UML, Conceitos e Exercícios Resolvidos, Editora Sílabo, 2ª Edição, 2007
-Perreira, J. Tecnologia de Base de Dados" FCA Editora de Informática, 1998
-Damas, L. SQL - Structured Query Language " FCA Editora de Informática, 2005 (II)
http://plsql-tutorial.com/.
Authors:
Reference: null
Year:
Title: -Date, C.J. "An introduction to Database Systems" Addison-Wesley Publishing Company, sexta edição, 1995 (I.2, I.3, I.4, II);
-Booch, G., Rumbaugh, J., Jacobson, I "The Unified Modeling Language User Guide" Addison-Wesley Publishing Company, 1999 (I.1);
-Nunes, O´Neill, Fundamentos de UML, FCA, 2002
Authors:
Reference: null
Year:
Modelação Estocástica
No final do período curricular desta UC, o aluno deverá:
OA1. Compreender os princípios e métodos de simulação estocástica;
OA2. Ser capaz de desenvolver algoritmos eficientes para a geração de números pseudoaleatórios;
OA3. Ser capaz de aplicar o método de Monte Carlo;
OA4. Compreender e ser capaz de aplicar diferentes métodos de Monte Carlo via Cadeias de Markov;
OA5. Ser capaz de implementar técnicas de reamostragem;
OA6. Ser capaz de simular um sistema real através de simulação de eventos discretos;
OA7. Ser capaz de analisar e avaliar os resultados da simulação;
OA8. Ser capaz de implementar algoritmos eficientes de simulação estocástica em R.
O Programa de Modelação Estocástica é constituído pelos seguintes conteúdos programáticos (CP):
CP1. Introdução à Simulação em Ciência de Dados
CP2. Geração de Números Pseudoaleatórios
- Método Congruencial Linear;
- Método da Transformação Inversa;
- Método da Aceitação/Rejeição;
- Outras Transformações;
- Somas e Misturas
CP3. Métodos de Monte Carlo em Inferência Estatística
CP4. Métodos de Monte Carlo via Cadeias de Markov (MCMC)
CP5. Métodos de Reamostragem
- Bootstrapp;
- Cross-Validation
CP6. Simulação de Eventos Discretos
A avaliação ao longo do semestre exige a presença em 2/3 das aulas e inclui:
1 - Um trabalho de grupo de 4 a 5 pessoas (30%), com eventual discussão individual;
2 - Dois mini-trabalhos de grupo de 2 pessoas (20%);
3 - Um teste final individual (50%).
A aprovação requer classificação mínima de 8,5 no teste final e classificação final mínima (média) de 10 valores.
A avaliação pode ser também realizada por exame (100%).
Title: Templ, M. (2016). Simulation for Data Science with R. Packt Publishing Ltd:Birmingham, Uk.
Rizzo, M. L. (2008). Statistical Computing with R. Chapman & Hall/CRC.
Robert, C. P. and Casella, G. (2010). Introducing Monte Carlo Methods with R. Springer-Verlag.
Authors:
Reference: null
Year:
Title: Wickham, H. and Grolemund , G. (2017). R for Data Science. O'Reilly Media Inc.
Authors:
Reference: null
Year:
Análise de Redes
Ao concluir esta unidade curricular o aluno deve estar apto para:
OA1. Caracterizar as redes com base em medidas de associação, agrupamento, distância, centralidade e heterogeneidade. Avaliar a robustez das redes;
OA2. Obter a rede de co-ocorrência associada a uma rede em que se representam relações. Analisar redes com pesos associados às ligações;
OA3. Escolher e caracterizar modelos de redes aleatórias;
OA4. Detetar comunidades e avaliar os métodos de detecção de comunidades.
1. Conceitos Básicos
Elementos de uma rede, subredes, densidade e grau. Redes Bipartidas.
2. Small Worlds
Correlação de Grau. Caminhos e distâncias. Conectividade. Seis Graus de Separação. Coeficientes de Clustering.
3. Hubs e Heterogeneidade de Pesos
Medidas de centralidade, Heterogeneidade baseada no Grau, Robustez, Decomposição de Core e Heterogeneidade de Pesos
4. Redes Aleatórias
Geração de Redes Aleatórias e caracterização. Modelo de Watts-Strogatz, Configuration Model e Modelos de Preferência.
5. Comunidades
Conceitos, Problemas Relacionados, Métodos de Detecção de Comunidades (Remoção de Pontes, Otimização de Modularidade, Propagação de Etiquetas). Métodos de Avaliação.
Avaliação ao longo do semestre ou avaliação por exame.
Avaliação ao longo do semrestre:
i) Trabalhos de Grupo:
• Peso de 40% na classificação final
• Grupos de 4 estudantes
• Pode ter discussão oral;
ii) Teste Final Individual:
• Peso de 60% na classificação final
• Classificação Mínima necessária 8,5;
iii) Assiduidade mínima:
• 2/3 das aulas leccionadas.
Avaliação por exame:
• projecto (40%);
• exame escrito (60%).
Nota do exame >= 8.5;
Classificação final: média >= 9.5;
Em ambas as modalidades, se classificação final >=9.5: poderão ser sujeitos a um exame oral.
Escala: 0-20 valores.
Title: Menczer, F., Fortunato, S. and Davis, C., A First Course in Network Science,, 2020, 1st edition, Cambridge University Press: Cambridge.,
Barabási, A.-L., Network Science, 2016, 1st edition, Cambridge University Press,
Authors:
Reference: null
Year:
Title: Newman, M., Networks, 2018, 2nd edition. Oxford University Press: Oxford.,
Katherine Ognyanova, Introduction to R and network analysis, 2018, Rutgers University, https://kateto.net/wp-content/uploads/2018/03/R%20for%20Networks%20Workshop%20-%20Ognyanova%20-%202018.pdf
Authors:
Reference: null
Year:
Análise da Performance em Gestão
No final da UC, o estudante deverá ser capaz de:
OA1. Compreender sistemas de avaliação de desempenho alternativos aos modelos tradicionais que possam ser eficazes para apoiar decisões empresariais.
OA2. Criar um modelo gestão da performance que promova a performance individual e global.
OA3. Analisar a informação financeira existente nas organizações e organizá-la numa perspetiva de gestão.
1. Informação financeira para a gestão
2. Análise da performance global
3. Descentralização e gestão da performance
1) Avaliação ao longo do semestre: Instrumentos: trabalhos ou casos, individuais/grupo (40%) e teste escrito individual (60%). Aprovação: a) mín. 7,5 valores em cada uma das provas ou conjunto de provas individuais; b) classificação final mín. 10 valores.
2) Avaliação por exame (1ª época): teste escrito (100%), com classificação mínima 10 valores.
3) Avaliação por exame (2ª época): teste escrito (100%) com classificação mínima 10 valores.
Escala: 0-20 valores.
Title: Jordan, H., Neves, J. C., e Rodrigues, J. A. (2021). O Controlo de Gestão - ao Serviço da Estratégia e dos Gestores, 11ª Ed., Áreas Editora.
Authors:
Reference: null
Year:
Title: Simons, R. (2000). Performance Measurement and Control Systems for Implementing Strategy Text and Cases. 1st Edition. Pearson.
Authors:
Reference: null
Year:
Projeto Aplicado em Ciência de Dados II
Pretende-se prover os estudantes de experiência na aplicação de soluções a problemas concretos, baseados em dados e em variados contextos e domínios. Os estudantes aprenderão a desenvolver um projeto em ciência de dados, em ambiente académico e científico, identificando necessidades, manipulando dados, e identificando as metodologias apropriadas para o problema a resolver. Serão reforçados um conjunto de aspetos, potencialmente relevantes para um projeto com dados (reais) de dimensão considerável, tais como: visualização (geoespacial), métodos de classificação automáticos, balanceamento de dados e overfitting, séries temporais, realçando também a forma correta de comunicação dos resultados. Dá-se preferência ao acolhimento de problemas de docentes/investigadores do Iscte com projetos reais e delimitados.
CP1: Introdução de elementos potencialmente relevantes para o desenvolvimento de um projeto
CP2: Introdução aos projetos aplicados em Data Science
CP3: Enquadramento e escolha de metodologia adequada
CP4: Desenvolvimento do projeto com dados de dimensão considerável e preferencialmente reais
CP5: Templates de divulgação de resultados obtidos
Dada a sua natureza, esta UC é feita apenas por avaliação ao longo do semestre, não contemplando a modalidade de avaliação por exame.
A avaliação consiste em duas componentes:
a) Questionários (40%): 2 questionários feitos em grupo, com consulta e realizados em aula (5% cada) + 1 questionário feito em grupo e com consulta (30%);
b) Trabalho de grupo (60%): acompanhamento semanal (10%) + escrita de relatório e apresentação oral (50%).
Os alunos devem obter uma nota mínima de 9 valores em cada componente.
Escala 0-20
Title: Field Cady, The Data Science Handbook, 2017, DOI:10.1002/9781119092919, https://onlinelibrary.wiley.com/doi/book/10.1002/9781119092919
Bradley Boehmke & Brandon Greenwell, Hands-On Machine Learning with R, 2020, https://bradleyboehmke.github.io/HOML/, https://bradleyboehmke.github.io/HOML/
Jake VanderPlas, Python Data Science Handbook, 2016, O'Reilly Media, Inc., https://jakevdp.github.io/PythonDataScienceHandbook/
José Braga de Vasconcelos e Alexandre Barão, Ciência Dos Dados Nas Organizações - Aplicações Em Python, 2017, FCA Editora,
Trevor Hastie , Robert Tibshirani , Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference and Prediction, 2016, https://link.springer.com/book/10.1007/978-0-387-84858-7, https://hastie.su.domains/Papers/ESLII.pdf
James, G., Witten, D., Hastie, T., and Tibshirani, R., An Introduction to Statistical Learning with Applications in R (1st Ed.), 2013, Springer,
Authors:
Reference: null
Year:
Title: Glenn J. Myatt and Wayne P. Johnson, Making Sense of Data I: A Practical Guide to Exploratory Data Analysis and Data Mining", Second Edition, 2014, John Wiley & Sons, Inc.,
Authors:
Reference: null
Year:
Projeto Final Aplicado em Ciência dos Dados
No final da UC, cada estudante deverá ser capaz de:
OA1. Definir os objetivos e formular as tarefas em CD que permitem extrair o conhecimento pretendido pelo cliente.
OA2. Definir as variáveis de dados e os metadados que conduzem ao conhecimento necessário.
OA3. Planear as diferentes fases de desenvolvimento do projeto.
OA4. Tratar os dados com as ferramentas de Ciência de Dados mais apropriadas para atingir os objetivos propostos.
OA5. Produzir visualizações de dados e documentos adequados a correta comunicação dos resultados obtidos.
OA6. Resolver problemas inerentes à utilização de dados reais numa ótica de ethics-by-design.
Os conteúdos programáticos (CP) são os seguintes:
CP1. Introdução aos desafios (projetos) propostos e organização de equipas de projeto.
CP2. Metodologias de pesquisa de informação para enquadramento do tema de projeto.
CP3. Abordagens práticas ao desenvolvimento de projeto numa ótica de ethics-by-design.
CP4. Ferramentas para cada etapa de desenvolvimento do projecto.
CP5. Modelos usuais de comunicação de dados e de resultados.
Sendo uma UC de projeto, não existe a figura de exame a 100%. A avaliação será efetuada ao longo do semestre, consistindo nas diferentes etapas de desenvolvimento do projeto, onde:
(i) cada etapa é pontuada por um entregável (escrito / apresentado em aula) (E) com feedback.
(ii) uma apresentação intermédia (A1) com feedback.
(iii) uma apresentação final (A2) com discussão.
(iv) um poster (informativo) (P).
(v) um relatório de projeto final (R).
A nota será o resultado de: E x 0,15 + A1 x 0,10 + P x 0,10 + A2 x 0,30 + R x 0,35.
Title: Dependente dos temas específicos do desafio em que cada grupo de estudantes irá desenvolver os trabalhos do projeto.
Authors:
Reference: null
Year:
Title: Voeneky, S., Kellmeyer, P., Mueller, O., & Burgard, W. (Eds.). 2022. The Cambridge Handbook of Responsible Artificial Intelligence: Interdisciplinary Perspectives. Cambridge: Cambridge University Press.
Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. 2016. Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.
Provost, F., & Fawcett, T. 2013. Data Science for Business: What you need to know about data mining and data-analytic thinking. O'Reilly Media, Inc.
Authors:
Reference: null
Year:
Interfaces Web para A Gestão de Dados
Um aluno quando termina esta UC deve ser capaz de:
OA1. Conhecer e compreender os conceitos e as tecnologias de base para o desenvolvimento para a Web.
OA2. Conhecer e compreender as tecnologias de interface entre uma aplicação Web e uma Base de Dados.
OA3. Modelar e desenvolver uma aplicação Web com capacidade para a gestão de dados persistentes provenientes da interação humana com software Web.
CP1 [Introdução]
- A história da Web;
- Antigas e atuais linguagens de programação para a Web;
- Standards W3C.
CP2 [Modelação e programação de uma aplicação Web]
- Arquitetura cliente/servidor;
- Arquitetura MVC para a Web;
- Principais linguagens de formatação gráfica para a Web;
- Bibliotecas de formatação gráfica;
- Principais linguagens de programação para a Web;
- Bibliotecas de programação para a Web;
- Introdução à segurança do lado do cliente e do lado do servidor.
CP3 [Acesso a Base de Dados]
- Acesso a Base de Dados a partir da Web;
- Modelo de dados na aplicação Web e correspondente interação com a Base de Dados.
CP4 [Registo e Gestão de Dados]
- Registo de dados da Web em Base de Dados.
- Gestão dos dados.
Dada a natureza prática dos conteúdos lecionados, a avaliação será realizada por projeto. O seu tema deverá estar alinhado com a totalidade ou parte do programa da UC.
Exercícios realizados na aula (10%).
Projeto (90%, incluindo trabalho de grupo (relatório e software) 40% e prova oral individual 50%).
Todas as componentes do projeto proposta, relatório, software e prova oral, são obrigatórias. A classificação mínima para cada componente é de 10 numa escala de 0 a 20.
Haverá apenas uma data limite para a entrega do projeto, com exceção dos alunos inscritos em época especial que poderão entregar durante esse período.
A presença nas aulas não é obrigatória.
Não existe exame final.
A melhoria de nota pode ser realizada através de entrega de novo projeto no ano letivo seguinte.
Title: Mitchell, R. (2016). Web Scraping with Python: Collecting Data from the Modern Web. Ed. O?Reilly Media, Inc. ISBN-13: 978-1491910290. ISBN-10: 1491910291.
Vincent W. S. (2018). Build websites with Python and Django. Ed: Independently published. ISBN-10: 1983172669. ISBN-13: 978-1983172663.
Dean J. (2018). Web Programming with HTML5, CSS, and JavaScript. Ed: Jones & Bartlett Learning. ISBN-13: 978-1284091793. ISBN-10: 1284091791.
Ryan J. (2013). A History of the Internet and the Digital Future. Ed: Reaktion Books. ISBN-13: 978-1780231129
Authors:
Reference: null
Year:
Title: Lambert M. and Jobsen B. (2017). Complete Bootstrap: Responsive Web Development with Bootstrap 4. Ed: Impackt Publishing. ISBN-10: 1788833406. ISBN-13: 978-1788833400.
Downey A. B. (2015). Think Python: How to Think Like a Computer Scientist. Ed: O'Reilly Media. ISBN-10: 1491939362. ISBN-13: 978-1491939369.
Authors:
Reference: null
Year:
Inteligência Artificial Simbólica para Ciência de Dados
Pretende introduzir-se as temáticas da Inteligência Artificial e Aprendizagem Automática Simbólicas, numa perspetiva essencialmente aplicada, tendo em linha de conta a inserção da cadeira no curso, os conhecimentos adquiridos noutras cadeiras e as necessidades fundamentais do curso.
Os três principais tópicos do programa são a programação em lógica, tecnologias adaptativas essencialmente simbólicas para a representação de modelos adaptativos do mundo, e métodos de aprendizagem automática simbólica para aprender modelos do mundo.
Após a conclusão da UC, os alunos devem
- Ter consciência da existência de paradigmas simbólicos para a representação e aprendizagem de modelos adaptativos do mundo
- Ter adquirido a aptidão de decidir usar os paradigmas aprendidos na unidade curricular em problemas / domínios aplicacionais adequados
Perspetiva Geral da Cadeira: necessidade, vantagens e desvantagens das tecnologias essencialmente simbólicas para a representação e aprendizagem de modelos adaptativos da realidade, e o papel de cada componente do programa nos desideratos da cadeira.
Programação em lógica para representar modelos da realidade e raciocinar com eles.
Representação e raciocínio baseados em conjuntos vagos e em lógica vaga para representar modelos adaptativos essencialmente simbólicos e raciocinar com eles.
Representação e raciocínio baseado em casos para representar modelos adaptativos essencialmente simbólicos e raciocinar com eles.
Introdução à Explainable AI e suas características e domínios de aplicação.
Conceitos de Responsible AI.
Na avaliação ao longo do semestre, os alunos terão de realizar:
- Teste escrito individual sobre todo o programa da UC (60%) - a realizar na época de exames (1º ou 2º exame).
- Trabalho de investigação (em grupo) sobre um dos temas da UC, com relatório e apresentação oral (40%). A apresentação oral é efectuada em tempo de aula durante o semestre. A nota do trabalho de investigação é dividida em 50% por cada elemento e os membros do grupo podem ter notas diferentes.
Ambas as componentes de avaliação na avaliação ao longo do semestre têm uma nota mínima de 8 valores.
Em alternativa, os alunos podem realizar apenas um exame (100%), que pode ser em ambas as datas de exame.
Na época especial de exames os alunos realizam o exame (100%).
Title: Logic Programming and Inductive Logic Programming:
Ivan Bratko. 2011. Prolog Programming for Artificial Intelligence (4th Edition). Pearson Education Canada (International Computer Science Series).
Fuzzy Systems:
Guanrong Chen, and Trung Tat Pham. 2005. Introduction to Fuzzy Systems. CRC Press.
Case based reasoning:
Michael M. Richter, and Rosina Weber. 2013. Case-Based Reasoning. A Textbook. Springer-Verlag Berlin Heidelberg
Authors:
Reference: null
Year:
Title: Lynne Billard, Edwin Diday. 2007. Symbolic Data Analysis: Conceptual Statistics and Data Mining, John Wiley & Sons, Ltd, Chichester, UK
Authors:
Reference: null
Year:
Objetivos
A Licenciatura em Ciência de Dados proporciona:
- uma formação sólida, ao nível dos mais elevados padrões internacionais, que permite retorno de valor à sociedade;
- uma sólida base deontológica para a integração profissional dos licenciados;
- um conjunto de competências para conceber e implementar soluções computacionais para problemas no domínio da recolha, tratamento, modelação e análise de dados;
- competências para trabalho em equipas multidisciplinares e de comunicação, escrita e oral;
- capacidade para empreender e inovar.
Em suma, os objetivos gerais são:
- Dominar os raciocínios computacional e o estatístico;
- Possuir conhecimentos teóricos, metodológicos e práticos em áreas específicas de estatística, investigação operacional, ciências da computação e ciências da informação relevantes para a análise de dados em larga escala;
- Capacidade para aplicar soluções para construção de conhecimento num leque variado de problemas e domínios;
- Desenvolver uma prática profissional regulada por princípios e condutas éticas;
- Adquirir competências necessárias para a elaboração de investigações científicas ou de resolução de problemas no âmbito das várias temáticas associadas.
Um licenciado deverá ter atingido os seguintes objetivos de aprendizagem:
Conhecimentos: teóricos, metodológicos e práticos em áreas particulares de estatística, investigação operacional, ciências da informação e ciências da computação, de aplicação em ciência de dados;
Aptidões - apto a:
- recolher, limpar, transformar e integrar dados de fontes diversas;
- organizar, sumarizar e visualizar informação descritiva e explicativa de dados e resultados;
- selecionar e aplicar de modo eficiente as metodologias mais apropriadas para analisar os dados de que dispõe, bem como inferir, prescrever e prever usando os modelos construídos;
- desenhar e implementar algoritmos numa linguagem generalista;
- perceber o nível de segurança, proteção e privacidade de dados num sistema proposto.
Competências - capaz de:
- completar o ciclo de análise por dados;
- obter e avaliar conhecimento científico;
- trabalhar numa equipa de caráter multidisciplinar e comunicar resultados.
Acreditações