Tópicos de Ciência dos Dados
1
2025-2026
02038778
Opcional
Português
Inglês
Presencial
Semestral
6.0
Opcional
2º Ciclo - Mestrado
Conhecimentos de Base Recomendados
Cálculo, Álgebra Linear, Programação.
Métodos de Ensino
Aulas T: apresentação e discussão dos conceitos, técnicas e algoritmos. Na PL, o aluno exercita em computador o uso dos algoritmos de aprendizagem computacional na resolução de problemas de complexidade média, efectuando simulações eventualmente por recurso a ferramentas. Este trabalho é feito em grupo, na aula PL, com a monitorização do professor. Esta componente pesa na avaliação final (20%). Realização, fora das aulas, de um projecto com entrega de um relatório e defesa pública (40% da nota final). Exame escrito com peso de 40%.
Resultados de Aprendizagem
UC pretende introduzir a área da ciência dos dados, apresentando ao aluno uma visão geral da área, dos seus princípios metodológicos, dos seus desafios e das suas principais aplicações. Pretende-se ainda introduzir os algoritmos básicos de um pipeline de análise de dados com particular ênfase na preparação dos dados, extração atributos e de redução da dimensionalidade e na aprendizagem computacional e validação. No final pretende-se que o/a aluno/a seja capaz de identificar de desenhar pipelines e validar experimental e formalmente, a melhor solução algorítmicas para uma tarefa particular. Também se pretende fomentar a aprendizagem autónoma e o trabalho em grupo, as relações interpessoais, e a comunicação oral e escrita.
Estágio(s)
NãoPrograma
Cap 1: Introduction
- Big Data, Aprendizagem Computacional e Ciência de Dados
- Life cycle e o pipeline
Cap 2: Atributos e Limpeza
- Análise de dados preliminar
- Tipos de atributos e conversão de atributos
- Binning
- Normalização
- Limpeza de dados (outliers univariado e multivariado, imputação de dados contínuos e categóricos, deteção de duplicados e medidas de
semelhança, ruído e Fourier)
- Tratamento de dados desbalanceados
Cap 3: Engenharia de Atributos
- Tipos de atributos
- Redução de dimensionalidade (PCA, FDA e LDA)
- Seleção de atributos (Filtros, Wrappers e Métodos Embebidos)
- Análise tempo-frequência e espaço frequência
Chapter 4: Aprendizagem Computacional
- Taxonomias de Aprendizagem Computacional
- O processo de Aprendizagem Computacional
- Modelos e Algoritmos (redes neuronais feedforward, SVM e árvores de decisão e as suas aplicações em problemas de classificação e regressão; algoritmos Baysianos)
Docente(s) responsável(eis)
Paulo Fernando Pereira de Carvalho
Métodos de Avaliação
Avaliação
Resolução de problemas: 20.0%
Projecto: 40.0%
Exame: 40.0%
Bibliografia
- Peter Flach, Machine Learning: the art and science of algorithms that maker sense of data, Cambridge University Press, 2012.
I. Ilyas and X. Chu, Data Cleaning, ACM, 2019
P Duboue, The art of Feature Enguineering: Essentials for Machine Learning,
C. Bishop, Pattern Recognition and Machine Learning, Springer-Verlag, 2016
A. Géron, Hand-on Machine Learning with Scikit-Learn, Keras & TensorFlow, O'Reilly,
Deepti Chopra, Roopal Khurana, Introduction to Machine Learning with Python, Beenthem Books, 2023
Chapman & Hall, Feature Engineering and Selection, CRC Data Science Series, 2021
- Introduction to Machine Learning with Python, Andreas C. Muller and Sarah Guido, O'Reilly, 2017.
- García, Luengo & Herrera (2015). "Data Preprocessing in Data Mining". Springer.
- Nixon & Aguado (2008). "Feature Extraction & Image Processing". Academic Press