Tópicos de Ciência dos Dados

Ano
1
Ano lectivo
2022-2023
Código
02038778
Área Científica
Opcional
Língua de Ensino
Português
Outras Línguas de Ensino
Inglês
Modo de Ensino
Presencial
Duração
Semestral
Créditos ECTS
6.0
Tipo
Opcional
Nível
2º Ciclo - Mestrado

Conhecimentos de Base Recomendados

Cálculo, Álgebra Linear, Programação

Métodos de Ensino

Aulas T: apresentação e discussão dos conceitos, técnicas e algoritmos. Na PL, o aluno exercita em computador o uso dos algoritmos de aprendizagem computacional na resolução de problemas de complexidade média, efectuando simulações eventualmente por recurso a ferramentas. Este trabalho é feito em grupo, na aula PL, com a monitorização do professor. Esta componente pesa na avaliação final (20%).  Realização, fora das aulas, de um projecto com entrega de um relatório e defesa pública (40% da nota final). Exame escrito com peso de 40%.

Resultados de Aprendizagem

A UC pretende introduzir a área da ciência dos dados, apresentando ao aluno uma visão geral da área, dos seus princípios metodológicos, dos seus desafios e das suas principais aplicações. Pretende-se ainda introduzir os algoritmos básicos de um pipeline de análise de dados com particular ênfase na preparação dos dados, extração atributos e de redução da dimensionalidade e na aprendizagem e validação. No final pretende-se que o/a aluno/a seja capaz de identificar de desenhar pipelines e validar experimental e formalmente, a melhor solução algorítmicas para uma tarefa particular. Também se pretende fomentar a aprendizagem autónoma e o trabalho em grupo, as relações interpessoais, e a comunicação oral e escrita.

Estágio(s)

Não

Programa

Cap 1: Introdução
- Big Data e Ciência dos Dados
- Situação atual e perspectivas
- Competências necessários
Cap 2: Problemas e Aplicações
- Ciclo de vida e o pipeline
- Problemas e aplicações típicas
Cap 3:Tratamento de dados
• Avaliação da relação sinal/ruído
• Filtragem de séries temporais
• Detecção e tratamento de outliers
• Detecção e tratamento de valores em falta
• Transformadas tempo-frequência: extração de atributos não estacionários
Cap 4:Tratamento de atributos
• Discretização de variáveis continuas, conversão de variáveis categóricas
• Normalização
• Tratamento de dados desbalanceados
Cap 5: Selecção e redução de atributos
• Métodos independentes do classificador/regressor: Filtros
• Wrappers e métodos “Embedded”
• Redução não supervisionada
• Redução supervisionada
Cap. 6: Aprendizagem Computacional
• Aprendizagem Supervisionada e não supervisionada
Cap 7: Validação

Docente(s) responsável(eis)

Paulo Fernando Pereira de Carvalho

Métodos de Avaliação

Avaliação
Resolução de problemas: 20.0%
Exame: 40.0%
Projecto: 40.0%

Bibliografia

- Peter Flach, Machine Learning: the art and science of algorithms that maker sense of data, Cambridge University Press, 2012.
- Introduction to Machine Learning with Python, Andreas C. Muller and Sarah Guido, O'Reilly, 2017.
- García, Luengo & Herrera (2015). "Data Preprocessing in Data Mining". Springer.
- Nixon & Aguado (2008). "Feature Extraction & Image Processing". Academic Press.