Tópicos de Ciência dos Dados
1
2020-2021
02038778
Opcional
Português
Inglês
Presencial
Semestral
6.0
Opcional
2º Ciclo - Mestrado
Conhecimentos de Base Recomendados
Cálculo, Álgebra Linear, Programação
Métodos de Ensino
Aulas T: apresentação e discussão dos conceitos, técnicas e algoritmos. Na PL, o aluno exercita em computador o uso dos algoritmos de aprendizagem computacional na resolução de problemas de complexidade média, efectuando simulações eventualmente por recurso a ferramentas. Este trabalho é feito em grupo, na aula PL, com a monitorização do professor. Esta componente pesa na avaliação final (20%). Realização, fora das aulas, de um projecto com entrega de um relatório e defesa pública (40% da nota final). Exame escrito com peso de 40%.
Resultados de Aprendizagem
A UC pretende introduzir a área da ciência dos dados, apresentando ao aluno uma visão geral da área, dos seus princípios metodológicos, dos seus desafios e das suas principais aplicações. Pretende-se ainda introduzir os algoritmos básicos de um pipeline de análise de dados com particular ênfase na preparação dos dados, extração atributos e de redução da dimensionalidade e na aprendizagem e validação. No final pretende-se que o/a aluno/a seja capaz de identificar de desenhar pipelines e validar experimental e formalmente, a melhor solução algorítmicas para uma tarefa particular. Também se pretende fomentar a aprendizagem autónoma e o trabalho em grupo, as relações interpessoais, e a comunicação oral e escrita.
Estágio(s)
NãoPrograma
Cap 1: Introdução
- Big Data e Ciência dos Dados
- Situação atual e perspectivas
- Competências necessários
Cap 2: Problemas e Aplicações
- Ciclo de vida e o pipeline
- Problemas e aplicações típicas
Cap 3:Tratamento de dados
• Avaliação da relação sinal/ruído
• Filtragem de séries temporais
• Detecção e tratamento de outliers
• Detecção e tratamento de valores em falta
• Transformadas tempo-frequência: extração de atributos não estacionários
Cap 4:Tratamento de atributos
• Discretização de variáveis continuas, conversão de variáveis categóricas
• Normalização
• Tratamento de dados desbalanceados
Cap 5: Selecção e redução de atributos
• Métodos independentes do classificador/regressor: Filtros
• Wrappers e métodos “Embedded”
• Redução não supervisionada
• Redução supervisionada
Cap. 6: Aprendizagem Computacional
• Aprendizagem Supervisionada e não supervisionada
Cap 7: Validação
Docente(s) responsável(eis)
Paulo Fernando Pereira de Carvalho
Métodos de Avaliação
Avaliação
Resolução de problemas: 20.0%
Projecto: 40.0%
Exame: 40.0%
Bibliografia
- Peter Flach, Machine Learning: the art and science of algorithms that maker sense of data, Cambridge University Press, 2012.
- Introduction to Machine Learning with Python, Andreas C. Muller and Sarah Guido, O'Reilly, 2017.
- García, Luengo & Herrera (2015). "Data Preprocessing in Data Mining". Springer.
- Nixon & Aguado (2008). "Feature Extraction & Image Processing". Academic Press.