Análise de Dados Biológicos

Ano
1
Ano lectivo
2020-2021
Código
02038823
Área Científica
Biologia Computacional
Língua de Ensino
Português
Outras Línguas de Ensino
Inglês
Modo de Ensino
Presencial
Duração
Semestral
Créditos ECTS
6.0
Tipo
Obrigatória
Nível
2º Ciclo - Mestrado

Conhecimentos de Base Recomendados

Não aplicável.

Métodos de Ensino

Metodologias de Ensino:

1. Aulas teórico-práticas com vários exemplos de aplicação e uso de R.

2. Desenvolvimento prático de projetos de grupo - oral (15%) e apresentação escrita (35%)

3. Exame final (50%; sem consulta).

As aulas são destinadas a apresentar e explicar os tópicos selecionados, introduzindo conceitos-chave, resultados e principais algoritmos, sempre destacando a relação com um problema de interesse prático em biologia computacional. O processo de exposição do material será feito de forma interativa e ajustado à velocidade de assimilação dos alunos.

Resultados de Aprendizagem

A Análise de Dados é a ciência de examinar dados para converter informações dispersas em conhecimento utilizável, o que se encaixa bem no novo paradigma da ciência: descoberta científica com uso intensivo de dados. O objetivo principal deste curso é a introdução de conceitos fundamentais sobre a manipulação e exploração de informação, técnicas de análise estatística e quantitativa bem como modelos exploratórios. O curso preparará os estudantes para se adaptarem à era de “big data”, facilitando a realização de inferências de dados biológicos provenientes de experiências genómicas e proteómicas.

Estágio(s)

Não

Programa

1. "Data Science": introdução à aprendizagem estatística e programação em R.

2. Coleta de dados genómicos e proteómicos, exploração e visualização.

3. Estatística Descritiva: limpeza de dados, medidas de tendência central e dispersão; distribuição de probabilidade conjunta, distribuição de probabilidade condicional, teorema de Bayes.

4. Pré-Processamento de Dados: transformações de dados - polinômios; box-cox, centralização e normalização de log e logit.

5. Redução de informação: "Principal Component Analysis (PCA)" e "t-Distributed Stochastic Neighbor Embedding (t-SNE)".

6. Análise Fatorial Exploratória e sua relação com PCA.

7. Análise de regressão: regressão linear múltipla, regressão para frente, para trás e stepwise, regressão logística.

8. Estatística Inferencial: teste de hipóteses (Qui-quadrado e teste t), análise de variância padrão (ANOVA), ANCOVA (análise de covariância), MANOVA (ANOVA multivariada) e MANCOVA (ANCOVA multivariada).

Docente(s) responsável(eis)

Irina de Sousa Moreira

Métodos de Avaliação

Avaliação
Exame: 50.0%
Trabalho de investigação: 50.0%

Bibliografia

1. Probability & Statistics for Engineers & Scientists (9th Edn.), Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers and Keying Ye, Prentice Hall Inc.

2. The Elements of Statistical Learning, Data Mining, Inference, and Prediction (2nd Edn.), Trevor Hastie Robert Tibshirani Jerome Friedman, Springer, 2014

3. An Introduction to Statistical Learning: with Applications in R, G James, D. Witten, T Hastie, and R. Tibshirani, Springer, 2013

4. Software for Data Analysis: Programming with R (Statistics and Computing), John M. Chambers, Springer

5. Beginning R: The Statistical Programming Language, Mark Gardener, Wiley, 2013