Tecnologias Semânticas e da Linguagem Natural

Ano
2
Ano lectivo
2023-2024
Código
02045688
Área Científica
Opcional
Língua de Ensino
Português
Outras Línguas de Ensino
Inglês
Modo de Ensino
Presencial
Duração
Semestral
Créditos ECTS
6.0
Tipo
Opcional
Nível
2º Ciclo - Mestrado

Conhecimentos de Base Recomendados

Conhecimentos não essenciais mais desejados:

- Bases de Inteligência Artificial

- Bases de Aprendizagem Computacional

- Programação, idealmente em Python ou Java.

Métodos de Ensino

A unidade curricular está estruturada em torno de duas atividades:

- Aulas de contacto

- Projeto

Haverá dois tipos de aulas:

- Aulas de exposição de matéria.

- Aulas para acompanhamento do projeto.

O projeto inclui uma componente de investigação e a realização de um conjunto de experiências que envolvam: a criação ou enriquecimento de uma base de dados semântica com conhecimento extraído a partir de dados textuais; ou a exploração de uma ou mais bases de dados semânticas numa tarefa de processamento de linguagem natural.

Resultados de Aprendizagem

Prevê-se a aquisição das seguintes competências:

-Utilização de linguagens da Web Semântica (RDF, RDFs, OWL) para representação de dados e de bases de conhecimento.

-SPARQL para interrogação de bases de dados semânticas.

-Reutilização de vocabulários e dados ligados.

-Fundamentos de processamento de linguagem natural.

-Criação e enriquecimento de bases de dados semânticas através de processamento de linguagem natural.

-Utilização de bases de dados semânticas em processamento de linguagem natural e pesquisa.

-Espaços vetoriais semânticos e modelos de linguagem como alternativa a bases de dados semânticas.

Prevê-se a aquisição dos seguintes conceitos:

-Taxonomia, tesauro, ontologia, outras estruturas de conhecimento;

-Linked Data;

-Processamento de Linguagem Natural;

-Extração de Informação;

-Similaridade Semântica;

-Semântica Distribucional;

-Modelação de Linguagem;

-Recuperação de Informação;

-Pesquisa Semântica.

Estágio(s)

Não

Programa

1. Representação de conhecimento:

            a. Linguagens RDF, RDF Schema, OWL

            b. Taxonomias, Tesauros, Ontologias e outras representações de conhecimento

            c. Dados Ligados e Reutilização de Vocabulários

            d. Interrogação com SPARQL

2. Do texto ao conhecimento estruturado

            a. Processamento de Linguagem Natural

            b. Extração de Informação

            c. Bases de conhecimento lexico-semântico

3. Semântica Distribucional

            a. Semântica Vetorial

            b. Modelos de Linguagem Neuronais

4. Recuperação de Informação e Pesquisa Semântica

            a. Em dados estruturados

            b. Em dados não estruturados (texto).

Métodos de Avaliação

Avaliação
Exame: 35.0%
Projecto: 65.0%

Bibliografia

-- Liyang Yu. A Developer's Guide to the Semantic Web, 3rd edition. Springer, 2015.

-- Dan Jurafsky & James H. Martin. Speech and Language Processing. Prentice Hall, 2009.

-- Jacob Eisenstein (2018). Natural Language Processing. MIT Press, draft edition.

-- Diana Maynard, Kalina Bontcheva & Isabelle Augenstein (2016). Natural Language Processing for the Semantic Web. Morgan & Claypool Publishers.