Tecnologias Semânticas e da Linguagem Natural
2
2023-2024
02045688
Opcional
Português
Inglês
Presencial
Semestral
6.0
Opcional
2º Ciclo - Mestrado
Conhecimentos de Base Recomendados
Conhecimentos não essenciais mais desejados:
- Bases de Inteligência Artificial
- Bases de Aprendizagem Computacional
- Programação, idealmente em Python ou Java.
Métodos de Ensino
A unidade curricular está estruturada em torno de duas atividades:
- Aulas de contacto
- Projeto
Haverá dois tipos de aulas:
- Aulas de exposição de matéria.
- Aulas para acompanhamento do projeto.
O projeto inclui uma componente de investigação e a realização de um conjunto de experiências que envolvam: a criação ou enriquecimento de uma base de dados semântica com conhecimento extraído a partir de dados textuais; ou a exploração de uma ou mais bases de dados semânticas numa tarefa de processamento de linguagem natural.
Resultados de Aprendizagem
Prevê-se a aquisição das seguintes competências:
-Utilização de linguagens da Web Semântica (RDF, RDFs, OWL) para representação de dados e de bases de conhecimento.
-SPARQL para interrogação de bases de dados semânticas.
-Reutilização de vocabulários e dados ligados.
-Fundamentos de processamento de linguagem natural.
-Criação e enriquecimento de bases de dados semânticas através de processamento de linguagem natural.
-Utilização de bases de dados semânticas em processamento de linguagem natural e pesquisa.
-Espaços vetoriais semânticos e modelos de linguagem como alternativa a bases de dados semânticas.
Prevê-se a aquisição dos seguintes conceitos:
-Taxonomia, tesauro, ontologia, outras estruturas de conhecimento;
-Linked Data;
-Processamento de Linguagem Natural;
-Extração de Informação;
-Similaridade Semântica;
-Semântica Distribucional;
-Modelação de Linguagem;
-Recuperação de Informação;
-Pesquisa Semântica.
Estágio(s)
NãoPrograma
1. Representação de conhecimento:
a. Linguagens RDF, RDF Schema, OWL
b. Taxonomias, Tesauros, Ontologias e outras representações de conhecimento
c. Dados Ligados e Reutilização de Vocabulários
d. Interrogação com SPARQL
2. Do texto ao conhecimento estruturado
a. Processamento de Linguagem Natural
b. Extração de Informação
c. Bases de conhecimento lexico-semântico
3. Semântica Distribucional
a. Semântica Vetorial
b. Modelos de Linguagem Neuronais
4. Recuperação de Informação e Pesquisa Semântica
a. Em dados estruturados
b. Em dados não estruturados (texto).
Métodos de Avaliação
Avaliação
Exame: 35.0%
Projecto: 65.0%
Bibliografia
-- Liyang Yu. A Developer's Guide to the Semantic Web, 3rd edition. Springer, 2015.
-- Dan Jurafsky & James H. Martin. Speech and Language Processing. Prentice Hall, 2009.
-- Jacob Eisenstein (2018). Natural Language Processing. MIT Press, draft edition.
-- Diana Maynard, Kalina Bontcheva & Isabelle Augenstein (2016). Natural Language Processing for the Semantic Web. Morgan & Claypool Publishers.