Pesquisa e Recuperação de Informação
Código: 22119
Departamento: DCET
ECTS: 6
Área científica: Engenharia Informática
Total de horas trabalho: 156
Total de horas de contacto: 30

A atual relevância das técnicas de pesquisa e recuperação de informação (Information Retrieval, IR) fica demonstrada de forma bastante expressiva se tivermos em consideração estudos que indicam que cerca de 92% dos utilizadores da Internet considera ser este o método preferencial para obter a informação de que necessita no seu dia-a-dia. Não obstante o facto de nem todas as técnicas utilizadas terem sido originariamente pensadas para a Web, é uma realidade que esta constituiu um dos principais potenciadores da expansão e inovação da área de IR, nomeadamente através dos motores de pesquisa. Nesta unidade curricular são cobertas as principais técnicas e modelos subjacentes à pesquisa e recuperação de informação quer na sua vertente clássica de pesquisa em repositórios de dados, quer na sua aplicação Web. Consideram-se principalmente métodos de pesquisa de texto.

Recuperação de Informação
Motores de pesquisa
Pesquisa na Web

Espera-se que o aluno ao concluir esta unidade curricular esteja capaz de:
  1. Reconhecer a importância da pesquisa e recuperação de informação no contexto atual das exigências da sociedade de informação;
  2. Identificar os conceitos, modelos e técnicas principais de pesquisa e recuperação de informação dando especial relevância à pesquisa na Web e em repositórios de dados;
  3. Desenhar e implementar e aplicar soluções de pesquisa e recuperação de informação.

Os conteúdos programáticos que serão percorridos dentro dos 5 tópicos previstos para esta UC, abordarão os seguintes temas (alguns, incluídos dentro de outros):
  1. Motivação e perspetiva histórica.
  2. Modelos Booleanos: índices invertidos e dicionários.
  3. Operações de Pré Processamento e Compressão de dados.
  4. Modelos Vetoriais.
  5. Modelos Probabilísticos.
  6. Avaliação de Sistemas de IR.
  7. Procura na Web.
  8. Análise comparativa dos principais sistemas de IR.

Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information Retrieval, Pearson - Addison Wesley Longman/ACM Press, 2nd Edition, 2010. ISBN 978-0321416919.
 
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008. ISBN 978-0521865715.
 

E-learning

A avaliação tem caráter individual e implica a coexistência de duas modalidades: avaliação contínua (60%) e avaliação final (40%). Essa avaliação será desenvolvida na aplicação de formas diversificadas, definidas no Contrato de Aprendizagem da unidade curricular.

Admite-se que os estudantes dominem a língua inglesa ao nível da leitura.