Total de horas trabalho: 156
Total de horas de contacto: 30
A atual relevância das técnicas de pesquisa e recuperação de informação (Information Retrieval, IR) fica demonstrada de forma bastante expressiva se tivermos em consideração estudos que indicam que cerca de 92% dos utilizadores da Internet considera ser este o método preferencial para obter a informação de que necessita no seu dia-a-dia. Não obstante o facto de nem todas as técnicas utilizadas terem sido originariamente pensadas para a Web, é uma realidade que esta constituiu um dos principais potenciadores da expansão e inovação da área de IR, nomeadamente através dos motores de pesquisa. Nesta unidade curricular são cobertas as principais técnicas e modelos subjacentes à pesquisa e recuperação de informação quer na sua vertente clássica de pesquisa em repositórios de dados, quer na sua aplicação Web. Consideram-se principalmente métodos de pesquisa de texto.
Recuperação de Informação Motores de pesquisa Pesquisa na Web
Espera-se que o aluno ao concluir esta unidade curricular esteja capaz de:
Reconhecer a importância da pesquisa e recuperação de informação no contexto atual das exigências da sociedade de informação;
Identificar os conceitos, modelos e técnicas principais de pesquisa e recuperação de informação dando especial relevância à pesquisa na Web e em repositórios de dados;
Desenhar e implementar e aplicar soluções de pesquisa e recuperação de informação.
Os conteúdos programáticos que serão percorridos dentro dos 5 tópicos previstos para esta UC, abordarão os seguintes temas (alguns, incluídos dentro de outros):
Motivação e perspetiva histórica.
Modelos Booleanos: índices invertidos e dicionários.
Operações de Pré Processamento e Compressão de dados.
Modelos Vetoriais.
Modelos Probabilísticos.
Avaliação de Sistemas de IR.
Procura na Web.
Análise comparativa dos principais sistemas de IR.
Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information Retrieval, Pearson - Addison Wesley Longman/ACM Press, 2nd Edition, 2010. ISBN 978-0321416919.
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008. ISBN 978-0521865715.
E-learning
A avaliação tem caráter individual e implica a coexistência de duas modalidades: avaliação contínua (60%) e avaliação
final (40%). Essa avaliação será desenvolvida na aplicação de formas diversificadas, definidas no Contrato de Aprendizagem da
unidade curricular.
Admite-se que os estudantes dominem a língua inglesa ao nível da leitura.