Universitatea Babeş-Bolyai Cluj-Napoca
Facultatea de Matematică şi Informatică
Ciclul de studii: Licență

FISA DISCIPLINEI

Codul
Denumirea disciplinei
MII0007 Tehnici pentru regăsirea informaţiei
Specializarea
Semestrul
Ore: C+S+L
Categoria
Statutul
Informatică - linia de studiu română
5
2+0+2
specialitate
optionala
Matematică informatică - linia de studiu română
5
2+0+2
specialitate
optionala
Titularii de disciplina
Lect. Dr. LUPSA Dana,  danacs.ubbcluj.ro
Obiective
Prezentarea unuia dintre cele mai active domenii ale inteligentei artificiale, aplicatii ale tehnicilor de regasire a informatiei, in prelucrarea limbajului natural. Cursul trece in revista atat abordari traditionale, precum si cateva abordari in noul domeniu al regasirii $inteligente$ a informatiei. Sunt prezentati algoritmi si modele folosite in IR (Information Retrieval). Cautarea si regasirea informatiei este strans legata de organizarea si descrierea informatiei de regasit, motiv pentru care sunt prezentate tehnici de procesare a limbajului natural.
Continutul
1. Introducere in procesarea limbajului natural (NLP) si regasirea informatiei (IR).
2. Informatie in text: legatura intre informatia sintactica si semantica, informatie semantica (cu accent pe semantica lexicala). Modele de reprezentare a informatiei.
3. Proprietati ale textelor; procesarea textelor. Caracteristici statistice ale textelor, importanta termenilor, algoritmi de clasificare cu aplicatii la clasificarea textelor.
4. Organizarea fisierelor pentru IR.
5. Problema raspunsului la intrebari.
6. Modele probabilistice in NLP si IR.
7. Sisteme IR si WWW.
Bibliografie
1. J.ALLEN : $Natural language understanding$, Benjamin/Cummings Publ., 2nd ed., 1995.
2. S.COZENS, P.WAINWRIGHT: “Beginning Perl”, Wrox Press, 2000
3. C.MANNING, P.RAGHAVAN, H.SCHÜTZE: “Introduction to Information Retrieval”, Cambridge University Press. 2007.
http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html
4. D.JURAFSKY, J.MARTIN: $Speech and language processing$, Prentice Hall, 2000.
5. C.J. van RIJSBERGEN: “Information Retrieval”, 1979
6. D.TATAR: $Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural$, Ed. Albastra, Microinformatica, 2003
7. TREC-QA: http://trec.nist.gov/data/qa.html
Evaluare
Nota finala se va calcula astfel:
examen oral = 70%
activitate practica = 30%
Activitatea practica va fi evaluata pe baza unor programe sau proiecte dezvoltate in timpul orelor de laborator.
Legaturi: Syllabus-urile tuturor disciplinelor
Versiunea in limba engleza a acestei discipline
Versiunea in format rtf a acestei discipline