Universitatea "Babes-Bolyai" Cluj-Napoca
Facultatea de Matematica si Informatica
FISA DISCIPLINEI

Prelucrarea limbajului natural
Cod
Semes-
trul
Ore: C+S+L
Credite
Tipul
Specializarea
MI070
7
2+0+2
6
optionala
Informatică
MI070
7
2+0+2
6
optionala
Matematică-Informatică
Cadre didactice indrumatoare
Prof. Dr. TATAR Doina,  dtatarcs.ubbcluj.ro
Obiective
Prezentarea unuia dintre cele mai active domenii ale inteligentei artificiale, prelucrarea limbajului natural. In acest scop este prezentat modelul lingvistic de structura de atribute. Deasemenea sunt prezentate problemele de semantica si de pragmatica care apar in acest domeniu. Acestea sunt importante atunci cand sunt abordate aspectele legate de dialogul (interfetele) om-calculator sau probleme care pot fi incadrate in "information retrieval" sau "text mining".
Continut
1. Structuri de atribute (FS) ca obiecte de reprezentare a cunostintelor lingvistice.
Ierarhii de tipuri. Relatia de subsumare pe multimea FS. Unificarea ca operatie pe multimea FS. Descriptori si legatura cu FS. Teoria deductiva a descriptorilor. Cel mai general FS care satisface un descriptor. Cazul variabilelor si legatura cu programarea logica. Notiunea de "potrivire" a tipurilor cu atributele. Notiunea de buna-tipizare, total buna-tipizare.
2. Gramatici de unificare. Formalisme alternative: gramatici ale clauzelor definite,formalismul Patr, gramatici HPSG. Reguli de rescriere. Evaluari top-down si evaluari bottom-up.
3. Metode statistice de prelucrare a limbajului natural. Modelul Markov acoperit ( HMM). Drum de probabilitate maxima intr-un HMM, calculul probabilitatii unor secvente de intrare. Gramatici probabiliste.
4. Dezambiguare semantica. Dezambiguare supervizata. Dezambiguare bazata pe dictionare si "thesauri". Algoritme de dezambiguare client/server.Dezambiguare "bootstrapping". Dezambiguare nesupervizata. Aplicatii la categorizarea de text, sumarizarea de text si traducere automata.
Bibliografie
1. J.ALLEN : "Natural language understanding", Benjamin/Cummings Publ., 2nd ed., 1995.
2. B.CARPENTER: "The logic of typed feature structures", Cambridge University Press,1992.
3. B.CARPENTER: "ALE:The attribute logic engine.User's guide". Carnegie Mellon University,1994.
4. D.JURAFSKY, J.MARTIN: "Speech and language processing", Prentice Hall, 2000.
5. C.MANNING, H.SCHUTZE: "Foundation of statistical natural language processing", MIT, 1999.
6. G.MORILL:"Type LogicalGrammar.Categorial Logic of Signs", Kluwer Academic Publishers, 1994.
7. S.J.RUSSELL, P.NORVIG: "Artificial intelligence.A modern approach", Prentice-Hall International, 1995.
8. D.TATAR: "Inteligenta artificiala: demonstrare automata de teoreme, prelucrarea limbajului natural", Editura Albastra, Microinformatica, 2001.
9. D.TATAR: "Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural", Ed. Albastra, Microinformatica, 2003
10.E. CHARNIAK: "Statistical language learning", MIT Press, 1996.
Evaluare
Examenul este oral, cu subiecte din intreaga materie (70%). In nota finala se va tine cont de activitatea de realizare a unui proiect in legatura cu materia predata (30%).