Universitatea "Babeş-Bolyai" din Cluj-Napoca

Facultatea de Matematică şi Informatică
FISA DISCIPLINEI

Prelucrarea limbajului natural Natural language processing
Cod
Semes-
trul
Ore: C+S+L
Credite
Tipul
Sectia
MI282
1
2+2+0
9
obligatorie
Sisteme inteligente - în limba engleză
(Intelligent Systems - in English)
Cadre didactice indrumatoare Teaching Staff in Charge
Conf. Dr. TĂTAR Doina, dtatar@cs.ubbcluj.ro
Obiective Aims
Prezentarea unuia dintre cele mai active domenii ale inteligentei artificiale, prelucrarea limbajului natural. Aplicarea, in cazul concret al acestui domeniu, al notiunilor de ierarhie de tipuri si structuri de atribute, notiuni de baza in paradigma orientarii obiect. Necesitatea studiului acestui domeniu se impune in scopul optimizarii cantitatii imense de informatie scrisa stocata in acest moment pe Web.
Natural language processing is now accepted as one of the most studied and active field of Computer Science. The notion of feature structure as linguistic object stands on the base of
most recent approaches which are surveyed in this course. The optimization of the search on Web, the interfaces in natural language are only some of motivations for studying natural language processing.
Continut
1. Structuri de atribute (FS) ca obiecte de reprezentare a cunostintelor lingvistice. Ierarhii de tipuri.Relatia de subsumare pe multimea FS.Unificarea ca operatie pe multimea FS. Descriptori si legatura cu FS. Teoria deductiva a descriptorilor. Cel mai general FS care satisface un descriptor. Cazul variabilelor si legatura cu programarealogica. Notiunea de "potrivire" a tipurilor cu atributele.Notiunea de buna-tipizare, total buna-tipizare.
2. Gramatici de unificare. Formalisme alternative: gramatici ale clauzelor definite, formalismul Patr, gramatici HPSG. Reguli de rescriere. Evaluari top-down si evaluari bottom-up. Prezentarea produsului ALE de prelucrare a limbajului natural. Particularitati ale limbii romane. Alte produse de prelucrarea limbajului natural.
3. Metode statistice de prelucrare a limbajului natural. Modelul Markov acoperit (HMM). Drum de probabilitate maxima intr-un HMM, calculul probabilitatii unor secvente de intrare. Gramatici probabiliste. Dezambiguare statistica. Categorizare de text.
Bibliografie
1. J.Allen : "Natural language understanding", Benjamin/Cummings Publ. , 2nd ed., 1995.
2. B.Carpenter: "The logic of typed feature structures", Cambridge University Press,1992. 3. B.Carpenter: "ALE:The attribute logic engine.User's guide". Carnegie Mellon University,1994.
4. M.Johnson:"Attribute-value logic and the theory of grammar",CSLI,1988.
5. D.Jurafsky, J.Martin: "Speech and language processing", Prentice Hall, 2000.
6. C.Manning, H.Schutze: "Foundation of statistical natural language processing", MIT, 1999.
7. S.J.Russell, P.Norvig: "Artificial intelligence.A modern approach", Prentice-Hall International,1995.
8. M.Shieber: "Introduction to unification-based approaches to grammars", CSLI,1986.
8. D.Tatar: "Inteligenta artificiala: demonstrare automata de teoreme, prelucrarea limbajului natural", Editura Microinformatica, 2001.
9. D.Tatar: "Unification Grammars in Natural Language Processing", in "Recent topics in mathematical and computational linguistic", ed. C. Martin-Vide, G. Paun, Editura Academiei, 2000, pg 289-300.
Evaluare Assessment
Examenul este oral, cu subiecte din intreaga materie.
The examination is by oral exam, with the subjects from all the matter.