Universitatea Babeş-Bolyai Cluj-Napoca
Facultatea de Matematică şi Informatică
Ciclul de studii: Masterat

FISA DISCIPLINEI

Codul
Denumirea disciplinei
MII1005 Sisteme bazate pe cunoştinţe şi tehnologia limbajului
Specializarea
Semestrul
Ore: C+S+L
Categoria
Statutul
Sisteme inteligente - în limba engleză
2
2+1+0
specialitate
obligatorie
Titularii de disciplina
Lect. Dr. LUPEA Mihaiela,  lupeacs.ubbcluj.ro
Obiective
Tehnologia limbajului (LT) este un subdomeniu al Inteligentei artificiale si scopul sau principal este studierea aspectelor cantitative ale limbajului natural. Aplicatiile LT se construiesc deobicei pe baza unor Sisteme bazate pe cunostinte (KBS)
de exemplu ontologii, dictionare electronice, corpus-uri. Cursul are drept scop studiul
pricipiilor de baza, al tehnologiilor si al aplicatiilor recente in LT si in KBS, incepand de la optimizarea cautarilor Web si mergand pana la acele procesari de text care apar in domeniul denumit $text mining$.
O analiza a cercetarii recente in LT si KBS si realizarea unor aplicatii originale
majore este al doilea obiectiv al cursului.
Continutul
1. Tehnologia limbajului: etape, domenii.
2. Corpus-ul ca si KBS si ca instrument in diferitele aplicatii LT. Sisteme de adnotare
ale unui corpus. Utilizarea corpus-ului in metodele de invatare supervizata.
3. WordNet ca un Sistem bazat pe cunostinte.Relatii lexicale. Relatia de sinonimie.
Exemple de utilizare a WordNet-ului.
4. Dezambiguarea sensului cuvintelor (WSD): abordarea WSD prin invatare automata
supervizata si nesupervizata), abordarea WSD pe baza dictionarelor. Necesitatea
etapei de WSD.
5. Prelucrarea limbajului natural folosind logici descriptive.
6. Metode statistice in prelucrarea limbajului natural: lanturi Markov, modelul Hidden
Markov Model (HMM). Evaluarea si antrenarea HMM.Aplicatii.
7. Gramatici context-free probabiliste. Analiza sintactica cu diagrame active.
8. Structuri de atribute (FS): FS ca grafuri, ca AVM si ca descriptori. Unificarea FS.
9. Gramatici de unificare. Parsare cu gramatici de unificare.

Bibliografie
1. J.ALLEN : Natural language understanding, Benjamin/Cummings Publ., 2nd ed., 1995.
2. E. CHARNIAK: $Statistical language learning$, MIT press, 1996.
3. B.CARPENTER: ALE:The attribute logic engine.User@s guide. Carnegie Mellon
University,1994.
4. D.FEHRER et al: Description logics for natural language processing. In Proc. of the
1994 Description Logic Workshop (DL’94), 1994.
5. H. Helbig: $Knowledge Representation and the Semantics of Natural Language$, Springer,
2006.
6. D.JURAFSKY, J.MARTIN: Speech and language processing, Prentice Hall, 2000.
7. C.MANNING, H.SCHUTZE: Foundation of statistical natural language processing, MIT, 1999.
8. (Editor) R. MITKOV: The Oxford Handbook of Computational Linguistics, Oxford
University Press, 2003.
9. D.TATAR: Inteligenta artificiala: demonstrare automata de teoreme, prelucrarea
limbajului natural, Editura Albastra, Microinformatica, 2001.
10. D. TATAR: Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural,
Editura Albastra, Microinformatica, 2003.
Evaluare
Nota finala are urmatoarele componente:

(1) Un proiect finalizat printr-o aplicatie din domeniul LT si KBS....30%

(2) Dezbaterea a cel putin doua articole din literatura LT si KBS.....30%

(3) Examinare finala..................................................40%
Legaturi: Syllabus-urile tuturor disciplinelor
Versiunea in limba engleza a acestei discipline
Versiunea in format rtf a acestei discipline