Universitatea Babeş-Bolyai Cluj-Napoca
Facultatea de Matematică şi Informatică
Ciclul de studii: Masterat

FISA DISCIPLINEI

Codul
Denumirea disciplinei
MII1005 Sisteme bazate pe cunoştinţe şi tehnologia limbajului
Specializarea
Semestrul
Ore: C+S+L
Categoria
Statutul
Sisteme inteligente - în limba engleză
2
2+1+1
specialitate
obligatorie
Titularii de disciplina
Prof. Dr. TATAR Doina,  dtatarcs.ubbcluj.ro
Obiective
Tehnologia limbajului (LT) este un subdomeniu al Inteligentei artificiale si scopul sau principal este studierea aspectelor cantitative ale limbajului natural. Aplicatiile LT se construiesc deobicei pe baza unor Sisteme bazate pe cunostinte (KBS)
de exemplu ontologii, dictionare electronice, corpus-uri. Cursul are drept scop studiul
pricipiilor de baza, al tehnologiilor si al aplicatiilor recente in LT si in KBS, incepand de la optimizarea cautarilor Web si mergand pana la acele procesari de text care apar in domeniul denumit $text mining$.
O analiza a cercetarii recente in LT si KBS si realizarea unor aplicatii originale
majore este al doilea obiectiv al cursului.
Continutul
1. Tehnologia limbajului: etape, domenii.
2. Corpus-ul ca si KBS si ca instrument in diferitele aplicatii LT. Sisteme de adnotare ale unui corpus. Utilizarea corpus-ului in metodele de invatare supervizata.
3. WordNet ca un Sistem bazat pe cunostinte.Relatii lexicale. Relatia de sinonimie. Exemple de utilizare a WordNet-ului.
4. Dezambiguarea sensului cuvintelor (WSD): abordarea WSD prin invatare automata (supervizata si nesupervizata), abordarea WSD pe baza dictionarelor. Necesitatea etapei de WSD.
5. Metode statistice in prelucrarea limbajului natural: lanturi Markov, modelul Hidden Markov Model (HMM). Evaluarea si antrenarea HMM.Aplicatii.
6. Gramatici context-free probabiliste. Analiza sintactica cu diagrame active.
7. Structuri de atribute (FS): FS ca grafuri, ca AVM si ca descriptori. Unificarea FS.
8. Gramatici de unificare. Parsare cu gramatici de unificare.

Bibliografie
1. J.ALLEN : Natural language understanding, Benjamin/Cummings Publ. , 2nd ed., 1995.
2. E. CHARNIAK: $Statistical language learning$, MIT press, 1996.
3. B.CARPENTER: ALE:The attribute logic engine.User@s guide. Carnegie Mellon University,1994.
4. H. Helbig: $Knowledge Representation and the Semantics of Natural Language$, Springer, 2006.
5. D.JURAFSKY, J.MARTIN: Speech and language processing, Prentice Hall, 2000.
6. C.MANNING, H.SCHUTZE: Foundation of statistical natural language processing, MIT, 1999.
7. (Editor) R. MITKOV: The Oxford Handbook of Computational Linguistics, Oxford University Press, 2003.
8. S.J.RUSSELL, P.NORVIG: Artificial intelligence.A modern approach, Prentice-Hall International,1995.
9. D.TATAR: Inteligenta artificiala: demonstrare automata de teoreme, prelucrarea limbajului natural, Editura Albastra, Microinformatica, 2001.
ra Academiei, 2000, pg 289-300.
10. D. TATAR: Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural,Editura Albastra, Microinformatica, 2003, ISBN 973-650-100-0
Evaluare
Nota finala are urmatoarele componente:

(1) Un proiect finalizat printr-o aplicatie din domeniul LT si KBS....30%

(2) Dezbaterea a cel putin doua articole din literatura LT si KBS.....30%

(3) Examinare finala..................................................40%
Legaturi: Syllabus-urile tuturor disciplinelor
Versiunea in limba engleza a acestei discipline
Versiunea in format rtf a acestei discipline