Processament de llenguatge natural
De Viquip??dia
El Processament del llenguatge natural (PLN o NLP del seu nom en angl??s, Natural Language Processing) ??s la disciplina inform??tica que s'encarrega de tractar computacionalment les lleng??es naturals, o llenguatges humans.
El PLN va n??ixer a finals de la d??cada dels 40, per?? els intents de fer traducci?? autom??tica entre angl??s i rus (per part els Estats Units, degut a la Guerra Freda) no van tindre ??xit ja que s'utilitzaven models ling????stics molt simples, i la pot??ncia dels ordinadors era molt escassa. Durant les d??cades dels seixanta i setanta, amb objectius m??s humils, s'aconseguiren importants aven??os en la implementaci?? d'interf??cies d'acc??s a dades en llenguatge natural. Ja a partir dels anys vuitanta, gr??cies a la pot??ncia en augment dels ordinadors, aix?? com en l'adopci?? de teories ling????stiques m??s complexes, s'estan aconseguint resultats importants en diverses ??rees, com pot ser la traducci?? autom??tica.
Taula de continguts |
[edita] Principals aplicacions del PLN
Les principals aplicacions o ??rees de treball del PLN en l'actualitat s??n les seg??ents:
- Recuperaci?? de la informaci??
- Extracci?? de la informaci??
- Cerca de respostes
- Traducci?? autom??tica
- Generaci?? de resums
- Reconeixement de la parla
[edita] Tasques del PLN
Generalment, el PLN tracta les seg??ents tasques per tal d'aconseguir els seus objectius:
- An??lisi l??xica
- Categories gramaticals i sentits de les paraules
- An??lisi morfol??gica
- G??nere, nombre, persona, sufixos, prefixos, etc.
- An??lisi sint??ctica
- Ordre de les paraules, funcions de les paraules dins les oracions, connexi?? entre oracions, etc.
- Interpretaci?? sem??ntica
- Forma l??gica, independent del context i de l'idioma.
Aquestes s??n les tasques gen??riques que aborda el PLN, encara que la majoria de les aplicacions llistades anteriorment se centren en algunes d'elles i no les tracten totes amb profunditat.
[edita] L'ambig??itat, el problema del PLN
Els llenguatges humans s??n tots ambigus. Aquesta ambig??itat, que els humans sabem tractar i resoldre de forma inconscient la majoria de vegades, es presenta de distintes maneres.
- A nivell l??xic, ja que una paraula pot tenir distints significats. Trobem dins d'aquesta ambig??itat la l??xica pura, que es dona en casos de polis??mia (una paraula amb m??s d'un significat) i, segons alguns autors, l'ambig??itat l??xica categorial (homon??mies - paraules distintes que s'escriuen igual).
- A nivell referencial, la resoluci?? d'an??fores, que implica determinar a quina entitat de les que s'han anomenat pr??viament en el discurs es refer??ncia mitjan??ant pronoms, oracions subordinades, etc. Alguns autors consideren aquest tipus d'ambig??itat una ambig??itat l??xica, mentre que altres la consideren una classe d'ambig??itat diferenciada, a un nivell superior.
- A nivell estructural, quan una mateixa frase pot tindre dos arbres d'an??lisi sint??ctica diferents. Alguns autors inclouen en aquesta classe (o almenys com a ambig??itat mixta l??xica-estructural) les homon??mies.
- A nivell pragm??tic, ja que moltes vegades una frase no vol dir all?? que sembla estar dient. Met??fores, ironies, etc. afecten la interpretaci?? del discurs.
Per poder treballar amb llenguatges naturals, el PLN ha de resoldre totes aquestes ambig??itats, recorrent moltes vegades a una representaci?? interna que elimini aquesta ambig??itat.