Forum Barcelona 2004 | Español | English | herramientas Inici Mapa de continguts Buscador Mida textMida text text petita 11px text mitjana 14px text gran 17px
Continguts > 42a Reunió Anual de l'Associació de Lingüística Computacional. Comunicació i llenguatge en l´era digital > Tallers, seminaris i una conferència associada (Workshops)
Documents Envia a un amicEnvia a un amic ImprimeixImprimeix
Resum sessió Resum sessió
Tallers, seminaris i una conferència associada (Workshops)
Diàleg de referencia: 42a Reunió Anual de l'Associació de Lingüística Computacional. Comunicació i llenguatge en l´era digital

Els dos últims dies, 25 i 26 de juliol, acabat ja pròpiament el 42è Congrés de l’Associació de Lingüística Computacional (ACL), es van celebrar una sèrie de seminaris i tallers específics, a més d’una conferència associada que va tractar sobre el processament del llenguatge natural. Aquestes sessions van ser les següents:

- Fonologia i morfologia computacionals
- Marcat del discurs
- L’anàlisi incremental. Acostant l’enginyeria i la cognició
- Unitats multiparaules
- Sistemes d’interrogació en dominis restringits
- Processament del llenguatge i XML
- La resolució de la referència i les seves aplicacions
- Avaluació de sistemes per a l’anàlisi semàntica de textos
- El significat i la interpretació del text
- Resum automàtic de textos
- Processament del xinès
- Mètodes empírics en el processament del llenguatge natural

D’alguns d’aquests tallers i seminaris se n’ofereixen més detalls a continuació.

La resolució de la referència i les seves aplicacions

La identificació adequada de constituents i funcions sintàctiques i semàntiques depèn de molts factors, i es pot complicar si no es té en compte en quin entorn o context se situen. En aquest cas, el context no és una cosa externa, del món, natural, en realitat es parla del text en si, de l’estructura gramatical, de com està construït, si realment existeix una coherència i una cohesió lògica que facin que es refereixi a una idea general. L’objectiu d’aquest taller consistia a saber com un ordinador pot saber quines són les idees principals d’un discurs (la sumarització) o com pot aclarir quin és l’objectiu de les referències anafòriques en models discursius diferents.

Els experiments que es van dur a terme (i que es van explicar al taller) segueixen diversos models de discurs que s’acosten o s’allunyen d’un context situacional real, superen un nivell sintacticosemàntic fins arribar, algunes vegades, a la disciplina de la pragmàtica. Davant d’aquesta situació, les exposicions es divideixen en estudis sobre discurs en general (textos escrits procedents de la premsa o un altre tipus de documentació), situacions en les quals es desenvolupa un diàleg (on la pragmàtica juga un paper important fins a cert punt) i sistemes de pregunta i resposta que obeeixen, més que res, a temes de coreferència.

L’estudi de la referència dintre d’un text i el sistema de pregunta i resposta són similars perquè tots dos se serveixen de la qüestió de la coreferència (tant anafòrica com catafòrica). En els textos que s’agafen per realitzar aquestes experiències les cadenes de referències anafòriques sempre es dirigeixen a un terme comú que té un paper temàtic fonamental. El criteri de situar la idea principal al començament del paràgraf ha estat valuós, ja que molts sistemes es concentren en aquesta primera frase perquè el procés de «sumarització» sigui efectiu, amb la qual cosa l’ordinador podrà fer, per ell mateix, una síntesi del que s’està dient. En els sistemes de pregunta i resposta l’entramat de referències és més relatiu, però el concepte d’anàfora també ha estat útil en aquest segon cas. Generalment, la resposta a una pregunta en un buscador dóna lloc a una quantitat ingent d’informació relacionada que no sempre té relació amb el resultat que es pretén obtenir. Davant d’això es proposa crear una base de dades amb els resultats més habituals, fins arribar al punt de crear classes que més tard es podran aplicar depenent del tipus de recerca. Tornant a l’estructura interna d’un text en si, existeix un segon model d’anàlisi referencial que se separa més de la semàntica i conserva en gran mesura els procediments tradicionals de la sintaxi. La relació entre elements és ara més detallada, perquè a més de l’anàfora s’intenten classificar els complements del predicat, els diferents nuclis als quals se subordinen els altres constituents i les partícules que relacionen uns elements del discurs amb altres (tot això des d’un punt de vista més referencial que relacionant).

Però el problema més difícil és el dels textos en què es representa un diàleg, perquè la influència d’elements externs fa pensar en qüestions purament pragmàtiques. Si en una situació intervenen diversos actants, a vegades no es pot saber amb certesa a què o a qui es refereixen alguns pronoms. Per solucionar aquest tipus de qüestions s’intenta veure quines són les relacions dels interlocutors i s’intenta recrear una situació en la qual es vagin eliminant les referències que no obeeixin a un raonament purament lògic, provant de fer una reducció a l’absurd. Amb això no s’ha aconseguit arribar a resultats purament fiables, però s’han pogut eliminar algunes possibilitats que no tenen sentit.

El significat i la interpretació del text

Aquest taller va consistir en una sèrie de conferències sobre les diferents recerques que es fan actualment sobre la formalització de significats del text i la seva interpretació per part dels sistemes artificials. Els ponents van exposar els seus mètodes i experiments aplicats en contextos concrets, i van establir nous punts de partença per a futurs treballs. La majoria de les aplicacions del llenguatge natural, ja siguin sistemes de traducció automàtica, de resposta a preguntes, etc., es basen en la idea que la màquina ha d’analitzar el significat del text per poder interpretar-lo, encara que aquesta consideració s’ha desenvolupat només els últims anys. Els equips que van presentar les seves tesis en aquest taller van parlar de la necessitat de construir sistemes que sguin capaços d’extreure, representar, manipular i interpretar el significat del text, perquè es produeixi un veritable avenç en l’evolució positiva del llenguatge computacional.

Mètodes empírics en el processament del llenguatge natural

La «Conferència sobre els mètodes empírics en el processament del llenguatge natural» («Conference on Empirical Methods in Natural Language Processing, EMPLN 2004») va ser, de fet, una trobada celebrada després del 42è Congrés de l’Associació de Lingüística Computacional (ACL), tot i que integrada en els actes científics d’aquesta reunió anual de l’ACL. Va comptar amb gairebé 200 inscrits i es va desenvolupar durant dos dies, en horari de matí i tarda, en el transcurs de set sessions paral·leles que van abraçar camps d’estudi tan diversos com l’anàlisi semàntica, la semàntica lèxica, els models de llenguatge i la categorització textual. A més, s’havia determinat que el tema de la sessió plenària d’enguany fos «L’anàlisi de l’error en el processament del llenguatge natural empíric» («Error Analysis in Empirical NLP»). Aquesta qüestió va suscitar un gran interès, en especial, per l’examen detallat dels biaixos representacionals dels models utilitzats i la seva verificació empírica.

Pujar
Per paraula clau
Doc. més relacionats
RS Preguntes i respostes
 
RS L’anàlisi sintàctica i semàntica (Synthax/Semantic Parsing)
 
RS Els sistemes dialogats (Dialogue Systems)
 
RS El processament de la parla conversacional (Conversational Spoken Language Processing)
 
RS La semàntica lèxica (Lexical Semantics)
 

Els més de 800 Resums de Sessió que s’han generat durant els 141 dies de diàlegs al Fòrum BCN 2004 han estat realitzats gràcies a la participació de més de 70 estudiants i llicenciats universitaris, als quals agraïm el seu esforç desinteressat.