Procesamiento Inteligente de Documentos
Miércoles 6 de Septiembre, 15:30 hs. (Aula I)
Lic. Rafael A. Calvo
Amtec SA / IFIR, UNR CONICET
Uno de los grandes problemas del siglo XXI sería cómo
utilizar eficientemente todos los textos, sonidos e imágenes que
infinidad de fuentes producen continuamente. Un primer síntoma de
esta dificultad es lo que está sucediendo en Internet, donde la
cantidad de información está creciendo mucho más rápido
que la posibilidad de encontrarla. La necesidad de procesar información
no se refiere sólo a localizar textos, las llamadas "ingenierías
del lenguaje" forman la multidisciplina que utiliza nuestros conocimientos
lingüísticos para diseñar sistemas informáticos
que puedan reconocer, comprender, interpretar y generar lenguaje en cualquier
idioma.
Los modelos vectoriales de las ingenierías del lenguaje consisten
en representar como vectores los documentos multimediáticos de la
base de datos, de manera de poder modelarlos estadísticamente. Los
objetivos fundamentales perseguidos en este seminario son:
1. Introducir las Ingenierías del Lenguaje, algunos modelos
y aplicaciones.
2. Describir la utilización de las redes neuronales y otros
modelos estadísticos para el procesamiento automático de
documentos.
3. Estudiar técnicas de reducción de la dimensionalidad
que permitan utilizar modelos vectoriales en base de datos reales.
4. Estudiar la performance de las técnicas de base de datos
con texto en español y en inglés y comparar la performance
de las redes neuronales con otros métodos en base de datos estandarizadas.
Para mayor información comuníquese a jaiio2000@exa.unicen.edu.ar