Simposio Argentino de Inteligencia Artificial

Tandil, Argentina
4 al 9 de Septiembre del 2000

Procesamiento Inteligente de Documentos

Miércoles 6 de Septiembre, 15:30 hs. (Aula I)

Lic. Rafael A. Calvo
Amtec SA / IFIR, UNR CONICET

Uno de los grandes problemas del siglo XXI sería cómo utilizar eficientemente todos los textos, sonidos e imágenes que infinidad de fuentes producen continuamente. Un primer síntoma de esta dificultad es lo que está sucediendo en Internet, donde la cantidad de información está creciendo mucho más rápido que la posibilidad de encontrarla. La necesidad de procesar información no se refiere sólo a localizar textos, las llamadas "ingenierías del lenguaje" forman la multidisciplina que utiliza nuestros conocimientos lingüísticos para diseñar sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje en cualquier idioma.
Los modelos vectoriales de las ingenierías del lenguaje consisten en representar como vectores los documentos multimediáticos de la base de datos, de manera de poder modelarlos estadísticamente. Los objetivos fundamentales perseguidos en este seminario son:
1. Introducir las Ingenierías del Lenguaje, algunos modelos y aplicaciones.
2. Describir la utilización de las redes neuronales y otros modelos estadísticos para el procesamiento automático de documentos.
3. Estudiar técnicas de reducción de la dimensionalidad que permitan utilizar modelos vectoriales en base de datos reales.
4. Estudiar la performance de las técnicas de base de datos con texto en español y en inglés y comparar la performance de las redes neuronales con otros métodos en base de datos estandarizadas.

Tutorial Notes

Para mayor información comuníquese a jaiio2000@exa.unicen.edu.ar