
Educators: Earn a free Gold upgrade by joining the PBwiki Back To School Challenge.
Resúmenes automatizados
“La práctica de resumir se inserta en el paradigma de la representación documental o conjunto de procesos que experimentan los documentos en el seno de una colección determinada, con el objetivo de facilitar su recuperación, y sobre todo de potenciar su capacidad informativa. Su resultado es el resumen, documento secundario muy apreciado entre profesionales y estudiosos por su potencial informativo, convirtiéndose en el más importante vehículo de información referencial al servicio del principio de entropía que rige el comportamiento humano. El resumen es un instrumento eficaz en los sistemas de recuperación automatizados, ya que muchos creadores de bases de datos lo utilizan como fuente de indización para la selección de palabras claves representativas, y por tanto como clave de búsqueda en texto libre. Incluso en el contexto de los documentos electrónicos enlazados de un modo reticular, el resumen sigue siendo el metadato de más complejidad y relevancia informativa” (María Pinto Molina)
Definición:
El resumen de documentos ha sido siempre considerado una labor lenta y tediosa para los profesionales de la documentación. Hace años que existen ciertos avances enfocados hacia la automatización de esta tarea, aunque ha sido la explosión de Internet el verdadero motor del resumen automático de documentos.
¿Cómo obtener únicamente los documentos y la información que nos interesa entre toda la maraña de documentos y millones de páginas que pueblan la red? Según María Jesús Lamarca, “una ayuda importante sería que alguien o algo nos informara del contenido de los documentos para así obtener, filtrar, clasificar y extraer la información que nos interese.”
De esta forma, el buscador ideal encontraría la información que buscamos preguntándole en nuestra propia lengua, nos presentaría los documentos por orden de relevancia, los clasificaría de acuerdo a los criterios dados y haría un resumen sintético del contenido de cada documento. (Ver artículo sobre la web semántica)
El resumen automático de documentos está íntimamente relacionado con el análisis del contenido y con la búsqueda y recuperación de la información. Es decir, “con poder obtener los documentos que se ajustan a unos criterios dados y con la posibilidad de extraer de ellos sólo la información que nos interesa, generando, por ejemplo, un nuevo documento en el que se presente sólo la información relevante o creando algún tipo de estructura temática en el que aparezcan clasificados dichos documentos”.
Según Lamarca, las dos líneas de investigación actuales en el ámbito del resumen documental automatizado tienen que ver con:
Tipos de resúmenes:
La misma autora señala como en la actualidad existen tres tipos de resúmenes automáticos, aunque muchos sistemas son híbridos y combinan varias de estas técnicas:
Técnicas del resumen documental:
El resumen automático de documentos se puede realizar de muy diversas formas, pero las técnicas utilizadas se pueden resumir en tres:
“Los sistemas de resumen automáticos, al contrario de lo que pudiera pensarse, no se construyen para que imiten los razonamientos de la mente humana, sino que siguen otras estrategias distintas que tienen como fin emular un comportamiento inteligente, pero diferente del pensamiento racional humano. A nadie se le escapa la dificultad técnica que supone la puesta en marcha de cualquier sistema de resumen automático, una dificultad que tiene que ser resuelta por medio de la colaboración entre agentes de diversas disciplinas y campos dispares como la inteligencia artificial, la ingeniería lingüística, la informática, las ciencias de la información y documentación, etc.” (Lamarca)
Herramientas y programas para realizar resúmenes automáticos:
Bibliografía:
Marta Venegas.
mvenamo@yahoo.es
Page Information
|
Wiki Information |
Recent PBwiki Blog Posts |