BIENVENIDOS A NUESTRO BLOG

Este blog se crea gracias al espacio Academico Recuperación de Información que hace parte del programa de Sistemas de información y documentación de la Universidad de la Salle

Profesor Laureano Felipe Gomez



Recuperación de Información

Recuperación de Información
Este enlace te ayudara a consultar mas sobre recuperacion de información

sábado, 28 de agosto de 2010

recuperación de Información MEMORIAS DE CLASE 4

Lunes 23 de Agosto de 2010
Contexto del documento: relacionado con meta-información, metadatos, relaciones ontológicas, vocabularios controlados.
Contenido de documentos digitales:
Naturaleza texto
Sonido
Video
Imágenes
Otros

Codificación digital: como se guarda la información texto o formato maquina.
Documento documental referencial semiestrcuturado (como metadatos)
Documental contenido completo (con sentido en sí mismo) y satisface necesidades de información.
El docente hizo un ejercicio de buscar en internet definiciones para los siguientes conceptos:

• Palabra clave: son palabras tomadas del lenguaje natural que representan un contenido, no necesariamente están inmersos en el documento.

• Descriptor: termino que representa un contenido con vocabulario controlado.

• Encabezamiento de materia: términos que contienen muchos descriptores.

• Indización: representación del contenido mediante un conjunto de términos.

• Termino: palabra extraída por una maquina que puede representar un documento. Los términos son extraídos por un proceso de indización y permite representar un contenido.

• Descriptor libre: es un tipo de término y palabra clave a la vez, que al hacer un proceso de indización puede encontrar ciertos conceptos que representan un contenido. Extrae o infiere de qué se trata el contenido del documento.

• Etiqueta: palabra clave que no pertenece a un lenguaje normalizado, son palabras de uso común.

• Palabra vacía: semánticamente no dice nada pero para la maquina es un término de búsqueda.
Notas de clase:

El proceso de análisis e indización lo hace la maquina, localiza las palabras normalizadas, con documentos estructurados (etiquetas).
Ejercicio de indización:

Se descargo del repositorio http://sisinfo.lasalle.edu.co/original/sri el software TENKA-TEXT se descargo se guardo en mis documentos o descargas se descomprime se ejecuta se escoge la opción TENTA.TEXT.WINDOWS.INTERFACE file choose text browse se busca carpeta descomprimida (según archivo que vayamos a indizar) se selecciona OK wordlister (aparece el listado de términos indizados del archivo seleccionado)



No hay comentarios:

Publicar un comentario