BIENVENIDOS A NUESTRO BLOG

Este blog se crea gracias al espacio Academico Recuperación de Información que hace parte del programa de Sistemas de información y documentación de la Universidad de la Salle

Profesor Laureano Felipe Gomez



Recuperación de Información

Recuperación de Información
Este enlace te ayudara a consultar mas sobre recuperacion de información

sábado, 28 de agosto de 2010

recuperacion de informacion MEMORIAS DE CLASE 3

viernes 20 de Agosto de 2010
se inicio la clase con la tutoría No. 1,

Ingresamos al sitio http://sisinfo.lasalle.edu.co/original/sri, se ingreso al repositorio para visualizar las colecciones allí publicadas por el profesor Felipe Gómez. Ingresamos por: colecciones 2010-II Básica Noticias (tamaño: 2.3 MB contiene 1.000 archivos y 11 carpetas, contiene noticias de Cee, ciencia, cultura, deportes, economía, partidos, política, sociedad, sucesos y tribunales) los archivos se encuentran en formato txt. para abrir cualquier archivo es necesario dar click derecho con el mouse y escoger la opción “Abrir con” y escoger la aplicación MFC WORDPAD para ver el contenido de los archivos. Con esta colección se hizo el primer acercamiento al trabajo del primer corte, fue la presentación que hizo el docente para encaminarnos hacia el trabajo del corte.

Buscar por titular de la noticia, ya que condensa el contenido de la noticia, para recuperar la información. Preguntarse ¿Es un documento estructurado? ¿Tiene un nivel de estructura? ¿Cómo esta codificada la información?

A partir de las siguientes colecciones debemos realizar el trabajo del primer corte, analizando las 4 colecciones:
1. Correos listas tamaño: 38.5 MB
2. Libros tamaño: 381 MB
3. Metadatos tamaño: 5.66 MB
4. Sitios web tamaño: 9.18 MB

Para el trabajo del primer corte consta de:
Parte 1: análisis de la colección, a partir de:
• Análisis de tamaños, organización y clasificación
• Análisis de formatos, codificación y extensiones
• Análisis de estructuras
• Análisis de contenidos
• Análisis de contextos
• Análisis de interfaces
• Conversión de formatos y estructuras

Parte 2: análisis del contenido, a partir de:

• Como se comporta el texto
• Análisis de cuerpos documentales
• Términos de búsqueda (ecuaciones)
• Análisis de contextos

Parte 3: análisis de las herramientas, creación de un manual de las herramientas Google Desktop Search y la escogida para realizar el proceso de comparación.

Parte 4: análisis de resultados, cuantos resultados, posiciones, características, cobertura, velocidad., entre otros. De las dos herramientas utilizadas para recuperación de información. ¿Cuál Sistema de Recuperación de Información es mejor?
Notas de clase:

Sistema de Recuperación de Información, herramienta que haga análisis sobre contenidos, que pueda buscar en cualquier formato.

Desktop Search: buscadores de escritorio, herramienta informática que busca documentos en un ordenador personal. Un motor de búsqueda de escritorio típico incluye un indexador que rastrea el disco duro en busca de archivos existentes. Cuando encuentra un archivo extrae la siguiente información y la guarda en un archivo de índice :

• La localización jerárquica al disco duro del archivo.

• Metadatos (el nombre, el tipo, la extensión, las palabras clave del archivo, etc.).

Categoría de herramientas para trabajar con colecciones de documentos, hace un proceso de indización y hace recuperación sobre cualquier término (localizar información).

Se hizo el ejercicio de instalar Google Desktop Search en clase, de la siguiente forma:

o Buscando en google “Google desktop”

o Haciendo click en “instalar google desktop”

o Guardando el archivo en mis documentos descargas

o Instalando la herramienta con doble click, luego se aceptan los términos y condiciones

o Eligiendo la única opción: búsqueda de archivos por nombre y ejecutar aplicaciones

o En el icono de “google desktop” se da click derecho opciones y lleva a una página de google en la cual permite configurar la herramienta para recuperación de información.





No hay comentarios:

Publicar un comentario