BIENVENIDOS A NUESTRO BLOG

Este blog se crea gracias al espacio Academico Recuperación de Información que hace parte del programa de Sistemas de información y documentación de la Universidad de la Salle

Profesor Laureano Felipe Gomez



Recuperación de Información

Recuperación de Información
Este enlace te ayudara a consultar mas sobre recuperacion de información

sábado, 9 de octubre de 2010

Posicionamiento web en Google

Este artículo tiene como objetivo poner en práctica lo establecido en la clase de Recuperación de información, en la Universidad de la Salle.
Nos intereso ya que maneja un lenguaje sencillo y es por tener un contenido explícito se facilita su lectura.

"Aquí te presentamos un pequeño manual de posicionamiento web en Google. Con él podrás conseguir aparecer en las primeras posiciones de los resultados. Recuerda que solamente podrás ser la primera posición si te esfuerzas mucho.

El posicionamiento en buscadores se ha convertido en los últimos tiempos en una de las herramientas más cotizadas por los webmasters. En particular, aparecer en las primeras posiciones en Google es algo indispensable si quieres generar tráfico hacia tu sitio web, ya que Google responde a casi el 60% de las búsquedas de Internet.

El tutorial que te proponemos te ayudará a conseguir un buen posicionamiento web, pero no esperes resultados en unos días, ni en unas semanas, ni quizá en meses. Se trata de un trabajo constante generando contenidos, optimizando páginas web y buscando enlaces cuyos resultados son a largo plazo.

:: 1 :: Buenos contenidos.
Este es el punto principal, ya no solo para aparecer en los primeros puestos en Google, sino para que la gente visite tu sitio web.

:: 2 :: Tecnología web.
Éstate informado de las últimas novedades en cuanto a servidores o lenguajes de programación. Te harán la tarea de gestionar los contenidos mucho más amena, y puedes "gustar más a Google".

:: 3 :: Sencillez.
Al robot de Google no le gustan las páginas con excesivas decoraciones y simplemente busca textos legibles y contenidos claros.

:: 4 :: Alta en Google.
El primer paso para conseguir una buena posición en Google es aparecer en el buscador. Descubre cómo hacerlo.

:: 5 :: Conseguir enlaces.
Es el pilar fundamental para obtener un PageRank alto. Intenta aparecer en los principales directorios (Yahoo! y DMOZ) y que te enlacen desde otros sitios web.

:: 6 :: Evitar penalizaciones.
Google sabe que muchas personas le intentan engañar, y está empezando a tomar medidas contra páginas web que realizan prácticas poco éticas para mejorar su posicionamiento. Infórmate de cuáles son y cómo evitarlas.

:: 7 :: Conseguir ayuda.
El posicionamiento requiere estar informado constantemente. Sigue nuestro foro y la Google Dance.

:: 8 :: Términos SEO.
Algunos de los términos y palabras con los que podrás entender más fácilmente toda la documentación referente al posicionamiento en buscadores.


Esperamos les halla gustado y lo podamos poner en práctica.
Posicionamiento Web en Google. [En línea].[consultado el 09/10/2010]. disponible en: http://google.dirson.com/posicionamiento.net/.

jueves, 7 de octubre de 2010

Disponible servicio Backup & Recovery de Acronis

Entornos físicos y virtuales


La compañía desvelará en VMWorld su solución de copia de seguridad y recuperación basada en imágenes en el cloud para completar su catálogo de soluciones de recuperación de catástrofes para entornos físicos y virtuales.

Diario Ti: Acronis presentará Acronis Backup & Recovery 10 Online. Solución de copia de seguridad y recuperación online que ofrece las ventajas de un centro de datos remoto sin tener que realizar una importante inversión inicial.

Acronis Backup & Recovery 10 Online ha sido diseñado para las pymes que actualmente suelen guardar sus copias de seguridad en cintas o discos y las almacenan en un lugar remoto, o aquéllas que no tienen una estrategia de protección de datos en otro lugar. Con este servicio, los administradores de TI podrán recuperar archivos, carpetas e incluso imágenes completas de sistemas.

El servicio incluye asistencia para entornos informáticos mixtos, que combinan elementos físicos y virtuales, como los que se encuentran en muchas de las empresas de hoy. Con este anuncio, la familia Acronis Backup & Recovery 10 se convierte en una de las primeras soluciones de protección de datos que ofrece copias de seguridad online sin agentes para máquinas virtuales.

“La copia de seguridad y la recuperación se basan en la confianza y la fiabilidad. Estos valores fundamentales son aún más importantes cuando las empresas guardan datos esenciales en la cloud", afirmó Jason Donahue, Consejero Delegado de Acronis. “Este producto es una ampliación natural de nuestra solución para instalaciones in situ".


Acronis desarrolla software de gestión de almacenamiento, incluyendo software para la recuperación de fallos graves, restauración y backups de imágenes de discos, gestión de particiones, gestión de arranque y migraciones de datos de un ordenador a otro. También desarrolla software para la virtualización, migración y conversión con propósitos como migrar un servidor físico a servidor virtual VMware o lo que se conoce como Físico a virtual (P2V). (Wikipedia)

REFERENCIA

DiarioTi [en línea]. [consulta: 07 de octubre de 2010]. Disponible en: http://www.diarioti.com/gate/n.php?id=27765

miércoles, 6 de octubre de 2010

BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN

Búsqueda y Recuperación de información

El proceso de recuperación se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los índices, palabras clave, tesauros y los fenómenos que se pueden dar en el proceso como son el ruido y silencio documental.

Sistema de recuperación de información: proceso donde se accede a una información previamente almacenada, mediante herramientas informáticas que permiten establecer ecuaciones de búsqueda específicas. Dicha información ha debido de ser estructura previamente a su almacenamiento.

Componentes:

• Documentos estructurados. Es necesario establecer un proceso donde se establezcan herramientas de indización y control terminológico.

• Bases de datos donde estén almacenados los documentos. Definir lenguajes de interrogación y operadores que soportará la base de datos y, establecer qué tipo de ecuaciones serán permitidas.


Técnicas de recuperación de información

o Sistemas de recuperación de lógica difusa
Esta técnica permite establecer consultas con frases normales, de forma que la máquina al realizar la búsqueda elimina signos de puntuación, artículos, conjunciones, plurales, tiempos verbales, palabras comunes (que suelen aparecer en todos los documentos), dejando sólo aquellas palabras que el sistema considera relevantes. La recuperación se basa en proposiciones lógicas con valores de verdadero y falso, teniendo en cuenta la localización de la palabra en el documento

o Técnicas de ponderación de términos
Es común que unos criterios en la búsqueda tenga más valor que otros, por tanto la ponderación pretende darle un valor adecuado a la búsqueda dependiendo de los intereses del usuario. Los documentos recuperados se encuentran en función del valor obtenido en la ponderación. El valor depende de los términos pertinentes que contenga el documento y la frecuencia con que se repita. De forma que, el documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y además el que más valor tenga repetidos más veces, independientemente de donde se localice en el documento.

o Técnica de clustering
Es un modelo probabilístico que permite las frecuencias de los términos de búsqueda en los documentos recuperados. Se atribuyen unos valores (pesos) que actúan como agentes para agrupar los documentos por orden de importancia, mediante algoritmos ranking.

Algoritmos utilizados para realizar la categorización (cluster):

 Algoritmo K-means
 COBWEB
 Algoritmo EM

o Técnicas de retroalimentación por relevancia
Esta técnica pretende obtener el mayor número de documentos relevantes tras establecer varias estrategias de búsqueda. La idea es que, tras determinar unos criterios de búsqueda y observar los documentos recuperados se vuelva a repetir nuevamente la consulta pero esta vez con los elementos interesantes, seleccionados de los documentos primeramente recuperados.

Algoritmo Genético: es el que se ha utilizado para llevar a cabo este tipo de técnicas de recuperación

o Técnicas de stemming
Morfológicamente las palabras están estructuradas en prefijos, sufijos y la raíz. La técnica de Stemming lo que pretende es eliminar las posibles confusiones semánticas que se puedan dar en la búsqueda de un concepto, para ello trunca la palabra y busca solo por la raíz.

Algoritmos utilizados para desechar prefijos y sufijos:

 Paice/Husk
 S-stemmer / n-gramas
 Técnicas lingüísticas

Pretenden acotar de una manera eficaz los documentos relevantes. Por esta razón, esta técnica lo consigue mediante una correcta indización en el proceso de tratamiento de los documentos con ayuda de índices, tesauros, etc.; evitando las ambigüedades léxicas y semánticas a la hora de establecer las consultas.

REFERENCIA

PINTO MOLINA, María. Electronic Contents Management Skills. [en línea]. [consulta: 06 de octubre de 2010]. Disponible en: http://www.mariapinto.es/e-coms/recu_infor.htm

martes, 5 de octubre de 2010

EL DOCUMENTO ELECTRÓNICO

Si tengo información en papel, la digitalizo, la convierto en imágenes y con el software, administrador de imágenes, la puedo conservar y recuperar en el futuro; si por el contrario tengo correo electrónico, que sale o llega a mi organización, los productos existentes en el mercado, que administran el correo y no se hace referencia a la plataforma de correo electrónico porque esa la conocen todos, sino a cómo administrar el correo electrónico como un mensaje de datos y como una información que debe ser conservada dentro de la organización. Existen administradores de documentos, para manejar la información que manejamos directamente desde el computador, que es la tercera fuente del manejo de la información electrónica, entonces tenemos todo el software de ofimática y tenemos igual administradores de documentos que fácilmente me permiten indexar esta información almacenarla y poderla recuperar. Para la última fuente de información, que son todos aquellos datos que generan mis sistemas de información, mis aplicaciones corporativas, cartera, nomina de recursos humanos etc. Tenemos aplicaciones que me permiten por un lado tomar del spool de impresión esos grandes listados de información y guardarlos en medios electrónicos.

ARCHIVO GENERAL DE LA NACIÓN.Los Archivos y las Nuevas Tecnologías.editores graficos colombia Ltda. Bogotá. 2002. p62

ProQuest admite bibliotecarios e investigadores las herramientas necesarias para mejorar la experiencia de la investigación

Siempre estamos pensando en herramientas y servicios para ayudar a los bibliotecarios conectar sus comunidades de usuarios con los recursos de información profunda que impulsan la investigación.
Desde folletos para fomentar el conocimiento de valiosos recursos en línea a la investigación para guías de descubrimiento, ofrecemos herramientas para que los bibliotecarios más éxito.

Library Marketing Toolkits Biblioteca de Herramientas de Marketing
¿Cómo recordar a su comunidad de usuarios acerca de los grandes recursos en línea que ofrece, cuando piensan en todo lo que necesitan es la web? Las herramientas y las muestras en estos juegos libres será de ayuda.

Para Bibliotecas Universitarias
Para Bibliotecas Corporativo
Para Bibliotecas Públicas
Para los militares Bibliotecas Universitarias
Para las Bibliotecas Base Militar
Para K-12 Escuelas y Bibliotecas
Para todas las bibliotecas: Prensa Histórica Toolkit
RSS Feeds RSS Feeds

ProQuest ofrece actualizaciones artículo y el contenido para mejorar los servicios a sus usuarios mediante la integración de los últimos artículos en un campo determinado en la página correspondiente de recursos electrónicos en el sitio de la Biblioteca.

ProQuest LLC. La colección de herramientas. [En línea].2010. Disponible http://translate.google.com.co/translate?hl=es&sl=en&u=http://www.proquest.com/&ei=99-rTIv-L4n2swOHtOy0Aw&sa=X&oi=translate&ct=result&resnum=1&ved=0CBwQ7gEwAA&prev=/search%3Fq%3Dproquest%26hl%3Des%26prmd%3Dlen. [citado el 05 de Octube de 2010]

lunes, 4 de octubre de 2010

PROGRAMA DE GESTION DOCUMENTAL EN EL MARCO DE LAS NUEVAS TECNOLOGIAS

Los programas de gestión documental también abarcan las nuevas tecnologías y en eso es preciso que tengamos claridad, por cuanto se enmarcan como los procesos archivísticos sistemáticos que comprenden el conjunto de actividades administrativas y técnicas tendientes a lograr el eficiente y eficaz manejo en la organización de la documentación producida y recibida por una entidad, con el objeto de facilitar su producción, tramite, ordenación, clasificación, descripción, conservación, utilización y disposición final . Además estos procesos incluyen sistemas automatizados de organización de los documentos y en estos sistemas debemos tener en cuenta, por ejemplo que desde la misma unidad de correspondencia, se da el desarrollo a todo el trámite del manejo documental por ello la integralidad entre la unidad de correspondencia, los archivos de gestión. Los archivos centrales y los archivos históricos es fundamental para que se dé el adecuado proceso en este programa de gestión documental. Es importante también, que se dé la aplicación en cada una de las fases de este programa, lo cual es inherente a todos los documentos indistintamente del soporte. Uno de los problemas que más se trata hoy en día a nivel archivístico, es si se debe dar el mismo tratamiento al documentos electrónico que al documento de soporte tradicional; básicamente, es el enfoque que ha llevado a que el Consejo Internacional de Archivos también trabaje sobre esta temática
El sistema de información que soporta la gestión documental tiene que ver con aspectos de compatibilidad, como lo podemos observar entre el sistema de información y la integralidad en cada una de las herramientas y sus procesos. Es fundamental para que dentro del programa de gestión documental se tenga en cuenta todos los lineamientos que están en los manuales de procedimientos, porque estos deben ir de la mano para el desarrollo de cada una de las fases en el manejo del documento.

ARCHIVO GENERAL DE LA NACION. Los Archivos y las Nuevas Tecnologías. Editores gráficos Colombia. Ltda.Bogotá.2001.p49

domingo, 3 de octubre de 2010

MEMORIAS DE CLASE 8

20 de septiembre de 2010

El docente asesora acerca de la segunda tutoría, para lo cual se hace el proceso de instalación del software greenstone. El software puede crear y distribuir colecciones de biblioteca digital. Proporciona una nueva forma de organizar la información y publicarla en internet o en CD-ROOM.1

Greenstone es un conjunto de software para construir colecciones pertenecientes a una biblioteca digital. Proyecto apoyado por la UNESCO. Modelo para montar una colección digital en internet.

Se descargo el software se ingresa por programas a Greenstone: Library Interface, de donde se crea una nueva colección con datos como: titulo de la colección, descripción, etc. Luego se buscan las carpetas de la colección que se quiere ingresar al sistema, se arrastran con el mouse.

Se analizaron opciones del software como:

 Enriquecer: tiene la opción para colocar metadatos (describe el texto)
 Diseño: pluggins son los indizadores, índices (sobre cual elemento se quiere buscar), partición a índices
 Crear: toma la colección y la indiza, tiene vista previa, se pueden hacer búsquedas.

El docente confirma que la entrega de la segunda tutoría será el día 20 de octubre teneindo en cuenta:

1. Instalación y configuración de las herramientas (software Greenstone y escoger uno para archivos). Manuales

2. Búsquedas en los software anteriores y nuevos

3. Comparación de las 4 herramientas (Google Desktop, Copernic Desktop, Greenstone y Alfresco)

Se hace el proceso de instalación de Knowledge Tree en clase de recuperación de información, pero no es posible acceder a ninguna colección ya que no las toma ni comprimidas.

1. Greenstonte Digital Library. [en línea]. [consulta: 25 de septiembre de 2010]. Disponible en: http://www.greenstone.org/

HTML, y los documentos estructurados

En XML hablamos mucho acerca de los documentos estructurados. pero, ¿qué son?. Intuitivamente, pensamos en los documentos como contenedores de algo. Un archivo de Microsoft Word, un memorando, un mensaje de correo electrónico e, incluso, una página web, se suelen considerar documentos. Pero, ¿como se clasificaría una hoja de cálculo, un registro de base de datos o un mensaje middleware? En términos de XML, todos ellos también serían considerados documentos.
Especialmente en el caso de las páginas web estáticas, es fácil caer en la trampa de considerar los documentos orientados a la edición. Sin embargo, los datos de cualquier aplicación pueden describirse por medio del marcado XML.
Sin embargo, si nos preguntamos qué es un docuemento web, casi todos los desarrolladores web responderán intuitivamente que es una página HTML.

XML, tiene la opción que le permite formalizar la estructura por medio de una sitaxis especializada. De cualquier manera, una definición de la estructura se denomina esquema, y las reglas que rigen el uso de los elementos en función de ese esquema se denomina colectivamente definición del tipo de documento , o DTD.

FLOYD, Michael. Creación de sitios web con XML. Pearson Educación, s.a, Madrid, 2000.18p.