miércoles, 11 de diciembre de 2013

Recuperación de la Información y Ciencias de la Información

Recuperación de la Información

La Búsqueda y Recuperación de Información, llamada en inglés Information Search and Retrieval (ISR), es la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de éstos mismos, búsqueda de metadatos que describan documentos, o también la búsqueda en bases de datos relacionales, ya sea a través de internet,y como objetivo realiza la recuperación en textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante.
La recuperación de información es un estudio interdisciplinario. Cubre tantas disciplinas que eso genera normalmente un conocimiento parcial desde tan solo una u otra perspectiva. Algunas de las disciplinas que se ocupan de estos estudios son la psicología cognitiva, la arquitectura de la información, diseño de la información, artificial, lingüística, semiótica, informática, biblioteconomía, archivística y documentación. 
Para alcanzar su objetivo de recuperación se sustenta en los sistemas de información, y al ser de carácter multidisciplinario intervienen bibliotecólogos para determinar criterio de búsqueda, la relevancia y pertinencia de los términos, en conjunto con la informática
 La idea del uso de computadoras para la búsqueda de trozos relevantes de información se popularizó a raíz de un artículo As We May Think de Vannevar Bush en el año 1945. Los primeros sistemas automatizados de recuperación de la información fueron presentados durante la década de 1950 a 1960. Durante 1970 se paralizaron pruebas un grupo de textos como la colección Cranfield para un gran número de distintas técnicas cuyo rendimiento fue bueno. Los sistemas de recuperación a larga escala, como el Sistema de Diálogo Lockheed, comenzaron a utilizarse a principios de 1970.
En 1992, el Departamento de Defensa de los Estados Unidos conjuntamente con el Instituto Nacional de Standards y Tecnología (NIST), patrocinaron la Conferencia de Recuperación de Texto (TREC) como parte del programa TIPSTER. Esto proveyó ayuda desde la comunidad de recuperación de la información al suministrar la infraestructura necesaria para la evaluación de metodologías de recuperación de texto en una colección a larga escala. La introducción de motores de búsqueda ha elevado aún más la necesidad de sistemas de recuperación con mayor capacidad.
El uso de métodos digitales para almacenar y recuperar información ha desembocado en el denominado fenómeno de la obsolescencia digital, que sucede cuando una fuente digital deja de ser accesible porque sus medio físico, el lector utilizado para la lectura de ese medio o el software que lo controla, ya no se encuentra disponible. La información, inicialmente es más fácil de recuperar en lugar de su fuente en papel, pero dicha información entonces, se pierde definitivamente.
Los buscadores, tales como Google, Google Desktop Search,Lycos y Copernic, son algunas de las aplicaciones más populares para la recuperación de información. Básicamente hay que construir un Vocabulario, que es una lista de términos en lenguaje natural, un algoritmo que incluya las reglas lógicas de la búsqueda (Tabla de verdad) y una valoración de los resultados o cantidad de información lograda o posible. Este motor de búsqueda es pues el que permite plantear una pregunta con no menos de dos términos (en algunos casos pueden ser menos de dos términos) y mostrar los resultados mínimos y el logaritmo natural de las interacciones será alrededor de 789.
Enlace: www.wikipedia.ogr
Ciencias de la Información
La Ciencia de la Información se conoce con diversas denominaciones, según su etapa de desarrollo. Términos como Documentación, Documentalista e Información Científica se han empleado para definir, en esencia, a un mismo fenómeno que, como resultado del continuo desarrollo humano y tecnológico, ha experimentado diferentes fases en su evolución.
Todas ellas se refieren a una ciencia que surgió como respuesta a la necesidad social creciente de desarrollar métodos y medios eficaces para recopilar, conservar, buscar y divulgar la información, debido a la diversificación de las ramas científicas, así como la mezcla y surgimiento de nuevas áreas de investigación, que hicieron más complejo su proceso de organización y suministro.
El Siglo XX vino acompañado de grandes descubrimientos científicos y transformaciones tecnológicas, que ampliaron notablemente el conocimiento del hombre acerca del mundo que le rodeaba y que, a su vez, condujeron a cambios en la forma de interactuar con él.
El acceso a información científica y tecnológica relevante, actualizada, constituía una necesidad. Poco a poco, se ocurrieron cambios en los soportes de la información y se aplicaron las nuevas tecnologías para la organización, almacenamiento y recuperación de la información. Surgió, así, una nueva ciencia y un nuevo profesional, que aun cuando compartían algunas de las labores comunes a la actividad bibliotecaria, tenían ante sí exigencias más complejas que requerían de una especialización.
Origen
Cuando en 1934, el belga Paul Otlet, publicó su obra titulada "Tratado de la Documentación", enunció las bases de lo que posteriormente se constituiría en una ciencia integradora.
El término documentación designaba la actividad específica de recolectar, conservar, buscar y diseminar documentos.
La documentación presentaba particularidades específicas que la diferenciaban de la Bibliotecología y la Bibliografía. Entre sus rasgos más importantes, se hallaban la capacidad de reflejar con rapidez las nuevas informaciones y agrupar las que estaban dispersas, facilitar el acceso a ellas y posibilitar su uso eficaz mediante el empleo de índices, la oferta de resúmenes con valor agregado y el empleo de las nuevas tecnologías en la búsqueda de nuevas bases del conocimiento, la organización y el almacenamiento de la información.
La mención de Paul Otlet, por tanto, es insoslayable al hacer referencia a la historia de la Ciencia de la Información. Otlet fue la figura central en el desarrollo de la Documentación. Durante años, trabajó, desde el punto de vista técnico, teórico y organizacional, en aquellos aspectos concernientes a uno de los problemas fundamentales de la sociedad, tanto en aquella como en esta época: facilitar, a quienes lo necesitan, el acceso al conocimiento registrado.
La década del treinta vino acompañada por la irrupción de un nuevo soporte: el uso de las microcopias para almacenar información, sería el primer gran salto cualitativo que se introdujo en el manejo y uso de los documentos. La aplicación de esta tecnología al campo de la información hizo más eficaz el proceso de almacenamiento y recuperación de la información.
Nuevas teorías, conceptos y tecnologías vinculados al uso y recuperación de la información surgirían: el empleo de los Microfilms generó una nueva dimensión para la recuperación de la información; se crearon las máquinas selectoras que permitían el análisis documental con tarjetas perforadas sobre Equipos IBM en 1935, el inglés Charles Babbage diseñó la primera computadora digital, conocida como "máquina analítica" y aunque preparó todos los planos para su fabricación, nunca la pudo construir porque en esa época no existían las piezas que él necesitaba; Claude E. Shannon publicó su tesis de maestría "A Symbolic Analisys of Relay and Switching Circuits" donde apareció, por vez primera, la definición de dígito binario y en Alemania Konrad Zuse desarrolló el modelo experimental de una computadora binaria.
De gran trascendencia fueron también, los trabajos publicados por Vannevar Bush en los que proponía la creación de sistemas de organización y recuperación de la información con estructuras menos artificiales, capaces de simular el carácter asociativo del pensamiento humano y que pudiesen hacer frente a la enorme acumulación del saber científico.
Bush es considerado el precursor de las principales ideas que caracterizan un sistema Hipertexto y que aparecieron, por vez primera, reflejadas en su artículo publicado en el año 1945 y titulado "As we may think".
En el mismo, Bush plasmó su preocupación principal: la necesidad de organizar la enorme masa de conocimiento que la humanidad había acumulado a lo largo de años de desarrollo, de modo que éstos pudiesen recuperarse eficientemente en el momento preciso y de la manera en que el usuario la necesitase.
Una ciencia especial sobre la información y la documentación. Como rama de la ciencia investiga la estructura, propiedades y procesos de la transmisión de la información utilizando métodos de otras ciencias como Sicología, Lógica, Neurofisiología y Matemática. Como rama de la técnica: se relaciona con los medios de procesamiento de la información que aseguran su acceso y uso. Emplea métodos de la técnica de la computación, la bibliotecología, sistemas de investigación y la ciencia administrativa.
Desarrollo
Borko, en su artículo Ciencia de la Información: ¿qué es?, publicado en la revista American Documentation en febrero de 1968 reunió las ideas de Taylor y las reelaboró en una amplia visión acerca de la naturaleza de esta ciencia y su actividad práctica.
Para él, Ciencia de la Información es:
"la disciplina que investiga las propiedades y el comportamiento de la información, las fuerzas que rigen su flujo y los métodos para procesarla, a fin de obtener accesibilidad y utilización óptimas. Está interesada en un conjunto de conocimientos relacionados con el origen, colección, organización, almacenamiento, recuperación, interpretación, transmisión, transformación y utilización de la información. Incluye la investigación de las representaciones de información en los sistemas naturales y artificiales, la utilización de códigos para la transmisión eficiente del mensaje el estudio de instrumentos y técnicas de procesamiento de la información, tales como computadoras y sistemas de programación. Es una ciencia interdisciplinaria [...] relacionada con la matemática, la lógica, la lingüística, la psicología, la biblioteconomía, la administración... Tiene componentes de una ciencia pura, que investiga el asunto y su relación con sus aplicaciones, y componentes de una ciencia aplicada, que crea servicios y productos."
Al estudiar los efectos de la ciencia en la sociedad, no se trata solamente de los efectos en la sociedad actual, sino también de los efectos sobre la sociedad futura. En las sociedades tradicionales estaban bien definidas las funciones del individuo, había una armonía entre la naturaleza, la sociedad y el hombre. Ahora bien, la ciencia trajo consigo la desaparición de este marco tradicional, la ruptura del equilibrio entre el hombre y la sociedad y una profunda modificación del ambiente. Aunque no debemos culpar directamente a la ciencia.
Los progresos de la ciencia han sido muy rápidos en los países desarrollados; en cambio, en los países subdesarrollados su adquisición es tan lenta que cada día la diferencia entre dos tipos de países se hace más grande. Dicho retraso contribuye a mantener e incluso a agravar la situación de dependencia de los países subdesarrollados con respecto a los desarrollados.
Como la ciencia ha pasado a formar parte de las fuerzas productivas en mucho mayor medida que nunca, se considera ya que hoy se trata de un agente estratégico del cambio en los planes de desarrollo económico y social.
La ciencia ha llegado al punto de influir sobre la mentalidad de la humanidad. La sociedad de hoy no esta cautiva en las condiciones pasados o en las presentes, sino que se orienta hacia el futuro. La ciencia no es simplemente uno de los varios elementos que componen las fuerzas productivas, sino que ha pasado a ser un factor clave para el desarrollo social, que cala cada vez más a fondo en los diversos sectores de la vida.
La ciencia trata de establecer verdades universales, un conocimiento común sobre el que exista un consenso y que se base en ideas e información cuya validez sea independiente de los individuos. Hay algo que pienso que es de gran importancia resaltar y es que el papel de la ciencia en la sociedad es inseparable del papel de la tecnología.
Las Tecnologías de la información y las comunicaciones (TIC) agrupan los elementos y las técnicas usadas en el tratamiento y la transmisión de la información, principalmente la información, Internet y las telecomunicaciones.
El uso de las tecnologías de la información y la comunicación ayudaría a disminuir la brecha digital aumentando el conglomerado de usuarios que las utilicen como medio tecnológico para el desarrollo de sus actividades.
Las nuevas tecnologías de la Información y Comunicación son aquellas herramientas computacionales e informáticas que procesan, almacenan, sintetizan, recuperan y presentan información representada de la más variada forma. Es un conjunto de herramientas, soportes y canales para el tratamiento y acceso a la información. Constituyen nuevos soportes y canales para dar forma, registrar, almacenar y difundir contenidos informacionales. Algunos ejemplos de estas tecnologías son la pizarra digital (ordenador personal + proyector multimedia), los blogs, el podcast y, por supuesto, la web.
Existe una conciencia creciente acerca de la importancia que tienen las tecnologías de la información y la comunicación (TIC) como herramientas para el logro de las metas del desarrollo económico y social. Se ha pasado de una idealización de sus ventajas, reflejo de su acelerado crecimiento en la década del noventa, a una aproximación más equilibrada que destaca el papel fundamental de los recursos humanos en este proceso. En la actualidad se reconoce que es necesario lograr además un adecuado balance entre las políticas públicas, la asignación de recursos y el establecimiento de metas concretas para alcanzar un impacto positivo de estas.
Como resultado del progreso de las TIC, continuará el desarrollo de nuevos productos, específicamente inalámbricos, ubicuos e interconectados, que llevarán a una vasta integración del mundo real y el virtual y se desarrollarán numerosos servicios que extenderán el acceso y la utilidad de los sistemas de información, particularmente en el campo de la salud y la educación.
Otro aspecto primordial en la comprensión del impacto que pueden tener las TIC en el desarrollo es el hecho de que se están produciendo cambios cardinales en la manera en que se realizan los procesos organizacionales, de gestión y financieros. Internet, los nuevos servicios sobre el Web y el empleo del "Extended Markup Language" (XML), por citar algunos ejemplos, sustentan una ruptura de las fronteras tradicionales y de los flujos que se establecen para cumplir diferentes misiones. Ello supone un reto a la forma de trabajar y a los marcos reglamentarios y legales en que tendrán lugar los modelos de dirección, gestión y producción del futuro. Esto abarcará de forma sustancial al sector de la salud.
A la par de este gran despliegue tecnológico, los países en desarrollo se encuentran ante la disyuntiva de incorporarse o no a la denominada Revolución de la información, pues de no hacerlo se profundizará aún más la brecha que los separa del mundo desarrollado. Al propio tiempo, estos países no cuentan con los recursos humanos y financieros que exige este proceso y el ambiente internacional aún no propicia la cooperación. Cuba tiene una situación particular en este contexto, dados los enormes recursos dedicados por años a la formación de un capital humano que puede asumir estos retos y que es la base de una estrategia para poner estas tecnologías al servicio de su avance económico y social.
El auge de las TIC ha estado acompañado por un gran avance en la gestión de la información y el conocimiento. Tan es así, que esta era que recién comienza se ha dado en llamar la era del conocimiento. Aquí encontramos una gran paradoja: por una parte la gestión de la información y el conocimiento se ha favorecido enormemente con la Revolución Digital y por otra parte no puede hablarse de ésta en aquellos lugares donde el hombre no esté preparado para su utilización e introducción. Por tanto, en todo caso, la solución pasa por la preparación de los recursos humanos.
Al hacerse referencia a la gestión de la información, se habla del manejo de la información en favor de los objetivos estratégicos de una organización y en el cumplimiento de las misiones encomendadas a cada uno de sus individuos. La información abarca documentos, informes, metodologías, publicaciones y está relacionada con la significación que adquieren los datos como resultado de su contextualización, categorización y procesamiento.
Con independencia de la definición que se adopte y de las formas de transmisión, ya sea mediante el habla, la escritura o la lectura; la información comunicada es el recurso por medio del cual el saber individual se socializa y se vuelve trascendente.
La capacidad de la información comprende más que su solo acceso (el cual es un elemento sobre el que se ha establecido la profesión de los bibliotecarios y trabajadores de la información); ésta también comprende la conciencia de su existencia y las habilidades para explotarla una vez adquirida. La sociedad de la información no será socialmente inclusiva en ningún sentido si no se apunta al desarrollo de esta capacidad.

No hay comentarios:

Publicar un comentario