Ref 6_001
CURSO
Texto
   

La búsqueda de información en Internet

Lic. Francisco Javier Albarello

Los motores de búsqueda son las herramientas privilegiadas para encontrar información en Internet, y aprender su utilización puede mejorar el uso de la red como fuente de documentación.
Sin embargo, los buscadores tienen sus sesgos y limitaciones, así como sus criterios de agenda y de inclusión de determinados temas en sus índices.
Conocer sus posibilidades y defectos es una manera de hacer un uso inteligente de las posibilidades que nos brinda la web.

Asimismo, los mentores de la red ya están pensando en desarrollar una red más "inteligente": la web semántica, que proyecta ajustarse más a las necesidades específicas de cada usuario.

 

LA BUSQUEDA DE INFORMACIÓN EN INTERNET

Antecedentes: la biblioteca y la enciclopedia

La documentación electrónica

La información en Internet

Los motores de búsqueda de Internet

Búsquedas básicas

Búsquedas avanzadas

Metabuscadores

Buscadores temáticos

Las limitaciones y los sesgos de los buscadores en Internet

El problema de la indexación

El mito de la neutralidad de la tecnología

Encontrar lo que no se quiere

Un estudio de caso

La web inteligente

BIBLIOGRAFÍA

 

La búsqueda de información en Internet

Antecedentes: la biblioteca y la enciclopedia

Desde que el hombre es hombre necesitó comunicarse con sus semejantes, y esa capacidad de simbolizar es el rasgo cualitativo que lo separó del animal. Las culturas orales recurrieron al uso de la memoria como sistema de preservación de la información, la tradición y la identidad, y la función de los mayores, los ancianos y los padres de la comunidad era la de recordación de la historia de determinada agrupación humana: sus héroes, sus batallas, sus tiempos de abundancia y sus crisis. Gracias a su memoria se podía recuperar información del pasado para aplicarla en acciones futuras. Con el advenimiento de la escritura no sólo hubo un cambio en el modo de comunicar, sino que con ella nació la documentación: la capacidad de almacenar documentos de información que podían resistir el paso de los años y trascender la fragilidad de la memoria de los padres de las culturas orales.

De esta forma, se puede establecer que la primera etapa destacable en los sistemas de almacenamiento de información tiene que ver con la institucionalización de la biblioteca como lugar donde se conservaban los volúmenes de autores diversos. La historia de la biblioteca estuvo muy marcada por el condicionante de la alfabetización, a la cual accedían principalmente las clases pudientes, y tuvo su bastión principal en los monasterios de clausura. Los monjes, que accedían a la alfabetización y en muchos casos dedicaban su vida a copiar volúmenes en los scriptoriums de los conventos, tenían al alcance de sus manos el acerbo cultural de la época, y el bibliotecario hacía uso de un poder exclusivo: controlar el acceso a l a información. Con la invención de la imprenta de Gutemberg todo eso cambió: los libros, ahora reproducidos mecánicamente, ganando en economía y rapidez, se les fueron de las manos a los monjes en los monasterios y a la Iglesia Católica, que en plena Edad Media  monopolizaba la producción del saber. Si no fuera por la Imprenta, no hubiera existido la Reforma Luterana, que tuvo lugar gracias a la libre interpretación de los textos sagrados, los cuales ya no permanecieron guardados en las bibliotecas bajo la celosa mirada del bibliotecario, sino que salieron de los claustros y fueron ganando lugar en la vida cotidiana de las clases populares paulatinamente alfabetizadas. De la mano de la libre interpretación de los textos y del entronamiento, no ahora de la fe en Dios sino en la razón, surge en el siglo XVIII el proyecto iluminista de la Enciclopedia. Diderot y D´Alambert inauguran la tendencia a comprimir el conocimiento en volúmenes, esquemas que englobaban las distintas ramas del saber. Desde ese momento surge la necesidad de clasificaciones pretendidamente universales y omniabarcativas con el fin de facilitar el ordenamiento y la recuperación del conocimiento disponible.

La documentación electrónica

De acuerdo al profesor López Yepes, "documentación puede entenderse como conjunto de las disciplinas (Ciencias de la documentación) relacionadas con el estudio del documento como fuente de información para obtener nueva información o una toma de decisiones, disciplinas... o, si se prefiere, el estudio de los procedimientos netamente informativos subsiguientes al tratamiento técnico de los documentos para la eficaz difusión de los mensajes en ellos contenidos". (1) Esta definición amplia de documentación, según Juan Carlos Marcos Recio, puede ser considerada una integración de la vieja disputa entre documentación y biblioteconomía. Más allá de esta dicotomía, aquí es importante resaltar que la documentación se fue desarrollando como ciencia principalmente durante el siglo pasado, y que esta ciencia recibe sus aportes de otras, como lingüística, matemáticas, psicología, información, ingeniería e informática. (2)

"El origen de la información electrónica lo tenemos que situar en la aparición del cable como elemento transmisor a distancia, fundamentalmente el telégrafo y el teléfono". (3) Pero sin dudas, el cambio fundamental para las ciencias de la documentación vino de la mano de las computadoras, desarrolladas en la segunda mitad del siglo XX.  Con los nuevos avances técnicos se permitió no sólo mejorar la conservación de los datos (por ejemplo, la digitalización de información en soporte papel evita la manipulación de éste), sino que también aportó mayorper versatilidad en su manejo y redujo ostensiblemente los tiempos en su recuperación de datos gracias a la interactividad de los sistemas. A esto hay que sumarle la reducción de los espacios en los archivos, ya que los bits prácticamente no ocupan lugar (como ejemplo, piénsese en una enciclopedia en CD-Rom) Tampoco hay que dejar de lado las mejoras que incorporó la información electrónica en las bibliotecas: las tareas de análisis, indización, resumen y catalogación se ven impulsadas por el nuevo soporte y facilitan la tarea para la búsqueda de la información.

En los años setenta aparecen en Estados Unidos las primeras bases de datos de uso periodístico, tales como el Information Bank, del New York Times, o el DowJones/Retrieval. A partir de allí los periódicos comenzaron a desarrollar sus propias bases de datos electrónicas a fin de satisfacer las necesidades de documentación de sus redactores, y también comenzaron a tercerizar los servicios contratando a empresas dedicadas a dicha actividad. Estas bases de datos encontraron en los diskettes y luego en los CD-Rom sus soportes ideales, pero con el desarrollo de Internet, la documentación alcanza niveles inusitados. Mucha información ahora se puede recibir gratuitamente, prescindiendo de los soportes y ganando tiempo, ya que los datos se pueden solicitar on-line al instante. En otros casos, esa información se sigue cobrando: un ejemplo de ello son las suscripciones a fuentes de documentación, las bases de datos de revistas científicas o los anuarios de los diarios que se editan en CD-Rom.

Marcos recio señala un punto importante: "la información electrónica no entró a formar parte dentro de la redacción y del centro de documentación hasta la llegada de los periódicos electrónicos, que utilizando las primeras herramientas permitían una interconexión de la información entre el redactor y el lector, o entre el redactor y el documentalista". (4) Es decir, que la documentación electrónica prácticamente no tuvo vida en las redacciones antes de Internet. Una de las virtudes de la red es, justamente, la que pone en un nuevo aprieto a las ciencias de la documentación: nadie es propietario de la información, no hay una autoridad jerárquica que la administre. Entonces se corre un riesgo importante: la disolución de la profesionalidad en la producción y organización de la información, ya que ésta se encuentra accesible, gratuitamente y sin intermediarios.  

 

La información en Internet

Con el caudal de información producido en los siglos XIX y XX, las categorías de la enciclopedia de los filósofos iluministas fueron superadas, e irrumpieron en el escenario del saber los medios de comunicación, con su capacidad de recolectar información en tiempos cada vez más cortos. En la denominada "sociedad de la información", los diarios se transformaron en valiosos documentos de consulta. Lo mismo sucedió con los archivos fotográficos y audiovisuales. Pero con Internet, de alguna forma, se impone la necesidad de un ordenamiento de la información en constante cambio, y esa es la batalla de nunca acabar: ¿es posible clasificar, sumar, ordenar y almacenar toda la información que hay en la WWW? Aún concibiendo la posibilidad de que en la web esté almacenada toda o al menos gran parte de la información necesaria para la sociedad, ¿es posible acceder a ella? ¿Se puede encontrar específicamente lo que se busca? Provisionalmente podemos decir que en Internet encontramos mucha información sobre determinados temas, poca de otros y nada de otros tantos. Se estima que hay una web invisible (es decir, que no aparece indexada en los buscadores) 500 veces mayor a la que podemos ver. Así como "un libro mal colocado en un librero puede desaparecer para siempre", la acción de incluir o no en un listado lo que se publica en la web es determinante: "clasificar, por consiguiente, es ejercer el poder" (5).

Los motores de búsqueda de Internet

Para buscar información en la WWW contamos con dos alternativas: los "buscadores", o "motores de búsqueda (search engines)", ejemplos de ellos son Altavista, Goggle. About, Excite, Hotbot; y los directorios o "árboles temáticos" (ejemplo: Yahoo!), que utilizan categorías para ayudar en la búsqueda tanto de archivos de texto como de fotografías y música en formato MP3. Esas categorías, que recuerdan a la clasificación de la enciclopedia de Diderot, suelen ser el primer paso para la recogida de información.

A través del lenguaje hipertextual característico de Internet, es posible llegar a la información buscada clickeando sobre las palabras o frases que aparecen resaltadas en la pantalla, y de esa forma, sin necesidad de recurrir al soporte-papel (y sin moverse de la silla), se accede a la información.

Para familiarizarse con el funcionamiento de los buscadores es recomendable visitar cada uno de ellos, ya que además de tener en común la forma de buscar datos (en el caso de los directorios clickeando una categoría, y en el de los motores de búsqueda, tipeando una palabra o frase para iniciar la exploración), poseen herramientas diferentes para refinar la búsqueda o personalizarla de acuerdo a las necesidades del usuario. De todas formas, el presente artículo brinda algunas herramientas para iniciarse en la búsqueda de información (6).

Búsquedas básicas

Para iniciar un rastreo en un motor de búsqueda es importante escribir las palabras que llevarán directo a la información deseada. Algunos consejos útiles:

-Usar sustantivos como palabras clave. Los verbos, adjetivos y adverbios no son muy específicos. (Ejemplo: periodismo)

-Tipear las palabras con minúsculas, ya que si se comienza con mayúscula el resultado arrojará sólo aquellas páginas en donde el término esté escrito de esa manera

-Es mejor tipear varias palabras que describan el tema, para que el buscador acote más los resultados. Ejemplo: periodismo, diarios electrónicos, periodismo digital. También se puede escribir una frase entre comillas, lo que discriminará aún más la búsqueda. Ejemplos: "periodismo on line"

-Se pueden combinar varios conceptos y separarlos con paréntesis, para que el programa los tome como una sola unidad. Ejemplo: (diarios electrónicos) (revistas electrónicas) 

-Para indicarle al buscador que la palabra puede aparecer en singular o plural, se puede escribir en singular seguido de asterisco, y el buscador devolverá todas las páginas que contengan el término de las dos formas

-Los buscadores suelen darle más relevancia a los términos que aparecen primero, por eso es fundamental encabezar la lista de palabras o frases clave con las más importantes para el rastreo

Búsquedas avanzadas

En un segundo paso se pueden dejar de lado las búsquedas que, por muy generales, dificultan el acceso a información específica, y animarse a métodos de búsqueda que acoten más la información. En motores tales como Altavista, Yahoo!, Excite o Hotbot, las búsquedas complejas se hacen a través de los conectores lógicos o booleanos: los términos and (y), near (cerca), and not (y no) y or (o). Colocando estas palabras entre los términos de nuestra búsqueda, el usuario se puede aproximar a los resultados esperados:

AND (y): al vincular los términos con este conector. Se le indica al buscador que todas las palabras tipeadas en el casillero deben estar presentes en las páginas y sitios hallados. Ejemplo: periodismo and internet and digital

AND NOT (y no): se le puede pedir al buscador que no incluya a los términos que aparecen después del conector. Ejemplo: periodismo and not gráfico

OR (o): una u otra palabra clave debe aparecer en los resultados. Es útil cuando se quieren dar sinónimos de los términos. Ejemplo: periodismo electrónico or periodismo digital

NEAR (cerca): sólo aparecerán las páginas o sitios que tengan los términos unidos por este conector a una distancia mínima de 10 palabras. Este comando le exige al buscador que busque información donde las palabras pedidas estén cerca unas de otras

Estos conectores booleanos pueden emplearse también para relacionar frases, las cuales deberán encerrase entre comillas. Ejemplo: "periodismo electrónico" and "sociedad de la información". Asimismo, pueden utilizarse paréntesis. Ejemplo: periodismo near (digital or electrónico).

Algunos buscadores utilizan conectores boléanos designados con signos: por ejemplo el signo más (+) y el signo menos (-), que pueden ser utilizados para refinar la búsqueda, adicionando o excluyendo ítems en la devolución de los resultados.

Metabuscadores

Para facilitar la búsqueda de información en Internet y no limitarse a hacerlo mediante un motor de búsqueda determinado, existen metabuscadores (buscadores de buscadores) que relevan la información en varios motores a la vez. El caso paradigmático es el de Copernic, que se puede bajar gratis de Internet. Copernic es un programa que se baja al disco rígido y, conectado a la web, realiza búsquedas en 80 fuentes de información. Posee herramientas de búsqueda avanzada, muestra los resultados en orden jerárquico según su relevancia, y cada búsqueda realizada queda registrada en una ventana, de modo que se puede volver a chequear tantas veces como se quiera.

Buscadores temáticos

Otras de las opciones para buscar información de manera más específica es recurrir a rastreadores especializados en ciertas áreas como salud, derecho, música, tecnología. Como los buscadores generales tienen indexados un mínimo porcentaje de los sitios que hay en la red, la tendencia a la especialización intentará solucionar ese problema.  

 

Las limitaciones y los sesgos de los buscadores en Internet

Desde que existen las fuentes de documentación, administrar o disponer de ellas fue una cuestión de poder. El bibliotecario de los monasterios medievales, el filósofo iluminista que clasificaba el conocimiento en determinadas ramas, el diseñador de los buscadores de información en Internet; todos ellos comparten una función: manejan información, gestionan el conocimiento. Si antes ese poder estuvo en manos de la Iglesia Católica (en el caso de las bibliotecas), luego en el racionalismo positivista (la enciclopedia de Diderot), ahora -de acuerdo a Laura Siri y Aníbal Ford, ese poder es sustentado por un país: Estados Unidos. En el libro: "Internet: búsquedas y Buscadores", Laura Siri elabora una crítica a los motores de búsqueda y directorios de Internet. Establece que estos tienen sesgos bien marcados a la hora de brindar la información que se publica en la web:

"la hiperinformación que caracteriza la época actual funciona en un solo sentido: cada vez es más fácil encontrar en Internet documentación de toda clase referida a los países del Primer Mundo (y muy especialmente, a Estados Unidos), mientras que hay grandes dificultades para documentarse sobre temas vinculados a los otros países" (7)

Este fenómeno también se registra en las Enciclopedias en CD-ROM, tales como Encarta de Microsoft. En "La marca de la bestia", Anibal Ford dice:

"los nuevos sistemas globales de información, como es el caso de Internet o las enciclopedias globales en CD-ROM como Encarta de Microsoft, privilegian la información sobre ciertas culturas, obviamente la de los países industrializados y marginan, disminuyen, simplifican e incluso procesan de manera errada a muchas otras. Este es un proceso muy antiguo pero sobre el que pesa la hegemonía "ideológica/clasificatoria" de Estados Unidos presente en toda búsqueda de Internet y produce, como también sucede en las enciclopedias en CD-ROM, un proceso de desinformación global importante con respecto a los países pobres cuando no una intermediación o intrusión en la información sobre ellos errónea e hiper-simplificada" (8)

Esta visión crítica de los buscadores de Internet es también compartida por investigadores del primer mundo:

"un "defecto" especialmente significativo de los buscadores es que, según el estudio de Lawrence y Giles (financiado por la compañía norteamericana NEC en New Jersey, 1999), tienden a indexar con mucha más frecuencia las páginas que están en Estados Unidos que las que no lo están. Es decir que, no sólo la cantidad de sitios norteamericanos (72 por ciento según Activmedia) con respecto a los del resto del mundo es mucho mayor, sino también que los sitios no norteamericanos son más difíciles de encontrar con las herramientas disponibles" (9)

Esta visión "hipersimplificada" de los países del tercer mundo recurre a estereotipos sobre esas sociedades, y lejos de conocer profundamente su cultura, destacan su carácter de "exótico" y "diferente", para marcar una diferencia insalvable entre los dos mundos. Desde esta lógica, las distancias que parece neutralizar Internet, se vuelven más pronunciadas a la hora de analizar quiénes son los que más hablen y qué dicen de quienes no pueden hablar en este nuevo medio.

El problema de la indexación

Para entender como funciona un motor de búsqueda, es necesario comprender cual es su lógica de indexación, es decir, cómo es el proceso de inclusión de las páginas o archivos sobre determinados temas que se hallan publicadas en la red. Teniendo en cuenta que para el usuario común es difícil acceder a las páginas en forma directa (a no ser que sepa de su existencia por otras vías), el rol de los buscadores es determinante.

Laura Siri señala tres factores fundamentales acerca de cómo trabajan los motores de búsqueda:

a)      La base de datos. Los buscadores la construyen con la información proveniente de los formularios de alta que los administradores de sitios les envían voluntariamente. Además, muchos search engines (Altavista, Infoseek, Lycos, Excite, Hotbot, Open Text, Web Index, Northern Light y Web Crawler) tienen programas llamados web crawlers, spiders o robots, que vagan por la Internet y almacenan la información sobre cada página que encuentran.En general, estos agentes comienzan con una lista histórica de links "populares", y los siguen para encontrar más enlaces y agregarlos a la base. De los 100 sitios más populares, la totalidad son norteamericanos.

b)      La interfaz con el usuario. Este aspecto tiene que ver con lo que el navegante tiene permitido hacer al ingresar la palabra clave (esto fue descrito en los puntos sobre búsquedas básicas y avanzadas)

c)      Presentación de resultados. Dado que el número de páginas halladas para una determinada búsqueda puede ser alto, los buscadores deben tener criterios para su ordenamiento y jerarquización. Para ello asignan a cada resultado un "puntaje de relevancia". En general, este tiene que ver con: el número de veces que el término aparece en el texto, si aparece en el título, si lo hace al principio o si las palabras buscadas figuran o no próximas entre sí. (10)

 A todo esto se debe sumar que por lo general -continua Siri- "los usuarios no van más allá de los primeros quince o veinte sitios que aparecen en la lista de resultados"(11). Este factor se vuelve determinante si pensamos -tal como se explicó- que no necesariamente los sitios más importantes aparecen en primer término.

El documento "Herramientas de búsqueda para la WWW", de Adelaida Delgado Domínguez (publicado en el CIVE2001) contiene información interesante sobre los buscadores, y con respecto a sus sesgos dice que los creadores de páginas comerciales desarrollan una serie de trucos para aparecer en la lista de los 10 primeros sitios indexados por el buscador, empleando estratagemas tales como:

"repetir reiteradamente ciertas palabras en el texto (incluso escribiéndolas con el mismo color que el fondo para que así sólo las lea el robot y no el usuario), asociar palabras clave al documento que tengan mucha probabilidad de ser buscadas por los usuarios (por ejemplo "gratis", "sexo", etc. o marcas comerciales importantes) incluso aunque no tengan que ver con el contenido del documento, realizar alianzas con otros autores para referenciarse mutuamente a través de enlaces, o en algunos casos, pagar al buscador (si éste lo permite) por aparecer en los primeros lugares de la lista de resultados en la consulta de ciertos términos."

 

El mito de la neutralidad de la tecnología

Internet, como otras tantos inventos, aún goza de cierto halo de neutralidad tecnológica. Mucha gente aún piensa que la tecnología es neutral, y que depende de quién haga uso de ella. Si tenemos en cuenta que la Red nació en Estados Unidos, no debe sorprendernos comprobar que a mayor parte de la información que brinda es sobre ese país. Entonces, lo que -según los gurúes de la comunicación como Nicholas Negroponte - algunos entienden por "democracia perfecta" o "libre acceso a la información" desde cualquier lugar del planeta, se transforma en una más de las utopías que el hombre fabricó alrededor de los inventos a los que dio creación.

Con respecto a Internet, esa aura de neutralidad es acentuada en la medida e que quienes organizan el conocimiento en los motores de búsqueda o directorios, son técnicos. Tal como dice Siri:

"mientras que la obra de los enciclopedistas fue construida por filósofos, científicos y gente de letras, hoy la Internet y otros medios interactivos son el fruto de knowledge managers, cuya formación es más técnica que vinculada a las ciencias y las artes, y cuyas metodologías imponen sobre sus productos el halo de neutralidad ideológica tradicionalmente atribuidos a los algoritmos computacionales" (12)

Entonces, no sólo los criterios de clasificación de los "árboles del conocimiento" dependen de la ideología de los países del primer mundo, sino que además esos criterios son elaborados por agentes técnicos que carecen de la formación humanista que se requiere para elaborar esos criterios.   

Encontrar lo que no se quiere

En forma paralela al crecimiento de la información que ofrece Internet, también hay cada vez más basura. Basta con introducir una palabra clave en un motor de búsqueda para que, entre algunas direcciones útiles, aparezcan numerosos links que nada tienen que ver con la búsqueda inicial. Asimismo, se puede comprobar que muchos de esos links aparecen repetidos, porque el buscador indexa todos los sitios que utilizan ese término, sin discriminar si el sitio ya fue citado o no.

Además, existe un truco muy común que es utilizado por los programadores de páginas web, que es el de abrir automáticamente páginas que no tienen que ver con lo que busca el usuario, pero que utilizan palabras clave para accionarlas. Al armar un sitio web, el programador incluye etiquetas (denominadas metatags) con palabras claves que actúan como disparadores de búsqueda y que llevan al usuario a esos sitios sin haberlo solicitado, y no teniendo -muchas veces- que ver con la página que se encontraba visitando.

Por último, no es descabellado suponer que detrás de los motores de búsqueda se esconden fuertes intereses económicos, teniendo en cuenta que los search engines perteneces a compañías que se desarrollan y fusionan al igual que muchos medios de comunicación, contribuyendo a la concentración monopólica de la información. Al respecto, Siri introduce la duda:

"Existe, o se sospecha que existe, otro criterio más de jerarquización de los resultados: es posible que el algoritmo esté programado para asignar mayor puntaje a los sitios de aquellas empresas que hayan pagado para figurar en primer lugar (del mismo modo, también se venden keywords a los anunciantes para que cuando un navegante las ingresa como término de búsqueda, se despliegue un "banner" con publicidad de la compañía correspondiente)" (13)

La duda es despejada por una de las tantas denuncias sobre los intereses comerciales que existen detrás de la información que brindan los buscadores. Por ejemplo, en julio del año 2001, la Organización norteamericana de Consumidores denuncio a 8 de los más importantes motores de búsqueda (Microsoft, Altavista, AOL Time Warner, Terra, Lycos, Direct Hit, iWon y LookSmart) por incluir en las primeras posiciones en los resultados de las búsquedas a empresas que habían pagado por ello, sin que previamente se avisas a los usuarios de ese hecho. (14)

Un estudio de caso

Durante la semana del 11 de septiembre del 2001, una fecha imborrable por los sucesos que tuvieron lugar en EE.UU, se analizó el buscador Ubbi, del diario argentino Clarín, y soportado por el buscador norteamericano Google. Durante esa semana se comprobó el sesgo de ese buscador y, coincidiendo con esa fecha lamentable, se pudo corroborar los cambios que se produjeron a la luz de dichos acontecimientos. Se puede acceder al análisis del caso haciendo clic aquí.

La web inteligente

El los últimos años, investigadores de Estados Unidos y de Europa se han dedicado a trabajar en lo que se puede denominar una nueva revolución en Internet: la web inteligente. Existen dos proyectos paralelos: la web semántica y el cerebro global.

La web semántica: impulsada por el creador de la WWW, Tim Berners-Lee: "La Web Semántica no es algo que tenga relación con la Inteligencia Artificial, es algo muy práctico, cuyo objetivo es que los agentes entiendan el significado en base a marcas semánticas".(15) Se trata de asignar etiquetas (marcas semánticas) a los datos a través de un nuevo lenguaje (XML) para que la red comprenda el significado de ese dato. Cuando el usuario busca información en Internet, en la devolución de resultados aparecen numerosos links de interés, muchos de ellos repetidos, y junto a otros tantos denominados "información basura". El proyecto de la web semántica intenta discriminar más la búsqueda de información a través de un software inteligente ("agents") que comprende el sentido de los datos, los contextualiza y recién después de esa instancia los devuelve al usuario que busca la información.(16) Berners-Lee, director del World Wide Web Consortium con base en el MIT (Instituto Tecnológico de Massachussets) se encuentra embarcado en este proyecto en los últimos años, y junto a Hans-Georg Stork, y James Hendler lidera a un grupo de al menos cien investigadores. Para Berners-Lee, "la web semántica es información realmente procesable por la máquina" (17). Por su parte, Hans-Georg Stork, responsable de la investigación la Web Semántica de la Comisión Europea, dice que “La Web Semántica tiene por objeto ordenar el caos de Internet”.(18)

El cerebro global: es el otro proyecto que llevan adelante investigadores como Francis Heylighen, Johan Bollen y Cliff Joslyn. El objetivo que se persigue es que "los servidores sean capaces de aprender el recorrido virtual que hacen los internautas en su navegación por la Red para que ésta acaba funcionando como un cerebro global". (19). Se trata de una gran red de redes de información precisa, que se crea con la inteligencia de los usuarios en la red, algo así como una "inteligencia compartida", "una inteligencia que une cada uno de los ordenadores conectados como si fueran las neuronas de un cerebro". (20). En esta línea están trabajando el belga Francis Heylighen, codirector del Instituto de Investigación Transdiciplinar de la Universidad Leo Apostel, y coeditor del Proyecto Principia Cibernética y su discípulo, Johan Bollen, que trabaja en el Laboratorio Nacional de Los Alamos (EE.UU). Con algoritmos matemáticos se están realizando experimentos que demuestran cómo se trabaja con las máquinas que simulan el funcionamiento del cerebro humano. Para Karma Peiró, "El cerebro humano es un órgano flexible y eficiente que contiene una enorme cantidad de datos. No es perfecto pero, comparativamente, funciona muchísimo mejor que un buscador de Internet". (21) El proyecto del cerebro global, entonces, pretende que la web funcione como un gran cerebro colectivo inteligente, pero desarrollado por los recorridos de los navegantes, por asociación de ideas y no por simples algoritmos matemáticos que no pueden distinguir un dato de otro similar.

Por otra parte, desde España, el grupo de periodistas digitales liderado por Luis Angel Fernández hermana está haciendo lo suyo desde hace algunos años en función de la web inteligente. Desde su sitio, www.enredando.com, ofrece interesantes notas y entrevistas sobre el tema. Concretamente, el 26 de octubre de 2001 tuvo lugar en Barcelona un congreso organizado pro este grupo, donde se dieron a conocer los proyectos descriptos. Sin dudas, los próximos avances en Internet tendrán que ver con estas ideas que hoy parecen inalcanzables.

Los proyectos de la web semántica y el cerebro global se plantean como alternativas a los actuales motores de búsqueda de Internet. Conocidas sus limitaciones y sesgos en la recogida de datos, estos dos proyectos pretenden ofrecer información específica, útil y verdadera.

 

BIBLIOGRAFÍA

1-     Marcos Recio, Juan Carlos, La documentación electrónica en los medios de comunicación, (Madrid), Fragua, 1999, pág. 30

2-     Marcos Recio, Juan Carlos, La documentación electrónica en los medios de comunicación, (Madrid), Fragua, 1999, pág. 25

3-     Marcos Recio, Juan Carlos, La documentación electrónica en los medios de comunicación, (Madrid), Fragua, 1999, pág. 56

4-     Marcos Recio, Juan Carlos, La documentación electrónica en los medios de comunicación, (Madrid), Fragua, 1999, pág. 61

5- Darnton, Robert. Los filósofos podan el árbol del conocimiento: la estrategia epistemológica de la "Enciclopedia". En: La gran matanza de gatos y otros episodios en la historia de la cultura francesa. (México), Fondo de Cultura Económica, 1987

6-     Gentil, Andrea y Bellucci, Marcelo. El que sabe buscar bien, encuentra más y mejor. En Suplemento de Informática de Clarín, miércoles 21 de junio de 2000

7-     Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 15

8-     Ford, Anibal. La marca de la bestia. Identificación, desigualdades e infoentretenimiento en la sociedad contemporánea, (Buenos Aires), Norma, 1999, pág. 119

9-     Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 23.

10- Siri, Laura. Internet: búsquedas y buscadores, (Buenos Aires), Norma, 200, pág. 59

11- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 63

12- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 18

13- Siri, Laura. Internet: búsquedas y buscadores (Buenos Aires), Norma, 2000, pág. 66

14- La denuncia fue publicada en el Boletín electrónico Albanova.Año II - Número 70 - 23 de julio de 2001 (www.albanova.com)

15-Flotats,Sonia, La tercera revolución de la web, En:www.enredando.com (30/10/2001) Nota completa

16- Port, Otis, The Next Web, Business Week, New York, March 4, 2002, Industrial/Technology Edition, Issue: 3772, pp. 96-102

17- Frauenfelder, Mark, A smarter web, Technology Review, Cambridge, Nov 2001, Vol. 104 Issue: 9, pp. 52-59

18- Peiró, Karma, El compromiso entre los humanos y las máquina, En: www.enredando.com (30/10/2001) Nota completa

19- Rexxac Pous, Eva, Inteligencias compartidas, En: www.enredando.com (23/10/2001) Nota completa

20- Rexxac Pous, Eva, Inteligencias compartidas, En: www.enredando.com (23/10/2001) Nota completa

21- Peiró, Karma, El compromiso entre los humanos y las máquina, En: www.enredando.com (30/10/2001) Nota completa