DOMINGO
libro / Buscar lo importante en la avalancha de datos

Navegar en medio del caos

La era digital se caracteriza por la sobreinformación y el exceso de datos. La ausencia referencial y la inmediatez a la que el ser humano se está habituando dificultan valorar la calidad de los contenidos en todos los ámbitos. Curaduría recupera desde una visión histórica y pragmática la evolución del contexto digital y traza un camino para la creación en un mundo de excesos basado en el concepto de curaduría.

20181229_1373_domingo_shutterstock_588542351
. | shutterstock

IBM calcula que el mundo de hoy produce más de 2,5 trillones de bytes de información –es decir, 2.500 000 000 000– cada día. Si se escribieran a mano todos los unos y los ceros de un solo megabyte, la línea resultante sería cinco veces más alta que el monte Everest. Tan solo Facebook manipula al menos 2,7 mil millones de unidades de contenido y 660 terabytes diariamente. En los dos últimos años, la humanidad ha producido más información que en el resto de la historia humana, y este extraordinario ritmo de producción sigue creciendo 60% anualmente. En el momento de leer esto, las cifras habrán aumentado. La computación crece de manera paralela. De acuerdo con McKinsey, el mundo aumentó en cinco exaflops la capacidad computacional en 2008; solo en el año 2014 aumentó 40 exaflops. A manera de comparación diré que la Biblioteca del Congreso en Washington contiene alrededor de 23 millones de libros. Asumamos que el libro promedio tiene 400 páginas. De acuerdo con LexisNexi, en su formato más elemental, 667 .963 páginas equivalen a un gigabyte de información. Esto quiere decir que la colección completa de la Biblioteca del Congreso contiene cerca de 13 .570 gigabytes de información, es decir, 13,5 billones de bytes; 45 veces menos que la producción diaria de Facebook. Los routers más sofisticados y nuevos pueden transferir esta cantidad de datos en segundos. Este cúmulo de información representa la sabiduría, el conocimiento y la cultura de la humanidad entera.
La información solía ser escasa. La creación, la recolección, el almacenamiento y la transmisión de la información eran lentos, caros y complicados. En gran medida, dependían del laborioso acto de copiar. Los materiales en los que se hacían las copias eran frágiles y escasos; los libros se escribían en tabletas de arcilla, papiro o vitela en algunos pocos oasis de aprendizaje. Incluso tras la invención de la imprenta los libros eran una rareza, y encontrar, ya no digamos verificar, la información era increíblemente difícil.
La Biblioteca de Alejandría fue el mayor almacén de información de la Antigüedad. Fue el pináculo del conocimiento de una sociedad que abarcaba todo el mundo conocido, cuyas rutas comerciales, caminos y acueductos cruzaban continentes; que mantenía un ejército fijo de más de medio millón de hombres y podía movilizar millones de personas más; cuyas ciudades eran las más grandes vistas y cuya cultura, ingeniería y economía no serían igualadas durante 1 .500 años. Creada alrededor de la idea de las Nueve Musas, la biblioteca era un semillero de erudición; allí se descubrió la naturaleza heliocéntrica del sistema solar muchos siglos antes de que Copérnico lo hiciera. El contenido de sus cientos de miles de pergaminos era invaluable, inigualable, único y, una vez hecho cenizas, irremplazable: era el pináculo, el límite, de lo que se pensaba y se sabía.
Hoy en día llevamos una cantidad de información equivalente en los bolsillos y está a nuestro alcance en cualquier instante. Esto es una forma de milagro. También es un problema. En tan solo unos años hemos pasado de la escasez de información a un tsunami de datos. Pero ¿acaso esos 2,5 trillones de bytes valen más que la colección, considerablemente más pequeña, contenida en la Biblioteca del Congreso e incluso que la Biblioteca de Alejandría? No: mucha de esa información son videos de CCTV, pulsaciones sin significado, correos electrónicos basura. Hemos resuelto por mucho el problema de la transmisión y el registro de la información. De hecho, lo hemos resuelto de manera tal que ahora existe un nuevo problema: ya no es la escasez de información, sino su saturación. La pregunta ahora no es cómo podemos producir o transmitir más información, sino cómo encontrar lo que verdaderamente importa.
No siempre necesitamos más información. Por el contrario, hoy en día el valor reside en su curaduría. Esta es una lección que las empresas tecnológicas han aprendido rápidamente, pero cuyas ramificaciones se extienden más allá del mundo de los medios digitales (...)
Sin importar lo grande que se crea que es internet, esta simplemente sigue creciendo. Así como nos acostumbramos a la idea de los petabytes, ya estamos entrando a la era del yottabyte, tras habernos saltado el exabyte en el camino. Internet recientemente recibió un nuevo estándar para el IP (protocolo de internet), IvP6, sin el cual se hubiera detenido por completo: para aquellos con inclinaciones matemáticas hay que decir que IvP6 tiene 7,9 × 10 28 más ubicaciones que el estándar anterior, IvP4. En un artículo de The Economist, Virginia Rometty, directora ejecutiva de IBM, asegura que “hay más de un trillón de objetos y organismos inteligentes interconectados, incluyendo mil millones de transistores para cada persona del planeta”. Además, hay vastas secciones de la red que permanecen escondidas. La Deep Web o red profunda, esa porción más allá del ámbito de la indexación de búsquedas, representa hasta 69% de todos los datos digitales, ya sea en forma de intranets empresariales, el sistema de comunicación anónimo Tor o la darknet de transacciones criminales. La tecnología social, móvil y portátil ha exacerbado la expansión de internet, así como lo hace el creciente número de dispositivos conectados gracias a la recién nacida internet de las cosas. Con la caída del costo de producir, publicar y almacenar datos, estos florecieron. Hoy internet es de una vastedad incomprensible. La historia de Silicon Valley y sus llamados unicornios, todas esas empresas emergentes de mil millones de dólares, es la historia de los servicios que navegan en esa infinitud. Se trata de los grandes agregadores que, al hacer que internet funcione administrando el exceso, consiguen nuestra atención; y al hacerlo, consiguen dinero mediante la venta de anuncios.
Es fácil ver por qué la curaduría se ha vuelto parte de internet. De toda la saturación que experimentamos, la de internet, con su explosión de datos e información, la densidad de  sus conexiones y su velocidad, es la más evidente.
Tampoco se trata solo de volumen. Tiene que ver con el curioso aplanamiento de la información. Si el presidente de los Estados Unidos manda un tuit, en términos de forma no es diferente de cualquier cosa que uno de nosotros pudiera tuitear. Si el presidente de los Estados Unidos da un discurso, este ocurre en un contexto completamente diferente del que habría si lo diera cualquiera de nosotros. Sin duda, el impacto de los tuits será diferente, pero la esencia es equivalente, a diferencia de cómo ocurre en el dispar mundo offline. La curaduría en línea no solo se trata de reducir las cosas, también tiene que ver con sintetizar entre distinciones de grano mucho más fino.
Anteriormente describí la curaduría como una suerte de interfaz. En el caso de internet esto es literalmente cierto: todas nuestras interacciones tienen que ser mediadas a través de interfases, y esto involucra patrones necesarios de selección y acomodo. Si la curaduría se ha vuelto tan prominente en los últimos años, en gran medida se debe a este proceso; los seres humanos de un lado de la pantalla, una enorme masa de datos del otro. Se han dado muchos ejemplos que ya ocurren en la red, y eso no debería sorprendernos.
La mezcla curatorial de internet es multifacética. Todos los individuos, los servicios y los protocolos desempeñan un papel. En los niveles más altos, las nuevas disciplinas curatoriales construyen reputaciones y hacen crecer empresas. Un nuevo tipo de celebridades, que son conocidas por aquello que comparten, domina los nuevos medios. Y los nuevos tipos de negocios facilitan la curaduría a escala industrial.
Una de las más conocidas es Paper.li, una empresa emergente que surgió a partir del Instituto Federal de Tecnología Suizo. Cofundada por Edouard Lambelet, Paper.li usa filtros de internet y los reempaca de forma digerible. Diariamente se procesan 144 millones de sitios. Sus usuarios recolectan aquello que resulta interesante con la ayuda de la tecnología de Paper.li, que lleva a cabo el trabajo más pesado y luego lo publica. En una conversación con Lambelet, este me explicó el razonamiento detrás del sitio: “La idea es facilitar el descubrimiento de la larga cola del contenido”, dijo. “Todos tenemos esta sensación de que el contenido nos está sobrepasando, de que nos ahogamos en contenido e información, en noticias. Yo creo que la gente es parte de la solución”, continuó.
La visión de Lambelet de la curaduría es la de un proceso humano construido sobre la tecnología. Lo considera algo integral: en esa larga cola, los caprichos humanos son capaces de encontrar algo diferente, algo inesperado que vale la pena compartir. La fusión es crucial. “Hay muchas personas que en realidad no desean crear contenido, pero están lo suficientemente conectadas como para recomendarlo. Si tienen que pasar tres horas al día buscando qué recomendar, no pueden hacerlo, es demasiado, ahí entra la tecnología en la web y la tecnología semántica para facilitar el trabajo de curaduría diariamente”.
En última instancia, lo que Lambelet está construyendo es un negocio basado en la saturación de información y en la solución a este problema. El lo reconoce así y se da cuenta de que en realidad ambas cosas han formado una dinámica central en internet.
“Dado el enorme ruido que encontramos en internet, la filtración del contenido es cada vez más valiosa para los usuarios. Si yo encuentro a alguien que puede ayudarme a filtrar todo ese ruido, lo voy a hacer. Los consumidores están preocupados por el ruido. Así que no es solo un asunto de creación de contenido, la filtración del contenido también es valiosa.
Desde el principio de internet hemos requerido filtros: desde los portales y directorios hasta los sitios y las páginas, y después en los motores de búsqueda. Ahora, la situación se ha vuelto apabullante de nuevo con las redes sociales y la nomadicidad del contenido. Una vez más tenemos que filtrar y, esta vez, el proceso de filtrado se hace conjuntamente y se cura”.
Los servicios de curaduría especializados han encontrado un nicho. El Storify de Damman y el Paper.li de Lambelet han conseguido una tracción considerable. Pero del mismo modo hubiéramos podido hablar de Curata o de Trap.it, de Scoop It o de Swaay, que son modelos de software empresarial dirigidos a convertir las empresas en  curadores valiosos.
Paper.li y otros se especializan en curaduría de contenido. Esto se ha convertido en una disciplina por derecho propio, en un método para construir alrededor del ciclo de vida de la curaduría de contenido. En términos generales, esto funciona de la siguiente manera:
• Encontrar el contenido (en periódicos, Twitter, boletines electrónicos, lectores de RSS gratuitos, monitoreo de palabras claves, en la prensa especializada en negocios y otros temas, y en los usuarios influyentes en redes sociales).
• Seleccionar y organizar el contenido. Esto con frecuencia incluye escribir algún comentario sobre el tema, hacer resúmenes, ponerlo en contexto o hacer colecciones.
• Compartirlo con otros.
La curaduría más explícita en internet se basa en este mismo patrón aunque, como veremos, la curaduría implícita de la red es mucho más compleja. (...)
Necesitamos ir más allá de la idea de la curaduría del contenido, la cual sirve para describir boletines, blogs o listas de reproducción en Spotify, pero que no resume el verdadero significado de la curaduría en internet. En lugar de eso, tenemos que verla como parte de las capas de la curaduría.
Internet se piensa muchas veces en términos de capas, desde la capa física de cables y servidores, pasando por los varios protocolos, hasta llegar a las capas de aplicación, la parte que los usuarios normalmente encontramos en forma de buscadores y cosas de ese tipo. Las capas de la curaduría no se insertan formalmente en un marco específico, sino en espíritu, junto con otras capas, como la de contenido, la social o incluso la de juegos.
Dada la limitada cantidad de información con la que un ser humano puede enfrentarse, siempre existen mecanismos de filtración y selección. Este colectivo de filtros conforma las capas de la curaduría.
Estamos envueltos en curaduría y las capas de la curaduría aparecen por todos lados. Es solo que es más fácil detectarlas en el mundo digital.
¿Cómo trabajamos con y en las capas de la curaduría? Las empresas las usan como parte de sus ofertas de mercadotecnia en forma de curaduría de contenido. Los curadores como Maria Popova, Matt Drudge o Jason Kottke crean audiencias considerables mediante la curaduría idiosincrásica. Empresas emergentes como Paper.li desarrollan herramientas para aumentar el poder curatorial de otros. Ciertos sitios como Pinterest convierten a todos en curadores de pasteles, gatos y, en mi caso, portadas de libros. El tema es que la curaduría en internet ocurre a gran escala, se concentra en burbujas de curaduría de contenido, pero también en algo más grande: es parte importante del núcleo de nuestro entorno tecnológico, de información y de negocios.
Sin embargo, hay otra pregunta que es obligatorio hacer. A lo largo de este libro me he concentrado en la curaduría algorítmica y humana a la vez. He llamado curadores a los grandes servicios de internet. ¿En verdad podemos considerar esto curaduría o estamos estirando demasiado el término al grado de que puede llegar a fracturarse?

Sobre máquinas y hombres.
En su oficina en el Instituto de Internet de la Universidad de Oxford, Luciano Floridi, profesor de Filosofía y Ética de la información, me habla clara y rápidamente cuando dice que la curaduría no puede atribuirse a las grandes plataformas de la red. “La curaduría implica responsabilidad sobre lo que se cura”, afirma. La responsabilidad es una característica humana. “Los curadores son expertos; para ser un curador hay que tener poder de decisión. La curaduría tiene un lado práctico que significa que la curaduría algorítmica debe ir acompañada de un sentido casi de posesión o custodia. La habilidad de intervenir, de dar seguimiento, de asegurar que la curaduría tenga un impacto, es crucial. Se trata de una relación pragmática”. Lo que Floridi quiere señalar es que la curaduría tiene matices que remiten a la raíz curare. La curaduría no es solo un asunto de seleccionar y acomodar. Todo eso lo hace con un propósito anclado en la idea de ayudar.
Estamos ampliamente de acuerdo en por qué la curaduría es importante. “La curaduría surge como consecuencia de la abundancia –me dice–, no hace falta curar papiros o pergaminos con texto”. Pero Floridi considera que la curaduría tiene un rol muy específico. “Coloca a la entidad, aquello que se está curando, en el centro. El curador tiene una mentalidad, una sensibilidad que se fija en lo que es bueno para algo. Lo bueno de la entidad es lo primero, incluso antes que el curador mismo”. Considera que la curaduría “es altruista hacia lo que se está curando”: y aquí es donde la idea de la curaduría mecánica se mete en problemas. Los programas automatizados que sencillamente dirigen a los usuarios hacia otro lugar, que no tienen custodia de la información o el contenido, no pueden hacer esto. Floridi asegura que es más probable que Google cure publicidad, de la cual sí es el custodio directo, que contenido, hacia el cual simplemente dirige a los usuarios. Es lo que la autora Carmen Medina llama la lente moral de la curaduría.