Cómo Linked Open Data impactará en las bibliotecas a través de la innovación abierta
5 diciembre, 2011 | Por Tomás Saorín en Notas ThinkEPI 2012 |
Vamos a tratar de presentar un único aspecto del movimiento hacia los datos abiertos y enlazados (Linked open data): su vinculación con la innovación abierta. Además, situaremos esta forma de innovación dentro del contexto bibliotecario en sentido amplio (LAM, para los anglófilos).
Linked data es ya una apuesta tecnológica segura, y conviene comprender a qué sectores de la información afecta. No es únicamente un desarrollo tecnológico potente, sino también un componente de innovación en el mercado de la información. Si alguien sospecha que es sólo vaporware -otra etiqueta que la industria propone para renovar las plataformas de gestión de sistemas de información–, se pretende aquí ayudar a precisar su propuesta de valor y a dar más razones para aprovecharla.
La innovación abierta puede multiplicar la oferta de servicios bibliotecarios
Son muchas las notas ThinkEPI cuyo motor es alguna innovación tecnológica, como la realidad aumentada o el acceso móvil, o en “innovación en procesos”, como las normas 30300, la gestión orientada al cliente o la innovación social, como las redes sociales o elcrowdsourcing. Pablo Lara (2010) ofrece una síntesis de los modelos existentes, y de la importancia de la sistematización de la innovación en la práctica de la profesión. Existe una abundante bibliografía sobre el tema, incluyendo la vigilancia tecnológica. Incluso es un eje básico de cualquier estrategia de desarrollo empresarial y competitividad (Escorsa Castells; Valls Pasola, 2003). En la innovación hay una promesa de valor creíble con capacidad de movilizar recursos y abrir espacios profesionales.
Aunque las bibliotecas han estado activas en la evolución de internet, especialmente en sus primeras etapas, sería fantasioso -y peligroso- creer que siguen hoy día ocupando un lugar central en el mundo digital: ni en contenidos digitales, ni en interacción, ni en búsqueda, ni en relevancia social, ni en liderazgo de opinión ni, por supuesto, en innovación. Aunque se han planificado y desarrollado servicios digitales de vocación innovadora, su impacto es muy limitado y su propuesta innovadora está a gran distancia de lo que, desde otros actores, se ha puesto en marcha. Su innovación es de corto alcance. Las bibliotecas ni han hecho Wikipedia ni Facebook, ni podían hacerlo.
Seguro que alguien se pregunta qué tiene entonces ahora de especial Linked open datapara armar tanto revuelo, ¿es para las bibliotecas una amenaza o una oportunidad? ¿Conviene esperar o es el momento de incorporarse? Es momento de acordar cuál ha de ser la posición en la que las bibliotecas pueden ser más útiles y eficientes en el mundoLinked open data.
Linked data es una transición necesaria para las bibliotecas y proyectos de información culturales. Europeana estaría señalando el camino a seguir, así como los esfuerzos por conseguir gestionar una transición bibliográfica desde la Library of Congress (2011). El reciente informe sobre “Datos enlazados bibliotecarios” del Grupo incubadora del W3C(LLD XG, 2011), es relevante para entender la oportunidad que se abre para las bibliotecas de hacer mejor las cosas, alcanzar más impacto digital y apostar por formas complementarias de utilidad social indirecta. Ya comenzamos a disponer de bibliografía sectorial de referencia para trazar un mapa de iniciativas y elementos básicos del campo LOD (Stuart, 2011; Peset; Ferrer-Sapena; Subirats-Coll, 2011).
Linked data es un mundo complejo, y por lo tanto conviene seleccionar en qué se van a centrar nuestros recursos, ¿qué área del abanico de Linked data encaja con la competencia central y dimensiones de las bibliotecas? En las siguientes líneas se argumenta a favor de centrarse en la publicación de datasets (conjuntos o fuentes de datos) para permitir la innovación abierta.
¿Qué es la innovación abierta?
El término “innovación abierta” es acuñado por Henry Chesbrough, y hace referencia a la apertura del proceso de investigación de una empresa a terceros. Supone delegar en agentes externos a la propia organización parte de las tareas de desarrollo de innovaciones, compartiendo con ellos nuestros datos y nuestra información (Chesbrough, 2006).
El autor defiende que, en un mundo caracterizado por el conocimiento distribuido, las empresas pueden crear más valor y explotar mejor sus procesos de investigación si integran conocimientos, objetos de propiedad intelectual y productos externos en su trabajo de innovación. El término “capilaridad” (Cornellà; Flores, 2007) pone en relación la capacidad de la comunicación intensificada entre todos los niveles internos y externos de la organización para ampliar las posibilidades de innovación; pone énfasis en la información que fluye con los clientes, proveedores, socios y subcontratistas. En las zonas de frontera es donde se recombinan las ideas que pueden derivar en nuevas oportunidades.
Pero incorporar al entorno es sólo una de las caras de la innovación abierta. La otra es la de dejar que sea alguien de fuera el que la desarrolle de forma autónoma. Se conoce como “inside-out”, innovación de dentro-afuera, a la que genera rentabilidad de activos que nuestra organización no es capaz de poner en valor. La naturaleza de las tecnologíasLinked data se adapta perfectamente a esta forma de la innovación, cada vez más frecuente en otros campos: dejar que otros busquen beneficio con algo que, en realidad, apenas sabemos qué hacer.
Uno de los patrones para modelos de negocio (Osterwalder; Pigneur, 2011) que tiene especial incidencia en la información digital es el de rentabilizar productos, tecnologías, conocimientos y objetos de propiedad intelectual que no se utilizan en la empresa se pueden poner a disposición de terceros –mediante licencias, empresas conjuntas, alianzas o spin-offs (empresas segregadas).
Es característico de las instituciones públicas el no estar en condiciones de obtener todo el valor de sus activos en información, tanto por limitaciones conceptuales como por incapacidad de abordar inversiones para la innovación. Las bibliotecas pueden tener recursos valiosos o únicos a los que no consigue sacar todo el fruto, no sólo por limitaciones estructurales y de escala, sino incluso por falta de visiones alternativas sobre qué cosas diferentes hacer con sus datos.
Incluso por falta de estímulos para asumir riesgos. Las políticas públicas de reutilización de información están tratando de crear conciencia del valor económico de liberar los datos, porque son una de las nuevas materias primas de la economía de la información. Los datos públicos pueden además liberarse de la forma más abierta posible, de modo que deberíamos precisar que en este caso estaríamos refiriéndonos a “innovación abierta x2”, porque es abierta a que otros le busquen utilidad y basada en datos abiertos (Open data &Open innovation). Además de las barreras técnicas, se eliminan restricciones al tipo de uso en el que puedan aplicarse.
Publicar primero; consumir, ya veremos
La dualidad más evidente ante los datos enlazados es el equilibrio entre publicar y consumir. Publicar supone adaptar nuestros sistemas para generar fuentes de datos de calidad, basadas en vocabularios RDF y convenientemente enlazadas a recursos de otrosdatasets. Consumir supone la explotación de los datos externos disponibles para aportar valor a nuestros propios servicios digitales: combinar datos en una aplicación para el usuario final.
Entendiendo las fuerzas que actúan en la red actual, creemos que las bibliotecas hemos de apostar por publicar con calidad (transformando urgentemente nuestros sistemas de catalogación y de acceso público) y difundir nuestros datasets entre los agentes infomediarios, no entre los usuarios finales. Conviene pues que centremos nuestra atención, en este momento, en comprender los patrones de publicación de datos enlazados, los procesos para asegurar su calidad y la transformación desde diferentes modelos de sistemas de almacenamiento de contenidos. El capítulo 5 del libro online “Linked Data: Evolving the Web into a Global Data Space”, de Heath y Bizer (2011) es una buena lectura práctica para publicar Linked data.
El término infomediarios es central en la cadena de valor propuesta dentro del Proyecto Agrega para la reutilización de datos públicos (ONSTI, 2011). Es decir, nuestro público, en el contexto de los datos enlazados, son los agentes de todo tipo que están en disposición de concebir, explotar y poner en práctica propuestas innovadoras, y que ya disponen de tecnologías y pueden encontrar líneas de negocio.
A través de ellos se llegará al usuario final, de forma que los datos bibliotecarios serán en cierto modo invisibles al consumidor. Ya hemos sugerido alguna vez la oportunidad de algo así como una etiqueta “library data inside” (una forma sencilla de expresar “para hacer el producto que está usted usando se han utilizado datos procedentes de la red de bibliotecas públicas…”) para obtener beneficios de posicionamiento de la imagen del servicio de bibliotecas.
En este contexto de desintermediación radical que se avecina, en la que la procedencia de la información se difumina al ser simplemente una commodity o componente intercambiable de los servicios para el usuario final, hay que también idear, entre todos, formas de hacer visible la participación de las bibliotecas en lugares a los que difícilmente habríamos llegado por nosotros mismos.
No obstante también las bibliotecas, especialmente bajo la forma de proyectos de redes e intersectoriales, pueden explorar la capacidad de combinar datos culturales, impulsando iniciativas de consumo de datos enlazados. Aunque esta es una de las líneas del Resource Discovery Taskforce del Jisc, no debe entenderse en términos de exclusividad, como por ejemplo los catálogos actuales de bibliotecas, sino otra propuesta más dentro de la oferta en internet. Si un indicador frecuente de éxito es el número de visitas del sitio web de un portal, en Linked data el máximo valor se obtiene cuantas más veces sea integrada la información de las bibliotecas en productos de información de otras entidades.
¿Qué tienen las tecnologías LOD para ser tan apropiadas para la innovación abierta?
La integración de datos se hace más fácil. Este no es un factor menor para su difusión, al reducir las barreras (el coste, digamos) para que los servicios incorporen masivamente datos. Las actuales APIs que permiten realizar mashups exigen un esfuerzo individualizado para cada una de ellas, por lo cual este coste actúa limitando su uso o focalizando la capacidad de aplicación a unas pocas fuentes. El reciente anuncio de Spotify de su propia API para que sobre ella se construyan aplicaciones implica que los desarrolladores tienen que conocer un nuevo lenguaje, el cual sólo podrán rentabilizar en una única fuente.
RDF y Sparql significan que en lugar de APIs existen protocolos estandarizados para el consumo de datos: suponen la creación de un mercado amplio para los datos en el que las empresas puedan competir por ofrecer servicios diferenciados, en lugar de por islas de datos que aspiran a copar un mercado. Que exista un lenguaje universal para la interrogación de fuentes de datos de cualquier naturaleza es un avance de tanto valor como el invento de la división por dos cifras. Ya no hay que enseñar a usar los verbos de OAI/PMH o una serie de comandos válidos Z39.50: todo puede plantearse, simplificando, como una query Sparql. Estamos poniendo piezas sólidas para un “único espacio de datos global” (Heath; Bizer, 2011).
La arquitectura del grafo de datos enlazados permite descubrir fuentes de datos, explorando las relaciones que enriquecen los datos publicados. Una de las actividades de la biblioteca Linked data será que se conozcan bien sus fuentes de datos y promocionar su uso entre tantas opciones como pueda haber. Porque, aunque sabemos que actualmente ya hay miles de fuentes diferentes en internet, la Web semántica trata de que esto sea un factor positivo. El slogan AAA de la Web semántica “Anyone can say Anything about Any topic” (Allemang; Hendler, 2008). Esto fomenta la pluralidad de la información, permitiendo que muchos agentes agreguen información sobre las mismas entidades, digamos un libro o un autor, para hacer diferentes puntos de vista simultáneos. Como expresan en el mencionado LLD XG “In a Linked Data ecosystem, there is literally no contribution too small — an attribute that makes it possible for important connections to come from previously unknown sources”, cada vez cobra más sentido la asunción de “open-world” (open-world assumption): los datos no pueden concebirse como completos o acabados, siempre cabe la posibilidad de ampliación para una entidad dada.
Son piezas de un discurso abierto, el cual se soporta en la naturaleza distribuida e interconectada de RDF. Claro que, como en todo espacio abierto, aparecerá el “data spam”, la manipulación de datos y los intentos de explotación ilegítima. Por otro lado, cierta redundancia en los datos disponibles ayuda también a optimizar los sistemas intensivos en uso de datos distribuidos, y a reducir las fases de puesta en marcha de servicios.
Los vocabularios y esquemas de metadatos son públicos y en línea (y comprensibles), de forma que el negocio bibliotecario, hasta ahora muy exclusivo con sus formatos y modelos de datos, pasa a ser global: pueden ser incorporados algunos elementos bibliotecarios a un proyecto sobre cine o cocina, o al revés, las bibliotecas pueden enriquecer sus datos con fuentes de origen sectorial hasta ahora inaccesibles. Ya no existen modelos puros, todo puede ser recombinado, y cuantos más elementos comunes se usen, más abierto se está a la reutilización en la Web.
Esto también tiene importantes implicaciones en la irrupción de nuevas empresas en el mercado de soluciones informáticas para bibliotecas, que hasta ahora es casi un mercado cautivo, dominado por grandes y caros productos. La descentralización masiva significa más de lo que parece. También tiene implicaciones económicas, ya que los costes de puesta en marcha, escalabilidad y despliegue se comparten entre proveedores de datos y consumidores, y permite avanzar e invertir (lo que se denomina con la fórmula “pay-as-you-go”). Que las inversiones puedan distribuirse entre agentes y en el tiempo es una clave para su éxito en la economía real.
“Forse altro canterà con miglior plectro”
Este verso de Ariosto, que usó Cervantes al cerrar el primer Quijote, nos sirve para insistir en que, en un espacio digital hiperconectado, facilitar la reutilización podrá provocar que otros produzcan innovación a partir de nuestra oferta de datos. “Quizá otro tendrá mejor pecho para cantar”, significa primero que desde otros puntos se añadirá información sobre el mismo ítem, y también que es seguro que otros tendrán buenas ideas, conocimientos, medios y una visión que aportará valor a los datos procedentes de bibliotecas. Daniel Vila (2011) nos recordaba en el pasado International Workshop for transfer of information for innovation, la lúcida frase de Rufus Pollock: “the coolest thing to do to your data will be thought by someone else”.
Es bastante frecuente que la mejor propuesta de valor esté fuera de la propia institución: no la mejor idea, sea eso lo que sea, sino aquella que conecta con una necesidad de un segmento de usuarios y que se despliega con capacidad de producción sostenible y percepción directa de utilidad. Aquella que puede, potencialmente, construir un modelo de negocio. Recomendamos vivamente aplicar algunas de las propuestas de estructura de diferentes modelos de negocio con Linked data, que identifican la naturaleza de los fondos, el pago diferido, la creación de valor de marca, derivación de tráfico, etc. (Brinker, 2010)
Abrir nuestros datos aumenta las posibilidades de participar en la innovación. Nuestra responsabilidad no era hacerlo todo directamente, era hacerlo posible. Eso es también voluntad de servicio; crear las condiciones para la acción desde la iniciativa social o empresarial.
Así como estamos pasando del paradigma de “databases” al de “dataspaces” (Franklin;Halevy; Maier, 2005) construidos colectivamente y no planificados desde una instancia central, tenemos que comprender que pasaremos del “servicio ofrecido” por un organismo, al “servicio facilitado” al usuario final por infomediarios de diversa naturaleza, para cuya elaboración se han usado ingredientes bibliotecarios, cocinado con diferentes recetas y envasado por muchas marcas.
Linked data nos permitirá ser parte de la Web, y no sólo estar en ella.
Referencias bibliográficas
Allemang, Dean; Hendler, James A. Semantic Web for the working ontologist: effective modeling in RDFS and OWL. San Francisco, Calif.: Morgan Kaufmann; Oxford: Elsevier Science, 2008.
Brinker, Scott. Business models for linked data and web 3.0 / Marzo, 2010,
http://www.chiefmartec.com/2010/03/business-models-for-linked-data-and-web-30.html
http://www.chiefmartec.com/2010/03/business-models-for-linked-data-and-web-30.html
Chesbrough, Henry. Open Business Models: How to Thrive in the New Innovation Landscape. Boston, Massachusetts: Harvard Business School, 2006.
Cornellà, Alfons; Flores, Antoni. La alquimia de la innovación. Deusto, 2007.
Escorsa Castells, Pere; Valls Pasola, Jaume. Tecnología e innovación en la empresa. Barcelona: Udicions UPC, 2003 (reimp. 2009).
Franklin, M.; Halevy, A.; Maier, D. From Databases to Dataspaces: A new Abstraction for Information Management. Sigmod Rec., December, 2005, v. 34, n. 4.
http://dl.acm.org/citation.cfm?id=1107499.1107502
http://dl.acm.org/citation.cfm?id=1107499.1107502
Heath, T.; Bizer, C. “Linked Data: Evolving the Web into a Global Data Space.” En:Synthesis lectures on the semantic web: theory and technology, 2011, v.1, n. 1, pp. 1-136.
http://linkeddatabook.com/book
http://linkeddatabook.com/book
JISC Resource Discovery Taskforce.
http://www.chiefmartec.com/2010/03/business-models-for-linked-data-and-web-30.html
http://www.chiefmartec.com/2010/03/business-models-for-linked-data-and-web-30.html
Lara-Navarra, Pablo. “Innovación: modelos, tendencias y visiones en información”.Anuario ThinkEpi, 2010, v.4, pp. 11-15.
Library of Congress. Bibliographic framework transition initiative: A Bibliographic Framework for the Digital Age. Library of Congress, 2011.
http://www.loc.gov/marc/transition/news/framework-103111.html
http://www.loc.gov/marc/transition/news/framework-103111.html
Library Linked Data Incubator Group Final Report. W3C Incubator Group Report, 25 October 2011.
http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025
http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025
ONTSI. Estudio de Caracterización del Sector Infomediario. Observatorio Nacional de las Telecomunicaciones y la Sociedad de la Información, 2011.
http://www.aporta.es/web/guest/estudioRISP2011
http://www.aporta.es/web/guest/estudioRISP2011
Osterwalder, Alexander; Pigneur, Yves. Generación de modelos de negocio. Ediciones Deusto, 2011.
Peset, Fernanda; Ferrer-Sapena, Antonia; Subirats-Coll, Imma. “Open data y Linked open data: su impacto en el área de bibliotecas y documentación”. El profesional de la información, 2011, v. 10, n. 2, pp. 165-173.
Stuart, David. Facilitating Access to the Web of Data: A guide for librarians. London: Facet Pub., 2011.