Los robots reporteros necesitan aprender accesibilidad

Robot escribiendo un artículo en un portátil.

Me impulsa a escribir esta entrada en mi blog, un mensaje enviado por Ignacio Agulló a la lista del capítulo español de la Internet Society (ISOC) con el asunto: Robots periodistas. En el mensaje alude al primer robot periodista utilizado por la Lusa, agencia de noticias portuguesa, que diariamente redacta dos nociticias relativas a la apertura y cierre de la bolsa de ese país ibérico.

La noticia la publicaba, antes de ayer, Sapo: Robôs também já escrevem notícias em Portugal. Estão a estagiar na Lusa y al hacerse eco de ella, Ignacio, reflexionaba:

Es el primer ejemplo que conozco de periodistas automáticos, pero con certeza no será el último. A partir de ahora la profesión periodística pasa a formar parte de un conjunto de profesiones como la atención al cliente, los cajeros bancarios, la difusión de publicidad encubierta en Twitter o la venta de bebidas, donde la labor profesional se reparte entre humanos y máquinas.

Ciertamente no será el último y desde luego no es el primero, quizás sea el primero en trabajar en Portugal, pero en el mundo desde hace tiempo ya vienen trabajando varios bots en la generación de noticias.

La Associated Press (AP) fue una de las primeras en adoptar un bot en 2014 al llegar a un acuerdo con Automated Insights, empresa especializada en software de generación de lenguaje que produce miles de millones de historias al año generadas por máquina.

Pero quizás el primer periodista robot con nombre propio fue Cyborg, que trabaja para Bloomberg News, especializado en información financiera. Nadie más rápido, preciso e incansable, permitiendo a sus dueños competir con otras agencias de noticias e incluso con los fondos de inversión que compiten por ofrecer a sus clientes nuevos datos constantemnte.

Sobre dichos fondos Ignacio Agulló plantea que:

Sabemos desde hace años que el manejo de fondos a cortísimo plazo (lo que en inglés llaman «daytrading«) está en manos de inteligencias artificiales, pues nadie puede reaccionar ante los vaivenes del mercado más rápido que una máquina. A partir de ahí podemos imaginar que llegue a haber máquinas inversoras que lean lo escrito por la máquina periodista para tomar sus decisiones. Máquinas hablando con máquinas.

Volveré sobre ello más adelante, pero sigamos con la relación de bots periodistas y hasta dónde hemos llegado.

Heliograf es el nombre del bot que utiliza The Washintong Post y que en su primer año, 2016, produjo nada más y nada menos que 850 artículos. Artículos extensos y tweets, si bien, sobre cuestiones basadas en datos (fútbol americano) y de los que una inteligencia artificial puede destacar los principales hechos y las cifras más relevantes. El siguiente trino, por ejemplo:

Tanto hemos avanzado ya en el uso de robots redactores que incluso existe un premio que ganó el año pasado, precisamente, Heliograf o mejor dicho, el Post. Se trata de la categoría de Excelencia en el uso de Bots, de los premios anuales Biggies, que reconocen los logros en el uso de big data e inteligencia artificial.

Por su parte Forbes viene usando a Bertie, que no es una robot sino un gestor de contenidos (CMS por sus siglas en inglés) dotado de inteligencia artificial y que proporciona a sus redactores una especie de traje biónico, sugiriéndoles temas de tendencia, metáforas para enriquecer sus escritos y recomendaciones para que sus titulares sean más atractivos y convincentes.

En términos generales los robots están siendo usados más como un apoyo para el periodista que como un ente que pueda reemplazarle, al menos por el momento. Los robots pueden ser más rápidos a la hora de extraer información y alertar sobre determinadas cuestiones como las subidas y bajadas de la bolsa, un terremoto o un asesinato, que es por ejemplo para lo que se usa en The LA Times. Pero un buen periodista es mucho más que un extractor de datos y cifras. Un buen periodista es capaz de contar una historia que emociona, que llega al lector o espectador. Un buen periodista analiza, critica, saca conclusiones personales.

Además, aún es necesario entrenar a los bot para que nos se dejen engañar. Por ejemplo en Bloomberg los reproteros y editores han de dedicar tiempo a impedir que Cyborg caiga en las tácticas de las empresas que presentan sus datos de una manera «creativa».

Aunque, por otra parte, la inteligencia artificial está ayudando también a detectar los llamados «deep fakes», esas imágenes de personas que no son realmente ninguna persona o esos vídeos, por ejemplo el de Obama que hemos visto todos, que no son realmente esa persona, creadas por alguna otra inteligencia artificial. A ello está contribuyendo otro grande del periodismo, The Wall Street Journal.

La inteligencia artificial se está usando en algunos diarios de todo el mundo para otras tareas también, tareas administrativas o de gestión de usuarios, para búsqueda e indización, etc.; como lo hace, por ejemplo, The New York Times que la utiliza para generar boletines personalizados, ayudar en la moderación de comentarios y para la localización de imágenes. Pero esa es otra historia. Historia que abordaré en otra entrada porque en realidad llevo meses, muchos meses, pensando hacerla.

Centrándonos en la generción de contenido lo que a mí me preocupa va en la línea de lo que Caswell apunta en las conclusiones de su artículo Automated Journalism 2.0: Event-driven narratives From simple descriptions to real stories :

Las investigaciones futuras sobre periodismo automatizado no solo deben abordar preguntas sobre la calidad de los textos automatizados en relación con los textos escritos por humanos (el software NLG ─Natural language generation─ ya es de calidad comparable (ver Graefe et al. 2016)), sino que también deben examinar cómo los periodistas y las organizaciones de medios pueden deliberadamente modelar los datos estructurados utilizados por el software NLG para avanzar en la sofisticación del periodismo automatizado. Del mismo modo, las preguntas éticas que se hacen actualmente sobre aspectos de los datos en el periodismo, como el origen, la selección y el uso de los datos (Zion y Craig 2014), el sesgo y la objetividad (Gillespie 2014), y la transparencia algorítmica y la responsabilidad (Diakopoulos 2015), pueden necesitar ser ampliadas para incluir preguntas sobre los modelos de datos utilizados para capturar esos datos periodísticos.

Automated Journalism 2.0: Event-driven narratives. From simple descriptions to real stories

Para mí una cuestión fundamental es cómo se están generando los modelos de datos y qué tienen o no en cuenta. Qué prejuicios y sesgos les estamos transmitiendo a los robot periodistas y qué debemos hacer para evitar la generación de sesgos y discriminaciones. En definitiva ¿les estamos enseñando accesibilidad, tolerancia y aceptación de la diversidad?

Mi teoría es que es imprescindible enseñar accesibilidad a los humanos para que adquieran la empatía necesaria para no transmitir sesgos dañiños a los robots que ellos crean. Así lo expuse en Tolerancia y aceptación de la diversidad, factores clave para una sana inteligencia artificial, conferencia que impartí en DiverEduTec 2018 y en los artículos científicos: Responsive and responsible higher education through advanced technology y Accessibility, biases and ethics in chatbots and intelligent agents for education.

Pero aquí, además, hablamos de que esos robots generan contenidos que han de se publicados y, por tanto, han de presentarse cumpliendo con los requisitos de accesibilidad, así que deben aprenderlo también.

En el caso de ese trino del Washington Post la imagen que lo acompaña parecer ser estándar, es decir, una imagen que identifica al diario pero que no ha sido elegida por estar relacionada con el conetenido de la noticia. Pero imaginemos que el bot puede ir más alá y puede elegir la imagen adecuada para acompañar e ilustrar el artículo que acaba de redactar. En ese caso ha de proporcionar a los lectores el correspondiente texto alternativo, que ha de redactar también. Para la cuál necesita no sólo ser capaz de expresar de la mejor manera posible en qué consiste la imagen sino seguir las reglas sobre creación de textos alternativos. USA Today ha usado ya una inteligencia artificial para generar vídeos cortos. Debería, por tanto, ser capaz de generar también el texto alternativo, los subtítulos y la transcripción si son necesarias.

Pero es más, sin irnos a tal sofisticación que supone el uso o la generación de imágenes, en cualquier texto, en este mismo, es necesario aplicar ciertas reglas de accesibilidad. Cosas tan simples como indicar el idioma de textos que se incluyan en otro distinto a principal de la página o crear los títulos y subtítulos de manera que se aniden correctamente.

Por tanto, creo que es imprescindible que enseñemos a todos esos robots y no sólo a los humanos que los crean los principios y criterios de accesibilidad para contenidos digitales.

En esta entrada he hecho referencia a los bot que usan diarios de Estados Unidos, pero ocurre también en otros países. En China, por supuesto, desde 2017; pero no es objeto del articulo hacer una estudio de la historia del uso de bot en el periodismo mundial sino hacer una llamado esa necesidad de formar a los bot en la creación de artículos y contenidos que cumplan con los criterios de accesibilidad de manera que resulten útiles para todos, incluyendo a las personas mayores y con discapacidad.

Referencias

Para la elaboración de este artículos me he basado en las siguientes publicaciones:

Un nuevo contrato para la web

De izquierda a derecha: Emmanuelle Gutiérrez y Restrepo, William Loughborough, Charles McCathie Nevile, Tim Bernes-Lee.
La autora, Emmanuelle Gutiérrez y Restrepo a la izquierda y a la derecha Sir Tim Bernes-Lee el día de su doctorado honoris causa por la Universidad Politécnica de Madrid. Entre ambos, William Loughborough y Charles McCathie Nevile.

El sueño de una web como elemento de unión y bien para la humanidad se está desmoronando.

En su conferencia del doce de octubre de 1995 «Hypertext and Our Collective Destiny», Sir Tim Bernes-Lee compartía su sueño:

Quizás debería explicar de dónde vengo. Tenía (y todavía tengo) un sueño de que la web podría ser menos un canal de televisión y más un mar interactivo de conocimiento compartido. Lo imagino sumergiéndonos en un ambiente cálido y amigable hecho de las cosas que nosotros y nuestros amigos hemos visto, escuchado, creído o descubierto. Me gustaría que acercara a nuestros amigos y colegas, ya que trabajando juntos en este conocimiento podemos llegar a una mejor comprensión. Si los malentendidos son la causa de muchos de los problemas del mundo, entonces ¿no podemos resolverlos en el ciberespacio? Y, una vez resueltos, dejarlos para aquellos que siguen el rastro de nuestro razonamiento y suposiciones para adoptarlas o corregirlas.

El trabajo web inicial fue impulsado en gran medida por mi trabajo en proyectos con personas en sitios remotos. Estas personas tenían un gran entusiasmo, pero poco tiempo o presupuesto para viajes. (Además, como tecnólogos, todos querríamos centrarnos en los problemas técnicos, dejando la interacción humana a lo estrictamente necesario.) El sueño es que si todos trabajan día a día usando la web como su cuaderno, correo y calendario, (tal como el sistema NLS / Augment de Englebart lo permitió, por ejemplo), los problemas de escala de equipos y organizaciones podrían resolverse de alguna manera. Esto es un sueño.

Hypertext and Our Collective Destiny

Ahora, catorce años más tarde, ve claramente que algunos están aprovechando la web para llevar al mundo a una distopía digital y que es necesario hacer algo al respecto para evitarlo.

Por ello ha creado un grupo de trabajo centrado en elaborar y poner en marcha un plan de acción global contra las noticias falsas, violaciones de privacidad y manipulaciones políticas que están destruyendo el sueño y convirtiendo la web en una pesadilla.

El Contrato para la web, que puede suscribirse tanto a título personal, particular, como en nombre de una empresa, entidad de la sociedad civil o gobierno, consta de 9 principios y 76 cláusulas, divididos los principios en tres para cada uno de los actores principales, como sigue:

Gobiernos
Empresas
Ciudadanos

¿Se ha tenido en cuenta la accesibilidad? ¡Por supuesto que sí!, queda incluida en el principio 7 dirigido a todos los ciudadanos, en su cláusula primera y única:

  1. Mediante la participación activa en la construcción de la Web, incluyendo el contenido y los sistemas disponibles a través de ella​, como, por ejemplo:
    1. El impulso y fomento del uso de licencias abiertas para compartir información de interés público.
    2. El intercambio de buenas prácticas y pautas para ayudar a crear y desarrollar una Web centrada en las necesidades de la ciudadanía.
    3. La defensa de las tecnologías estándar y de carácter abierto y accesible para todas las personas, independientemente de sus capacidades.
    4. La producción o traducción de contenidos a idiomas locales de carácter minoritario.

Quienes han participado directamente en el desarrollo del nuevo contrato para la web pertenecen también a los tres sectores:

  • Gobiernos: Francia y Alemania
  • Sociedad civil: Wikimedia, Avaaz, CIPESA, Web Foundation, The NewNow
  • Empresas: Pango (anteriormente conocida como AnchorFree), Google, Microsoft

El contrato está siendo respaldado por las grandes empresas, entre ellas Facebook y las mencionadas Google y Microsoft. Pero algunas de ellas es posible que no se mantengan mucho tiempo en la lista, ya que quienes respalden el contrato deben demostrar que están implementando sus principios y trabajando en soluciones para los problemas planteados o se serán eliminados de la lista de patrocinadores. Tal como alerta The Guardian: Si la estipulación se aplica correctamente, algunos pueden no durar mucho. Un informe de Amnistía Internacional acusa a Google y Facebook de «permitir daños a los derechos humanos a escala de población». El informe se produce semanas después de que se descubriera que Google había adquirido los registros de salud personales de 50 millones de estadounidenses sin su consentimiento.

Con motivo del 25 aniversario de la Web Sir Tim Bernes-Lee dio una charla TED en la que ya apuntaba sobre la necesidad de crear una Carta Magna par la web:

Ahora tú también puedes adherirte tanto a título particular como en representación de tu entidad o empresa y espero que contribuyas cumpliendo con todos los principios que se espera cumplas, en especial el de la accesibilidad, por supuesto 😉

El derecho de las personas a ser escuchadas

Titulo esta entrada con el mismo título de la nota que compartió María Jesús Rosado, compañera de la Asociación Icono 14, asociación de investigadores en comunicación, sobre su participación en un «conversatorio» celebrado en Chile recientemente: Nuevas mediciones de satisfacción y evaluación de servicios en pobreza.

La lectura de esa nota es la que me ha impulsado a escribir esta entrada, porque como comenté en el grupo de WhatsApp en el que compartió el enlace, me parece «Fenomenal que se escuche a los usuarios de los servicios. Eso es imprescindible para un diseño usable y accesible».

Uno de los participantes en el conversatorio citado destacó «la necesidad que ha detectado la institución de otorgarle voz a las personas que se encuentran en situación de vulnerabilidad, con el objetivo de darles el derecho de ser escuchados para convertirse en protagonistas del diseño de los programas que están dirigidos a mejorar sus vidas. »

Por su parte, María Jesús incidió en que «Hay que desterrar el concepto de beneficencia y caridad, porque estamos hablando de derechos humanos. Es necesario pasar del proteccionismo a la libertad de expresión, ya que lo que la gente necesita, lo sabe la gente»

Mira si seré ingenua que me sorprende que en pleno 2019, tras trece años de publicarse la Convención Internacional de los Derechos de las Personas con Discapacidad (CDPD), aún haya personas e incluso entidades que trabajan en el llamado tercer sector, que desconocen el concepto de accesibilidad y su alcance.

Mapa de firmas y ratificaciones de la Convención y su protocolo.
Mapa de firmas y ratificaciones de la Convención y del Protocolo. Fuente: Naciones Unidas. Pulsar en la imagen para verla ampliada.

La CDPD, promulgada en 2006, ha sido firmada y ratificado su protocolo en la mayoría de los países. Quizás te sorprenda la situación en tu país al ver el mapa que muestra los que han firmado y ratificado tanto la Convención como el protocolo, los que han ratificado la Convención pero no el Protocolo, los que sólo han firmado la Convención y el Protocolo y los que sólo han firmado la Convención. No voy a entrar aquí en la diferencias, pero son importantes.

Esa convención exige que se aplique la accesibilidad en el diseño de servicios y productos, para que las personas con discapaciad no resulten excluidas. Pero lo que me sorprende, digo, es que haya tantos y tantos actores de la sociedad civil que aún no han integrado en sus competencias la accesibilidad. Porque, precisamente, si lo hubiesen hecho no estarían planteándose la necesidad de escuchar a esa misma sociedad, a los usuarios, beneficiarios, en definitiva a todas la personas, a la hora de llevar a cabo el diseño de servicios sociales.

Que pueda ser un titular o que haya que llamar la atención sobre la necesidad de escuchar a las personas es lo que me llama poderosamente la atención. Porque si el concepto de accesibilidad estuviera suficientemente difundido e integrado en nuestro acervo cultural, todas esas personas no lo plantearían como algo novedoso. Si la accesibilidad formara parte de nuestra educación, escuchar a las personas no sería algo que tendríamos que reclamar.

Otra cosa sería discutir cómo se ha de «escuchar» a las personas. Es decir, qué se ha de atender y qué no, quién tiene competencias para hacer esa escucha, qué conocimientos se han de tener para poder ser un escucha válido. Porque al igual que pasa con el diseño de sitios web, por ejemplo, es fundamental incluir desde el diseño la participación de las personas, de los usuarios, en especial de las personas con discapacidad; pero lo que no debemos hacer de ninguna manera es simplemente implementar aquello que esas personas digan. Es necesario escuchar, pero quien escucha ha de tener un conocimiento sobre las estrategias de navegación de las esas personas y sobre las ayudas técnicas o tecnologías de apoyo superior a la que tiene el usuario en cuestión, de manera que pueda detectar cuándo ese usuario está, por ejemplo, ignorando algún elemento.