BAQUIA

Entrevista a Mar Cabra, del ICIJ

La nube de Amazon, criptografía y software libre: así se fraguó el ‘Panama Papers’

La responsable de Datos e Investigación del ICIJ, Mar Cabra, explica a Baquía cómo es la tecnología con la que han trabajado los más de 400 periodistas que han ayudado a destapar los Papeles de Panamá.

Sin la tecnología que hemos utilizado, sin los programadores con los que ha contado el Consorcio, no se hubiera podido realizar esta colaboración a gran escala.

tecnología papeles panama

Las exclusivas periodísticas, hoy más que nunca, se planifican con programación casi milimétrica, como si de una coreografía se tratara. El domingo 3 de abril más de un centenar de medios de comunicación en todo el mundo –en España la exclusiva la compartían ElConfidencial y La Sexta— comenzaban a publicar los primeros detalles de lo que se ha convertido ya en la mayor filtración de documentos de la historia del periodismo.

Hasta hace unos días lo que habíamos visto pertenecía al ámbito del gigabite: el Cablegate de Wikileaks (1,7 GB), Ashley Madison (30 GB) o el sablazo a Sony (estimado en 230 GB). Este Watergate del S.XXI nos lleva al universo del tera, casi 40 años de vida de la firma de abogados Mossack Fonseca que incluyen más 4,8 millones de correos electrónicos, 3 millones de bases de datos de archivos y 2,1 millones de PDF procedentes de esta compañía aparentemente especializada en crear empresas pantalla para que sus clientes ocultaran así sus activos. Son los ‘Papeles de Panamá‘, hechos públicos gracias al Consorcio Internacional de Periodistas de Investigación (ICIJ).

Tras un año de investigación, en el que el ICIJ ha coordinado a más de 370 periodistas de 109 redacciones de 76 países de todo el planeta, conocemos por el momento a penas la punta del iceberg, entre los presuntos evasores se encuentran el primer ministro de Islandia, Sigmundur Gunnlaugsson –que queda retratado en una entrevista con el equipo del Consorcio, sin desperdicio, donde el islandés acaba levantándose abrumado por las inesperadas preguntas sobre su relación con el bufete panameño y que ha acabado dimitiendo presionado por las protestas ciudadanas—, el presidente de Rusia, Vladimir Putin –a quien se le relaciona con 2.000 millones de dólares ocultos— o altos cargos de la FIFA y FMI.  

En nuestro país, rostros conocidos de la del mundo de la cultura y el deporte, políticos y personas vinculadas a la política, incluso miembros de la Familia Real han aparecido en el histórico de datos de Mossack Fonseca. Prácticamente, no eres nadie si no estás en los Papeles de Panamá.

Pero más allá de quién y qué se esconde tras este entramado mundial de evasión de capitales, que no es poco, esta filtración alberga una historia propia, que tal vez dé lugar a una película documental como ya ocurriera con la mítica Watergate o CITIZENFOUR, el film donde Laura Poitras retrata a Edward Snowden exactamente en las horas en las que la exclusiva mundial fuera a ser lanzada en las rotativas del diario estadounidense Washington Post y el británico The Guardian.

¿Cómo una fuente anónima fue capaz de extraer de Mossak Fonseca 2,6 terabites de información confidencial, traspasarlos a dos periodistas de un periódico alemán y posteriormente ser analizados en total secreto por más de 400 periodistas durante un año?

Poco a poco vamos conociendo más detalles del ‘backstage’ de los ‘PanamaPapers’. Un volumen ingente de información procedente de los sistemas de Mossack Fonsecas, guardados en discos duros cifrados y actualmente alojados en un centro de datos cloud de Amazon desde donde, a principios del mes de mayo, se liberarán los nombres de las personas detrás de las más de 200.000 sociedades que aparecen en la documentación, como ya hiciera ICIJ en casos de corrupción anteriores como Offshore Leaks (2013) y Luxleaks (2014) —no así en Swiss Leaks (2015).

Información cifrada

tecnología papeles panama

El equipo del periódico alemán Süddesutsche Zeitung | Pantallazo del making of de la investigación.

No se ha confirmado, por el momento, si se trata de una filtración o un hackeo a las entrañas de la firma legal panameña, pero desde que un días de abril de 2015, el primer mensaje de un tal John Doe llegara a los periodistas de investigación del Süddesutsche Zeitung, el informador anónimo dejó claro que “nunca se verían en persona y sólo se comunicarían a través de sistemas cifrados”. “Mi vida está en peligro”.

Es por ello, que los discos duros donde se traspasaron los más de 11,5 millones de documentos fueron cifrados utilizando un sistema de código abierto (open source) que ‘guarda bajo llave la información’ llamado VeraCrypt –un software desarrollado a raíz de un fork de TrueCrypt por los especialistas en cifrado franceses IDRIX, que incluye la posibilidad  de tener ‘volúmenes ocultos’ (hidden volumes).

Esta característica del software permite a los usuarios tener dos niveles de información, uno al que se accede mediante una contraseña y otro no visible, utilizado para información más sensible, al que se accede mediante una segunda contraseña.

“Es técnicamente imposible probar si hay un fichero oculto”, explica el principal desarrollador de Veracrypt, Mounir Idrassi, en Forbes. Lo cual hace de gran utilidad este programa, especialmente en casos como este donde, bajo presión, un periodista podría acceder a dar una de las passwords, sin revelar que hay más información escondida.

Pero la única manera de hacer un trabajo simultáneo y transnacional era volcando los datos en una plataforma en nube accesible por los cientos de periodistas del equipo, donde se encuentran actualmente: en Amazon. Un proceso lento, teniendo en cuenta los 26.000 gigas de información a subir.

No sólo la información de ‘en bruto’ ha de estar protegida. Las comunicaciones entre los miembros del equipo y las fuentes se realizan mediante correos electrónicos cifrados de extremo a extremos, en soportes como Hushmail, Tutanota o peerio, o a través de extensiones como Mailvelope, en los que se requiere el intercambio de claves por PGP (Pretty Good Privacy).  Para la mensajería la app por excelencia en Signal, cuyo uso se extendió exponencialmente desde las revelaciones de Snowden y que cifra los mensajes en conversaciones tipo WhatsApp o Telegram.

Precisión de reloj suizo

Sin la tecnología, sin las plataformas que hemos utilizado, sin los programadores con los que ha contado el Consorcio, no se hubiera podido realizar esta colaboración a gran escala.

Como medio especializado en periodismo crossborder (global y transfronterizo) el Consorcio viene usando y desarrollando tecnología desde hace más de un lustro, por lo que a pesar de ser el mayor volumen de documentación al que se han enfrentado, no han necesitado desarrollar herramientas ni plataformas de trabajo nuevas, si bien, las han “refinado”, explica a Baquía, Mar Cabra, jefa de la Unidad de Datos e Investigación del ICIJ.

Para esta investigación la organización periodística con sede en Washington puso a disposición para los más de 370 periodistas tres plataformas de trabajo –las habituales: una para comunicación , otra para la búsqueda de documentos y una tercera para establecer relaciones.

  • Global I-Hub, es la red social interna del equipo. Lo que Cabra denominada la “redacción virtual”. Cuenta con una especie de muro, como en Facebook, con un foro para comentar cuestiones ‘en público’, mensajería privada para compartir documentación,…Esta plataforma está construida sobre Oxwall, un software open source. A ella se accede por un sistema de doble autenticación de identidad, como Google Authenticator, que facilita un código temporal adicional, tras facilitar la contraseña incial.
  • También basada en open source (Apache Sorl), se utilizó Blacklight, plataforma para buscar documentos ya utilizada en el caso de SwissLeaks. Entonces se encontró con un gran volumen de documentación en excels lo que hizo bastante sencillo el trabajo.Sin embargo, en esta ocasión se encontraron con diversos formatos para lo que el consorcio tuvo que contar con un programador dedicado durante todo un año a desarrollar sobre esta plataforma y procesar los documentos.“Al contar con distintos tipos de documentos, muchos de ellos imágenes, hemos tenido que muchos procesamiento sobre todo de reconocimiento óptico de caracteres”, puntualiza.
    “Esta vez hemos conseguido cosas fantásticas, que no teníamos antes”, explica orgullosa de los resultados del multitudinario equipo. Por ejemplo, el reportero puede subir una lista de nombres con todos los políticos de su país para que les devuelva una hoja de cálculo de vuelta que le dice si ha encontrado alguna coincidencia. Un ‘match’, incluyendo diferentes grados según una búsqueda por proximidad.
  • Con la ayuda de Linkurius, este de software propietario, se ha realizado la visualización de la trama, o lo que es lo mismo la relación en nube de las conexiones de los distintos actores involucrados en el sistema de empresas pantalla —como se muestra en el apartado Power players.

<<Esas tres plataformas ya existían,pero no solo las hemos mejorado sino que las hemos llevado a su máximo exponente>>, lo que servirá para futuras investigaciones globales, aún mayores, concluye Mar Cabra.

Corrección 11/4/2016 11:00 AM: El ICIJ no liberará en mayo “una base de datos con más de 200 nombres de personas que parecen en los documentos” como se indicaba en el texto inicial, sino que publicará los nombres de las personas detrás de las más de 200.000 sociedades que aparecen en la documentación,

Compartir en :


Noticias relacionadas




Comentarios