Deberías estar leyendo esto en Xataka, pero puede que no lo estés haciendo. Puede que lo estés leyendo desde otro medio que no es Xataka pero que se dedica a publicar estos contenidos casi como si fueran propios. O sin el casi. Y lo que ocurre en Xataka ocurre con otros muchos medios, en mayor o menor medida.
El plagio de contenidos se ha extendido de forma incontrolable por internet, y las técnicas para robar y copiar trabajos originales han hecho que este problema se convierta en una pesadilla para los creadores de contenidos. Así es como los plagiadores roban y copian en la era internet.
Robar y copiar nunca fue más fácil
Los grandes artistas roban. Eso decían Steve Jobs o Pablo Picasso —la célebre cita no es de ninguno de ellos, por cierto—, pero esa realidad ha explotado en nuestros días en los que los contenidos se plagian y se roban por doquier tanto en medios como en redes sociales.
No hablamos de nuestra realidad periodística, la que hace que a menudo veamos la misma noticia en distintos medios. Eso ocurre tanto si la noticia original proviene de un medio en el mismo idioma como de otro en otro idioma: todos quieren (queremos) informar de la mejor forma posible e intentan (intentamos) aportar nuestra propia visión a los contenidos, pero siempre citando fuentes.
El problema afecta especialmente a medios de cierta entidad, aquellos que son capaces de publicar contenidos originales que otros aprovechan para nutrir sus publicaciones de forma fácil y gratuita.
Los medios que copian contenidos a menudo lo hacen con una pequeña mención a la fuente original para intentar evitar potenciales problemas, pero tanto cuando lo hacen como cuando no lo hacen no suele haber aviso de que ese medio va a copiar esos contenidos. Copian primero y, como mucho, preguntan después.
YouTube se llena de plagios
Uno de los motores del fenómeno en los últimos tiempos ha sido YouTube, el servicio de Google que entre su enorme catálogo de contenidos cuenta con una amplia oferta de vídeos en los que noticias y reportajes son leídos por una voz sintética.
Hay muchos casos de este tipo de actividad, pero basta comprobar canales como Latest World News, abandonado ahora, que no hacía más que plagiar contenidos de medios como la BBC. Es fácil demostrarlo: basta echar un vistazo a este vídeo mientras comprobamos como el texto que se lee en el vídeo es esta noticia de la BBC.
El plagio va desde las imágenes hasta por supuesto esos textos dictados, y aunque en muchos casos la actividad de los canales que plagian es escasa, hay otros en los que las visualizaciones son numerosas. Es en esos casos cuando los que copian pueden obtener beneficios directos, aunque en otros con menos visitas estos canales son tan solo parte de una estrategia de spam más amplia.
YouTube tiene aquí otro problema de contenidos no apropiados, pero lo curioso es que estos sistemas funcionan también a la inversa: no solo hay gente que coge artículos en texto y los plagia dándoles ese formato de vídeo en YouTube. También hay gente que coge vídeos de YouTube y los plagia convirtiéndolos en artículos de texto plano.
Los plagios "cantan" a plagios
Eso es precisamente lo que hicimos en un pequeño experimento en Xataka en el que involucramos a algunos de nuestros compañeros en Weblogs SL. Cogimos un par de vídeos de nuestro canal de Xataka TV y los pasamos por la herramienta de transcripción de Facebook para luego subir el resultado a un par de artículos en Medium.
La herramienta de transcripción realiza un trabajo demasiado crudo, así que para disimular un poco el plagio editamos mínimamente los textos añadiendo básicamente los signos de puntuación —nada de imágenes, nada de cambios en las frases— y quitando algún error clamoroso de la transcripción. El objetivo, hacer esos textos más "humanos" y sobre todo, más legibles.
Sin decir nada del origen pedimos a algunos compañeros que nos comentaran qué les parecían esos dos artículos que hablaban del Surface Book 2 y del Razer Phone, y que como comentábamos procedían de este vídeo y este otro vídeo de nuestro canal de Xataka TV respectivamente.
¿El resultado? Nuestros compañeros criticaron la redacción, y la mayoría notaron que algo "olía raro". Los textos fueron calificados por nuestra compañera Anna Martí como escuetos, con una redacción caótica y desordenada y "con una ausencia de comas preocupante" —y eso que editamos ligeramente los textos—. A pesar de ello había puntos a favor, como un "tono desenfadado que ayuda", aunque criticaba la falta de imágenes o una mejor redacción.
Amparo Babiloni, coordinadora en Xataka Android y Xataka Móvil, también fue víctima del experimento. Ella nos comentaba cómo "el contenido es muy flojo para algo que pretende ser un análisis de producto" y añadía que el texto "resulta muy confuso de leer, necesita orden". Como Anna, Amparo tenía claro que "la redacción es un horror", pero ella sí se olía algo y deducía que alguien había cogido un vídeo y sacado el texto mediante algún sistema de transcripción. "Es la única explicación a este despropósito", concluía.
Juan Carlos López, parte del equipo de Xataka, también detectó una posible automatización en esa redacción, y desde luego coincidió con sus compañeros en la redacción. "Estos textos dejan mucho que desear. Hay faltas de ortografía, errores gramaticales y una puntuación muy deficiente, tanto que parece casi inexistente" explicaba. Al criticar esos problemas, reaccionaba: "de hecho, parece que esos textos han sido generados por un traductor automático a partir de un texto original escrito en otro idioma". No acertó del todo, pero se acercó al origen del problema.
Incluso quisimos interrogar a nuestra experta en SEO en Xataka, Aldara Pérez, para preguntarle qué le parecían estos textos de cara a su posicionamiento en buscadores. Ella detectó que el texto provenía de una transcripción, y explicaba, eso sí, que al texto "habría que darle un repaso para meter título o h2, por ejemplo". Además, añadía, "por semántica podrían colarlo en Google, pero como digo revisando, porque creo que el paso de micro a texto algunas cosas no las suele transcribir bien".
¿Conclusiones? Los plagios con transcripciones de YouTube cantan, y mucho, sobre todo cuando no están mínimamente editados. A buen seguro existen herramientas más avanzadas de transcripción que realizan un trabajo más preciso a la hora de reconocer pausas o términos técnicos para no cometer tantos errores, pero el "lenguaje vídeo" es claramente distinto al "lenguaje texto". Y aún así esta es una de las prácticas más comunes en cuanto a plagios online.
Plagios con traducción incluida
Otra de las prácticas más comunes a la hora de plagiar contenidos es la de hacerlo mediante traducción de textos desde otros idiomas. La detección de copias online no es difícil cuando éstas reproducen el mismo texto en el mismo idioma —hay varios servicios que ayudan a detectar estos robos de contenido—, pero la cosa cambia cuando el artículo plagiado está traducido.
Nuestra compañera Alesya MO, editora sénior en WATmag, fue también víctima de esta prueba. Alesya donina el ruso, así que cogimos otros dos artículos de Xataka, los tradujimos al ruso y los publicamos también en Medium incluyendo las imágenes. El resultado a priori era algo mejor: en esa traducción se mantuvieron los signos de puntuación, los párrafos o las distintas secciones de los artículos.
Los artículos elegidos fueron uno que nos habla de las GPUs de Intel y otro de genética. Los temas resultado de traducir esos artículos y publicarlos en Medium fueron este y este, respectivamente.
Al preguntarle por los textos, Alesya también se olió algo raro, y comentó cómo el texto "tiene la composición de las frases como venidas del español", aunque no acababa de estar segura de si eran una traducción (como efectivamente lo eran). "En general", añadía al hablar de ambos artículos, "se entienden y son directos". La calidad de la redacción aquí era mayor y aun con esa sospecha de traducción los textos se podían entender sin problemas.
Estos métodos de plagio son aún más interesantes para quienes plagian: su detección es como decimos más compleja, la calidad de los traductores automáticos ha mejorado de forma sorprendente y los resultados permiten construir una audiencia sin que esta pueda apreciar fácilmente que esos textos son plagios. Es lo que ocurre por ejemplo en el lejano oriente.
El caso extremo: China
El plagio de contenidos es especialmente frecuente en China, donde la inmensa mayoría de los medios ni siquiera pueden ofrecer contenidos propios: o "agregan" historias de otros medios chinos no digitales, o los agregan desde sitios online controlados por el gobierno.
Lo explicaban en CNBC, donde llegaron a descubrir cómo funcionan muchos medios en China, que traducen los contenidos de medios como Bloomberg o TechCrunch sin pedir permiso para luego reproducirlos en sus sitios web. Una redactora de un periódico financiero aclaraba que esa práctica era la norma en el país: "no solo lo hacemos nosotros. Otros sitios web chinos están haciendo exactamente lo mismo".
La necesidad de información en el gigante asiático ha creado toda una industria alrededor de estas prácticas: aplicaciones como Jinri Toutiao ("Titulares del día") han levantado rondas de inversión de 2.000 millones de dólares y logran personalizar el hilo de noticias de sus usuarios gracias a sus algoritmos de aprendizaje automático... y al contenido traducido, adaptado y a fin de cuentas copiado de medios occidentales.
Un fenómeno difícil de controlar
Esta avalancha de refritos tienen el problema de que ni siquiera respetan la fuente original. Muchos medios permiten la reproducción parcial o total de sus contenidos en diversos casos, pero siempre y cuando se haga referencia al autor o autores de dicho contenido.
En la era pre-internet este tipo de casos podían ser más escasos, pero la adopción de internet ha hecho que hoy en día los plagios y la violación del copyright —o cualquier otra licencia que proteja los derechos de autor— sean básicamente incontrolables.
De hecho incluso detectando la copia no es fácil solucionar el problema. Algunos de los medios que son 'cazados' violando los términos de reproducción de contenidos corrigen sus acciones retirando esas copias o ajustándose a los requisitos de los creadores, pero otros simplemente no atienden a razones.
Las dificultades a la hora de perseguir legalmente este tipo de problemas —el que copia puede residir en otro país, por ejemplo— complican aún más un fenómeno que tampoco las grandes de internet tienen fácil solucionar. Pero ante todo, recuerda: esto lo leíste en Xataka.
O en un medio que nos plagió, claro.
En Xataka | Lo que nunca oirás decir a un investigador en público: poder y silencio en el debate científico
Ver 17 comentarios