Giro radical de Netflix, OpenAI y el RGPD

00:00 /18:32

Patrocinador: Aunque el Gobierno haya eliminado las ayudas, en BP siguen los ahorros de 10 céntimos por litro utilizando la tarjeta MI BP, que puedes instalar como aplicación en tu móvil, y en cuestión de segundos empezar a ahorrar y acumular puntos. — Disponible hasta el 31 de marzo.

Cambio drástico en el RGPD / OpenAI publica un detector de ChatGPT / Será casi imposible compartir cuenta de Netflix / Amazon vende oficinas gigantes por el trabajo remoto / Cagada gigante de GitHub / NASA y Boeing crearán prototipos Truss Braced

🚨 La Comisión Europea vigilará de cerca a las agencias de protección de datos. Un cambio sísmico en la aplicación del RGPD. Las agencias nacionales tendrán que enviar un reporte actualizado cada dos meses de sus investigaciones, en vez de hacerlo de forma opaca, lenta y semi-aleatoria.

👉 Se acabó la siesta para las agencias de Irlanda, Luxemburgo y demás, que torpedeaban desde dentro la normativa con grandes cuellos de botella.

🔍 OpenAI presenta su propio detector de texto sintético. Necesita que el texto tenga una longitud mínima de 150-250 palabras, y funciona mejor en inglés que en otros idiomas, y devuelve una nota probabilística sobre el origen del mismo. — Alertan que no han medido su tasa de acierto en texto que mezcla sintético y natural.

🤖 Un prometedor estudio sobre las filigranas en los textos sintéticos abre la posibilidad de un sistema capaz de detectar contenido artificial (PDF) sin tener acceso al propio modelo ni su entrenamiento, y que es muy eficiente a nivel computacional. Solo necesita saber una lista pública tokens positivos y negativos.

📺 Netflix aumentará las restricciones para compartir cuentas con tus familiares. Cualquier dispositivo que no se conecten a la Wi-Fi "principal" al menos una vez cada 30 días para ver contenido, dejará de tener acceso. El sistema no estará limitado a televisores como habían dicho antes.

👉 ¿Afectará a las vacaciones de verano? ¿Y las familias con hijos en el extranjero? — Han añadido una "Caja Misteriosa" a los perfiles infantiles, un cambio estético de su botón aleatorio.

☠️ Analizan el código fuente filtrado del buscador de Yandex. Y están encontrando cosas muy curiosas: casi 18.000 variables diferentes para determinar la posición de un resultado, medidas anti-spam, anti-SEO, e incluso unos sistemas paralelos que comparan los resultados con los de Google. — Además de secretos de sus redes neuronales, indizadores, etc. Goloso.

🛫 NASA y Boeing desarrollarán dos aviones reales con alas de entramado reforzado. El concepto de hace unos años dejará de ser virtual, y fabricarán dos prototipos funcionales y a tamaño real, con este nuevo tipo de alas más largas, finas y ligeras, gracias al refuerzo diagonal extra (vídeo). — Esperan poder ahorrar hasta 30% de combustible.

💩 GitHub cambia un programa interno y casi rompe Internet. Anunciaron que iban a cambiar el software con el que creaban automáticamente los archivos comprimidos de cada proyecto subido, creando una cascada de fallos en la comunidad de código abierto porque los checksum fallaban.

🤳 Los fundadores de Instagram preparan un "TikTok de noticias", que se llama Artifact y que de momento está en beta cerrada. La interfaz será el típico scroll infinito de recomendaciones basadas en el comportamiento previo. Un poco lector de RSS, un poco de Google Discover, y otro poco de Instapaper y similares.

🤓 El W3C se convierte en una OIP privada sin ánimo de lucro. Tras 28 años dejará de ser un Consorcio administrado por sus miembros, para ser una entidad privada de interés público, bajo el control de miembros actuales y nuevos, y tener mayor capacidad de reacción y transparencia.

🛳️ Irán modifica un gran buque mercante en un barco militar porta-drones. Con más de 240 metros de eslora, lleva varios meses en dique seco para añadir una cubierta más ancha desde la que puedan despegar sus drones suicidas Shahed 136 y similares. — Los que tienen un sonido de ciclomotor inconfundible y hélices de madera.

🏢 Amazon se gastó 120 millones en unas oficinas que no va a usar por el trabajo remoto. En 2021 compró un campus de cuatro edificios en Silicon Valley con más de 110.000 m²w, y ahora lo venderá perdiendo dinero porque no le compensa con la poca ocupación que iba a tener.

✨ Hablando de trabajo remoto, no te pierdas nuestro último especial de Terapia de Grupo, en el que resolvemos los problemas que trabajar desde casa ha traído a la vida de nuestros oyentes. Nos reímos un montón, y además patrocinado por Nvidia Broadcast, qué más queréis. — Suscríbete en Podcast o en YouTube.

----

🌐 ¿Quieres escuchar mixx.io sin anuncios? Apúntate en Patreon y descubre todas las ventajas ser colaborador

  • Camisetas
  • Tazas
  • Pegatinas
  • Feed RSS exclusivo sin publicidad de todos los programas.

----

----

Y recuerda que puedes seguir mixx.io también en:

Para contactar conmigo, puedes:

Transcripción

Bienvenidos a un nuevo episodio de Mixio, podcast diario de tecnología. Mi nombre es Alex Barredo y hoy tengo tantas ganas de ir a las noticias que me voy a saltar hasta la recomendación de que os apuntéis al Patreon de Mixio. Pero bueno, ya que os lo cuento, os apuntáis a patreon.com barra Mixio.

Pero no le dedico más tiempo. Comenzamos con un cambio sísmico directamente desde Bruselas y es que la Comisión Europea va a vigilar de cerca a las agencias de protección de datos. Esto viene después de una denuncia de un grupo de derechos civiles irlandés ante el defensor del pueblo comunitario de la Unión Europea que pedían explicaciones. Oye, ¿qué es lo que está haciendo la comisión, este brazo ejecutivo del bloque, para asegurarse que la normativa y toda la legislación nacida después del RGPD estaba siendo bien implementada y sobre

todo bien ejecutada por las agencias nacionales? Como llevamos protestando bastante tiempo en este podcast, sobre todo de las agencias de Luxemburgo y especialmente de Irlanda. Ya hemos comentado muchas veces la ineficiencia, la lentitud e incluso la opacidad con la que operan en casos que duran años las investigaciones y que luego se archivan sin saber muy bien por qué, sin llegar a tener un tipo de multa.

Es decir, también hay un elemento de semi aleatoriedad en la propia ejecución de esta nueva normativa que debería de tener mucho más diente, por decirlo así. Entonces, ahora la Comisión Europea, a petición de este ombudsman, va a pedir seis informes cada año, es decir, cada dos meses, a cada una de las agencias de protección de datos nacionales. A la de España, a la de Irlanda, a la de Francia, a la de Luxemburgo, etcétera, etcétera, etcétera.

De tal forma que en esos reportes deberán de ir contándole en todo momento cuáles son sus casos de mayor envergadura y lo que están tratando. De tal forma que van a estar como si tuvieran al profesor mirándoles por encima del hombro mientras hacen los deberes. Es decir, que se ha acabado, como digo en el boletín, la siesta.

Id preparando las palomitas porque seguramente este sea el cambio que necesitaba todos estos engorrosos mecanismos de privacidad para que realmente las compañías se pongan las pilas. Entre esto y la entrada en vigor de las nuevas normativas, de la ley de servicios digitales, la ley de mercados digitales, etcétera, si yo fuera Facebook, Google, Microsoft, cualquier empresa en general de publicidad de Internet, o de tecnología, o grupos industriales, iría empezando a contratar muchos, muchos abogados porque se vienen curvas.

Siguiente noticia. Hablábamos de profesores como metáfora para el caso del RGPD y me viene muy bien esta figura porque la de los profesores es quizás una de las más afectadas por sistemas de generación y de creación de texto sintético. Les pides un trabajo a tus alumnos tanto de instituto como de primaria como incluso de universidad sobre una temática concreta y en vez de escribirlo se van al ordenador y en cuestión de segundos tienen un tocho de texto ahí que ni se han leído ni tiene mucho sentido pero que a lo

mejor cuela. Esto, la popularidad de este tipo de herramientas y la facilidad con la que se pueden acceder desde hace unos meses, ha puesto patas arriba muchas universidades y muchos centros educativos e incluso ministerios. Hemos explicado aquí que de verdad no debería de haber mayor problema porque, por simplificar un poco los términos, invertimos el proceso del modelo que genera ese texto, puedes conseguir un modelo alternativo que detecte si ese texto ha podido

ser generado de forma sintética y esto es precisamente lo que ha hecho OpenAI, los creadores de ChatGPT, de GPT-3, de DALI-2, etcétera, que han publicado su propio detector de texto artificial. Necesita una longitud aproximada de 150 a 250 palabras, dicen que unos mil caracteres. Funciona mejor en inglés que en otros idiomas, esperemos que esto poco a poco vaya evolucionando y sobre todo es abierto y es gratuito, con lo cual los profesores de todo tipo lo van a tener muy fácil,

no van a tener que recurrir a herramientas externas, a herramientas de pago, etcétera. Y entonces este detector, o mejor dicho este clasificador, que es como se denomina técnicamente a este tipo de herramientas, devuelve una respuesta probabilística entre cinco diferentes grados. Muy poco probable, poco probable, dudoso, probable y muy probable.

Es decir, que no te dice una nota del 95% porque es básicamente imposible, sobre todo como explican los propios ingenieros de OpenAI, que en una de las notas del lanzamiento dicen no hemos probado y no hemos medido el rendimiento o la tasa de acierto en texto que combina el material sintético y el contenido escrito de forma natural o de forma biológica, como queráis decir.

De todas formas, no me preocuparía mucho por este segundo tipo de texto porque en el caso de los alumnos, si han modificado suficientemente un texto como para que no sea detectable, yo creo que han sido capaces de entender, al menos en una cierta medida, los conceptos y, digamos, como suelen pedir los profesores, explicarlo con sus propias palabras.

Así que, oye, muy buenas noticias, que yo personalmente conocía a varios profesores que estaban un poco ya alerta. Siguiente noticia es un estudio precisamente sobre este campo, en concreto sobre la detección de estas filigranas, de estas marcas de agua en los textos sintéticos, y es un sistema muy ingenioso y además con muy poca exigencia a nivel computacional.

Os dejo el pdf en las notas del episodio, que es muy técnico, pero tiene un pro y un contra, que creo que os puedo resumir. El pro es que funciona con cualquier modelo de texto sintético, es decir, que es agnóstico o que es generalista en este sentido. No tienes que tener un clasificador para cada uno de los diferentes generadores. Simplemente necesitas indicarle una serie de tokens positivos y negativos, que los autores llaman tokens verdes para los positivos y rojos para los negativos, y que son meramente una serie de valores numéricos que los creadores del

modelo hacen público, como esta marca de agua. Pero claro, un humano no puede ver la marca de agua y un sistema estadístico de este estilo si puede, y ahí entra la gracia de este modelo de verdes y rojos. Los valores numéricos en verde se refieren a tokens, a conceptos que van a estar artificialmente inflados dentro del modelo, es decir, a unas formas de escribir, a unas palabras y términos y formas ortográficas y sintácticas, y los rojos unos que van a estar artificialmente

reducidos, de tal forma que, sin saber específicamente qué palabras son, porque son representaciones computacionales de vectores de muchísimos parámetros que por sí solos no significan nada, pero que estadísticamente le permiten detectar la presencia de estos valores verdes y rojos.

Entonces, si un humano escribe un texto de forma natural, deberá escribir utilizando conceptos similares a los verdes y a los rojos, con lo cual, ahí tienes el resultado matemático que indica que ese texto es natural. Y sin embargo, si es sintético, pues vas a encontrar muchísimos más de estos parámetros numéricos verdes que de los rojos, porque, recordemos, unos están inflados y otros están reducidos de forma artificial en ese modelo.

Y ahora, el contra, esta debilidad de este modelo, y es que necesita saber cuáles son esos valores, es decir, necesita conocer el grupo de valores verdes y el grupo de valores rojos, con lo cual, los creadores responsables de este tipo de herramientas, imagino que OpenAI se apuntará a este tipo de arquitectura, la gente de Google, la gente de las grandes universidades y grandes académicos, etcétera, lo harán y pueden publicar esos valores verdes y esos valores rojos sin tener que enseñar su propio

código fuente, su propio modelo, sus propios parámetros, es decir, manteniendo la salsa secreta para que sus rivales o sus competidores no lo conozcan, pero sí pueden saber si un resultado es bueno o malo. Esto es increíblemente importante, no solo para los temas de profesores, para los temas de detección de spam, o de detección de dddd, este tipo de contenido que hemos visto que está empezando a llenar las redes sociales, los blogs, de texto que parece natural pero que

obviamente no lo es y que está generado a ritmos de millones de palabras por minuto. Francamente, no recuerdo un episodio reciente de Mixio en los que las tres primeras noticias me hayan dejado tan buen sabor de boca. Y para seguir un poco con el buen sabor de boca nos vamos a Boeing y NASA que van a desarrollar juntos dos aviones reales con el nuevo concepto de alas de entramados reforzados, que es la mejor traducción que se me ha ocurrido.

En las notas del episodio os dejo enlaces para que lo veáis con vuestros propios ojos, pero os los voy a intentar describir. Son aviones tradicionales de pasajeros pero las alas tienen tres modificaciones comparadas con el avión típico que podemos imaginar. La primera es que no salen desde el centro del fuselaje sino que salen desde la parte de arriba.

Son mucho más finas y alargadas y además están sujetadas, de ahí ese nombre de entramado reforzado, por una especie de segunda ala inferior que se conecta con el ala superior saliendo desde abajo. Queda ahí como un triángulo, con lo cual después de varios años de simuladores, de ordenadores, de maquetas, etcétera, vamos a tener dos aviones, uno de como aproximadamente 80-90 pasajeros y otro algo más grande de unos 100-120 aproximadamente de tamaño, con los que comprobar si las simulaciones, las teorías, etcétera, encajan con las potenciales ventajas

que vayan a tener estos prototipos reales cuando empiecen a surcar los cielos. Y es que se habla de hasta un 30% de reducción de consumo, lo cual podría ser increíble sobre todo si se combina a mayores con mejoras de eficiencia en los motores, mejoras de eficiencia en futuros tipos de combustibles, etcétera.

Así que oye, ilusionante, que no se ha quedado clara mi descripción, os vais a las notas del episodio. Que ahí os dejo los vídeos, imágenes, enlaces, todo lo que queráis para que lo podáis ver por vuestra cuenta. Y por cierto, hablábamos de combustibles de estos aviones, precisamente vamos ahora a contar el patrocinador de esta semana, que es miBP, que sigue manteniendo activos los ahorros, los descuentos, para todos los conductores, todos los oyentes de Mixio.

Y aunque no seáis oyentes de Mixio, también vais a poder ahorrar 10 céntimos por litro cada vez que repostéis en una estación de miBP con los combustibles Ultimate, con tecnología Active, y además acumular un montón de puntos, con lo cual no sólo son los descuentos, sino los regalos. Y para conseguirlo, sólo tenéis que instalar la aplicación de miBP, que ya os lo he comentado muchas veces.

De nuevo, sé que muchos ya la tenéis instalada, pero es que, vuelvo a insistir, es que es muy fácil, es que tardas segundos en descargarla para tu iPhone, para tu Android, etcétera, y cada vez que vayas a repostar, enseñas el código QR para recibir estos 10 céntimos por litro de descuento que, ya sabéis, no hace falta que os saque yo la calculadora, se notan y mucho.

Y hemos empezado el programa con muy buenas noticias, y ahora vamos a unas noticias un poco más regulares. La primera es de Netflix. Y es que parece que en las próximas semanas estas restricciones para compartir cuentas van a expandirse a nivel global y van a ser más duras de lo que pensábamos. Os lo explico, para que una cuenta de Netflix siga funcionando dentro de un dispositivo, cualquier dispositivo, un smartphone, una tablet, una tele, un ordenador, etcétera, ese dispositivo tiene que estar conectado a Netflix y

ver contenido al menos una vez al mes dentro de la misma red Wi-Fi. Pensábamos que esto iba a estar limitado a las teles porque lo dijo la propia Netflix, lo dijeron sus ejecutivos, pero parece que va más allá. Con lo cual, si por ejemplo dentro de tu familia tienes compartido Netflix, como os digo en el boletín, con unos hijos que están estudiando fuera de tu país, pues en cuanto pasen 30 días que no han visto Netflix desde la IP de tu red local, Netflix se les va a bloquear

en su terminal. O por ejemplo, otro caso que se me ocurre, te vas de vacaciones en verano, unas vacaciones un poco largas, te llevas el portátil, los móviles, no sé qué, pero como no estás conectándote a Netflix desde tu IP principal, es posible que Netflix te diga que tú no eres tú y que eres otra persona a la que le ha dejado de forma excesiva, por decirlo así, la clave.

No me queda nada claro cuáles van a ser, digamos, los asteriscos o la manga ancha que vayan a poder ir dando, si habrá algún tipo de notificación, algún tipo de extensión para que el corte no sea abrupto, pero vamos, todas aquellas personas que tengáis las típicas cuentas de Netflix compartidas con los amigos, etcétera, pagándola a medias y que está la misma cuenta en no sé cuántas teles, en no sé cuántos móviles, etcétera, eso literalmente se ha acabado.

O tendréis que comprar estas cuentas satélite, que cuestan un poquito menos, o tendréis que poneros cuentas independientes cada uno. Así que vosotros decidiréis cuál es la mejor opción, porque parece que después de casi 15 años se acaba este, entre comillas, chollo.

Y la otra noticia un poco más negativa que os comentaba, es un cambio de software de GitHub que ha durado yo no sé si minutos u horas, porque casi rompe internet y no lo digo de broma. Cada vez que alguien publica código fuente en GitHub, los servidores de esta plataforma crean dos pequeños ficheros comprimidos con esa nueva versión, o con ese nuevo commit, o con los cambios que haya tenido.

Y cada uno de esos ficheros tiene su propia huella digital, lo que se conoce como su checksum. Entonces en GitHub han decidido cambiar el programa o el sistema con el que creaban esos ficheros, con lo cual cambiaban estas huellas digitales de todos estos archivos. Yo creo que obviamente en GitHub sabían que esto iba a ocurrir, de hecho es así como lo planteaban en su anuncio público, pero creo que no entendieron la gravedad de todo lo que iba a ocurrir después.

Y es que todos estos típicos sistemas de programación, de carga de dependencias, de verificación, de que el software no haya sido modificado y que alguien haya cambiado el binario, alguien ha cambiado algo y te estén intentando hackear o ejecutar código diferente al que tu máquina conocía, han empezado a saltar todas las alarmas y la gente que estaba utilizando cualquiera de los millones de proyectos que hay en GitHub a través de estos sistemas de dependencias o lo que sea, le ha empezado a poner errores y fallos por todas partes, con lo cual han deshecho

rápidamente el cambio y ahora estamos un poco en espera de saber qué es lo que va a ocurrir, porque de verdad que la comunidad de desarrolladores mundial está muy muy muy enfadada, pues seguramente esto acabe teniendo una reacción importante. Y por último, hablamos de Amazon, que hace poco más de un año se gastó más de 120 millones de dólares en comprar unas nuevas oficinas en Silicon Valley,

que son más de ciento y pico mil metros cuadrados, cuatro edificios, un campus no muy moderno, pero para remodelarlo y poner ahí a miles de trabajadores. Bueno, pues ahora han decidido que no lo van a usar, porque tienen tantos trabajadores que están haciendo sus tareas en remoto que no tenía sentido financiero seguir adelante.

Ya habéis visto el cambio, ya digo, en 15-18 meses y que ahora Amazon tiene que vender estos edificios perdiendo dinero, pero al menos se quita un muerto de encima, porque imaginaos, un edificio de oficinas es un gasto terrible de mantenerlo, pero si encima está al 30% de capacidad, porque la gente está desde su casa, pues imagínate qué mala decisión.

Y por cierto, hablando de trabajo remoto, ya sabéis que no me gusta mucho promocionarme en este podcast, pero me gustaría que no os perdierais el nuevo episodio de Terapia de Grupo, que podéis escuchar tanto en podcast como en YouTube, en los que resolvemos los problemas de nuestros oyentes con el trabajo remoto.

Ya sabéis que en Terapia de Grupo la gente nos envía sus propias cartas y sus propias dudas y sus propias indecisiones, y nosotros intentamos darles un poco de ayuda, resolvérselas, etc. Siempre desde el punto de vista, obviamente, del humor. La verdad es que quedan unos episodios muy, muy, muy divertidos, y como este era especial sobre el trabajo remoto, nos lo han patrocinado ni más ni menos que la gente de NVIDIA Broadcast.

Y la verdad es que tanto el episodio como el patrocinio, como todo, ha quedado muy divertido. Y por favor, por favor, por favor, me gustaría muchísimo que os suscribierais en Spotify, en YouTube, en Apple Podcast, en Overcast, donde queráis. Ya sabéis, simplemente tenéis que buscar Terapia de Grupo o pinchar en los enlaces que os dejo al final de las notas del episodio.

Muchísimas gracias a todos por estar conmigo un día más, y nos vemos mañana con más noticias de tecnología.

Episodios recientes

Programas relacionados