
﻿WEBVTT
Kind: captions
Language: es

00:00:00.000 --> 00:00:04.640
Bienvenidos a un nuevo episodio de Mixio, podcast diario de tecnología. Mi nombre es Alex Barredo

00:00:04.640 --> 00:00:10.720
y hoy tengo tantas ganas de ir a las noticias que me voy a saltar hasta la recomendación de que os

00:00:10.720 --> 00:00:15.840
apuntéis al Patreon de Mixio. Pero bueno, ya que os lo cuento, os apuntáis a patreon.com

00:00:15.840 --> 00:00:22.240
barra Mixio. Pero no le dedico más tiempo. Comenzamos con un cambio sísmico directamente

00:00:22.240 --> 00:00:28.960
desde Bruselas y es que la Comisión Europea va a vigilar de cerca a las agencias de protección

00:00:28.960 --> 00:00:37.280
de datos. Esto viene después de una denuncia de un grupo de derechos civiles irlandés ante

00:00:37.280 --> 00:00:44.040
el defensor del pueblo comunitario de la Unión Europea que pedían explicaciones. Oye, ¿qué es

00:00:44.040 --> 00:00:49.680
lo que está haciendo la comisión, este brazo ejecutivo del bloque, para asegurarse que la

00:00:49.680 --> 00:00:56.120
normativa y toda la legislación nacida después del RGPD estaba siendo bien implementada y sobre

00:00:56.120 --> 00:01:03.480
todo bien ejecutada por las agencias nacionales? Como llevamos protestando bastante tiempo en este

00:01:03.480 --> 00:01:09.440
podcast, sobre todo de las agencias de Luxemburgo y especialmente de Irlanda. Ya hemos comentado

00:01:09.440 --> 00:01:18.480
muchas veces la ineficiencia, la lentitud e incluso la opacidad con la que operan en casos

00:01:18.480 --> 00:01:24.440
que duran años las investigaciones y que luego se archivan sin saber muy bien por qué, sin llegar a

00:01:24.440 --> 00:01:31.840
tener un tipo de multa. Es decir, también hay un elemento de semi aleatoriedad en la propia

00:01:31.840 --> 00:01:37.760
ejecución de esta nueva normativa que debería de tener mucho más diente, por decirlo así.

00:01:37.760 --> 00:01:46.800
Entonces, ahora la Comisión Europea, a petición de este ombudsman, va a pedir seis informes cada

00:01:46.800 --> 00:01:53.160
año, es decir, cada dos meses, a cada una de las agencias de protección de datos nacionales. A la

00:01:53.160 --> 00:01:57.720
de España, a la de Irlanda, a la de Francia, a la de Luxemburgo, etcétera, etcétera, etcétera. De tal

00:01:57.720 --> 00:02:05.280
forma que en esos reportes deberán de ir contándole en todo momento cuáles son sus casos de mayor

00:02:05.280 --> 00:02:11.920
envergadura y lo que están tratando. De tal forma que van a estar como si tuvieran al profesor

00:02:11.920 --> 00:02:16.720
mirándoles por encima del hombro mientras hacen los deberes. Es decir, que se ha acabado, como

00:02:16.720 --> 00:02:23.520
digo en el boletín, la siesta. Id preparando las palomitas porque seguramente este sea el cambio que

00:02:23.520 --> 00:02:30.200
necesitaba todos estos engorrosos mecanismos de privacidad para que realmente las compañías se

00:02:30.200 --> 00:02:36.400
pongan las pilas. Entre esto y la entrada en vigor de las nuevas normativas, de la ley de servicios

00:02:36.400 --> 00:02:41.840
digitales, la ley de mercados digitales, etcétera, si yo fuera Facebook, Google, Microsoft, cualquier

00:02:41.840 --> 00:02:47.240
empresa en general de publicidad de Internet, o de tecnología, o grupos industriales, iría empezando

00:02:47.240 --> 00:02:54.400
a contratar muchos, muchos abogados porque se vienen curvas. Siguiente noticia. Hablábamos de

00:02:54.400 --> 00:03:01.400
profesores como metáfora para el caso del RGPD y me viene muy bien esta figura porque la de los

00:03:01.400 --> 00:03:08.280
profesores es quizás una de las más afectadas por sistemas de generación y de creación de texto

00:03:08.280 --> 00:03:14.520
sintético. Les pides un trabajo a tus alumnos tanto de instituto como de primaria como incluso

00:03:14.520 --> 00:03:20.600
de universidad sobre una temática concreta y en vez de escribirlo se van al ordenador y en cuestión

00:03:20.600 --> 00:03:26.280
de segundos tienen un tocho de texto ahí que ni se han leído ni tiene mucho sentido pero que a lo

00:03:26.280 --> 00:03:33.320
mejor cuela. Esto, la popularidad de este tipo de herramientas y la facilidad con la que se pueden

00:03:33.320 --> 00:03:38.640
acceder desde hace unos meses, ha puesto patas arriba muchas universidades y muchos centros

00:03:38.640 --> 00:03:44.560
educativos e incluso ministerios. Hemos explicado aquí que de verdad no debería de haber mayor

00:03:44.560 --> 00:03:50.480
problema porque, por simplificar un poco los términos, invertimos el proceso del modelo que

00:03:50.480 --> 00:03:56.760
genera ese texto, puedes conseguir un modelo alternativo que detecte si ese texto ha podido

00:03:56.760 --> 00:04:01.880
ser generado de forma sintética y esto es precisamente lo que ha hecho OpenAI, los creadores

00:04:01.880 --> 00:04:09.200
de ChatGPT, de GPT-3, de DALI-2, etcétera, que han publicado su propio detector de texto artificial.

00:04:09.200 --> 00:04:16.040
Necesita una longitud aproximada de 150 a 250 palabras, dicen que unos mil caracteres. Funciona

00:04:16.040 --> 00:04:21.480
mejor en inglés que en otros idiomas, esperemos que esto poco a poco vaya evolucionando y sobre

00:04:21.480 --> 00:04:26.960
todo es abierto y es gratuito, con lo cual los profesores de todo tipo lo van a tener muy fácil,

00:04:26.960 --> 00:04:31.760
no van a tener que recurrir a herramientas externas, a herramientas de pago, etcétera. Y entonces este

00:04:31.760 --> 00:04:37.720
detector, o mejor dicho este clasificador, que es como se denomina técnicamente a este tipo de

00:04:37.720 --> 00:04:44.880
herramientas, devuelve una respuesta probabilística entre cinco diferentes grados. Muy poco probable,

00:04:44.880 --> 00:04:53.240
poco probable, dudoso, probable y muy probable. Es decir, que no te dice una nota del 95% porque

00:04:53.240 --> 00:04:59.360
es básicamente imposible, sobre todo como explican los propios ingenieros de OpenAI,

00:04:59.360 --> 00:05:06.720
que en una de las notas del lanzamiento dicen no hemos probado y no hemos medido el rendimiento o

00:05:06.720 --> 00:05:14.360
la tasa de acierto en texto que combina el material sintético y el contenido escrito de forma natural

00:05:14.360 --> 00:05:20.200
o de forma biológica, como queráis decir. De todas formas, no me preocuparía mucho por este

00:05:20.200 --> 00:05:26.280
segundo tipo de texto porque en el caso de los alumnos, si han modificado suficientemente un

00:05:26.280 --> 00:05:31.840
texto como para que no sea detectable, yo creo que han sido capaces de entender, al menos en

00:05:31.840 --> 00:05:37.320
una cierta medida, los conceptos y, digamos, como suelen pedir los profesores, explicarlo con sus

00:05:37.320 --> 00:05:41.720
propias palabras. Así que, oye, muy buenas noticias, que yo personalmente conocía a varios

00:05:41.720 --> 00:05:48.280
profesores que estaban un poco ya alerta. Siguiente noticia es un estudio precisamente

00:05:48.280 --> 00:05:55.560
sobre este campo, en concreto sobre la detección de estas filigranas, de estas marcas de agua en

00:05:55.560 --> 00:06:02.600
los textos sintéticos, y es un sistema muy ingenioso y además con muy poca exigencia a

00:06:02.600 --> 00:06:09.640
nivel computacional. Os dejo el pdf en las notas del episodio, que es muy técnico, pero tiene un

00:06:09.640 --> 00:06:17.240
pro y un contra, que creo que os puedo resumir. El pro es que funciona con cualquier modelo de

00:06:17.240 --> 00:06:24.360
texto sintético, es decir, que es agnóstico o que es generalista en este sentido. No tienes que tener

00:06:24.360 --> 00:06:32.040
un clasificador para cada uno de los diferentes generadores. Simplemente necesitas indicarle una

00:06:32.040 --> 00:06:37.400
serie de tokens positivos y negativos, que los autores llaman tokens verdes para los positivos

00:06:37.400 --> 00:06:45.560
y rojos para los negativos, y que son meramente una serie de valores numéricos que los creadores del

00:06:45.560 --> 00:06:52.200
modelo hacen público, como esta marca de agua. Pero claro, un humano no puede ver la marca de

00:06:52.200 --> 00:06:58.200
agua y un sistema estadístico de este estilo si puede, y ahí entra la gracia de este modelo de

00:06:58.200 --> 00:07:04.240
verdes y rojos. Los valores numéricos en verde se refieren a tokens, a conceptos que van a estar

00:07:04.240 --> 00:07:10.960
artificialmente inflados dentro del modelo, es decir, a unas formas de escribir, a unas palabras

00:07:10.960 --> 00:07:17.360
y términos y formas ortográficas y sintácticas, y los rojos unos que van a estar artificialmente

00:07:17.360 --> 00:07:23.480
reducidos, de tal forma que, sin saber específicamente qué palabras son, porque son

00:07:23.480 --> 00:07:29.200
representaciones computacionales de vectores de muchísimos parámetros que por sí solos no

00:07:29.200 --> 00:07:34.520
significan nada, pero que estadísticamente le permiten detectar la presencia de estos valores

00:07:34.520 --> 00:07:42.080
verdes y rojos. Entonces, si un humano escribe un texto de forma natural, deberá escribir

00:07:42.080 --> 00:07:48.520
utilizando conceptos similares a los verdes y a los rojos, con lo cual, ahí tienes el resultado

00:07:48.520 --> 00:07:54.320
matemático que indica que ese texto es natural. Y sin embargo, si es sintético, pues vas a encontrar

00:07:54.320 --> 00:07:59.480
muchísimos más de estos parámetros numéricos verdes que de los rojos, porque, recordemos,

00:07:59.480 --> 00:08:05.720
unos están inflados y otros están reducidos de forma artificial en ese modelo. Y ahora, el contra,

00:08:05.720 --> 00:08:12.520
esta debilidad de este modelo, y es que necesita saber cuáles son esos valores, es decir, necesita

00:08:12.520 --> 00:08:17.920
conocer el grupo de valores verdes y el grupo de valores rojos, con lo cual, los creadores

00:08:17.920 --> 00:08:24.440
responsables de este tipo de herramientas, imagino que OpenAI se apuntará a este tipo de arquitectura,

00:08:24.440 --> 00:08:30.360
la gente de Google, la gente de las grandes universidades y grandes académicos, etcétera,

00:08:30.360 --> 00:08:36.760
lo harán y pueden publicar esos valores verdes y esos valores rojos sin tener que enseñar su propio

00:08:36.760 --> 00:08:41.880
código fuente, su propio modelo, sus propios parámetros, es decir, manteniendo la salsa secreta

00:08:41.880 --> 00:08:48.360
para que sus rivales o sus competidores no lo conozcan, pero sí pueden saber si un resultado

00:08:48.360 --> 00:08:54.520
es bueno o malo. Esto es increíblemente importante, no solo para los temas de profesores, para los

00:08:54.520 --> 00:09:00.920
temas de detección de spam, o de detección de dddd, este tipo de contenido que hemos visto que

00:09:00.920 --> 00:09:06.480
está empezando a llenar las redes sociales, los blogs, de texto que parece natural pero que

00:09:06.480 --> 00:09:12.240
obviamente no lo es y que está generado a ritmos de millones de palabras por minuto. Francamente,

00:09:12.240 --> 00:09:18.680
no recuerdo un episodio reciente de Mixio en los que las tres primeras noticias me hayan

00:09:18.680 --> 00:09:25.520
dejado tan buen sabor de boca. Y para seguir un poco con el buen sabor de boca nos vamos a Boeing

00:09:25.520 --> 00:09:34.560
y NASA que van a desarrollar juntos dos aviones reales con el nuevo concepto de alas de entramados

00:09:34.560 --> 00:09:40.520
reforzados, que es la mejor traducción que se me ha ocurrido. En las notas del episodio os

00:09:40.520 --> 00:09:45.840
dejo enlaces para que lo veáis con vuestros propios ojos, pero os los voy a intentar describir. Son

00:09:45.840 --> 00:09:53.400
aviones tradicionales de pasajeros pero las alas tienen tres modificaciones comparadas con el avión

00:09:53.400 --> 00:10:00.080
típico que podemos imaginar. La primera es que no salen desde el centro del fuselaje sino que salen

00:10:00.080 --> 00:10:07.360
desde la parte de arriba. Son mucho más finas y alargadas y además están sujetadas, de ahí ese

00:10:07.360 --> 00:10:15.040
nombre de entramado reforzado, por una especie de segunda ala inferior que se conecta con el ala

00:10:15.040 --> 00:10:21.240
superior saliendo desde abajo. Queda ahí como un triángulo, con lo cual después de varios años de

00:10:21.240 --> 00:10:28.560
simuladores, de ordenadores, de maquetas, etcétera, vamos a tener dos aviones, uno de como aproximadamente

00:10:28.560 --> 00:10:35.320
80-90 pasajeros y otro algo más grande de unos 100-120 aproximadamente de tamaño, con los que

00:10:35.320 --> 00:10:41.680
comprobar si las simulaciones, las teorías, etcétera, encajan con las potenciales ventajas

00:10:41.680 --> 00:10:46.720
que vayan a tener estos prototipos reales cuando empiecen a surcar los cielos. Y es que se habla

00:10:46.720 --> 00:10:54.800
de hasta un 30% de reducción de consumo, lo cual podría ser increíble sobre todo si se combina a

00:10:54.800 --> 00:11:02.160
mayores con mejoras de eficiencia en los motores, mejoras de eficiencia en futuros tipos de combustibles,

00:11:02.160 --> 00:11:08.240
etcétera. Así que oye, ilusionante, que no se ha quedado clara mi descripción, os vais a las notas

00:11:08.240 --> 00:11:12.920
del episodio. Que ahí os dejo los vídeos, imágenes, enlaces, todo lo que queráis para que lo podáis

00:11:12.920 --> 00:11:18.480
ver por vuestra cuenta. Y por cierto, hablábamos de combustibles de estos aviones, precisamente vamos

00:11:18.480 --> 00:11:25.080
ahora a contar el patrocinador de esta semana, que es miBP, que sigue manteniendo activos los ahorros,

00:11:25.080 --> 00:11:30.200
los descuentos, para todos los conductores, todos los oyentes de Mixio. Y aunque no seáis oyentes

00:11:30.200 --> 00:11:36.160
de Mixio, también vais a poder ahorrar 10 céntimos por litro cada vez que repostéis en una estación

00:11:36.160 --> 00:11:41.320
de miBP con los combustibles Ultimate, con tecnología Active, y además acumular un montón

00:11:41.320 --> 00:11:46.640
de puntos, con lo cual no sólo son los descuentos, sino los regalos. Y para conseguirlo, sólo tenéis

00:11:46.640 --> 00:11:51.880
que instalar la aplicación de miBP, que ya os lo he comentado muchas veces. De nuevo, sé que muchos

00:11:51.880 --> 00:11:56.200
ya la tenéis instalada, pero es que, vuelvo a insistir, es que es muy fácil, es que tardas

00:11:56.200 --> 00:12:00.840
segundos en descargarla para tu iPhone, para tu Android, etcétera, y cada vez que vayas a repostar,

00:12:00.840 --> 00:12:06.200
enseñas el código QR para recibir estos 10 céntimos por litro de descuento que, ya sabéis,

00:12:06.200 --> 00:12:11.880
no hace falta que os saque yo la calculadora, se notan y mucho. Y hemos empezado el programa con

00:12:11.880 --> 00:12:17.880
muy buenas noticias, y ahora vamos a unas noticias un poco más regulares. La primera es de Netflix. Y

00:12:17.880 --> 00:12:24.400
es que parece que en las próximas semanas estas restricciones para compartir cuentas van a

00:12:24.400 --> 00:12:31.640
expandirse a nivel global y van a ser más duras de lo que pensábamos. Os lo explico, para que una

00:12:31.640 --> 00:12:37.720
cuenta de Netflix siga funcionando dentro de un dispositivo, cualquier dispositivo, un smartphone,

00:12:37.720 --> 00:12:46.240
una tablet, una tele, un ordenador, etcétera, ese dispositivo tiene que estar conectado a Netflix y

00:12:46.240 --> 00:12:54.000
ver contenido al menos una vez al mes dentro de la misma red Wi-Fi. Pensábamos que esto iba a estar

00:12:54.000 --> 00:13:00.640
limitado a las teles porque lo dijo la propia Netflix, lo dijeron sus ejecutivos, pero parece

00:13:00.640 --> 00:13:06.840
que va más allá. Con lo cual, si por ejemplo dentro de tu familia tienes compartido Netflix,

00:13:06.840 --> 00:13:12.280
como os digo en el boletín, con unos hijos que están estudiando fuera de tu país, pues en cuanto

00:13:12.280 --> 00:13:19.760
pasen 30 días que no han visto Netflix desde la IP de tu red local, Netflix se les va a bloquear

00:13:19.760 --> 00:13:25.320
en su terminal. O por ejemplo, otro caso que se me ocurre, te vas de vacaciones en verano, unas

00:13:25.320 --> 00:13:30.080
vacaciones un poco largas, te llevas el portátil, los móviles, no sé qué, pero como no estás

00:13:30.080 --> 00:13:36.760
conectándote a Netflix desde tu IP principal, es posible que Netflix te diga que tú no eres tú y

00:13:36.760 --> 00:13:43.520
que eres otra persona a la que le ha dejado de forma excesiva, por decirlo así, la clave. No me

00:13:43.520 --> 00:13:50.440
queda nada claro cuáles van a ser, digamos, los asteriscos o la manga ancha que vayan a poder ir

00:13:50.440 --> 00:13:56.840
dando, si habrá algún tipo de notificación, algún tipo de extensión para que el corte no sea abrupto,

00:13:56.840 --> 00:14:03.080
pero vamos, todas aquellas personas que tengáis las típicas cuentas de Netflix compartidas con

00:14:03.080 --> 00:14:08.600
los amigos, etcétera, pagándola a medias y que está la misma cuenta en no sé cuántas teles,

00:14:08.600 --> 00:14:13.760
en no sé cuántos móviles, etcétera, eso literalmente se ha acabado. O tendréis que comprar

00:14:13.760 --> 00:14:19.920
estas cuentas satélite, que cuestan un poquito menos, o tendréis que poneros cuentas independientes

00:14:19.920 --> 00:14:25.560
cada uno. Así que vosotros decidiréis cuál es la mejor opción, porque parece que después de casi

00:14:25.560 --> 00:14:32.480
15 años se acaba este, entre comillas, chollo. Y la otra noticia un poco más negativa que os

00:14:32.480 --> 00:14:40.120
comentaba, es un cambio de software de GitHub que ha durado yo no sé si minutos u horas, porque casi

00:14:40.120 --> 00:14:48.080
rompe internet y no lo digo de broma. Cada vez que alguien publica código fuente en GitHub, los

00:14:48.080 --> 00:14:53.760
servidores de esta plataforma crean dos pequeños ficheros comprimidos con esa nueva versión, o con

00:14:53.760 --> 00:14:59.760
ese nuevo commit, o con los cambios que haya tenido. Y cada uno de esos ficheros tiene su propia huella

00:14:59.760 --> 00:15:07.040
digital, lo que se conoce como su checksum. Entonces en GitHub han decidido cambiar el programa o el

00:15:07.040 --> 00:15:13.400
sistema con el que creaban esos ficheros, con lo cual cambiaban estas huellas digitales de todos

00:15:13.400 --> 00:15:18.960
estos archivos. Yo creo que obviamente en GitHub sabían que esto iba a ocurrir, de hecho es así

00:15:18.960 --> 00:15:24.600
como lo planteaban en su anuncio público, pero creo que no entendieron la gravedad de todo lo

00:15:24.600 --> 00:15:30.520
que iba a ocurrir después. Y es que todos estos típicos sistemas de programación, de carga de

00:15:30.520 --> 00:15:37.640
dependencias, de verificación, de que el software no haya sido modificado y que alguien haya cambiado

00:15:37.640 --> 00:15:44.720
el binario, alguien ha cambiado algo y te estén intentando hackear o ejecutar código diferente al

00:15:44.720 --> 00:15:50.440
que tu máquina conocía, han empezado a saltar todas las alarmas y la gente que estaba utilizando

00:15:50.440 --> 00:15:56.040
cualquiera de los millones de proyectos que hay en GitHub a través de estos sistemas de dependencias

00:15:56.040 --> 00:16:01.680
o lo que sea, le ha empezado a poner errores y fallos por todas partes, con lo cual han deshecho

00:16:01.680 --> 00:16:06.280
rápidamente el cambio y ahora estamos un poco en espera de saber qué es lo que va a ocurrir,

00:16:06.280 --> 00:16:12.920
porque de verdad que la comunidad de desarrolladores mundial está muy muy muy enfadada, pues seguramente

00:16:12.920 --> 00:16:20.520
esto acabe teniendo una reacción importante. Y por último, hablamos de Amazon, que hace poco más de

00:16:20.520 --> 00:16:27.840
un año se gastó más de 120 millones de dólares en comprar unas nuevas oficinas en Silicon Valley,

00:16:27.840 --> 00:16:33.520
que son más de ciento y pico mil metros cuadrados, cuatro edificios, un campus no muy moderno,

00:16:33.520 --> 00:16:39.240
pero para remodelarlo y poner ahí a miles de trabajadores. Bueno, pues ahora han decidido que

00:16:39.240 --> 00:16:44.520
no lo van a usar, porque tienen tantos trabajadores que están haciendo sus tareas en remoto que no

00:16:44.520 --> 00:16:50.680
tenía sentido financiero seguir adelante. Ya habéis visto el cambio, ya digo, en 15-18 meses y que

00:16:50.680 --> 00:16:56.480
ahora Amazon tiene que vender estos edificios perdiendo dinero, pero al menos se quita un muerto

00:16:56.480 --> 00:17:01.480
de encima, porque imaginaos, un edificio de oficinas es un gasto terrible de mantenerlo,

00:17:01.480 --> 00:17:08.200
pero si encima está al 30% de capacidad, porque la gente está desde su casa, pues imagínate qué mala

00:17:08.200 --> 00:17:14.760
decisión. Y por cierto, hablando de trabajo remoto, ya sabéis que no me gusta mucho promocionarme en

00:17:14.760 --> 00:17:21.680
este podcast, pero me gustaría que no os perdierais el nuevo episodio de Terapia de Grupo, que podéis

00:17:21.680 --> 00:17:28.760
escuchar tanto en podcast como en YouTube, en los que resolvemos los problemas de nuestros oyentes

00:17:28.760 --> 00:17:35.080
con el trabajo remoto. Ya sabéis que en Terapia de Grupo la gente nos envía sus propias cartas y sus

00:17:35.080 --> 00:17:42.200
propias dudas y sus propias indecisiones, y nosotros intentamos darles un poco de ayuda,

00:17:42.200 --> 00:17:46.640
resolvérselas, etc. Siempre desde el punto de vista, obviamente, del humor. La verdad es que

00:17:46.640 --> 00:17:52.120
quedan unos episodios muy, muy, muy divertidos, y como este era especial sobre el trabajo remoto,

00:17:52.120 --> 00:17:57.960
nos lo han patrocinado ni más ni menos que la gente de NVIDIA Broadcast. Y la verdad es que

00:17:57.960 --> 00:18:03.640
tanto el episodio como el patrocinio, como todo, ha quedado muy divertido. Y por favor, por favor,

00:18:03.640 --> 00:18:10.680
por favor, me gustaría muchísimo que os suscribierais en Spotify, en YouTube, en Apple Podcast, en

00:18:10.680 --> 00:18:16.520
Overcast, donde queráis. Ya sabéis, simplemente tenéis que buscar Terapia de Grupo o pinchar en

00:18:16.520 --> 00:18:21.240
los enlaces que os dejo al final de las notas del episodio. Muchísimas gracias a todos por

00:18:21.240 --> 00:18:33.920
estar conmigo un día más, y nos vemos mañana con más noticias de tecnología.