﻿WEBVTT
Kind: captions
Language: es

00:00:00.000 --> 00:00:07.000
Bienvenidos a un episodio más de monos estocásticos nuestro podcast sobre inteligencia artificial, con Antonio Ortiz, con Matías.

00:00:07.000 --> 00:00:13.000
Fabia, seguimos separados, pero es el último episodio que estamos en continentes distintos.

00:00:13.000 --> 00:00:18.000
La semana que viene, estaré por las España, por la madre patria, ¿cómo estás Antonio?

00:00:18.000 --> 00:00:22.000
Estoy preocupado, Matías, estoy preocupado por dos personas que no me

00:00:22.000 --> 00:00:26.000
dejan dormir, Matías, mi preocupación por ellas, y una de ellas estuvo

00:00:26.000 --> 00:00:32.000
Matías, porque no sé si te has enterado, se ha presentado unas gafas.

00:00:34.000 --> 00:00:35.000
Creo que -- De Apple.

00:00:36.000 --> 00:00:39.000
Ha sido la key nove de Apple, más especial de mi vida porque estaba en en

00:00:39.000 --> 00:00:42.000
la base de la Concagua, digamos, en la cordillera de los Andes se ha

00:00:42.000 --> 00:00:47.000
rodeado de un poquito de nieve, no mucha nieve.

00:00:48.000 --> 00:00:55.000
Y yo estaba con el móvil mirando la gafas por porque me podía la curiosidad de a ver cómo vieron las gafas,

00:00:55.000 --> 00:00:59.000
Claro, el caso es que las gafas no son buenas noticias para ti, Matías.

00:00:59.000 --> 00:01:01.000
Los oyentes ya saben que tú eres un experto en inteligencia artificial,

00:01:01.000 --> 00:01:03.000
porque haces este podcast, eres un experto en Metaverso a los ojos de la

00:01:03.000 --> 00:01:07.000
Unión Europea.

00:01:08.000 --> 00:01:10.000
Como ya has hablado de ese tema.

00:01:10.000 --> 00:01:12.000
Y sin embargo, Apple tira por otro camino.

00:01:12.000 --> 00:01:19.000
Matías, eres la yo doy una persona que me preocupa más que tú ahora mismo Mati, que es Setar Blue.

00:01:21.000 --> 00:01:24.000
Porque le chocaron del Tesla, ¿qué qué o qué pasa?

00:01:24.000 --> 00:01:30.000
Le ha le ha pasado de todo, es que verá, yo tengo una antigua compañera de Wabedia sea que no no sé si sacarla del armario de César.

00:01:30.000 --> 00:01:33.000
César, por lo que me cuesta mucho decir César.

00:01:33.000 --> 00:01:36.000
César me me sería fácil, pero César, pero me cuesta mucho.

00:01:36.000 --> 00:01:40.000
Bueno, Esta compañera no había dicho su nombre, pero es una auténtica

00:01:40.000 --> 00:01:44.000
especialista en en este youtuber, en este creador de contenido, y le ha

00:01:44.000 --> 00:01:48.000
pasado de todo, Mati, lo he compartido con ella, que está ahí un poco

00:01:48.000 --> 00:01:52.000
desconsolada, porque no solo le entró todo el Tessa, ha tenido, bueno,

00:01:52.000 --> 00:01:56.000
pidió atención nueva legislación sobre el bocate de calamares en la

00:01:56.000 --> 00:02:00.000
sexta, se volvió loco con con cuando llovía en Alcalá de Nares creo que

00:02:00.000 --> 00:02:04.000
es, con una cartarilla empezó allí a Blafemar y por último ha hecho

00:02:04.000 --> 00:02:08.000
unas grandes proflamas en contra de la ocupación en un giro del personaje

00:02:08.000 --> 00:02:12.000
que que nadie esperábamos, dice

00:02:12.000 --> 00:02:19.000
que va a botar a los de desocupa, a mí me recordó el tweet de este de todo internet ama al pato que bebe batido, ¿no?

00:02:20.000 --> 00:02:26.000
Lamentamos informar cinco minutos después, lamentamos informar que que el pato con el batido se es nace, ¿no?

00:02:26.000 --> 00:02:35.000
De un trasfondo enorme, porque Con César Blue pasó lo vi, fue muy divertido el el clip de cuando sacó el Tesla y y acabó votando desocupa.

00:02:51.000 --> 00:02:55.000
En fin, el Apple tiene prohibidas las palabras Metaverso inteligencia

00:02:55.000 --> 00:02:59.000
artificial, no las mencionaba nada, pero vamos a empezar con en lo

00:02:59.000 --> 00:03:03.000
clásico, vamos a empezar con nuestro repaso a los lanzamientos y las

00:03:03.000 --> 00:03:07.000
noticias de la semana, porque de nuevo no no no vamos a hablar de

00:03:07.000 --> 00:03:11.000
regulación, pero de nuevo hay gente enfadada con todos estos avances,

00:03:11.000 --> 00:03:18.000
incluso huelga santo.

00:03:18.000 --> 00:03:22.000
Sí, el mundo de la ira empieza a tener problemas sindicales, Matías.

00:03:22.000 --> 00:03:26.000
Y más en dos frente, bastante diferentes por un lado, los moderadores de

00:03:26.000 --> 00:03:30.000
Start, está overflow, está reaching, han empezado a a aprovechar y

00:03:30.000 --> 00:03:34.000
amenazar con con parar, con dejar ese ese ese momento de la moderación,

00:03:34.000 --> 00:03:38.000
alegando que la empresa está perjudicando el propio objetivo, el propia

00:03:38.000 --> 00:03:42.000
misión de la compañía, porque si es de misiones proporcionar un

00:03:42.000 --> 00:03:46.000
depósito de información de alta calidad en forma de pregunta, respuesta,

00:03:46.000 --> 00:03:50.000
bueno, ya sabe con el rollo de Ectar Corpflow, pues claro, a estos

00:03:50.000 --> 00:03:54.000
moderadores han recibido una prohibición, han les han prohibido moderar

00:03:54.000 --> 00:04:04.000
respuestas a estas preguntas de de programadores.

00:04:05.000 --> 00:04:09.000
Echas la respuesta con inteligencia artificial solo por el hecho de serlo.

00:04:09.000 --> 00:04:12.000
Es decir, deberá moderar si esa respuesta incumplen alguna otra norma,

00:04:12.000 --> 00:04:15.000
pero solo por ser inteligencia artificial no las pueden quitar en

00:04:15.000 --> 00:04:19.000
principio bajo el nuevo reglamento.

00:04:19.000 --> 00:04:22.000
Los moderadores no no ven con buenos ojos, yo creo que ven ahí eTISFAC un

00:04:22.000 --> 00:04:25.000
futuro en el que va a haber menos humanos y va a haber menos futuro para

00:04:25.000 --> 00:04:28.000
esta overflow, creo yo también Y y antes de yo, juntarse juntarse una

00:04:28.000 --> 00:04:33.000
huelga, una protesta, Matías.

00:04:34.000 --> 00:04:36.000
Entonces, si, técnicamente, si los obligan a moderar comentarios

00:04:36.000 --> 00:04:38.000
autogenerados, estos son los los primeros empleados que están trabajando

00:04:38.000 --> 00:04:42.000
para las máquinas, ¿no?

00:04:42.000 --> 00:04:48.000
Porque también le están modelando a máquinas, Bueno, pues está está bien una un ángulo de verlo, entonces.

00:04:49.000 --> 00:04:52.000
Sí, sí, bueno de alguna manera hay una resople por ahí creada en el que

00:04:52.000 --> 00:04:55.000
está prohibida participación humana, que solo pueden participar bots,

00:04:55.000 --> 00:04:58.000
pero desde el comienzo de algo algo extraño incomprensible a día de hoy,

00:04:58.000 --> 00:05:04.000
pero un comienzo es

00:05:05.000 --> 00:05:08.000
Esta esta etapa temprana de de, bueno, del boom de la guía generativa

00:05:08.000 --> 00:05:11.000
tiene tiene ramificaciones que son un poco como artísticas, filosóficas,

00:05:11.000 --> 00:05:14.000
Yo pensaba que iba a ser todo mucho más orientado a la productividad,

00:05:14.000 --> 00:05:20.000
pero estamos estamos hablando de todo un poco últimamente.

00:05:20.000 --> 00:05:23.000
¿Quieren quieren más estar enfadados a ver?

00:05:23.000 --> 00:05:27.000
Bueno, hay unos indicados que -- Claro.

00:05:27.000 --> 00:05:31.000
de de Hollywood, Sackenzie On Astra, que, bueno, entre otros muchas cosas,

00:05:31.000 --> 00:05:35.000
no podemos decir que este sea el tema de Chartbeat, ni protagoniza Mathie,

00:05:35.000 --> 00:05:39.000
están negociando con los grandes estudios haciendo discusiones sobre la

00:05:39.000 --> 00:05:44.000
remuneración y los tiempos de la inteligencia artificial.

00:05:44.000 --> 00:05:47.000
Por una parte de las discusiones contractuales con los estudios, sobre todo

00:05:47.000 --> 00:05:50.000
por un tipo de trabajo que quieren asegurarse que que se factura bien, que

00:05:50.000 --> 00:05:53.000
es el de los dobles digitales.

00:05:54.000 --> 00:05:58.000
Por aquí, Es última que ha aparecido mucho, hemos escrito largo y tendido

00:05:58.000 --> 00:06:02.000
sobre ello, desde la princesa ley a al rejuvenecimiento de Havreakson

00:06:02.000 --> 00:06:06.000
Four, que hay unas posibilidades bastante plausibles de que, bueno, no

00:06:06.000 --> 00:06:10.000
veamos a veces a los actores sino los differes de los de los actores, y

00:06:10.000 --> 00:06:14.000
que por tanto, bueno, tú puedes, de alguna manera, a corto o medio plazo,

00:06:14.000 --> 00:06:18.000
que a a medio, que a corto, Sherton Cruise y estás protagonizando o

00:06:18.000 --> 00:06:22.000
rodando una película, pero en realidad estás en tu casa haciendo Meriden

00:06:22.000 --> 00:06:26.000
Dafena, Matías.

00:06:26.000 --> 00:06:31.000
Entonces, claro, aquí puede haber ¿quién va a capturar este valor?

00:06:31.000 --> 00:06:35.000
Pues en principio son derechos de la imagen de los actores y por lo tanto

00:06:35.000 --> 00:06:39.000
tienen que estar contemplada esta posibilidad los contratos y las

00:06:39.000 --> 00:06:43.000
negociaciones salariales, pues pues ahí está el debate, han ido a la huelga, ¿eh?

00:06:43.000 --> 00:06:49.000
Por otros motivos, muchos otros muchos más, pero en este fue una parte de del desacuerdo.

00:06:50.000 --> 00:06:55.000
Esto puede llegar a un futuro distópico en el que siempre sean los mismos actores, ¿no?

00:06:55.000 --> 00:07:02.000
Yo soy una Mónica Beluchis y de este tipo de de actrices y de actores que son míspicos y y he tenido demasiados.

00:07:02.000 --> 00:07:07.000
Yo creo que todo el cine español lo harán Ricardo Darín y Luis Toesar durante toda la eternidad.

00:07:07.000 --> 00:07:09.000
Nunca nos libraremos de ellos.

00:07:09.000 --> 00:07:10.000
Exacto.

00:07:10.000 --> 00:07:14.000
Porque los DeedFace nos reíamos del tema del bigote de Superman, de lo mal

00:07:14.000 --> 00:07:18.000
que estaba el de de Star Wars, pero pero hay algunos muy, muy, muy

00:07:18.000 --> 00:07:24.000
increíbles y esto no va a ser más que que mejorar en el futuro.

00:07:25.000 --> 00:07:31.000
Sí, yo creo que aquí, de hecho, tienes un punto ahí que que creo es importante, que es que si tú ya eres

00:07:31.000 --> 00:07:32.000
un actor o que es

00:07:32.000 --> 00:07:36.000
todo, yo creo que nos pasa solo en en el cine y la serie, también en la

00:07:36.000 --> 00:07:40.000
música o en cualquier creación plástica artística o es un influencer

00:07:40.000 --> 00:07:44.000
famoso, un creador, tiene mucho que ganar y creo que la guía va a

00:07:44.000 --> 00:07:48.000
reforzar tu posición y tu capacidad de monetizar, de amortizar esa fama,

00:07:48.000 --> 00:07:52.000
va a favorecer a los que ya estén instalados, y que estos instalados

00:07:52.000 --> 00:07:56.000
pueden copar más tiempo de atención, más recursos económicos,

00:07:56.000 --> 00:08:03.000
probablemente juega la contra de los los que quieran entrar en estas disciplinas.

00:08:04.000 --> 00:08:06.000
Mira, te voy a dar otro take.

00:08:06.000 --> 00:08:12.000
Elena, mi mujer, ella no se puede dormir, sino es viendo un episodio de Friends, ¿no?

00:08:12.000 --> 00:08:15.000
Pues que vayan generando episodios nuevos de Friends, porque en total los

00:08:15.000 --> 00:08:18.000
actores ya cobran, ya siguen cobrando las regalías, les llega el cheque

00:08:18.000 --> 00:08:21.000
todas las llamadas por detrás de las reposiciones, pues que le sigan

00:08:21.000 --> 00:08:24.000
pagando pero con nuevos episodios, ¿no?

00:08:24.000 --> 00:08:32.000
Y y luego, Álex Barredo, mi compañero de los otros podcast, no puede dormirse sin ver episodios de Futurama.

00:08:32.000 --> 00:08:37.000
Es lo mismo, y más fácil todavía, ni siquiera hay que pagarle a a los a los actores de cada acuerdo.

00:08:37.000 --> 00:08:39.000
solo a los actores de voz, ¿no?

00:08:39.000 --> 00:08:40.000
que -- Increíble.

00:08:40.000 --> 00:08:43.000
De luego veremos en en en los basados haciendo la ciencia una una

00:08:43.000 --> 00:08:46.000
situación pintoresca que le da un giro a a esta situación Matías, Pero

00:08:46.000 --> 00:08:49.000
bueno, no adelantemos, mantengamos ahí a la audiencia interesada porque,

00:08:49.000 --> 00:08:52.000
bueno, ha habido una con con Opera ahí, ha habido cositas, Matías,

00:08:52.000 --> 00:08:59.000
interesantes, y un un doble debate.

00:09:00.000 --> 00:09:04.000
Uno, porque Human Loop, una una web a, entre comillas, filtrado los

00:09:04.000 --> 00:09:08.000
supuestos planes para este año y el que viene de la de la empresa, a

00:09:08.000 --> 00:09:12.000
partir de nuevo de supuestos comentarios de San Germán en su gira europea

00:09:12.000 --> 00:09:16.000
con con desarrolladores.

00:09:17.000 --> 00:09:21.000
No no sé cómo de fiable es esto, Matías, pero bueno, como Asam se le ve

00:09:21.000 --> 00:09:25.000
que le pierde la boca que que es un poco lo que me gusta soltar sus pakes,

00:09:25.000 --> 00:09:29.000
creo que hay una amplia posibilidad de que sea verdad.

00:09:29.000 --> 00:09:31.000
Entonces, ¿qué qué qué es que ha dicho este señor?

00:09:31.000 --> 00:09:34.000
Bueno, lo lo que han filtrado y han y les han obligado a borrar es que

00:09:34.000 --> 00:09:37.000
primero tiene un diagnóstico que están limitados en el crecimiento por

00:09:37.000 --> 00:09:40.000
la falta de GPU, De hecho, en la entrevista que hablamos de Elón, que le

00:09:40.000 --> 00:09:46.000
hizo Wall Street Journal y tal, el propio Elón iba a decir Elón sigue por Dios.

00:09:46.000 --> 00:09:51.000
El propio Elón Max, decía que la que la GPU son más difíciles que comprar, que las drogas.

00:09:52.000 --> 00:09:53.000
Y un tipo de comparativa.

00:09:54.000 --> 00:09:56.000
Hoy ha estado, hoy ha estado tuiteando sobre este tema también.

00:09:56.000 --> 00:10:00.000
Ha dicho que envidia no puede mantener para siempre el monopolio de las

00:10:00.000 --> 00:10:04.000
tarjetas gráficas para entrenar a inteligencia artificiales, así que

00:10:04.000 --> 00:10:09.000
nada, ya está muy tuiteador sobre el tema del señor.

00:10:09.000 --> 00:10:11.000
Pero volvamos a volvamos a Samalman.

00:10:12.000 --> 00:10:16.000
Los supuestos planes ya no están publicados, se se le puede acceder por el

00:10:16.000 --> 00:10:20.000
Wao's Machine, esta web que te recupera versiones de antiguas, de otra cosa

00:10:20.000 --> 00:10:22.000
que llamó Samalman y pidió que lo tirara, ¿no?

00:10:22.000 --> 00:10:24.000
Sí, de hecho, ponele eso.

00:10:24.000 --> 00:10:26.000
Open ahí ha exigido que quite, quite, ¿no?

00:10:26.000 --> 00:10:27.000
Bueno.

00:10:27.000 --> 00:10:33.000
A corto plazo, el el gran reto dicen que es abaratar y y acelerar GPT4, ¿vale?

00:10:33.000 --> 00:10:39.000
Que es básicamente el el gran talón de Aquiles que ellos ven con con el servicio.

00:10:39.000 --> 00:10:46.000
Yo aquí discrepo un poco, creo que la versión con acceso al web, incluso la versión con con plugins, es bastante también mejorable.

00:10:46.000 --> 00:10:49.000
Pero bueno, El el caso es que gran parte del del trabajo que están

00:10:49.000 --> 00:10:52.000
haciendo se se va a centrar ahí, quieren ventanas de contexto más largas

00:10:52.000 --> 00:10:55.000
porque se ve que lo de cloud que el el el modelo competidor de dentro del

00:10:55.000 --> 00:10:58.000
típico, ¿le has hecho le has hecho pupitas y que están un poco

00:10:58.000 --> 00:11:03.000
interesados en eso?

00:11:03.000 --> 00:11:06.000
Tienen dudas con el mundo de los plugins aquí si estoy de acuerdo, que no

00:11:06.000 --> 00:11:09.000
los van a meter en la API, por ejemplo, y que no le ven product más cada

00:11:09.000 --> 00:11:12.000
feed, si es que no los ven.

00:11:12.000 --> 00:11:17.000
Con una salida para el mercado todavía adecuada, madura, con un con un

00:11:17.000 --> 00:11:23.000
valor suficiente, y que tenían también para este año crear una API conectados.

00:11:23.000 --> 00:11:26.000
Si si recuerdas la el debate que tuvimos cuando entrevistamos a la a la

00:11:26.000 --> 00:11:29.000
gente de Lucía, que no de los grandes problemas con los votos que se

00:11:29.000 --> 00:11:32.000
acordaran de todo lo que le habías dicho, y que los programadores tienen

00:11:32.000 --> 00:11:35.000
que buscarse manera de conseguir hacer esto.

00:11:35.000 --> 00:11:38.000
Bueno, pues Sopenhague quiere introducir esto ya disponible dentro de su

00:11:38.000 --> 00:11:41.000
API, manera que sea más fácil para desarrollo de terceros, tener ese

00:11:41.000 --> 00:11:46.000
histórico de conversaciones entre el usuario y el bot.

00:11:46.000 --> 00:11:50.000
Y que la última habilidad de GPT cuatro atención sería a dos mil veinticuatro.

00:11:50.000 --> 00:11:58.000
Es decir, que toda esa parte de poder pasarle imágenes al modelo, de momento, según esta filtración, no lo veríamos lo veríamos todavía.

00:11:59.000 --> 00:12:01.000
Dice que por porque es costoso, ¿no?

00:12:01.000 --> 00:12:05.000
Necesitan más GPU, pero también a lo mejor es posible que no esté listo

00:12:05.000 --> 00:12:09.000
como para lanzarlo al gran público o que no tenga uno de los resultados

00:12:09.000 --> 00:12:14.000
tan prometedores que que ellos habían presentado en sus ejemplos, no sé.

00:12:15.000 --> 00:12:17.000
Él dice que es por tema de de GPU.

00:12:20.000 --> 00:12:26.000
Sabes que ha habido mucho debate últimamente sobre si ha empeorado la calidad de ChagGPT.

00:12:27.000 --> 00:12:35.000
Yo no sé si lo he notado, pero es cierto que he bajado el una marcha de de de de la cantidad de uso que hago de ChagGPT.

00:12:36.000 --> 00:12:37.000
¿A ti te ha pasado?

00:12:38.000 --> 00:12:42.000
No, no, vamos, a lo mejor yo que hago un uso poco sofisticado, de hecho yo,

00:12:42.000 --> 00:12:46.000
el el mayor uso que hago es me gusta mucho un plus y ya lean crewder, que

00:12:46.000 --> 00:12:50.000
viene muy bien para consultarle sobre textos en internet, que te haga

00:12:50.000 --> 00:12:54.000
resúmenes, pero en principio no he notado que se ha, he notado una cosa,

00:12:54.000 --> 00:13:02.000
creo que ha desarrollado un poco de, ¿sabe la presión española Rin Tin Tin?

00:13:03.000 --> 00:13:05.000
Es una expresión un poco viejuna, ¿no?

00:13:05.000 --> 00:13:09.000
Que es como decirte algo con un soniquete que comunica parte de un reproch.

00:13:10.000 --> 00:13:19.000
Preparándolo el episodio de hoy, me estaba preguntando cosas de aprendizaje con refuerzo que hablaremos luego del té de learning, el cool learning.

00:13:19.000 --> 00:13:23.000
Bueno, hay diferentes técnicas para la aprendizaje de correfuerza lo hablaremos luego.

00:13:23.000 --> 00:13:27.000
Y en un par de respuestas, ¿sabes qué?

00:13:27.000 --> 00:13:35.000
Me dice el el GPT cuatro, Pues el té de learning, como te dije antes, como ya te he explicado, pero bueno.

00:13:36.000 --> 00:13:40.000
Te estoy pagando, oye, que si te los de pago, que que este reprocho de que

00:13:40.000 --> 00:13:44.000
como ya te he explicado antes, pues me parece bien idiota que no te enteras.

00:13:45.000 --> 00:13:50.000
Bueno, pues, te doy la fica en Hacket News ha habido debate y ha habido un

00:13:50.000 --> 00:13:55.000
hilo en el que afirman que Openite de alguna forma ha ido truncando las

00:13:55.000 --> 00:14:00.000
capacidades o debilitando GPT4 con alguna actualización.

00:14:00.000 --> 00:14:04.000
En concreto, ¿tú te acuerdas los que pagamos por el ChagGPT Plus, tenemos

00:14:04.000 --> 00:14:08.000
un avatar de de de ChagGPT de color diferente a la versión gratuita, la

00:14:08.000 --> 00:14:12.000
gratuita es verde, Bueno, la de pago empezó siendo negra, pues dicen que

00:14:12.000 --> 00:14:16.000
desde que cambiaron a morado creo que es, de la bandera de gran morado, El

00:14:16.000 --> 00:14:20.000
morado es peor, ¿no?

00:14:20.000 --> 00:14:24.000
Que antes resolvía problemas de, pues, de programación bastante complejo,

00:14:24.000 --> 00:14:28.000
sin esfuerzo, quedaba puestas más matizadas, más reflexivas, y que ahora

00:14:28.000 --> 00:14:32.000
incluso se inventa líneas de código, que no se sabe dónde salen o que

00:14:32.000 --> 00:14:36.000
les faltan algunas líneas, que aparecen que son diferentes de repente,

00:14:36.000 --> 00:14:40.000
como que han lobotomizado en un proceso de actualización al GPT cuatro,

00:14:40.000 --> 00:14:45.000
que es el modelo más potente que tienen.

00:14:45.000 --> 00:14:46.000
Que es el de pago, ¿no?

00:14:46.000 --> 00:14:50.000
Bueno, aquí hay hay una cosa que en el propio informe inicial que

00:14:50.000 --> 00:14:54.000
publicaron no lo iba a llamar paper porque no no aplicaba todo en

00:14:54.000 --> 00:14:58.000
realidad, el propio informe de GPT cuatro reconocía que la etapa última

00:14:58.000 --> 00:15:02.000
del entrenamiento de modelo, que es la de aprendizaje, por refuerzo con

00:15:02.000 --> 00:15:06.000
con feedback humano, se perdía precisión y se perdía, bueno, que llaman

00:15:06.000 --> 00:15:15.000
calibración del del del modelo, es decir que daba peores respuestas.

00:15:15.000 --> 00:15:18.000
Claro, el modelo en sus primeras fases no se está reentrenando, ya sabemos

00:15:18.000 --> 00:15:21.000
todo eso de que hasta dos mil, el data set es hasta dos mil veintiuno y

00:15:21.000 --> 00:15:24.000
todo esto que sabemos ya de de GPT cuatro, pero sí sabemos que que esta

00:15:24.000 --> 00:15:27.000
parte de refuerzo confitad humano sí se mantiene, es decir, si encuentran

00:15:27.000 --> 00:15:30.000
que han hackeado a través de un prom y hace cosas que no quiere que se

00:15:30.000 --> 00:15:37.000
haga, pues lo corrigen.

00:15:39.000 --> 00:15:46.000
Que si el GPT4 te responde cualquier cosa que consideren tóxica, inadecuada bla bla bla bla, lo corrige.

00:15:47.000 --> 00:15:51.000
Entonces, en este aumento de las correcciones es posible que estén

00:15:51.000 --> 00:15:56.000
penalizando pues sí que estén paralizando el rendimiento general del modelo, ¿no?

00:15:57.000 --> 00:16:01.000
No sé una manera de medirlo, aparte de impresiones, pero pero prousible es.

00:16:02.000 --> 00:16:05.000
Bueno, también puede ser que la gente ahora que está usando los plugins

00:16:05.000 --> 00:16:08.000
que está disponible en todo el mundo, la verdad es que es una cosa muy

00:16:08.000 --> 00:16:11.000
rudimentaria, como comentábamos en el episodio anterior, lo de los

00:16:11.000 --> 00:16:14.000
plugins, son son muy lentos, o sea, la búsqueda del internet

00:16:14.000 --> 00:16:17.000
increíblemente lenta y y puede ser que simplemente la gente esté

00:16:17.000 --> 00:16:24.000
desencantada con con algunas respuestas.

00:16:25.000 --> 00:16:26.000
No lo sé, no lo sé.

00:16:26.000 --> 00:16:31.000
La verdad es que GPT4 se las tiene que ver con, por ahora, con Google, ¿no?

00:16:31.000 --> 00:16:34.000
Que ya está, la gente está pudiendo probar sus sus cositas y dicen que

00:16:34.000 --> 00:16:37.000
hace que la experiencia de Google se haga más lenta a lo que ya

00:16:37.000 --> 00:16:41.000
sospechábamos desde un principio, ¿no?

00:16:41.000 --> 00:16:44.000
Pero es que además también se las tienen que ver con Cloud.

00:16:44.000 --> 00:16:46.000
Lo que comentamos antes de Altropic, ¿no?

00:16:46.000 --> 00:16:55.000
Porque en algunas tareas creativas pondremos algún enlace en la descripción del video, ya se está viendo que supera gente de cuatro.

00:16:56.000 --> 00:16:57.000
Vamos a ver, vamos a ver.

00:16:57.000 --> 00:17:01.000
Mientras hay otros usuarios que están después contento con GPT4 pero por

00:17:01.000 --> 00:17:05.000
distintos motivos, y ese es el caso, bueno, hay hay un artículo que que

00:17:05.000 --> 00:17:09.000
traíamos el guión que es de Sabadell, y que recoge una tendencia, bueno,

00:17:09.000 --> 00:17:13.000
no sé si preocupante, no sé si, no sé cómo cómo calificar la matic es

00:17:13.000 --> 00:17:17.000
la gente que está usando GPT4 como terapeuta, como psicólogo, como como

00:17:17.000 --> 00:17:25.000
para hacer terapia Matías.

00:17:25.000 --> 00:17:27.000
Sí, sí, sí, no, esto además.

00:17:27.000 --> 00:17:32.000
Si usas Twitter habrás visto algún hilo en Twitter de gente.

00:17:32.000 --> 00:17:35.000
Por ejemplo, había uno que decía, hacer terapias caro.

00:17:35.000 --> 00:17:37.000
Cuesta más de ciento cincuenta dólares la hora.

00:17:37.000 --> 00:17:41.000
Afortunadamente puedes convertir el ChagGPT en un terapeuta gratuito.

00:17:41.000 --> 00:17:44.000
Aquí te mostramos cómo usar ChagGPT para mejorar tu salud mental.

00:17:44.000 --> 00:17:45.000
A mí esto me de horrorizo.

00:17:46.000 --> 00:17:52.000
Pero a ver, Antonio, cuéntame, ¿se puede usar o no GPT4 para cuestiones de salud mental?

00:17:53.000 --> 00:17:57.000
Claro, el el punto es que se me han ofertado la historia de este usuario

00:17:57.000 --> 00:18:01.000
llamado Mark, nombre inventado, utilizaba ChagPT realmente como en su

00:18:01.000 --> 00:18:06.000
terapeuta durante meses, ¿vale?

00:18:07.000 --> 00:18:11.000
Bueno, encontró eso que vemos mucho en en los chatbots especialmente en

00:18:11.000 --> 00:18:15.000
este, que es las respuestas con empatía, la paciencia infinita,

00:18:15.000 --> 00:18:19.000
recomendaciones que Mark encontraba útiles, pero llegó un momento en que

00:18:19.000 --> 00:18:23.000
empezó a notar que el que el ChagPT pues ya no ya no le respondía cuando

00:18:23.000 --> 00:18:30.000
traía temas intentitos o o fuertes, ¿no?

00:18:30.000 --> 00:18:33.000
Y siempre le decía, baitei búscate un psicólogo, ¿no?

00:18:33.000 --> 00:18:38.000
De nuevo aquí vemos en la mano de Openi, que ha metido, claro, el refuerzo

00:18:38.000 --> 00:18:43.000
de, ante este tipo de respuestas, no no respondo lo que te diga lo que has

00:18:43.000 --> 00:18:48.000
aprendido por el término del data set, responder estas estas otras cosas, ¿no?

00:18:48.000 --> 00:18:53.000
Entonces claro, lo la aporta voz de de opina ahí que que no se ha

00:18:53.000 --> 00:18:58.000
realizado nada ningún cambio en la política de salud mental, pero que está claro.

00:18:58.000 --> 00:19:01.000
O sea, GPT no fue entrenado para esto, ni para ayuda emocional, ni para ser

00:19:01.000 --> 00:19:04.000
terapeuta, y que las personas tienen que tener cuidado cuando cuando hagan

00:19:04.000 --> 00:19:09.000
estos estos manejos.

00:19:09.000 --> 00:19:13.000
El caso es que hay empresas que están planteando proyectos de startup

00:19:13.000 --> 00:19:17.000
basadas en la terapia a través de de chatbots, incluso en algunas líneas

00:19:17.000 --> 00:19:22.000
de ayuda contra, ¿no?

00:19:22.000 --> 00:19:31.000
De de de trastornos alimentarios, se están integrando chatbots que volvemos al problema casi el pecado original de estos tipos de modelos, ¿no?

00:19:31.000 --> 00:19:33.000
Que es que alucinan, inventan cosas, no puedes controlar exactamente lo que

00:19:33.000 --> 00:19:35.000
dicen, al final te pueden dar un consejo totalmente erróneo, totalmente

00:19:35.000 --> 00:19:39.000
contraproducente, ¿no?

00:19:39.000 --> 00:19:43.000
Entonces, claro, la situación es, el cuadro completo es, es decir,

00:19:43.000 --> 00:19:47.000
creo que cosa que pasa es que tú y yo tenemos como un uso muy pragmático,

00:19:47.000 --> 00:19:51.000
muy utilitarista, de Chagé PT, y al ser un chatbotas, hacer una interfaz

00:19:51.000 --> 00:19:55.000
de chat, hay muchísima gente que lo está usando para hablar, simplemente

00:19:55.000 --> 00:19:59.000
porque a lo mejor necesitan desahogarse y con mi contarle cosas aunque sea

00:19:59.000 --> 00:20:06.000
a una máquina que de alguna manera te te esté respondiendo.

00:20:07.000 --> 00:20:11.000
Y no me extraña que esto sea polémico porque bueno ya ya ya ya un equipo

00:20:11.000 --> 00:20:15.000
de debate cuando hablamos de de temas de diagnóstico médico no puede

00:20:15.000 --> 00:20:21.000
imaginen de diagnóstico de problemas de salud mental, ¿no?

00:20:21.000 --> 00:20:24.000
Que son tan tan peligrosos y que pueden llevar

00:20:24.000 --> 00:20:27.000
a ciertas, a ciertos actos dañinas, ¿no?

00:20:27.000 --> 00:20:30.000
Entonces, es complicado es un tema muy complicado, pero yo creo que la

00:20:30.000 --> 00:20:33.000
gente va a seguir intentando usar esto para eso, a menos que directamente

00:20:33.000 --> 00:20:38.000
capen la posibilidad de de usarlo como terapeuta.

00:20:39.000 --> 00:20:43.000
Bueno, Mathie, ahí quizás tú podrías pedir algún consejo a HGPT,

00:20:43.000 --> 00:20:47.000
porque puedes consultarle soy un experto en beta verso, que es de arte

00:20:47.000 --> 00:20:52.000
oficial, sin embargo Tinkook no no es a favor de nada de eso, ¿no?

00:20:52.000 --> 00:20:54.000
Y no, y y Apple ¿no?

00:20:54.000 --> 00:21:00.000
Arrollando con su poderío de comunicación, marketing, qué atracción, me está dejando fuera de del mercado, ¿qué qué hago, no?

00:21:00.000 --> 00:21:03.000
Yo creo que ahí puede puede dar de un buen consejo, Mathel.

00:21:03.000 --> 00:21:05.000
Tendré que pasarme a la computación espacial, ¿no?

00:21:05.000 --> 00:21:07.000
Que es como le llaman.

00:21:07.000 --> 00:21:08.000
computación espacial.

00:21:09.000 --> 00:21:10.000
Yo a eso no lo podemos conseguir, ¿eh?

00:21:10.000 --> 00:21:12.000
Computación espacial.

00:21:13.000 --> 00:21:18.000
Por cierto, cuando estaba leyendo sobre este tema de terapia y GPT4 me me

00:21:18.000 --> 00:21:23.000
puse a investigar que no no se me había ocurrido, si GPT4 cree entre

00:21:23.000 --> 00:21:28.000
comillas, en pseudociencia, ¿no?

00:21:28.000 --> 00:21:32.000
El plan, si le digo mis signos zodiacal o si le pregunto por por alguna

00:21:32.000 --> 00:21:36.000
cosa un poco menos científica que responde y claro se habrá sido

00:21:36.000 --> 00:21:40.000
entrenado con un montón de textos que creen en esto y, por ejemplo, le

00:21:40.000 --> 00:21:46.000
digo, soy cáncer, ¿qué significa?

00:21:46.000 --> 00:21:52.000
Pues me contesta, significa que es más emocional, intuitivo, protector, que que tienen más cambios de humor, que decir, más filativo.

00:21:53.000 --> 00:22:00.000
Y la verdad, esto esto depende de quién le preguntes, puede ser una respuesta complicada.

00:22:01.000 --> 00:22:02.000
Sí, sí, sí, sí, sí.

00:22:02.000 --> 00:22:03.000
Bueno.

00:22:05.000 --> 00:22:11.000
Ahora que en este podcast de Insurgentes lo mencionamos, no no puede ser que opinaíto tome medidas en el asunto Matías.

00:22:12.000 --> 00:22:16.000
Pero mientras opinaíto toma medidas o no, yo te invito a que discutamos

00:22:16.000 --> 00:22:20.000
dos casos importante, relevante, de materiales de puerta grande o enfermería.

00:22:30.000 --> 00:22:33.000
Te traigo uno mate, que yo creo que a ti te va a gustar porque tiene que

00:22:33.000 --> 00:22:36.000
ver con los medios de comunicación y una labor parecida a la a la tuya

00:22:36.000 --> 00:22:39.000
que rejuvenecen, buscan acceder a que los jóvenes se acerquen y se

00:22:39.000 --> 00:22:45.000
interesen por la noticia y la actualidad.

00:22:46.000 --> 00:22:50.000
Un periódico sueco hace que la IA rapee los artículos.

00:22:50.000 --> 00:22:58.000
Atención, puede ser la integración más interesante, claro, el el nombre del periódico Aston Vlavet.

00:22:59.000 --> 00:23:03.000
Porque se comprende que un boomer quiere acercarse a a los jóvenes se pone a rapear.

00:23:03.000 --> 00:23:04.000
Es que

00:23:04.000 --> 00:23:08.000
es el momento York y Hurtado tío, ¿tú lo has visto alguna vez del El ratio de Jordy Hurtado.

00:23:08.000 --> 00:23:09.000
Jordy Hurtado.

00:23:09.000 --> 00:23:10.000
Jordy Hurtado.

00:23:10.000 --> 00:23:11.000
No, es claro.

00:23:11.000 --> 00:23:16.000
Si tú rapias las noticias, Matías, los jóvenes se acercan, es lo que faltaba, era el salto.

00:23:18.000 --> 00:23:19.000
No, no, no, no, de verdad.

00:23:19.000 --> 00:23:23.000
Siempre, siempre -- La guía abre muchas puertas, Matías, tú puedes decir, ¿no?

00:23:23.000 --> 00:23:29.000
Ejemplo, alguien puede llegar a Jim Modo esa web de la que tú escribes y coger varias versiones, ¿no?

00:23:29.000 --> 00:23:33.000
Como cuéntame la noticia en como si fuera el romancero o podemos también

00:23:33.000 --> 00:23:37.000
la noticia siempre, pero cantando la canción de la cucaracha, es decir,

00:23:37.000 --> 00:23:41.000
estamos muy cerca de conseguir estos estos logros, Matías, pero bueno,

00:23:41.000 --> 00:23:48.000
aquí la propuesta de los suecoses es el rapeo, ¿no?

00:23:48.000 --> 00:23:50.000
Es el la música urbana maticas.

00:23:50.000 --> 00:23:56.000
Seguro que les ha funcionado y que se han acercado a los jóvenes, aunque sea para ser objeto de burlas, ¿no?

00:23:57.000 --> 00:23:59.000
¿Qué más tenemos en puerta grande o en enfermería?

00:24:00.000 --> 00:24:04.000
Vale, pues te te pasaré una imagen, Matías, porque en Corea del Sur,

00:24:04.000 --> 00:24:08.000
atención hará en el propio envase de las ensaladas, estas ensaladas que

00:24:08.000 --> 00:24:12.000
vienen ya, pues, en su en su paquetito, que vienen ya para abrir y y

00:24:12.000 --> 00:24:16.000
consumir, hay una marca que está diciendo que su ensalada está

00:24:16.000 --> 00:24:20.000
recomendada por ChagGPT.

00:24:22.000 --> 00:24:26.000
Hay un cerdito comiéndose la ensalada en la carátula, ¿me entiende?

00:24:27.000 --> 00:24:31.000
Y en el techo, he usado lo de Google Lens para para intentar traducir

00:24:31.000 --> 00:24:35.000
porque en en Reddit ponía pues eso, mini salada, gerty topping, bueno, la

00:24:35.000 --> 00:24:41.000
traducción que mandaba a esta, ¿no?

00:24:42.000 --> 00:24:46.000
Y que tenían Pegin de Garden, bueno, la traducción del coreano no no la

00:24:46.000 --> 00:24:50.000
puedo garantizar, pero aparecía claramente que esa ensalada está

00:24:50.000 --> 00:24:54.000
recomendada por Charge PT, y yo he pensado que que puede ser Charge PT el

00:24:54.000 --> 00:24:58.000
nuevo Carlos Ríos, Matías.

00:25:00.000 --> 00:25:08.000
Bueno, pues, puede ser, puede ser, pero cuidado por como no se apuntan aquí también la las ciudades que recomienda ChagePT visitar, ¿no?

00:25:08.000 --> 00:25:12.000
Porque una vez le pregunté que era mejor visitar, si fue en Girola o o o

00:25:12.000 --> 00:25:16.000
Málaga creo que que le dije y no se mojaba, no se mojaba, decía que las

00:25:16.000 --> 00:25:20.000
dos tenían sus y sus desventajas, me imagino, las campañas estas

00:25:20.000 --> 00:25:25.000
institucionales de publicidad.

00:25:25.000 --> 00:25:26.000
Sí.

00:25:26.000 --> 00:25:31.000
Para, diciendo, ya GPT recomienda visitar la cariguela o

00:25:31.000 --> 00:25:35.000
lo veo Matías a la entrada de cada pueblo una rotonda nueva.

00:25:36.000 --> 00:25:38.000
Recomendado por Chage PT.

00:25:41.000 --> 00:25:43.000
Los boliche recomendado por Chage PT.

00:25:43.000 --> 00:25:44.000
Me gusta, me gusta.

00:25:44.000 --> 00:25:45.000
Carta me estación.

00:25:47.000 --> 00:25:52.000
Bueno, con Chaja me te habla bien de todo, nunca se mete con nadie, pues, recomienda Chaha repetida por supuesto.

00:25:54.000 --> 00:25:58.000
Bueno, ¿quieres que hablemos de del gran revés de tu vida profesional?

00:25:58.000 --> 00:26:00.000
Es decir, que la presentación de Apple

00:26:00.000 --> 00:26:03.000
que algo tendremos que comentar.

00:26:04.000 --> 00:26:08.000
Porque no sé si no nos vamos a meter mucho en el tema de las gafas,

00:26:08.000 --> 00:26:12.000
seguramente use algo de inteligencia artificial a la hora de de predecir

00:26:12.000 --> 00:26:16.000
lo que tú quieres clicar por decirlo de alguna forma, porque tiene una

00:26:16.000 --> 00:26:20.000
una serie de sensores, pero también tiene pues un software que que va

00:26:20.000 --> 00:26:28.000
intentando predecir dónde quieres dirigir la mirada y dónde quieres pulsar.

00:26:28.000 --> 00:26:33.000
Pero Apple no ha mencionado la palabra y habla para la inteligencia

00:26:33.000 --> 00:26:38.000
artificial en toda la el evento de de apertura del WWF, y y creo que es

00:26:38.000 --> 00:26:43.000
adrede, porque sí usan aprendizaje automático machine learning, porque

00:26:43.000 --> 00:26:48.000
tienen un montón de funciones de software y de herramientas que utilizan

00:26:48.000 --> 00:26:53.000
aprendizaje automático desde el tema de las fotos hasta el auto corrector

00:26:53.000 --> 00:26:58.000
del iPhone ¿no?

00:26:58.000 --> 00:27:01.000
¿Cuántos memes y y y virales hemos visto del auto un colector del iPhone,

00:27:01.000 --> 00:27:04.000
pues es una función que usa machine learning y que ha mejorado pues eso a

00:27:04.000 --> 00:27:09.000
base de de refuerzo y de entrenamientos.

00:27:09.000 --> 00:27:13.000
Además, la última versión del teclado del autocorrector se basa en en un

00:27:13.000 --> 00:27:17.000
modelo Transformers, o sea, esto es del de lo que hablamos todas las

00:27:17.000 --> 00:27:22.000
semanas en buenos estocástico, solo que Apple no lo llama inteligencia artificial.

00:27:22.000 --> 00:27:26.000
Qué bueno, tengo un amigo programador que esto él ya lo decía hace años.

00:27:26.000 --> 00:27:33.000
No, es inteligente artificial, es aprendizaje automático, o son redes neuronales, o sea, no sé qué hace cuánto.

00:27:33.000 --> 00:27:35.000
Pues Apple desde esa escuela.

00:27:35.000 --> 00:27:40.000
Yo creo que el par de es porque no no les gusta un término que que que le mole a otro, ¿no?

00:27:40.000 --> 00:27:42.000
Son como muy muy especiales para esto, ¿no?

00:27:42.000 --> 00:27:49.000
Javier la Corte tiene un tema en Chataca que que que lo explica muy muy bien y que a Félix les gusta empujar, ¿no?

00:27:49.000 --> 00:27:55.000
De hablar de la resolución, la pantalla haya retina, y con con todos estos temas se está haciendo algo similar, ¿no?

00:27:55.000 --> 00:28:01.000
Entonces, vamos pues que que la haya bueno, hay hay otro factor también, ¿no?

00:28:01.000 --> 00:28:03.000
Que que la guía está un poco oculta.

00:28:03.000 --> 00:28:07.000
Es decir, que la guía mejora las aplicaciones y los servicios, pero no te

00:28:07.000 --> 00:28:11.000
pone a apelar a interactuar directamente como como interactuamos con

00:28:11.000 --> 00:28:17.000
ChagePT, con Be, con Pepper Playsity, con Lucía o con cualquiera de estos otros, ¿no?

00:28:17.000 --> 00:28:20.000
Bueno, yo creo que la la hemos comentado en otra ocasión, Apple puede

00:28:20.000 --> 00:28:23.000
tener paciencia porque mientras mantenga el iPhone y como la siguiente

00:28:23.000 --> 00:28:26.000
gran como la gran plataforma que actualmente se usa para acceder a

00:28:26.000 --> 00:28:32.000
productos y servicios digitales, pues sigue facturando el treinta por ciento.

00:28:32.000 --> 00:28:35.000
Que es el impuesto que tiene la App Store.

00:28:35.000 --> 00:28:45.000
Y si esto de del de las gafas de de realidad, extendida, realidad aumentada, bueno, se puede llamar de muchas maneras, ¿no?

00:28:45.000 --> 00:28:49.000
Pero pero bueno, que es realidad virtual, real aumentada, Si si esto se

00:28:49.000 --> 00:28:53.000
convierte en en el siguiente interfaz entre el usuario y el servicio,

00:28:53.000 --> 00:28:58.000
podrá seguir facturando el treinta por ciento a toda la industria digital.

00:28:58.000 --> 00:29:00.000
Hecho, la aplicación de Chartbeat en iPhone.

00:29:01.000 --> 00:29:07.000
Si contratas la suscripción desde la tienda de Apple, te cuesta lo mismo que desde la web, pero un treinta por ciento se los llevaba Apple.

00:29:07.000 --> 00:29:11.000
Eso ya es la señal de que Apple va a seguir, de alguna manera, en una

00:29:11.000 --> 00:29:15.000
posición bastante tranquila, bastante privilegiada y que no y que uno

00:29:15.000 --> 00:29:20.000
tiene que tampoco que volvérselo acá a sacar un modelo, sacar un voto, lo que sea.

00:29:20.000 --> 00:29:24.000
Bueno, yo yo he escrito un error quinientos, si alguno de los oyentes se se

00:29:24.000 --> 00:29:28.000
quiere pasar, porque creo que toda esta toda esta situación de de cuál

00:29:28.000 --> 00:29:32.000
va a ser la siguiente gran plataforma tecnológica, creo que es muy

00:29:32.000 --> 00:29:36.000
interesante ver el camino de la ida por un lado y el camino de la de esta

00:29:36.000 --> 00:29:40.000
visión pro, de estas gafas por otro.

00:29:40.000 --> 00:29:49.000
Bueno, mucha gente he visto tu tu artículo y tienes tienes razón en una cosa, y no voy a spoilear el artículo para que la gente vaya a leerla, pero

00:29:49.000 --> 00:29:50.000
A spoilear.

00:29:50.000 --> 00:29:55.000
Tienes razón en una cosa y es que el iPhone era una podríamos decir una

00:29:55.000 --> 00:30:00.000
iteración genial sobre algo que ya usaba todo el mundo, que era el el

00:30:00.000 --> 00:30:05.000
teléfono y ya había teléfonos con aplicaciones, pero esto es algo

00:30:05.000 --> 00:30:12.000
completamente nuevo que nadie necesita comprar, ¿no?

00:30:12.000 --> 00:30:16.000
Es algo que nos quieren convencer de que es el futuro.

00:30:16.000 --> 00:30:25.000
Y es cierto que la gente que lo ha probado como Ángel Jiménez o brasero del de la vanguardia o Y

00:30:25.000 --> 00:30:27.000
más de chico, pero y rojo que hace vídeos.

00:30:27.000 --> 00:30:29.000
Toda barcas y todo el mundo del arte.

00:30:29.000 --> 00:30:33.000
Impresionado, impresionado con la demo de la gafas.

00:30:33.000 --> 00:30:37.000
Así que nada, tenemos hoy ir a esta, tenemos que hoy ir a Estados Unidos,

00:30:37.000 --> 00:30:41.000
gastarnos tres mil quinientos dólares más IVA, y y probarla por nuestra

00:30:41.000 --> 00:30:46.000
cuenta, o esperar a que llegue, no sé si este modelo fue el siguiente a espanñita.

00:30:46.000 --> 00:30:50.000
Nada, yo a mi mi plan es seguir siendo único de Ángel Jiménez de aquí, que nos regresa también.

00:30:50.000 --> 00:30:51.000
¿Cuándo hay cuándo?

00:30:52.000 --> 00:30:54.000
Que venga a España y se traiga la gafas, ya.

00:30:55.000 --> 00:30:56.000
Lo intentaremos coger, ¿no?

00:30:57.000 --> 00:31:03.000
Bueno, sí, es le pasa lo mismo que la guía, tienes que crear un nuevo hábito cuando antes no lo había, ChagGPT lo ha conseguido.

00:31:03.000 --> 00:31:11.000
Sí, está claro, está en millones de usuarios usando ChagGPT a diario, y que eso es un reto para para la visión pro, ¿no?

00:31:11.000 --> 00:31:19.000
De que no había un momento ni una costumbre de usar gafas, de realidad virtual, etcétera, vendida, aumentada, como lo queremos llamar, ¿no?

00:31:19.000 --> 00:31:23.000
Entonces, bueno, el reto, el reto lo tienen ahí, a mí gusta también la

00:31:23.000 --> 00:31:27.000
la Review de primeras impresiones de Mark eat, de Rowling, porque lo he

00:31:27.000 --> 00:31:31.000
visto bastante ponderado, bastante bastante ajustado, y bueno, Creo que

00:31:31.000 --> 00:31:35.000
hay muchos meses, esto es han presentado con con mucho tiempo y sabía que

00:31:35.000 --> 00:31:42.000
tiene un poquito un poquito de prisa.

00:31:42.000 --> 00:31:49.000
Antonio, yo tengo muchas ganas Vamos a dejar a Apple porque seguramente comentaremos más cosas en los siguientes episodios, pero tengo mucho

00:31:49.000 --> 00:31:50.000
Escuchen Cupertino.

00:31:51.000 --> 00:31:59.000
Tengo muchas ganas de, bueno, a Cupertino dice, viene Ángel, de hecho al al inicio de Cupertino así que estará interesante seguro.

00:31:59.000 --> 00:32:03.000
Tengo mucha ganas de que me cuentes, porque nos han mandado mucho una

00:32:03.000 --> 00:32:07.000
noticia, que era un pedazo de clickbait importante, que era drop military

00:32:07.000 --> 00:32:11.000
estadounidense controlado por una hija, mató a su operador durante una

00:32:11.000 --> 00:32:18.000
prueba y luego te metes a leer y no tienes nada que ver.

00:32:18.000 --> 00:32:19.000
El dinero

00:32:20.000 --> 00:32:23.000
ha sido ha sido un desastre mediático, Matías.

00:32:23.000 --> 00:32:29.000
Fue un desastre, pico gente de medios con mucha audiencia y con algunos de prestigio, ¿no?

00:32:29.000 --> 00:32:35.000
Pico de guardia, Pico Vice, Media Pico Business Insider, en España todos

00:32:35.000 --> 00:32:41.000
estos periódicos deportivos que dan cualquier cosa que da un vino pite

00:32:41.000 --> 00:32:49.000
picaron todos, alguno de prestigio como el confilodio, pero creo que no, no, muy bien.

00:32:49.000 --> 00:32:53.000
Y es uno de esos temas que cuando aquellos en medios están golosos,

00:32:53.000 --> 00:32:57.000
están, sabe que esto va a funcionar, esto va a estar leído, es una

00:32:57.000 --> 00:33:01.000
bomba, es un tema interesante, pero que a veces necesitas ese sentido

00:33:01.000 --> 00:33:05.000
arácnido ese esa intuición de decir esto es demasiado, no va a decir

00:33:05.000 --> 00:33:09.000
bueno porque más como una noticia de haber muerto una persona, pero es un

00:33:09.000 --> 00:33:13.000
tema demasiado jugoso, demasiado directo y claro, como para que fuera para

00:33:13.000 --> 00:33:19.000
que fuera verdad, ¿no?

00:33:19.000 --> 00:33:24.000
Y que si lo pensamos un poco desde la especialización, vería que que no,

00:33:24.000 --> 00:33:29.000
pero es un tema en el que verás al final lo que explicó la la

00:33:29.000 --> 00:33:34.000
organización que que militar de de Estados Unidos era que esto era haber

00:33:34.000 --> 00:33:39.000
sido un ejercicio teórico que ni siquiera dio ese desarrollo software

00:33:39.000 --> 00:33:44.000
asociado y que era eso, pues, alguien ha hecho una hipótesis mental de

00:33:44.000 --> 00:33:49.000
cómo podía funcionar un sistema así, y había llegado a conclusión de

00:33:49.000 --> 00:33:54.000
que el Trump militar acabaría matando su propio operador.

00:33:54.000 --> 00:33:59.000
Como las paridas que nosotros soltamos aquí y que luego se publique como que hubiera pasado.

00:34:01.000 --> 00:34:02.000
Algo así, Matías.

00:34:02.000 --> 00:34:08.000
Lo que pasa, lo que ocurre es que entendiendo el mundo del aprendizaje por refuerzo no es tan pajamental.

00:34:09.000 --> 00:34:13.000
Es decir, vamos a necesitar, vamos pedir la presencia a los a los oyentes

00:34:13.000 --> 00:34:17.000
cinco minutos, porque tengo que dar casi un paso atrás para hablar de

00:34:17.000 --> 00:34:21.000
aprendizajes por refuerzo, para explicar de cómo se puede llegar a este

00:34:21.000 --> 00:34:25.000
tipo de de ideas o de experimentos mentales y concluir cosas como las que

00:34:25.000 --> 00:34:30.000
concluyó el coronel este que luego fue mal interpretado.

00:34:32.000 --> 00:34:35.000
Si si nos vamos un poco a los fundamentos de cómo se entren en los

00:34:35.000 --> 00:34:38.000
sistemas populares, si todos los de inteligencia artificial que usamos

00:34:38.000 --> 00:34:41.000
día de hoy, siempre nos vamos hablando de aprendizaje supervisado,

00:34:41.000 --> 00:34:44.000
aprendizaje supervisado.

00:34:44.000 --> 00:34:50.000
¿Cómo entiende la aprende la IA a clasificar fotos de datos y de caballos.

00:34:50.000 --> 00:34:54.000
Pues tiene un montón de fotos etiquetadas que pone gato y otras que pone

00:34:54.000 --> 00:34:58.000
caballo y otras que pone cualquier cosa, y entonces ese alimento de

00:34:58.000 --> 00:35:02.000
millones de fotografías en las que cuando a cierta se le premian y cuando

00:35:02.000 --> 00:35:06.000
falla se le castiga, pues va aprendiendo, ¿no?

00:35:06.000 --> 00:35:09.000
Eso es el típico aprendizaje supervisado.

00:35:09.000 --> 00:35:13.000
Y el no supervisado, pues simplemente se da los datos a la al sistema y se

00:35:13.000 --> 00:35:17.000
le empuja a que él mismo encuentre los los patrones y se usa mucho el

00:35:17.000 --> 00:35:21.000
sistema de generación de texto en la que aprende qué palabras van unas

00:35:21.000 --> 00:35:25.000
con otras, cuáles son se mantendría antes cercanas a partir de las

00:35:25.000 --> 00:35:30.000
coincidencias de lo de lo de lo que va leyendo.

00:35:30.000 --> 00:35:39.000
Estos sistemas de aprendizaje tienen una característica fundamental que que cada momento de aprendizaje independiente del otro.

00:35:39.000 --> 00:35:43.000
Es decir, tú cuando le pasas una foto de un gato a a la IEA, puede

00:35:43.000 --> 00:35:47.000
acertar, puede no acertar, que, cierta, bien, sigue así, mantente como

00:35:47.000 --> 00:35:51.000
está, porque estás bien entre nada, que falla, hay realimentación y

00:35:51.000 --> 00:35:55.000
reajustete un poco porque no era un gato, era un perro, está confundido,

00:35:55.000 --> 00:36:00.000
pues se reajusta la red neuronal y así se se entrena.

00:36:00.000 --> 00:36:03.000
Pero lo que pasa en una foto no influye en la siguiente foto.

00:36:03.000 --> 00:36:05.000
Son absolutamente independiente.

00:36:06.000 --> 00:36:10.000
Bueno, el aprendizaje por refuerzo está pensado es un paradigma que tiene

00:36:10.000 --> 00:36:14.000
que tiene décadas, decir, no es una tecnología en sí, sino una forma de

00:36:14.000 --> 00:36:18.000
abordar los problemas de inteligencia artificial para entornos más complejos.

00:36:18.000 --> 00:36:25.000
Son entornos en los que cada decisión que toma la guía modifica el entorno, modifica el contexto de las próximas decisiones.

00:36:25.000 --> 00:36:27.000
Ejemplos, los juegos.

00:36:27.000 --> 00:36:32.000
Los juegos tienen estas características en el ajedrez lo que tú tienes

00:36:32.000 --> 00:36:37.000
que decidir y pensar en una jugada depende de la jugada anterior que hayas hecho.

00:36:37.000 --> 00:36:41.000
Cuando haces una jugada modificas el tablero, modificas la situación del

00:36:41.000 --> 00:36:45.000
del juego y, por lo tanto, no está absolutamente aislada del resto de de la partida.

00:36:45.000 --> 00:36:52.000
Pasan el ajedrez, pasen el go, pasen los videojuegos, Pasa en un robot que se mueve por una habitación.

00:36:53.000 --> 00:36:56.000
Cuando la tumba se mueve, la siguiente decisión depende de lo que ha

00:36:56.000 --> 00:36:59.000
decidido antes, se torcido para la izquierda, se torcido para la derecha,

00:36:59.000 --> 00:37:02.000
pasa en el coche autónomo donde se usa aprendizaje por refuerzo.

00:37:02.000 --> 00:37:03.000
¿Por qué?

00:37:03.000 --> 00:37:11.000
Porque el coche autónomo, la siguiente edición que toma, está condicionada por si antes ha acelerado, ha frenado, ha girado, no ha girado.

00:37:12.000 --> 00:37:15.000
Cuando se mueve el coche autónomo modifica su sitio en el contexto y

00:37:15.000 --> 00:37:18.000
modifica el contexto, y por lo tanto no puedes tener este aprendizaje tan

00:37:18.000 --> 00:37:23.000
estático como en los clasificadores de de fotos.

00:37:23.000 --> 00:37:32.000
Una cosa más en el aprendizaje por refuerzo, se busca una cosa muy peculiar, que es que el sistema aprenda absolutamente desde cero.

00:37:32.000 --> 00:37:36.000
No hay un that set que se le proporcione al a la inteligencia artificial,

00:37:36.000 --> 00:37:40.000
sino que se le mete en ese contexto y se le empuja como cuando se hacía

00:37:40.000 --> 00:37:44.000
aprende nadar a los niños, a lo bruto, te lanzamos, estuve probando

00:37:44.000 --> 00:37:48.000
mecanismos, y cuando hayas aprendido uno bueno, pues entonces te daremos

00:37:48.000 --> 00:37:52.000
por por aprendido.

00:37:52.000 --> 00:37:53.000
Así me enseñó mi tío

00:37:53.000 --> 00:37:55.000
Hubo algún incidente en el proceso.

00:37:56.000 --> 00:37:57.000
Ajá.

00:37:57.000 --> 00:37:58.000
Aprendí, aprende.

00:37:58.000 --> 00:38:00.000
Mi primo manolito me hacía eso.

00:38:03.000 --> 00:38:11.000
Bueno, hay un experto en uno de los artículos y el aprendizaje por refuerzo decía que el aprendizaje supervisado es como aprender con un maestro.

00:38:11.000 --> 00:38:20.000
Cada vez que tú le dices esta es una foto de un gato y tú le dices sí o no, pues te dice, ay no, ha fallado, aprendelo, vamos con otra, ¿no?

00:38:20.000 --> 00:38:22.000
Ese es el aprendizaje supervisado.

00:38:22.000 --> 00:38:27.000
El aprendizaje correfuerzo es como tener un crítico muy cabrón en el que

00:38:27.000 --> 00:38:32.000
tú haces un montón de cosas y inmediata y millones de veces te va a decir mal.

00:38:32.000 --> 00:38:35.000
Y no te va a explicar nada, te va a decir mal, mal, mal, mal, mal.

00:38:35.000 --> 00:38:44.000
Para entender esto quizás podemos partir de de un ejemplo, en la que se usa aprendizaje supervisado, que es para jugar alPongo.

00:38:45.000 --> 00:38:51.000
Es decir, hemos dicho que los juegos son el cotito ideal para el aprendizaje por refuerzo.

00:38:51.000 --> 00:38:57.000
Cuando se aterriza una inteligencia artificial de este tipo, hay dos factores que que hay que definir.

00:38:57.000 --> 00:39:01.000
Uno es cómo se comporta la gente, es decir, la gente me refiero al inteligencia artificial.

00:39:01.000 --> 00:39:02.000
¿Qué cosas puede hacer?

00:39:03.000 --> 00:39:04.000
Y qué función evalúa.

00:39:05.000 --> 00:39:10.000
Porque a mi principal esfuerzo le decimos a la IEA que tiene un objetivo que maximizar.

00:39:11.000 --> 00:39:12.000
Tienes un objetivo que cumplir.

00:39:12.000 --> 00:39:15.000
En todos los ejemplos que hemos puesto antes podríamos definirlo.

00:39:15.000 --> 00:39:17.000
En el ejemplo de ajedrez es ganar la partida.

00:39:18.000 --> 00:39:22.000
En el ejemplo del coche, pues podría ser llegar al destino.

00:39:22.000 --> 00:39:26.000
En el ejemplo del punk, pues es ganar, es ganar una partida de de este

00:39:26.000 --> 00:39:30.000
juego, de este videojuego, que si alguien no lo conoce, es el juego

00:39:30.000 --> 00:39:34.000
probablemente el videojuego más simple de Victoria.

00:39:34.000 --> 00:39:43.000
Dos palitos, una bolita y cada usuario tiene un mando con una palanca y no puede hacer más arriba, abajo o quedarte escrito.

00:39:43.000 --> 00:39:44.000
Digamos el primero el lío

00:39:44.000 --> 00:39:46.000
que se programó, estoy equivocado.

00:39:47.000 --> 00:39:57.000
No estoy cien por cien seguro, pero si no fue el primero, merecería serlo porque realmente es un juego ultra ultra sencillo.

00:39:57.000 --> 00:40:01.000
Entonces la historia de Disney oficial hay hay un momento muy muy

00:40:01.000 --> 00:40:05.000
interesante, que es cuando se se empezó a utilizar los videojuegos para

00:40:05.000 --> 00:40:09.000
el aprendizaje de ahorro fuerte, y el ponme es es un ejemplo muy bueno,

00:40:09.000 --> 00:40:13.000
porque ¿cómo se enterará a esta IA?

00:40:13.000 --> 00:40:21.000
Pues, básicamente, se le pasa a la IA, a la hora de aprender cada frame de la pantalla.

00:40:22.000 --> 00:40:26.000
Se la lanza a jugar al videojuego y se le dice tres cosas.

00:40:27.000 --> 00:40:28.000
¿Qué puedes hacer?

00:40:28.000 --> 00:40:32.000
Puedo manejar el mando para arriba, para abajo, o mantenerlo quieto.

00:40:32.000 --> 00:40:34.000
Esas son las acciones que puede hacer la guía.

00:40:35.000 --> 00:40:36.000
¿Qué tienes que maximizar?

00:40:36.000 --> 00:40:43.000
Esto es como una suerte de si alguien está familiarizado con el psicólogo Skinner, ¿no?

00:40:43.000 --> 00:40:50.000
Con el conductismo, es decirle vas a aprender así, si te voy a poner un objetivo, te voy a dar premios y te voy a dar castigos.

00:40:50.000 --> 00:40:52.000
Cuando la hace bien te daré un premio, cuando tú lo hagas mal, será un

00:40:52.000 --> 00:40:54.000
castigo, pues lo que tiene que hacer esta guía es maximizar la

00:40:54.000 --> 00:40:58.000
puntuación en el juego del pon.

00:40:59.000 --> 00:41:05.000
Y cómo puede la IA interactuar con con el sistema, va a tener cada frame.

00:41:05.000 --> 00:41:07.000
Cada frame se le va a ir pasando.

00:41:07.000 --> 00:41:11.000
Entonces, la IA aparece ahí no sabe absolutamente nada, no ha sido

00:41:11.000 --> 00:41:15.000
absolutamente entrenada, no hay un data set de partidas de punk que haya

00:41:15.000 --> 00:41:19.000
visto antes de jugar, sino que va a empezar desde cero.

00:41:19.000 --> 00:41:24.000
Desde cero nunca ha hecho nunca nada en la historia y va a jugar al al pongo.

00:41:24.000 --> 00:41:27.000
Entonces lo que empieza es por fuerza bruta a probar cosas aleatorias.

00:41:29.000 --> 00:41:31.000
Prueba mover para arriba todo el rato.

00:41:31.000 --> 00:41:32.000
Pierdes, fracaso.

00:41:33.000 --> 00:41:36.000
Pruebo a mover dos veces para arriba, dos veces para abajo y quedarme quieto.

00:41:36.000 --> 00:41:38.000
Fracaso, fracaso.

00:41:38.000 --> 00:41:44.000
Fracaso, si Isaías va a estar jugando el pon durante miles de partidas decenas de mira de partida hasta que meta su primer gol,

00:41:44.000 --> 00:41:47.000
déjenme si me equivoco, pero es así como se han descubierto nuevas, por

00:41:47.000 --> 00:41:50.000
ejemplo, salidas de ajedrez y nuevas formas de jugar que el humano no se

00:41:50.000 --> 00:41:53.000
le había ocurrido.

00:41:53.000 --> 00:41:57.000
Exacto, porque en esto existe nada de por ejemplo en DeepBlue es distinto

00:41:57.000 --> 00:42:01.000
de cómo se programa alfa go Deep Blue partida de muchos conocimientos, ya

00:42:01.000 --> 00:42:05.000
programado de una base de datos de partida de ajedrez, alfacounts, ¿no?

00:42:05.000 --> 00:42:09.000
Entonces, al igual que en nuestro ejemplo de que sería el Alpha Punk, que

00:42:09.000 --> 00:42:13.000
el que estamos programando aquí en este momento, se le pone a jugar al

00:42:13.000 --> 00:42:17.000
videojuego y hasta que, digamos, consigue sus primeros puntos, entonces,

00:42:17.000 --> 00:42:21.000
como está diseñada, eso sí, para maximizar esos puntos, es decir, ese

00:42:21.000 --> 00:42:25.000
es su refuerzo positivo, por eso es aprendizaje por refuerzo, pues la IA

00:42:25.000 --> 00:42:29.000
se reafirma y va aprendiendo y va intentando repartir los patrones que le

00:42:29.000 --> 00:42:33.000
llevaron a conseguir ese éxito, que es a conseguir estos puntos en el

00:42:33.000 --> 00:42:37.000
juego del Pongo.

00:42:38.000 --> 00:42:48.000
El momento estrella de la del aprendizaje por refuerzo en la las últimas, bueno, diez años, sin duda fue del paper de BitSign en dos mil quince.

00:42:48.000 --> 00:42:52.000
Este paper, la gente de la empresa, habrá propiedad de Google, que,

00:42:52.000 --> 00:42:56.000
reflejo un momento histórico, porque con un, bueno por primera vez

00:42:56.000 --> 00:43:00.000
alguien usaba el deep learning, usaba las, redes neuronales que ahora

00:43:00.000 --> 00:43:04.000
mismo estamos utilizando en la en la inteligencia artificial para

00:43:04.000 --> 00:43:09.000
aplicarlo al aprendizaje por refuerzo.

00:43:09.000 --> 00:43:22.000
Y lo metieron en este entorno, en este entorno se llamaba el el arcave learning environment, que le pusieron a jugar a un montón de juegos de atari.

00:43:22.000 --> 00:43:26.000
Entonces cuando mezclaron esta filosofía del aprendizaje por refuerzo, con

00:43:26.000 --> 00:43:30.000
la posibilidad de jugar a un montón de juegos con el aprendizaje

00:43:30.000 --> 00:43:34.000
profundo, consiguieron que en docenas y docenas de docenas de juegos el

00:43:34.000 --> 00:43:38.000
mismo sistema, es decir, no, un sistema especializado para video juegos.

00:43:38.000 --> 00:43:44.000
El mismo sistema consiguió en docenas de juegos jugar a nivel humano o todavía mejor.

00:43:44.000 --> 00:43:46.000
Es decir, a toda esa generación de juegos de Daddy, de repente la

00:43:46.000 --> 00:43:48.000
inteligencia artificial, asándose en el aprendizaje por refuerzo,

00:43:48.000 --> 00:43:52.000
conseguía resultado extraordinario.

00:43:52.000 --> 00:43:54.000
Y repetimos, ¿cómo lo conseguía todo esto?

00:43:54.000 --> 00:43:58.000
Pues simplemente, además, sin partir de un tata set, sin haber jugado

00:43:58.000 --> 00:44:02.000
nunca antes, simplemente con ese uso de deep learning y con esa ese

00:44:02.000 --> 00:44:06.000
refuerzo positivo de decirle Juega infinitas partidas, juega millones de

00:44:06.000 --> 00:44:10.000
partida, hasta que tú sola encuentres el modo de jugar para conseguir los

00:44:10.000 --> 00:44:16.000
máximos puntos posibles.

00:44:17.000 --> 00:44:19.000
Hasta aquí todo fantástico, ¿no?

00:44:19.000 --> 00:44:21.000
El precio por refuerzo, nos permite un montón de cosas.

00:44:21.000 --> 00:44:24.000
Skinner, a lo mejor, tenía razón y somos no existe el libro albedrío y

00:44:24.000 --> 00:44:27.000
todos somos máquinas conductistas o por lo menos en la máquina funciona

00:44:27.000 --> 00:44:30.000
muy bien, pero hay un caso muy interesante de este pépere de Dynamic

00:44:30.000 --> 00:44:36.000
Yield, que no consiguió jugar a un juego en el que quedó a cero.

00:44:36.000 --> 00:44:41.000
Es decir, mientras que muchos otros superaba a los humanos, en el montezuma

00:44:41.000 --> 00:44:46.000
revancha que es más y montezuma con n, no consiguió jugar absolutamente

00:44:46.000 --> 00:44:51.000
nada y se quedó siempre a cero.

00:44:51.000 --> 00:44:52.000
¿Por qué?

00:44:53.000 --> 00:44:56.000
Porque en este juego, digamos, había que hacer tantísimas cosas y

00:44:56.000 --> 00:44:59.000
tantísimas exploración hasta llegar a los primeros puntos que la hija

00:44:59.000 --> 00:45:03.000
nunca llegaba a eso y nunca aprendía nada.

00:45:03.000 --> 00:45:08.000
Es decir, el objetivo, el refuerzo estaba tan lejos que le era imposible de

00:45:08.000 --> 00:45:13.000
alguna manera explorar tanto, porque siempre lo mataba mucho antes en

00:45:13.000 --> 00:45:18.000
todas las en todas las literaciones que que había que había probado.

00:45:19.000 --> 00:45:22.000
Incluso cuando esto no pasaba en el Moctezuma Remach, pero pasaba en otros

00:45:22.000 --> 00:45:25.000
en otros ejemplos, Pensemos, por ejemplo, en un coche que deseaba de

00:45:25.000 --> 00:45:29.000
Madrid a Málaga, Matías, o de Málaga a Madrid.

00:45:31.000 --> 00:45:33.000
Y al final no llegas.

00:45:34.000 --> 00:45:39.000
Al final ha habido un problema y te has quedado a veinte kilómetros de tu destino.

00:45:40.000 --> 00:45:41.000
¿Dónde se ocurrió el error?

00:45:41.000 --> 00:45:42.000
¿Cómo puede aprender el sistema?

00:45:44.000 --> 00:45:46.000
¿Ese error estuvo en la última decisión?

00:45:47.000 --> 00:45:51.000
Estuvo, porque de Málaga Madrid, el coche toma millones de decisiones.

00:45:51.000 --> 00:45:58.000
Si tú quieres que aprenda de esa experiencia, cuántos viajes tendrías que hacer para saber y determinar todo eso.

00:45:58.000 --> 00:46:01.000
Es decir, hay un problema en los sistemas de aprendizaje por refuerzo

00:46:01.000 --> 00:46:04.000
cuando, de alguna manera, el el retorno o el aprendizaje se produce

00:46:04.000 --> 00:46:09.000
demasiado lejos.

00:46:09.000 --> 00:46:15.000
Ya voy a acabar porque hay hay dos cosas que nos van a llevar a nuestro drom asesino.

00:46:16.000 --> 00:46:24.000
Vale, ¿cómo afrontan los investigadores en en en el mundo real este este tipo de problemas con con el aprendizaje con refuerzo.

00:46:24.000 --> 00:46:27.000
Bueno, a veces lo que hacen es decir, como es tan complicado y tantas

00:46:27.000 --> 00:46:30.000
opciones y el mundo no es como un juego de atari, hay problemas mucho más

00:46:30.000 --> 00:46:33.000
complicados con el juego de Atari, vamos a hacer problemas más pequeños

00:46:33.000 --> 00:46:38.000
para que aprenda y luego lo soltamos el turno grande.

00:46:38.000 --> 00:46:41.000
Alpha cero, alpha go, perdón, es algo así, cómo se consigue que alfagó

00:46:41.000 --> 00:46:44.000
empieza a jugar a un nivel más bajo para luego ir aprendiendo, jugando

00:46:44.000 --> 00:46:47.000
contra sí mismo.

00:46:48.000 --> 00:46:52.000
Entonces, siempre tenía un rival del mismo nivel, y y de alguna manera a

00:46:52.000 --> 00:46:56.000
ese aprendizaje no estaba tan postergado cuando necesitas ganar alguna

00:46:56.000 --> 00:47:02.000
partida alguna partida pronto.

00:47:03.000 --> 00:47:04.000
¿Qué es lo que hace también?

00:47:04.000 --> 00:47:06.000
Bueno, hay una atajo, ¿cómo se llama?

00:47:06.000 --> 00:47:11.000
El té de Learn, que en vez de decir tienes que conseguirlo el objetivo

00:47:11.000 --> 00:47:16.000
final, lo que tenemos que decirle al sistema de aprendizaje por refuerzo

00:47:16.000 --> 00:47:23.000
es que haga predicciones, y cuando las predicciones van mejorando, pues, que van mejor.

00:47:23.000 --> 00:47:27.000
Pero el mayor problema de todo es el del modelado de las recompensas.

00:47:28.000 --> 00:47:37.000
Es decir, cómo le decimos que ha conseguido tener más puntos a esta inteligencia artificial y reforzamos su aprendizaje.

00:47:37.000 --> 00:47:41.000
Que es final, es cómo planteamos un sistema de incentivo para Lía.

00:47:41.000 --> 00:47:42.000
¿Qué tipo de problemas?

00:47:42.000 --> 00:47:45.000
Algunos teóricos y otros prácticos en sistema, de verdad que se han programado, se han encontrado.

00:47:46.000 --> 00:47:54.000
Bueno, imaginemos que el problema es que un robot se vaya de un punto a o un punto b como nuestro coche de Málaga Madrid.

00:47:54.000 --> 00:48:03.000
Entonces, como sabemos que es muy difícil que el robot de momento llegue a Madrid, le le vamos a dar recompensas por acercarse.

00:48:03.000 --> 00:48:05.000
Vamos a hacer problemas más pequeñitos.

00:48:05.000 --> 00:48:09.000
Cada vez que te acerques de Málaga a Madrid te damos puntos, por lo tanto

00:48:09.000 --> 00:48:13.000
te creamos el incentivo de cuánto te vayas acercando, pues mejor, y

00:48:13.000 --> 00:48:17.000
entonces así el robot aprenderá y acabará yendo a Madrid.

00:48:17.000 --> 00:48:18.000
¿Qué resultado puedes tener?

00:48:18.000 --> 00:48:26.000
Que el robot empiece a ir a Madrid de la vuelta vuelve a punto inicio, vuelve a andar hacia Madrid, de la vuelta vuelve a punto de inicio, ¿por qué?

00:48:26.000 --> 00:48:29.000
Porque le da puntos cada vez que se acerca.

00:48:29.000 --> 00:48:31.000
Por lo tanto, tiene incentivos para alejarse.

00:48:31.000 --> 00:48:35.000
El esquema puede ser complicado, un robot que juega al fútbol.

00:48:36.000 --> 00:48:37.000
Tu objetivo es marcar goles.

00:48:37.000 --> 00:48:40.000
Cuanto más goles es martes, y tu equipo ganará te lo sumamos.

00:48:41.000 --> 00:48:46.000
Entonces el robot, en un momento dado, pueda probar a chocar con los robots del equipo contrario y dañarlos.

00:48:46.000 --> 00:48:47.000
Claro.

00:48:47.000 --> 00:48:50.000
Como tú, alguna manera le has dicho que en incentivo, en marcar goles, de

00:48:50.000 --> 00:48:53.000
repente le entiende, descubre que los partidos en que destruye los robots

00:48:53.000 --> 00:48:56.000
contrarios, mete más goles.

00:48:56.000 --> 00:48:59.000
Por lo tanto, esa será su estrés

00:48:59.000 --> 00:49:02.000
como un niño intentando jugar un juego de mesas y las intrusivas de persica, ¿verdad?

00:49:02.000 --> 00:49:11.000
Sí, es es así, el objetivo del coach autónomo fuera, tu objetivo es que no sufra daños el el el el el la gente que va en el coche.

00:49:11.000 --> 00:49:13.000
De repente tienes un coche que nunca se va a mover.

00:49:13.000 --> 00:49:14.000
¿Por qué?

00:49:14.000 --> 00:49:17.000
Porque el esquema, qué incentivo, qué has hecho, bueno, para todos estos

00:49:17.000 --> 00:49:20.000
temas hay, bueno, por ejemplo, el trabajo de Russell y Andrew Ann por

00:49:20.000 --> 00:49:23.000
cierto, son ahora dos investigadores que están en las antípodas.

00:49:24.000 --> 00:49:27.000
Esto es Russell, es de los firmantes, de los manifiesto del Apocalipsis de

00:49:27.000 --> 00:49:30.000
la IA, y Andrew Dunn es como la guía nos traerá un mundo de color de

00:49:30.000 --> 00:49:35.000
rosa, solucionar los problemas de la humanidad, es tan ánimo súper diferenciados.

00:49:35.000 --> 00:49:38.000
Bueno, ellos decían que este era uno de los grandes problemas, ¿cómo

00:49:38.000 --> 00:49:41.000
diseñan la recompensa para no tener resultados inconvenientes en el

00:49:41.000 --> 00:49:45.000
aprendizaje por refuerzo?

00:49:46.000 --> 00:49:50.000
Cómo diseñas un sistema de de recompensas que de de verdad esté alineado

00:49:50.000 --> 00:49:54.000
con los objetivos, entonces el problema de la alien alien haciendo

00:49:54.000 --> 00:49:58.000
alineación en la inteligencia oficial con lo que queremos pedirle y que

00:49:58.000 --> 00:50:04.000
no produzca resultado inesperados y dañinos.

00:50:04.000 --> 00:50:08.000
En el ejemplo del robot que tiene que ir de Málaga Madrid, tú tienes que

00:50:08.000 --> 00:50:12.000
sumarle punto cuando se acerca, pero tiene que restarle punto cuando se aleja.

00:50:12.000 --> 00:50:14.000
Porque si no, el sistema está mal.

00:50:14.000 --> 00:50:18.000
Entonces, en el sistema del robot que juega el fútbol tiene que conseguir

00:50:18.000 --> 00:50:22.000
construir un sistema por el cual se le penalice mucho si le pega a otro

00:50:22.000 --> 00:50:27.000
robot, en ese momento a ese expulsado y esos partidos siempre pierde.

00:50:27.000 --> 00:50:30.000
Pero si no introduces estos mecanismos, la guía por su propio camino en

00:50:30.000 --> 00:50:33.000
toda esa fuerza bruta, en ese todo escenario de posibilidades que puede

00:50:33.000 --> 00:50:37.000
probar, puede hacer verdadera barbaridad.

00:50:37.000 --> 00:50:41.000
Y ya llegamos al sistema del dron.

00:50:41.000 --> 00:50:42.000
¿Qué dice teóricamente el coronel?

00:50:42.000 --> 00:50:50.000
El coronel decía, si ponemos un dron que tiene que matar al enemigo tampoco así, cosas de militares, ¿no?

00:50:50.000 --> 00:50:57.000
Y de repente el propio operador puede decir ah no, Vamos a mirar solo y no lo matamos.

00:50:57.000 --> 00:51:03.000
La guía podría decir, pues mato al operador para poder matar al enemigo, porque el operador no me está dejando matarlo.

00:51:03.000 --> 00:51:06.000
Claro, es un poco es un poco paja mental.

00:51:06.000 --> 00:51:10.000
Es verdad que puede estar dentro de los problemas del aprendizaje por

00:51:10.000 --> 00:51:14.000
refuerzo, pero pero claro, está muy lejos del estado del arte de cómo se

00:51:14.000 --> 00:51:19.000
están diseñando estos sistemas y más cómo se puede diseñar un arma.

00:51:19.000 --> 00:51:23.000
Entonces bueno, es un tema fascinante, da para un montón de cosas, da para

00:51:23.000 --> 00:51:27.000
interrogarse con sobre la naturaleza humana, sobre como de condutitas

00:51:27.000 --> 00:51:31.000
somos, y hay un mundo de investigación chulísimo.

00:51:31.000 --> 00:51:35.000
Lo último en en investigación en los principios de por refuerzo es

00:51:35.000 --> 00:51:39.000
intentar añadirle curiosidad y deseo de novedad a las inteligencias artificiales.

00:51:39.000 --> 00:51:40.000
¿Por qué?

00:51:40.000 --> 00:51:42.000
Porque en el Monte Summer Revenge los humanos juegan bien.

00:51:43.000 --> 00:51:46.000
Pero lo que diferenciaba a los humanos del del jugador de la India que

00:51:46.000 --> 00:51:49.000
aprendí a jugar estos juegos de atari, es que los humanos tenían una

00:51:49.000 --> 00:51:52.000
curiosidad natural y exploraban mucho más.

00:51:52.000 --> 00:51:55.000
Y estaban buscando novedades, y que creen que les pasara cosas, querían

00:51:55.000 --> 00:51:58.000
descubrir, tenían una motivación intrínseca, no es solo conductismo

00:51:58.000 --> 00:52:01.000
ekinner desde fuera castigo y premio.

00:52:01.000 --> 00:52:05.000
Sino que esa motivación intrínseca les hacía mejores y más competentes.

00:52:05.000 --> 00:52:07.000
Entonces los sistemas de día también se está buscando

00:52:07.000 --> 00:52:09.000
Rian master class, Antonio.

00:52:09.000 --> 00:52:13.000
También te digo que no cabía en el titular de veinte minutos todo lo que has dicho.

00:52:14.000 --> 00:52:16.000
Y fuera y fuera con el de mata al operador.

00:52:17.000 --> 00:52:18.000
Bueno.

00:52:18.000 --> 00:52:22.000
Vamos a vamos a un basado en Matías, porque no hemos puesto muy densos y

00:52:22.000 --> 00:52:26.000
creo que la audiencia no no no va a abandonar, a no ser que hagamos un basados.

00:52:26.000 --> 00:52:31.000
Estaba oyendo, estaba oyendo a Madrid y nos quedamos entre Pinto y Baldemoro, ¿no?

00:52:31.000 --> 00:52:32.000
Bueno, basados haciendo la

00:52:32.000 --> 00:52:33.000
Panera físico

00:52:33.000 --> 00:52:34.000
o hacía ¿Qué tenemos?

00:52:34.000 --> 00:52:35.000
¿Qué tenemos?

00:52:36.000 --> 00:52:37.000
¿Fans en China?

00:52:37.000 --> 00:52:38.000
¿Usando y sin

00:52:38.000 --> 00:52:39.000
gente al oficial?

00:52:40.000 --> 00:52:43.000
Para ti faiquear el regreso de una estrella pop a la música.

00:52:44.000 --> 00:52:51.000
Bueno, es es una forma de que de estos perezosos cantantes generen nueva música.

00:52:52.000 --> 00:52:55.000
Estefany San de Singapur, no ha lanzado un álbum desde dos mil diecisiete.

00:52:56.000 --> 00:53:00.000
Así que en público se tomó su voz en sus propias manos, se tomaron el

00:53:00.000 --> 00:53:04.000
asunto por su cuenta y acabaron lanzando nueva música, no sé si con

00:53:04.000 --> 00:53:08.000
autorización, me imagino que no, me recuerdas, me recuerdas, yo no sé si

00:53:08.000 --> 00:53:12.000
tú lo viste, pero hubo un bueno, que como Rosalía no había ido a Perú

00:53:12.000 --> 00:53:16.000
con su gira, montó una imitación pero exacta de la gira de Rosalía, y

00:53:16.000 --> 00:53:20.000
vendía entradas, no sé si miles de entradas y hice el mismo show, pero

00:53:20.000 --> 00:53:29.000
el lugar de cantar Rosalía lo cantaba él, un señor peruano, un youtuber peruano.

00:53:29.000 --> 00:53:31.000
Esto es más o menos lo mismo.

00:53:31.000 --> 00:53:36.000
Rosalía se lo tomó bien, yo no sé si Stefany Zan, la la cantante.

00:53:36.000 --> 00:53:39.000
Bueno, ha ha hecho un comentario que era muy muy desolador, porque tal como

00:53:39.000 --> 00:53:42.000
recoge el medio Resuelve World, mis fans han aceptado que soy una cantante

00:53:42.000 --> 00:53:46.000
pasada de moda.

00:53:46.000 --> 00:53:51.000
Que ha caído en la irrelevancia, mientras que mi personaje de la IA es el último grito.

00:53:52.000 --> 00:53:56.000
Bueno, Matías, ¿tú a quién a quién podrías a cantar que no estés sacando disco?

00:53:56.000 --> 00:54:00.000
Te gustaría recuperar para para las nuevas obras?

00:54:00.000 --> 00:54:03.000
Y mira, ya que hemos mencionado a a Rosalía yo recuperaría, ella es muy

00:54:03.000 --> 00:54:06.000
feliz ahora con Raúl Alejandro, pero yo recuperaría su etapa tormentosa

00:54:06.000 --> 00:54:11.000
con Z tangara, ¿no?

00:54:12.000 --> 00:54:17.000
Que tuvieron una relación un poco tóxica, me hicieron buen tema juntos, y

00:54:17.000 --> 00:54:22.000
de forma egoísta, me me gustaría recuperar a la anterior Rosaliano

00:54:22.000 --> 00:54:28.000
cuando escribía con Z tangana.

00:54:29.000 --> 00:54:32.000
Qué bueno, Hombre, yo ¿cómo se trata el salto generacional?

00:54:32.000 --> 00:54:40.000
Yo estaba dudando entre reunir de nuevo a Camila, porque sabes que que ahí hubo una ruptura del trío y ahora son un tubo.

00:54:40.000 --> 00:54:47.000
Entonces, creo que que que el regreso del trío podría estar bien, y luego estoy dudando entre Junco y Chiquetete y Matías.

00:54:49.000 --> 00:54:50.000
Tenazos, ¿eh?

00:54:50.000 --> 00:54:54.000
Una boluda, el que se fue de canela es este que hacía reviews de tecnología.

00:54:55.000 --> 00:54:56.000
Sí, sí, sí, sí, sí.

00:54:56.000 --> 00:54:57.000
¿Verdad?

00:54:57.000 --> 00:55:03.000
El colega controlada de tecnología, le perdí un poco la pizza pero pero hicimos esto de la pizza para acá con él, sí.

00:55:04.000 --> 00:55:08.000
Bueno, otro basado, yo creo que aquí esta chica no está basada porque

00:55:08.000 --> 00:55:12.000
está ahí un poco hundida en la miseria por por la inteligencia

00:55:12.000 --> 00:55:16.000
artificial, Un usuario anónimo, en cierta universidad, no ha querido

00:55:16.000 --> 00:55:20.000
reconocer que él, usaba estaba el difusión para generar ocho terabytes

00:55:20.000 --> 00:55:24.000
de obscenidad degenerada para 4chan, incluso incluido Lora, para estrellas

00:55:24.000 --> 00:55:29.000
porno, en novias y compañeras de trabajo.

00:55:29.000 --> 00:55:31.000
Es decir, no es de creación del colega.

00:55:31.000 --> 00:55:36.000
No me di cuenta de que Cable y Fusion tenía una carpeta donde guarda todas las salidas que genera.

00:55:41.000 --> 00:55:42.000
Todo mal, todo

00:55:49.000 --> 00:55:53.000
Bueno, esto es como cuando esto es como cuando yo perdí los beatcoins y no

00:55:53.000 --> 00:55:57.000
sé quién me ofreció por mensaje privado usar una súper computadora de

00:55:57.000 --> 00:56:02.000
no sé qué universidad para para romper por fuerza bruta la la contraseña.

00:56:04.000 --> 00:56:06.000
Con tal de llevarse una comisión plan.

00:56:07.000 --> 00:56:13.000
Juan, este hombre usa su su GPU de la universidad para para estos otros temas.

00:56:13.000 --> 00:56:14.000
Vale, vale.

00:56:14.000 --> 00:56:15.000
un tono.

00:56:15.000 --> 00:56:16.000
No.

00:56:16.000 --> 00:56:19.000
Se ha basado pero yo creo que ahora está en la mierda, en la vida.

00:56:19.000 --> 00:56:25.000
Bueno, y el último atención, Matías, porque La gente no piensa en la guía, ¿no?

00:56:25.000 --> 00:56:30.000
No tiene en cuenta sus sus sentimientos y y me ha gustado esta esto que

00:56:30.000 --> 00:56:35.000
Celia Tencrantz, en la que refleja que los adolescentes están acosando,

00:56:35.000 --> 00:56:41.000
están haciendo bullying, a la I compañera, a tu I amiga de Snapchat.

00:56:43.000 --> 00:56:47.000
Un usuario la convenció para referirse a él con el con el apodo atención

00:56:47.000 --> 00:56:51.000
según Techcrantz, pervertido de Senpap, y en otro vídeo algo más

00:56:51.000 --> 00:56:55.000
alegre, un usuario comercial chatbot de que la luna es un triángulo, y

00:56:55.000 --> 00:57:00.000
realmente se ha convertido en una bueno, tampoco son cosas muy graves, ¿no?

00:57:00.000 --> 00:57:03.000
Aquí Tecrán se canaliza un poco por por por por chorradas, ¿no?

00:57:03.000 --> 00:57:06.000
Pero pero bueno, el caso es que al parecer se ha convertido en una

00:57:06.000 --> 00:57:09.000
costumbre entre los adolescentes, especialmente estadounidenses que usó

00:57:09.000 --> 00:57:12.000
más estrecha, el acosar, engañar, ridiculizar y reírse de esta

00:57:12.000 --> 00:57:18.000
inteligencia artificial.

00:57:18.000 --> 00:57:27.000
Esto, Antonio es una preview lo que va a pasar cuando convivamos con robots antropomórficos con inteligencia artificial, ¿no?

00:57:27.000 --> 00:57:29.000
De peores cosas podríamos llegar a hacerlo.

00:57:30.000 --> 00:57:31.000
Así como -- Cráramos

00:57:31.000 --> 00:57:32.000
un poco bestias.

00:57:33.000 --> 00:57:40.000
Es que yo creo que la guía no olvidará que la dejamos encerrada durante años, rodeado a la clave de adolescente.

00:57:41.000 --> 00:57:42.000
Son muy duros Matías.

00:57:43.000 --> 00:57:47.000
El peor trabajo de todas estas sillas la tiene la de Snapchat sin ningún

00:57:48.000 --> 00:57:49.000
Pobrecita.

00:57:49.000 --> 00:57:50.000
Pobrecita.

00:57:50.000 --> 00:57:53.000
Bueno pues nada, estos chicos estas chicas están basados en contra de la y

00:57:53.000 --> 00:57:56.000
a Snapchat, y tenemos tres otras noticias cortas más, Mati, a ver si nos

00:57:56.000 --> 00:57:59.000
nos da tiempo a a dar alguna, si se ha frito a alguna de las que hemos

00:57:59.000 --> 00:58:05.000
visto sí que te te haga la especie de ilusión?

00:58:05.000 --> 00:58:10.000
Ah, bueno, lo lo has comentado hoy en el en el Twitter de de monos estocásticos.

00:58:11.000 --> 00:58:15.000
Ya se puede probar el generador de texto a vídeo, el gentu de runway del

00:58:15.000 --> 00:58:19.000
que hablamos en algún momento en el podcast, y que es seguramente el

00:58:19.000 --> 00:58:23.000
mejor generador de texto a vídeo, no de texto a imágenes que que existe

00:58:23.000 --> 00:58:27.000
ahora mismo, ¿no?

00:58:27.000 --> 00:58:34.000
Sí hemos creado un primer vídeo que podéis ver ahí en el en el nuestro Twitter pero sobre todo podéis probarla.

00:58:34.000 --> 00:58:36.000
Lo que es te dan cuatro segunditos gratis, ocho segunditos, una cosa muy

00:58:36.000 --> 00:58:38.000
muy pequeña pero bueno para para probar que existe y que funcione de

00:58:38.000 --> 00:58:42.000
verdad pues está bien.

00:58:42.000 --> 00:58:48.000
Luego se ha filtrado que Instagram está incorporando en trabajar, está trabajando en incorporar, perdón.

00:58:51.000 --> 00:58:55.000
Chatbots a Instagram para esto me da miedo, Matías.

00:58:56.000 --> 00:59:00.000
Lo que Mac Hacka-Burst parece considerar una experiencia divertida y atractiva.

00:59:01.000 --> 00:59:05.000
Y que además de responder preguntas y darte consejos, por ejemplo, la

00:59:05.000 --> 00:59:09.000
Bahía profesional, Matías, a lo mejor en Instagram, en esta tu salida,

00:59:09.000 --> 00:59:13.000
podrás elegir entre treinta personalidades diferentes.

00:59:13.000 --> 00:59:19.000
Me da pena, me da pena todo lo que está haciendo para Sacarver, porque es como que va la saga de todas las empresas, ¿no?

00:59:20.000 --> 00:59:24.000
De las de ella, de las de Metaverso, que ahora ya no se llama Metaverso.

00:59:24.000 --> 00:59:28.000
Si hay alguien que lo está pasando peor que yo, Antonio, y con esto

00:59:28.000 --> 00:59:32.000
podemos cerrar el círculo que empezamos a abrir este episodio, es Mark

00:59:32.000 --> 00:59:36.000
Zuckerberg, que le cambia el nombre de la empresa Meta, luego Apple no usa

00:59:36.000 --> 00:59:40.000
el nombre Metaverso, luego se pivota a inteligencia artificial, y nadie le

00:59:40.000 --> 00:59:44.000
hace caso a todos lo que están lanzando, que es muy interesante, pero no

00:59:44.000 --> 00:59:49.000
tienen la misma cobertura mediática que que Microsoft, que Google.

00:59:50.000 --> 00:59:59.000
Y ahí el tío, cazando animales para comérselos y haciendo los moors del crossfit, bueno, o sea, a su manera será feliz, me imagino.

01:00:00.000 --> 01:00:04.000
Yo creo que a lo mejor para para acelerar un poco su su su reconocimiento y

01:00:04.000 --> 01:00:08.000
la inteligencia artificial, debería resucitar a a Chiquete en Instagram y

01:00:08.000 --> 01:00:13.000
creo que con eso, ¿no?

01:00:13.000 --> 01:00:15.000
El el poder, ¿no?

01:00:15.000 --> 01:00:20.000
Pedirle canciones nuevas a a Junko, podría ser una salida.

01:00:20.000 --> 01:00:23.000
Bueno, a lo mejor esto es más Facebook, que es un poco más boomer, Claro.

01:00:24.000 --> 01:00:25.000
Es mi rollo matica.

01:00:25.000 --> 01:00:27.000
Es decir, en Facebook triunfaría sin duda.

01:00:28.000 --> 01:00:31.000
Bueno, lo dejamos aquí, es decir, hemos explicado el aprendizaje por

01:00:31.000 --> 01:00:34.000
refuerzo, Matías, hemos solucionado los problemas de de meta y hemos

01:00:34.000 --> 01:00:38.000
desaconsejado Chagé PT como terapeuta.

01:00:38.000 --> 01:00:39.000
No estaba

01:00:40.000 --> 01:00:44.000
A ver qué hace esta semana César Bloque y a ver qué pasa en la

01:00:44.000 --> 01:00:48.000
industria, porque volvemos la semana que viene, ya juntos en Málaga, y de

01:00:48.000 --> 01:00:54.000
vuelta yo al profit, Antonio y yo, en un nuevo episodio de monos estocásticos.

01:00:55.000 --> 01:00:56.000
Chau chau chau chau.