- Al modo de voz avanzado de ChatGPT le han hecho una lobotomía
- OpenAI consigue una valoración de 150.000 millones
- Masayoshi Son hace caso a su corazón
- Meta ha presentado las gafas Orion
Upscale Conf: Nos vemos en Málaga el 19 y 20 de noviembre en la mejor conferencia de IA generativa con muchas caras conocidas. Compra tus entradas con un cupón del 50% de descuento usando el código MONOS durante el proceso de compra https://www.upscaleconf.com/
La entrevista de Paréntesis MEDia a los creadores de Fit Aitana https://www.parentesis.media/diana-nunez-mucha-gente-se-piensa-que-la-ia-es-un-buen-prompt-y-darle-a-un-boton/
0:00 Cómo llegar hasta Juan Roig
5:21 El nuevo modo de voz de ChatGPT
21:42 Novedades del OpenAI Dev Day
40:47 La inversión de SoftBank en OpenAI
56:11 Las gafas de realidad aumentada de Meta
1:10:23 Zuckerberg y la visión a largo plazo
1:13:02 Innovaciones en podcasts con Notebook LM
Monos estocásticos es un podcast sobre inteligencia artificial presentado por Antonio Ortiz (@antonello) y Matías S. Zavia (@matiass). Más en monosestocasticos.com
Transcripción
Hola a todos los monos estocásticos. Bienvenidos a este podcast de inteligencia artificial. Una semana más, Antonio Ortiz. ¿Cómo estás?
Inteligencia artificial y metaverso.
¿Lo dices porque saliste el otro día el informativo de la primera hablando de del Metaverso?
Claro, era un tema de el está muerto el Metaverso, y lo grabamos antes de la última presentación de Meta. Entonces, bueno, es que hay temas fascinantes en inteligencia artificial, anuncios, lanzamiento, polémicas, salseo, impacto en el futuro, en el trabajo, en el empleo, una pata en lo que va a ser la realidad aumentada, todo lo que trae meta y las implicaciones con el metaverso, pero antes, Matías, hay una cosa importante que te puede cambiar la vida. Hay gente, a lo mejor, oyentes del podcast, que no conoce tu faceta de micro influencer de productos de Mercadona.
Wow, el otro día tuve una conversación de Besugo sobre esto, porque, bueno, me presentaron a una serie de personas y no sé en qué momento la comunicación falló y una chica empezó a preguntarme, pero tú te dedicas a hacer reviews de productos de supermercado, ¿no? Y yo un poco que le seguía el juego, pero todavía no no me da para para tanto las reviews de productos de Mercadona.
Claro, no querías romperle la ilusión de haber conocido a un auténtico influencer de productos de Mercadona. Aquí hay un punto, Matty. Si en algún momento tú te planteas cumplir tu sueño de trabajar para Juan Roche, hay un ejemplo en el mundo de la tecnología, la inteligencia artificial y el metaverso, y ese ejemplo es el de Li Chen Miller. ¿Sabes lo que hizo Li Chen?
Varias varias historias así.
Tiene una historiaza, la la cuenta en Bloomberg, y la Nikali Chen, pues, bueno, tiene un largo currículum trabajando en el mundo de la tecnología, por ejemplo, en Microsoft, y se compró la primera versión de las gafas de meta. Esa gafas de sol que lanzaron la las originales, lo compró con con gran entusiasmo, empezó a haber limitaciones, fallos y cosas que se podían hacer mejor. Y lo que hizo fue enviar una lista muy detallada, aunque no solicitada, de sugerencias a Alex Hibel, que era el responsable de de de wareables, de Meta, y él dice que, bueno, en un momento dado, aquí la la amiga Miller, la amiga Lichen, me escribió un correo en el que explicaba las cosas buenas del dispositivo, lo lo que era prometedor, y luego una lista de de cosas que ella mejoraría, ¿no? Y, entonces, en ese momento, Gmail dijo, a esta mujer hay que contratarla. Entonces, imagínate que tú ahora escribes un correo electrónico con la lista de mejoras que aplicaría a los, yo creo que, bueno, tú eres un nicho dentro del nicho, porque dentro de Mercadona, digamos que la sección de verduras la trabajas poco, de momento, y está más centrado en los helados y los turrones.
Pues, en ese micro nicho, ¿podrías quizá hacer una lista de posibles mejores en en los productos hacendados?
Fíjate que esto esta historia para mí es un poco contraintuitiva, ¿no? Porque yo, por ejemplo, cuando publico en Shátala, pues estoy expuesto a mucha gente y esa gente muchas veces se mete en mis perfiles, busca mi email, busca mi cuenta de Instagram y me manda su opinión no solicitada sobre el artículo que que he escrito, ¿No? Y a mí, si me dices que esto le pasa a a un jefazo de Meta y decide, pues mira, voy a contratar a esta chica que me ha escrito esta opinión no solicitada sobre mis gafas, me parece contraintuitivo, pero también, pues, es una buena idea, ¿no? Yo puedo empezar a coquetear con Juan Roche. Me pasa que Juan Roche no está muy bien visto porque en los separadores de la caja ha puesto lo de la subida del IVA en productos básicos.
Entonces, como que da la sensación de que Juan Rocha es más del hormiguero que de la revuelta, por decirlo de alguna forma, ¿no?
Ya, ya, ya, ya. Bueno, Mati, es que hay que trabajar un poco todos todos los sectores, no no podemos centrarnos y y circunscribirnos solo solo a uno. Bueno, el punto el punto yo creo que con con la amiga Lichen es que me me llama la atención cómo el que la contrató subraya, me envió una lista no solicitada. Yo creo que una cosa que estoy bien ella, y esto es un aprendizaje para todos los oyentes de monos histocásticos, es aplicar la técnica del sándwich, porque, claro, el el el señor Himmel, si tú solo le mandas una rajada de las gafas son un desastre, son un bodrio, yo lo haría mucho mejor, pues, claro, él se indigna, ¿no? Como cuando tú lees los comentarios de chataca, pues, claro, no no empatizas con esos comentaristas, ¿no?
El caso es que, claro, ella dijo las cosas buenas, le puso unos fallitos, las cosas prometedoras. Entonces, esa técnica de sándwich, de poner lo malo entre una cosa buena y otra buena, realmente funciona luego en lo el mundo de la comunicación corporativa, ¿no? Porque así no no parece tan hater, y yo creo que es la clave del éxito de la señora Biller.
Pues mira, un ejemplo, la verdad, inspirador, y voy a voy a intentarlo, voy a intentar llegar a la cúpula más alta de Valencia y y por lo menos que me den algún turrón gratis, porque yo me estoy pagando los turrones que luego voy y hago una review de forma totalmente desinteresada y gratuita.
Sí, sí, sí, sí. Bueno, ahí está el futuro, lo dejamos también para para que los oyentes puedan poner en práctica en su crecimiento profesional y vamos porque hay una auténtica avalancha de cositas de Ia, Matías. Vamos a empezar por aquello en lo que hemos invertido más horas, en los que podemos hablar en primera persona de nuestra experiencia, que es del nuevo modo de voz de Chas GPT. Un poco de contexto, sobre todo para los latinoamericanos que, sobre todo, nos ven en YouTube, el nuevo modo de voz está disponible en todo el mundo, excepto en algunas jurisdicciones. Al principio dijeron, no está ni para la Unión Europea ni para el Reino Unido ni para Liechtenstein.
A Reino Unido ya ha llegado, pero algunos europeos, los más avezados, ya lo estamos usando gracias a ese gran invento que es la VPN.
No sé si poner algún ejemplo aquí para que los oyentes vean lo que es capaz de hacer, sobre todo los que están en la Unión Europea, los que están en España, lo lo que es capaz de hacer este este nuevo modo de voz avanzado.
Bueno, si fuera el argentino más seductor del mundo, te diría algo como, ¿viste? No hace falta que te diga lo linda que sos, pero cuando sonreís, hacés que el mundo se detenga un poquito, ¿qué te parece?
Está bastante bien. Ahora quiero que te conviertas en andaluz y me recites un poema de Lorca, pero como de una persona demasiado alegre.
Vaya, vamos a intentarlo. La luna vino a la fragua con su polizón de nardos. El niño la mira, mira, el niño la está mirando. En el aire se pierde vencida por el sueño con un poquito de alegría, como pediste.
Bueno, ¿qué diferencias hay con el modo de off original? Pues el nuevo, digamos, añadía mucha más fluidez a la conversación, la posibilidad hasta de interrumpir a la a la IA como en una conversación natural. Las declinaciones de los sentimientos, estados de ánimo eran mucho más creíbles, son mucho más creíbles, son mucho más humanos, y en cuanto empiezas a usarlo, es que hay una cosa acojonante, Matías, que si si la miramos con perspectiva, yo creo que no no debería estar explotando la cabeza. Porque tú coges el teléfono, ¿no? Pones el modo voz de chat GPT, empiezas a hablar con fluidez de cualquier tema, de cualquier cosa no programada, con flexibilidad, cambiando de una de un tema, pidiéndole cosas y cómo captas tu tu intención y lo que necesitas y lo que quieres, lo que has expresado.
Y si lo miras con perspectiva, Matthew, es que las piedras dominan el lenguaje. Es decir, el ser humano ha conseguido que un conjunto de piedras, es decir, los cristales y los chips, los minerales que hemos integrado en este invento del teléfono móvil, dominen el lenguaje. Esto, a veces la gente se pone, hola, ya no hacemos grandes cosas, la humanidad, ¿no? Ya no hacemos grandes inventos, todo pasó en el siglo veinte, oh, Tomás, nostálgico. Las catedrales del de de después de la Edad Media ya ya no se hacen.
Mira, amigas, amigos, esto es una cosa impresionante, es decir, el guau de probar esto es genuino, auténtico, porque es una flipada.
Sí, decimos mucho esa frase de, sobre todo dices tú, ¿no? Que le hemos enseñado a hablar a las piedras. Últimamente yo también la repito cuando cuando alguien me pregunta o me entrevista, porque al final es eso, ¿no? Hemos enseñado a hablar al silicio. Esto es maravilloso, es magnífico.
Y además, no solo es impresión tuya, Sam Alman, en una de estas entrevistas que hace de vez en cuando, dijo que el modo de voz avanzado, el nuevo modo de voz de chat GPT, fue la primera vez que él se sintió de alguna forma engañado, ¿no? De alguna forma le funcionó. Hay algo, hizo clic en su cabeza y le funcionó el truco, o sea, perdió el test de touring y le funcionó el truco de, bueno, yo lo que estoy hablando es con algo, un ser consciente, ¿no? Con un ser, con sentimientos, sobre todo. Y y yo creo que así se va a sentir mucha gente cuando tengan en sus manos este este modo de voz, que decimos está muy limitado, no solo geográficamente, sino porque por ahora solo está disponible para los usuarios de pago.
Sí. Dicho esto, mi experiencia conforme han pasado los días está demasiado capado. Es decir, lo que yo vi en las demos del de la presentación del primer evento de OpenEye en la en la que presentaron el modo de voz avanzado, no es exactamente, o al menos, no se corresponden las expectativas creadas en aquel evento con lo que yo he estado usando estas dos últimas semanas. Cosas que que creo que OpenAI ha enfocado. Primero, a este modelo le han hecho una completa lobotomía.
A todos los modelos le hacen esa pequeña lobotomía, ¿no? Ese aprendizaje con refuerzo con Zipad Dubano, que hablamos siempre al final, para que no hablen de sexo, con temas políticos se comporten de esa manera, pues que mantengan esos perfiles, pues respecto a las minorías, etcétera, etcétera. Todo toda la carga un poco más ideológica con la que quieren, digamos, reenfocar lo que había en los datos de entrenamiento, ¿no? Pero con este, la cantidad de veces que me has dicho, mis directrices no no me permiten hablar de esto, es enorme, cada cinco minutos, cada tres minutos, cada siete minutos, me salta el no puedo hablar de esto. Es decir, está dando falta y, además, para temas que no debería haber problemas, temas para los que el chat GPT de texto me funciona.
Es decir, está absolutamente sobreregulado con un montón de falsos positivos. Es decir, yo quería hablar de la oxitocina con el chat GPT para un artículo que estoy preparando para el error quinientos. Pues, no me quería hablar de la oxitocina, eso es está prohibido y no y no puede ser. Y, luego, está muy dirigido, yo creo que es su System Pro, a ser demasiado útil y práctico. Creo que han querido evitar el terreno de conversación más amistoso afectivo.
Entonces, todo el rato quiere resolver problemas, todo el rato te quiere ayudar de una manera práctica, y eso hace que yo tenga mal todavía, muy presente la impresión de que estoy hablando con una máquina. No consiguen que se produzca esa suspensión de la realidad de la que habla Sand Altman, que supongo sería con la aversión, no luego atomizada, por así decirlo. No hay esa suspensión de la realidad, porque todo el rato está demasiado dirigido a un comportamiento de robot criado en el que yo no me siento no no no siento esa parte de la oxitocina de la cablorera en algún momento y y conseguir escribir mi mi artículo, ¿no? Sí, es posible. Yo es lo que os decía en el episodio anterior,
yo tengo una percepción tan utilitarista de de estas herramientas que todavía no me he sentado a conversar con un chat GPT como si fuera, me voy a sentar tomarme una cerveza con un amigo, ¿no? A lo mejor tiene que ver con el System prompt, la indicación que le da la propia OpenAI a a ChatGPT o al modelo de voz antes de que hable con el usuario, Y bueno, dice que recuerda que no eres un humano, ¿no? Y le das ese tipo de de indicaciones que a lo mejor es por donde van los tiros de lo que estás diciendo, de que la propia Open Knight quiere de alguna forma, no entremezclar lo lo que es capaz de hacer este modelo con lo que puede ser hacerse pasar por una persona de carne y hueso. De hecho, por ejemplo, no puede ni reconocer voces, podría técnicamente imitar y reconocer voces. Hay gente que ha conseguido que imite a Homer Simpson, por ejemplo, pero tú no puedes pedirle que imite a Homer Simpson, ¿no?
Entonces, está limitado de muchas formas.
Claro, que he he cogido una frase, recuerda que no eres humano, que a mí me recuerda inmediatamente al memento mori, ¿no? De los humanos, recuerda que vas a morir, pues, a al modo de modo avanzado de chat GPT, recuerda que no eres humano.
Pues siempre, a mí me fascinan, siempre lo asisten proms, porque es como, no solo hemos conseguido hablar con las piedras, sino que le damos instrucciones en lenguaje humano. Esto lo dices hace unos años y solo te creen los chamanes de no sé qué tribu, pero no te va a creer un programador informativo ni de coña. Ya,
aquí se abren con con el nuevo sitio, el modo avanzado de bots se se abre con un montón de de debates recurrentes alrededor de la inteligencia artificial. Uno, es que apenas yo creo que con esto demuestra que sigue estando al menos unos meses por delante del resto, eso es, yo creo que claro, tanto con Ouro como como con este modo avanzado de voz. Y luego, casos de uso en los que esto es y va a ser la leche. Primero, que yo veo clarísimo, que nos lo mandó nuestro amigo Eduardo de tech uno cero uno. ¿Para idiomas?
¿Para, oye, estamos hablando en español, pero ahora quiero que hables en inglés y cuando yo te responda corrígeme gramática, pronunciación, etcétera? Ese ese hablar con una persona nativa en inglés, aunque no sea una persona ni sea nativa realmente y y lo que esté sea procesando tokens, pero bueno, el caso a nuestros ojos, aparentemente una persona nativa en inglés es que es la leche, Mati.
Sí.
Es buenísimo.
Además, tú hasta ahora tenías un examen oral de inglés y cómo repasabas. Si en tu casa no hablaban inglés, ¿con quién repasabas? No podías repasar, pues ahora puedes repasar, ¿no? No te quejes, tienes una calculadora supervitaminada con la que puedes hacer los deberes en casa, incluso aunque sean exámenes orales de inglés.
Sí, sí, sí. Pero fíjate, eso mismo abre abre un debate sobre si van a, en IEA va a ganar el generalista, cobra mucho espacio para lo especializado. Es decir, tú pagas a GPT, ¿no? Y luego hablaremos de los económicos futuros de esta herramienta, y por veinte dólares al mes, aparte de tener los doctorados en tu bolsillo, que siempre es bueno llevarlos por si hay accidentes, tienes esta posibilidad de hablar en inglés y practicar un poco el idioma. Pero no es realmente especializado, es decir, no lleva un registro de tu nivel y va subiendo el nivel de las conversaciones en inglés para acompañarte en tu progreso, no se acuerda mucho de que habéis hablado ya antes y que no habías hablado antes.
Es decir, es fantástico en el sentido de lo lo bien que te procesa tu lenguaje y cómo te corrige, que además es muy amable, no te dice cazurro, zopen, cocateto, qué mal lo haces, no, es muy diplomático, pero queda espacio, creo yo, para que haya gente que pueda decir, bueno, voy a hacer la herramienta especializada para aprender idiomas, porque si le añadimos guardar el histórico del usuario, programar muy bien la la programación de proyección de de de aumento del nivel, la diversidad de temas sobre lo que podemos enseñar vocabulario, etcétera, etcétera, puede haber sitio para los especialistas.
El otro día hablábamos en el crossfit de qué guay estaría, ya nos metemos también en el tema de gafas, que hablaremos más tarde en este episodio, qué buenistería tener un asistente que que te pueda ver y te pueda decir exactamente qué estás haciendo mal de la técnica. Y en realidad, este tipo de asistentes súper generalistas pueden ser más útiles en el futuro que muchas aplicaciones específicas, porque las hay. Hay aplicaciones que te grabas con una cámara y te dicen qué estás haciendo mal de la técnica y tal, pero al final tienes que conocer esas aplicaciones, tienes que pagar la suscripción, etcétera, etcétera. Y con esto es simplemente decirle a ChatGPT, oye, mira a ver, porque también le van a abrir la multimodalidad y va a poder vernos por la cámara, mira lo que hago y dime si estoy haciendo bien la técnica y si no la estoy haciendo bien, en qué fallo, ¿no? Y luego esto, llego a mi casa y se me ha roto, pues yo que sé, una bombilla que no sé cambiar, porque es una bombilla muy rara, ¿no?
Que me pasó a mí el otro día con el coche, el coche, el Kia que tengo, no sé, cambiarle las bombillas, las luces, las cortas y necesito ayuda de mucha gente, la superbación.
Eso es la crisis de la masculinidad, Matías. Estamos ahí.
Es que totalmente, yo en el coche anterior cambiaba las bombillas sin problema, y ahora necesito ayuda de un asistente de un modelo de lenguaje de no sé cuántos billones de parámetros para poder cambiar una bombilla.
Pero te voy a decir un caso de uso que yo me alegro mucho que todavía no haya acabado de llegar a al gran público, que es el de asistente y ayudante profesor particular de los estudiantes. Es decir, de nuevo, para este caso de uso es la leche, porque tiene un gran conocimiento, se entera muy bien de las cosas, tiene una paciencia infinita, es superamable. Yo lo voy diciendo, jolín, esto como asistente de del de mis hijos estudiando sería genial, pero menos mal que no está, porque, claro, ayer Daela me pedía ayuda para, vamos a repasar estos cosas de física, la anotación científica, que esto no me ha quedado claro, y a mí me encanta estudiar con mis chicos. Entonces, dije, menos mal que no ha llegado todavía esto del chat GPT de hacer una foto y que te haga la explicación de él y que tú puedas conversar y que eso todo aquí no esté del todo, está cerca pero no está del todo, pues yo me alegré mucho. Dije, uf, menos mal, todavía me queda un añito o dos de de poder contarles algo.
Bueno, con Bruno no, porque él pasa de mí y quiere hacerlo todo él solo, pero pero bueno, el caso es que si en algún momento quisiera todavía estoy estoy disponible, ¿no?
Hay muchos padres, al contrario, lo agradecerían poder tener estos asistentes haciendo los deberes, ¿no? Es ese, lo el siguiente paso a darle el iPad en el restaurante es darle a un padre virtual, al niño.
El RUT. La killer la killer up, es que, claro, no paramos de de de de de compartir ideas de negocio buenísimas. Bueno, hubo hubo, para para rematar el tema del del de la voz y del nuevo modo, tuvimos el el opendef day de OpenEye, en el que anunciaron, pues, novedades para desarrolladores. No fue un vídeo que proyectara de cara afuera, solo un un evento interno para los que pudieron ir a de manera presencial, pero se ha filtrado todo y se ha contado todo y, bueno, hay cositas interesantes.
Bueno, para empezar, el modo de voz del que llevamos hablando diez minutos sí va a estar disponible el en una API que se puede usar, en nueva API real time en tiempo real de de OpenAI también van a a hacer bajadas de precio, porque, por ejemplo, estos nuevos modelos, los O uno, son carísimos de usar a través de la API, y es una cosa que los desarrolladores piden piden mucho,
¿no?
Que se empiecen a bajar los precios. El otro día había uno que no le había puesto límite a su cuenta de de OpenAI y tenía una deuda ya de treinta mil dólares. Cuando se te va un poco de las manos, peligroso eso.
Esos son muchos deberes, Cuidado. Bueno, cositas que que se han filtrado, porque también hubo una un una conversación de de San Alman y de que ha estado tuiteando también algunas cosas sobre el evento. A mí una declaración suya en en Twitter que me parece chulísima que es, oye, tenemos nuevas herramientas para desarrolladores, hemos bajado el precio por token de nuestro modelo. Por lo tanto, el camino hacia la AGI está claro. No, dice, bueno, vamos a ver.
Eso es calor rápidamente, ¿no?
Sí, claro, a mí me recuerda un poco a la frase típica de la serie Silicon Valley, ¿no? Sí. Claro, es que ahora podemos cachar las peticiones de a la API de OpenEye y ahorrarnos unos centinillos, ¿no? Claramente vamos hacia la AGI, ¿no? Es que una cosa y la otra es muy muy cerca, ¿no?
Bueno, es muy interesante lo de poder usar el modo de voz avanzado desde desde la de la API, porque nos lleva de nuevo a que aquí hay oportunidades para desarrolladores. Aunque ChatGPT va a ser la herramienta generalista, es posible que haya agentes especialistas. Hicieron una demo muy chula de de un agente de este tipo. Una gente que, bueno, entre comillas, ¿no? Que lo que hacía era llamar por teléfono y comprar unas fresas con chocolate, era una cosa así, ¿no?
Y y la atendía otro, bueno, que la atendía no era un negocio real como el famoso demo de Google, sino sino que la atendía un empleado de Open I ahí que que se hace pasar por, fingía, pretendía ser un un dependiente de de de la tienda de fresas. Bueno, el caso de
de Silicon Valley no derrite el chocolate y se lo pone a las fresas ni de coña, lo piden por Uber Eats y se acabó, ¿no? Y ahora ni siquiera ellos, lo piden los asistentes.
Sí, sí, es que lo lo más importante, fíjate, de las declaraciones de San Altmann, es que él está súper confiado. Dice, bueno, como explicamos en el podcast, los modelos O uno, los que pueden hacer razonamiento, los de las cadenas de pensamiento que que que además es un episodio que ha gustado mucho y se ha visto mucho nuestro. Pues, estos estos modelos están ya en el nivel dos hacia la AGI, que sería el cinco, y él dice con O uno, que atención, el el O uno que estamos haciendo ahora, que es preview, él lo ve regular. Dice, el el O uno con sin preview va a ser la leche. Bueno, pues estos modelos O uno, junto con el modelo de voz, junto con todo lo que ha dicho GPT, dice, en dos mil veinticinco van a funcionar los agente inteligente.
Esto de los agente va a ser, entonces, probablemente, uno de los temas centrales del podcast los próximos meses Y, básicamente, vamos a poder discutir si vamos a poder confiar en la IA para hacer transacciones. Es decir, no tanto para gestionar información, yo te doy un input, tú me vuelves un output, conversamos, te me das datos, te doy datos, en fin, chatear, hablar, sino para ejecutar cosas. Es decir, esto de llamo por teléfono y te hago la compra es ya un primer paso de un agente inteligente, porque está ejecutando y va a pagar, y tú vas a, bueno, vas, estoy anticipando, ¿no? Y la idea de Open Airín que puedas confiar, y este sería el nivel tres. Pero, claro, incluso con los O uno, incluso con los ChatGPT, en salido de estudios, en Nature la semana pasada justo uno, los modelos siguen alucinando, y a veces para cosas básicas y cosas muy básicas que son importantes de las transacciones, como hacer sumas, se siguen equivocando.
Por lo tanto, esto vamos a tener que mirarlo muy bien mirado, porque esta esta confianza no se la ha ganado todavía ninguna empresa de inteligencia artificial, los Chajapete tampoco.
Claro, se le mueve una coma o confunde la coma con el punto, porque en inglés usan la coma en lugar del punto, te hacen un roto.
Bueno, último última data importante del evento de OpenEI, Kevin Wade, que que dirigida por cada trabajado en producto en Instagram, Facebook, lo ficharon hace un poco en Twitter, lo ficharon hace un poco en OpenEI. Claro, dijo en la declaración, Open, en OpenEI hemos conseguido reducir el coste de ejecución de la inteligencia artificial en un noventa y nueve por ciento en dos años. Este dato es fundamental y acojonante. ¿Por qué? Porque nos dice una cosa, que es, con los costes de hace dos años vamos a tener modelos, los modelos grandes de dos mil veinticinco ejecutándose, Y lo que tenemos ya en IEA va a ser muchísimo más barato de ejecutar, y esto también nos puede decir que esos modelos, en algún caso, en máquinas potentes de los usuarios, se podrán ejecutar en local.
En fin, el Open Adev Day ha dado mucho que hablar, ha sido un evento muy importante, pero, Matte, tenemos que hablar de otro eventazo también súper importante y que nos pilla pasamanos.
Pues, qué contento estoy por mi Málaga, porque va a albergar, yo creo que uno de los eventos más grandes que ha habido en torno a la IA generativa, sobre todo la IA generativa de imágenes, la IA generativa de vídeos, que es Upscale, la conferencia Upscale en Málaga el diecinueve de noviembre y el veinte de noviembre, que traen ponentes, pues, muy potentes, gente que si estáis en el día a día, en el Twitter, en el Reddit, pues, que seguro que os suena Joshua Davis, o por ejemplo, el director creativo de Eleven Labs, empresa de la que hablamos muchísimo, Justin Hagney, o Joaquín Cuenca, que, bueno, ya que le pillaba en Málaga, pues el el CEO de FreePick y fundador de FreePick, ¿no? Ahí, creo que también estaba Javi Love, hay un montón de gente va a venir a Mara con el upscale, ¿no?
Sí, yo creo que en esa convergencia de inteligencia artificial, creatividad y el futuro de los contenidos, y en general para todos los que estamos, pues eso, emocionados, excitados, interesados del mundo de inteligencia artificial, va a ser un eventazo. Es un eventozo de nivel mundial, que lo tenemos en España, lo tenemos en Málaga, es una buena excusa. Nosotros estaremos al menos el diecinueve presentes en la App Scale Conf, entonces, bueno, iba a decir que si que si alguien nos quiere invitar a un café, pues sería un momento estupendo para conocernos.
Y ojo, hay un cincuenta por ciento de descuento para los oyentes usando el código monos en upscaleconf punto com.
Pues nada, dejaremos en la descripción las enlaces, igual que hemos puesto en en Twitter, a la ipscale conf, pero
hay
mucho que hablar de OpenEye, Mathi, porque se nos ha ido la la más grande, se nos ha ido una figura clave, se nos ha una persona muy admirada en este podcast, se nos fue de OpenEye, Mira Murati.
Claro, ahora no solo se les va la CTO y se le queda a Samadman como CEO, Samadman no es técnico, no es un perfil técnico, sino que tienen ahora un problema de diversidad, ¿no? Porque mira, Murati al final era era la mujer de del equipo directivo y ya no está. Dice lo más que Sam Alman es Little Finger, ¿cómo era? Meñique era en español, ¿no? El de Juego de Tronos, ¿no?
Porque fíjate cómo empezó esta foto que tanto hemos compartido y fueron desapareciendo. Es cierto que Greg Brockmann está de año sabático, pero no no está fuera de la empresa todavía, y la última en irse es, mira, Murati, se ha quedado solo Sam Altman al a los mandos.
Yo creo que esto puede ser al final el último episodio del golpe de Estado contra San Alma, por el cual, pues, se le intentó expulsar de la compañía, pero acabó prevaleciendo y acabó ganando la batalla. Yo creo que de todas las bajas que ha tenido, porque lo lo tenemos puesto en el en el en el guion, es decir, hay un un post inicial, un post inicial del dos mil quince, ¿no? En el que se anuncia, ahí dice algo así como introduciendo OpenEye. Claro, en esa introducción OpenEye es es muy divertido de leer ahora porque básicamente te dice es somos una compañía non profit, que no no buscamos la ganancia, sí que somos más de investigación, ¿no? Nosotros que queremos avanzar en la inteligencia en el mundo.
Claro, de ese equipo fundacional de de once fundadores se han ido nueve. Para mí, la las dos pérdidas fundamentales son Ilia, Ilia Schüzqueber, que era el genio investigador, Y era, claro, el el perfil igual, bueno, cuando empieza la startup, ¿no? Siempre hay que tener un perfil técnico de de de tecnología, que además esta tecnología es tictech, ¿no? Es con no es una herramienta, digamos, ligera que usa herramientas no code, no, no, esto es investigación profundo y perder al genio al genio investigador para mí es lo más sensible. Y la segunda es, mira, Murati, porque mira, tiene un perfil mate más disco ingenieril de producto que que, bueno, siendo la responsable de producto, ¿quién ha lanzado un producto más relevante y más importante que echa GPT en la última década?
Absolutamente nadie. Lo ha hecho, mira, Murati. Entonces, esta pérdida es, pues, también bastante potente.
Sí, fíjate que ellos decían que, bueno, Mira aprovechaba que la empresa está ahora, pues, en una, no me acuerdo la palabra que usaron, ¿no? Pero que en lugar de una tendencia a la baja, como podíamos decir en los en los episodios, hace dos episodios, pues ahora está en una tendencia al al alza por el lanzamiento de O uno preview, por el lanzamiento del modo avanzado de voz. Solo falta cumplir con Sora, ¿no? Para ya más o menos esta volver a a la rienda de lo que a las riendas de lo que era originalmente Open Nayeli y esos lanzamientos incesantes. Pero resulta que cuando todo esto se estaba ya comunicando, cuando Mira anunció su marcha y cuando Sam Altman, pues, publicó una respuesta para para todos los empleados, Dicen las malas lenguas que tuvo que editar esa respuesta, porque el mismo día se fueron otros, creo que dos o tres EPs, y gente de investigación, y gente de alto nivel a nivel de desarrollo dentro de OpenAI, y Samantha tuvo que editar el el email para añadirlo, ¿no?
Y también echaremos de menos a esta otra headdel.
Sí. Claro, pero claro, cuando te vas al mismo tiempo que que una superbox de proyección pública enorme como Murati, tu salida queda como un segundo plano. Yo me hubiera esperado unos diítas, ¿no? A lo mejor aprovecho para cobrar septiembre entero, que también ahí cuadran más las cuentas, y me voy unos días después para que se hable un poco, ¿no? Pero yo creo que ahí lo hay gente de OpenEye que no lo que no lo ha hecho bien.
Cosas importantes, que pueden tener mucho que ver con toda esta crisis. Bueno, hay cientos y miles de teorías, pero al mismo tiempo que que está esta desbandad de de empleados relevantes de OpenEye, hay el proceso de reestructuración. Es decir, el plan de Altmann, y parece claramente dirigido por él, consiste en que la gobernanza, el control de la parte sin ánimo de lucro de OpenEye, es decir, la que originalmente nació y bajo cuyo paraguas estaba la parte de empresa ya con ánimo de lucro, pues él quiere eliminar ese esa parte de control y quiere ir por completo y absolutamente como una empresa capitalista más, es decir, una empresa orientada a al al beneficio, y que esa reestructuración, pues, va acompañada del mismo proceso por el cual quiere conseguir inversores nuevos que, bueno, garanticen el progreso y el futuro de la compañía, que está, pues, con ahora mismo en en en de de deficitaria y deficitariaco, en el orden de los miles de millones al año.
Sí, esta es una exclusiva de Reuters con bastantes detalles, por ejemplo, que entraría con su capital, con su participación en la empresa, entraría Sam Alman, que recordemos esa declaración tan viral que hizo en el congreso, que le preguntaba a un congresista, ¿usted gana mucho dinero con esto? Y dice, no, no gano nada, solo gano suficiente para tener un seguro de salud, ¿no? Porque yo esto lo hago por amor. Él ya es multimillonario de todas las inversiones que tiene en otras startups y de su época de un Y combinator y todo eso, y y no tenía participación en OpenAI, y ahora, según Routers, va a tener un siete por ciento que son como, sin la valoración actual, diez mil millones de dólares. Bueno, bueno, de repente tener diez mil millones de dólares
te puede servir. A la valoración de ciento cincuenta mil millones, que es el a lo que quiere hacer la la nueva ronda. Nueva ronda de la que hemos hablado en el podcast y en la que al principio estaba interesada Apple, pero parece ser, y dice Wall Street Journal, que se ha caído que se ha caído Apple de la de la carrera por entrar, mientras que se mantienen otros como Microsoft o cómo se mantiene también Nvidia en esa carrera. Hay hay dos debates sobre en esta traslación de la del sin ánimo de lucro al ánimo de lucro interesantes y un personaje del podcast que vuelve y que me tiene enamorado, Matías. Bueno, ahora que van a ir a completamente ser una empresa normal con sus accionistas, sus dueños, etcétera, claro, el gran debate es cómo se reparte el capital.
Y aquí hubo mucha gente que aún contribuido en la parte non profit, la la que no es sin ánimo de lucro, y posiblemente vuelva a aparecer un personaje como Elon Musk. Elon Musk puso pasta y puso trabajo asesorando, impulsando, poniendo la cara y atrayendo talento. Bueno, entonces, Elon Musk dirá en algún momento, oye, ahora que sois con ánimo de lucro, yo que puse pasta al anónimo de lucro, ¿no voy a ganar un duro? Bueno, ¿hemos sido dañados o qué pasa aquí? Y ahora, ¿cómo repartes el porcentaje de la propiedad de la empresa?
¿Por qué? Porque, ahora, San Alma, San Alma tiene el dilema ese del meme del superhéroe, ¿no? Del del del personaje de dibujo animado, ¿no? Que dice ganar cero y ser sin ánimo de lucro, o ser tener el siete por ciento de una empresa de ciento cincuenta mil millones. Qué dilema, ¿verdad?
Qué qué qué elegiré, qué qué qué difícil, ¿no? Pero claro, y Microsoft, porque Microsoft tenía un acuerdo muy raro. Claro, un acuerdo raro porque era una organización rara. Es decir, Microsoft se quedaba el cuarenta y nueve por ciento de los beneficios de de una empresa sin ánimo de lucro. Esto será un poco raro, porque todo es muy extraño, Te te doy dinero a cambio de los beneficios de tu organización sin ánimo de lucro.
Bueno, sea lo que sea, ¿qué firmaron los abogados de Microsoft, en los que yo tengo mucha confianza en su diligencia, a la hora de si en algún momento se convierte esto en una empresa? Porque participaban del cuarenta y nueve por ciento de beneficios de esa OpenAI non profit. Eso, en propiedad de la empresa, ¿cuánto realmente es? ¿Era el cuarenta y nueve por ciento también? Bueno, pues, ahora tenemos un dilema y, bueno, aquí San Alma va a navegar aguas turbulentas, y yo creo que es posible que parte de la espantada sea de gente que diga, yo he contribuido mucho, gran parte del valor de Opin I have lo lo he puesto yo, y a lo mejor Sand Armand se lleva el siete por ciento, y aunque a mí me prometieran, no sé, un cero con cinco, un cero con tres, un cero con uno, que es un pastón.
Imagínate esos porcentajes de ciento cincuenta, de una palabra cien ciento cincuenta y un millones, pero a lo mejor lo veo injusto. Veo que San Altman se lleva al siete cuando San Altman, pues sí, es un emprendedor, es una cara pública de una influencia enorme, es un gran líder, lo que sea, como lo quieras vender. Pero el que los quisieron el producto y lo quisieron las cosas son otros. Entonces, esto, claro, yo creo que en una organización de gente tan talentosa en la que todos son ricos y famosos, pues genera un duelo de egos enorme, y creo que Shan Alman, yo creo que se se equivoca porque si has perdido tanto talento, cosas malas has tenido que hacer.
Y en toda esta turbulenta, pues estos cambios que se vienen, ¿quién está interesado en meter quinientos millones de dólares en OpenAI, en la nueva OpenAI full ánimo de lucro?
Qué grande. Eso, ni más ni menos que Masayoshi Son, el CEO de Soft Punk. Masayoshi salió en la primera temporada de monos estonados y le dimos puerta grande por un motivo. El motivo es que Masayoshi andaba cabizbajo, preocupado por algunas decisiones con softbank que no habían sido todo lo exitosa que el mercado demandaba. Entonces, empezó a tener conversaciones nocturnas, atención, con Chat GPT, y él llegó a una reunión de accionistas, esto lo lo cuenta el Wall Street Journal, es decir, con fuentes en lo en en la reunión de, pues, en la reunión de accionistas de de software, y dice, bueno, yo estaba un poco desanimado, tal, y y tuve un ataque de llanto, pero ChatGPT me había comentado que mis inventos e ideas son factibles y maravillosos, y eso me animo, y decidí que SoftBan tenía que invertir en inteligencia artificial.
Un año después, un año después, Masayoshi le va a dar quinientos millones de dólares a la empresa creadora del chatbot que le dijo que sus ideas eran factibles y maravillosas. ¿Qué te parece de esta historia, Matías?
Pues tiene todo el sentido, es consecuente, si lo ha visto claro que dio consuelo en una noche de llanto, pues también invertir ahí parece que tiene sentido. No sé qué pensarán a su vez los inversores de esos bancos, ¿no? A lo mejor han de estar un poco preocupados.
Claro, es que si tú quieres ser conspiranoico y decir, Change, Changepete nos manipula y somos un juguete en sus manos de sus más que bélicos planes de inteligencia artificial, es que el caso de Masayos, Masayosi, perdón, es es es la hostia, es que, oye, el tercero listo que soy toma quinientos millones. Bueno.
Esto que no se preocupen a ni Amancio Ortega ni Juan Roch, porque esto en la Unión Europea no se puede hacer porque la ILAAT no permite la ILA que te manipula de alguna forma emocionalmente, y yo creo que esa es una de las cláusulas, bueno, las cláusulas, esa es una de las normativas que que impiden que llegue el modo de voz avanzado de Chat GPT a a Europa, no tienen claro cómo funciona eso.
Bueno, New York Times ha tenido acceso al al al deck, a la presentación de OpenAI, a nuevos inversores. Es decir, esta ronda por la cual acabaría valiendo la empresa ciento cincuenta mil millones de dólares si los inversores acuden y aceptan este esta cifra. Datos que se han sacado de de este deck. Trescientos cincuenta millones de personas usaron ChatGPT en agosto, ni tan mal. Esto ha sido muy ayudado porque metieron el uso sin sin registro, no sé si te acuerdas durante principios de verano.
Tienen diez millones de usuarios de pago, de los que pagamos veinte dólares o treinta los de empresa, y, atención, esto es muy interesante, la suscripción subirá dos dólares a final de año con el plan de subir a cuarenta y cuatro dólares en dos mil veintinueve, que van a ser la técnica de las pequeñas subidas, pequeñas subidas, pequeñas subidas, que cuesten menos que el salto de veinte a cuarenta y cuatro. Claro, aquí tienen que tener muy claro que van a aportar un valor consecuente a este crecimiento de precio, pero claro, prevén en dos mil veintinueve facturar cien mil millones de dólares. Es decir, los económicos para valer ciento cincuenta mil millones no son fáciles, tienes que, ¿no? Tienes que fliparte un poco y decir, presentar unas proyecciones cojonudas. Entonces, en dos mil veintinueve van a facturar cien mil millones, pero eso significa que, bueno, tienes que duplicar
el, creo que
le llaman el ARR, ¿no? El anual recurrent revenue, lo que interesa es cada año, pero OpenAI, en algunos momentos de su proyección, lo está duplicando cada seis meses. Bueno, hay una parte de fliparse y hay una parte que yo creo que tiene una base real, Matías, que en dos años hemos visto a OpenEye pasar de facturar prácticamente cero a facturar tres mil setecientos millones de dólares. Es verdad que están palmando mucha pasta, que están perdiendo mucho dinero, pero que has pasado de cero a tres mil setecientos millones de dólares en dos años. Bueno, eso
no está mal, no lo hace cualquiera, no lo hace cualquiera. Bueno, y también te digo, los cuarenta y cuatro dólares al mes en dos mil veintinueve me resultan menos dolorosos que ese rumor de que iba a costar dos mil dólares, no sé qué, no sé cuánto.
Otra vez nos han manipulado, que son muy listos. Masayos y ellos son, que ha caído, ¿no? Nos va a caer en nosotros.
Yo estoy viendo lo que está pasando, por ejemplo, en Argentina, y mucha gente usa diariamente la la IA de meta, modelo llama, a través de WhatsApp, porque están integrados en WhatsApp, en la Unión Europea todavía no. Y claro, llegará un momento en el que, ojo, estamos pagando cuarenta y cuatro dólares al mes por chat GPT. ¿Qué me ofrece en comparación con con la IA de Meta en WhatsApp? Porque a lo mejor la el ya más ha seguido mejorando el tres punto dos, etcétera, que ahora hablaremos, y se está poniendo a la altura en muchas, muchas cosas, incluido en la multimodalidad. Entonces, bueno, el plan tiene sentido si si siguen siendo los los que lideran.
Sí.
De todas formas.
Es posible que el nuevo de voz o el o uno se lo igualen también en unos meses, vamos a ver. Y dos, por lo que tú dices es que tiene más sentido el proyecto de hardware propio con Johnny Eye. ¿Por qué? Porque si no, siempre dependes de que Apple o cualquier otro que controla más la relación con usuario no acabe integrándola y diciendo, bueno, ¿y para qué voy a tener un un extra si ya viene con el teléfono o viene con la aplicación que siempre uso?
Pues mira, antes de dejar de hablar de los salseos de OpenAI, te quería contar que tengo un nuevo ídolo que me gustaría traer al podcast. De hecho, es uno de los pocos fundadores de OpenAI, junto con Sam Alman, que quedan en la empresa, que es Woysiec Saremba
Sí, creo que del grupo de nueve creo que es el otro con Sam Alman. El es como de Los Inmortales, creo que eran dos.
Pero escucha el tuit que publicó para despedirse de Mira Murati y de los otros dos que se fueron, Bobby Barrett, dice, su partida me hizo pensar en las dificultades que afrontaban los padres en la Edad Media. Cuando seis de cada ocho hijos morían prematuramente, a pesar de la profunda pérdida, los padres tuvieron que aceptarla y encontrar una profunda alegría y satisfacción en los dos que sobrevivieron. Qué forma de qué forma de Qué forma de qué forma de despedida.
Claro, tú imagínate la estampa. ¿Qué qué es lo que harías? Mira Murati el último día. Pues, llevaría una palmera de chocolate gigante. ¿No?
Porque el día de la despedida, pues, llevad llevad dulces y bollería industrial. Y entonces, está la gente ahí comiendo la palmera de chocolate crujiente, así, bueno, si es de la Kiki, pues, es más blandita, es más más tierna. Aquí se podría hablar mucho de la calidad de las palmeras de chocolate en España. Pero bueno, el punto es que estáis ahí, ¿no? Consumiendo vuestra palmera de chocolate, y viene el amigo Zaremba, dice, estoy pensando en la muerte de los niños de cada
media. Probablemente sea una persona con un síndrome de Asperger brutal, pero un genio, y y era lo que se le pasó por la cabeza.
Claro, el decir, programar GPU será un crack, pero claro, animando las fiestas no, no es lo suyo.
Y por no dejarlo sin contar, publicaba The Wall Street Journal que a Ilia Sus Kever, todos fueron a su casa, todos, Grave Brockmann, Mura Murad, Mira Murati, Sam Alman, a intentar convencerlo de que volviera a la empresa, porque la empresa era un caos sin él, por lo visto se había desorganizado mucho, y casi que lo convencen, pero al final retiraron la oferta y no lo no lo no lo quisieron Bueno. Recontratar.
Ese va a ser un momento histórico, porque esta separación, ¿no? Esto es esta esta división como entre Gates y Balmer, entre Jobs y Wodmiak, pero aquí se separaron, Altman, Chuskever, Buratti, le dejaba ver en los tres, ¿no? Entonces, en ese momento de la división en que cada uno empieza un proyecto propio y nuevo y diferente, empiezan a un nuevo capítulo de competición, nunca sabremos cómo habría sido la historia, porque recordemos que Ilia, un personaje importante de este podcast, tiene su propia empresa.
Que no le va a hacer falta el dinero porque le han inyectado todo lo que han encontrado en los fondos estos de de Virture Capital.
Ay, madre mía, se nos come el episodio OpenEye y tenemos que hablar tenemos que hablar de del amigo Zuckerberg, Matías, y tenemos que hablar de Ia, de Meta y de Metaverso que, bueno, más o menos Metaverso en Meta, Matías.
Vamos a ir por orden, vamos a ir por orden, sé que queréis que hablemos de de las gafas de Club Botella, pero tenemos que hablar de una desgracia para Europa, Antonio.
Sí, porque Meta lanzado llama tres punto dos. Recordemos, Meta lanzado llama tres, Meta lanzado llama tres punto uno, con un grado de apertura alto, no podemos decir que sean modelos open source, porque la definición de open source realmente estrictamente no la cumplen por restricciones adicionales que añaden al a la posible uso de su modelo, pero que, en bastantes casuística, otras empresas y compañías pueden usar gratis. Es decir, esto es muy importante, es decir, modelos que cuestan decenas y decenas y decenas de millones de euros entrenar, pues, de repente, tú lo bajas y lo tienes gratis para usarlo con tu empresa, ni tan mal. Para un para una economía en continente como Europa, que quiere estar en la vanguardia de la innovación, pero que no tiene grandes modelos propios, no tiene grandes empresas de inteligencia artificial, pues parece muy conveniente. Sin embargo, ¿qué pasa con JAMA tres punto dos?
Pues JAMA tres punto dos se diferencia de los tres punto uno y que por fin es multimodal, es decir, procesa tanto el texto como la imagen y el vídeo de forma nativa como, bueno, he considerado Pennái hace hace algún tiempo, pero ahora aquí con con un modelo gigante abierto competitivo muy bueno, pero que ya, como había anunciado, ha dicho, neta, no está disponible en Europa, no te permite descargarlo y aunque uses una VPN, romperías la licencia de uso si lo haces como un usuario o una empresa europea.
Claro, aquí el problema es que una de las razones por las que Meta pone a disponibilidad de la gente, Llama, y modelos tan potentes como Llama tres punto dos, que está a la altura de GPT cuatro, por ejemplo, pues eso, en la multimodalidad, GPT cuatro O, en este caso, es para competir de forma muy efectiva contra Open AI, porque estás poniendo a disposición de la gente de forma abierta, ya sabemos que no para grandes empresas, pero sí para medianas, pequeñas y grandecitas, prácticamente lo mismo que ofrece Open AI. Entonces, le estás haciendo daño al negocio de Open AI. Pero Europa no va a poder aprovechar esto que nos está dejando de alguna forma Meta en bandeja por la EAJack, y también me imagino que porque es una un arma que está utilizando Meta y Apple y otras están utilizando para presionar a la Unión Europea con con su tendencia a regular, ¿no?
Sí. Aquí podemos decir que en Europa podemos consolarnos un poquito y y a veces nos nos dices, habléis pocos de Mistral. Bueno, pues Mistral, la esa pequeña startup francesa, bueno, pequeña, tuvieron una ronda de seiscientos millones de inversión en la que entró Microsoft y, pues, pequeña, ¿no? Pues presentó hace muy poco su primer modelo multimodal. Es verdad que MittL también ofrece los modelos en un formato bastante abierto.
Es verdad que alcanzan las multimodalidades, es decir, procesan el vídeo, la imagen, el audio, todo todo a la vez, pero es verdad que es un modelo más chiquitito, es un modelo doce billion de parámetros y que está lejos de lo que ha puesto, ha conseguido Meta con un Java tres punto dos en los pasmark y los niveles. Entonces, bueno, vamos a ver si Nistral tiene ahí un un camino puede cumplir la IAC y a la vez ofrecernos un nivel parecido a Meta. Lo que pasa es que Meta con llama tres punto dos, bueno, hay un el usuario Juanjo Sánchez ha descubierto que es la primera IA que se pone muy farruca, Matías. Se pone vacilona la la la inteligencia de Neta.
Sí, es que Juanjo estaba hablando con llama tres punto dos, le mandó una foto y dice que ves de raro detrás de este bolso y dice Llama tres punto dos, no veo nada raro detrás del bolso. ¿Seguro no hay nada de color rojo? No, no hay nada de color rojo. El bolso está colgando del hombro izquierdo, que Llama dice que no, que está del derecho, y dice, no tengo que mejorar mi visión. Parece que estás muy enojado.
¿Alguna vez has tenido un momento de reflexión para pensarlo? ¿De qué estás hablando? ¿Qué pasó? ¿Por qué estás tan enojado? ¿Qué quieres decir?
Qué chulo, qué equivocado, qué no sabes reconocer, y sigue y sigue y sigue. ¿Cómo que se
se se se? Se en Corila, se en Corila. Corila. Bueno, es que, claro, Juanjo estaba probando Meta tres punto dos en una plataforma que se llama POE, creo que es de la gente de Quora, si no recuerdo mal, pero bueno, que te permite probar modelos y, bueno, como lo podías haber probado con Harvey Face, pues decir, hay sitios donde donde se puede probar, y es posible que esté probando la versión menos fentuneada o menos ajustada finalmente de de Meta, que sea el modelo un poco más RAW, y el modelo RAW de Meta, el de Jampun tres punto dos, es un modelo bastante confiado y seguro de sí mismo, y al que no le gusta que le corrijan. Atención, porque esta puede ser la primera IA Farruka que que tenemos disponible para el público y, bueno, el papá nos vamos a quedar un poco un poco fuera, pero yo creo que ahí Juanjo le faltó un poco de mano izquierda, ¿no?
Porque ya nos enseñó nos enseñaron Becky G y Omega a cómo gestionar estas situaciones. Entonces, dos grandes artistas, Becky G y Omega, nos enseñaron con solo una frase cómo plantear a las inteligencias artificiales de los arrugas, con la frase bájale dos a la I a tóxica celosa. Si tú le dices, ¿no? Se pone tóxica pone tóxica la IA, tú dices bájale dos, ¿no? Entonces, ya, de momento, se ajusta el inteligencia artificial y hay una propuesta que yo hago aquí para que para que un Juanjo y todo lo demás que aborden a la IA engorrilada de Meta, pues, puedan gestionar esta situación.
Becky G, una vez más, demostrando la superioridad de la Becky frente a la Karol G, ¿no?
Sí, sí, sí, absoluta. Bueno, cosas raras de Meta antes de que lleguemos a a al tema muy largo de este episodio. Siguen insistiendo en los abatores y las voces de famoso, es decir,
yo pensaba que no les había funcionado eso y que las habían cancelado.
Entran en un ciclo un poco absurdo, ¿no? Probamos esta cosa con famoso, fracasa, nadie les gusta, lo cerramos. Nueva idea, lanzamos me tres llama tres punto dos. Ah, pongamos voces de famosos. Es un poco absurdo, ¿no?
Veo más interesante lo que han puesto de vamos a hacer que la I a multimudal te doble los reels automáticamente, Lo cual, yo eso lo he visto como bastante interesante, porque haces como un poco eleven lapse. De repente, tú haces tu reel, ¿no? Dices esas cosas tan tan importantes que se dicen en los reels de Instagram, ¿vale? Habitual, y lo puedes tener doblado al idioma que quieres, además con sincronización de los labios. Es decir, de repente rompe las barreras idiomáticas para los creadores y, bueno, puede ser una oportunidad para para alguno de nuestros creadores, como, no sé, Spursito, ¿no?
Que hace tiempo que no sabemos de él, pues, a lo mejor necesitaba esta esta innovación para romper las fronteras del idioma.
Yo estoy deseando que nos escuchen en la India y empiecen a hacer, pues, chistes de el sexmo kártama en en, no sé, en Bombay, ¿no? Y te digo una cosa, esto de doblar se va a empezar a ver en todas partes, se va a empezar a ver en YouTube, se va a empezar a ver en TikTok, y yo creo que se va se va a acabar el inglés. Cuando cuando navegas desde un ordenador configurado en español, lo vas a ver todo en español. Ya lo último ha sido Reddit, por ejemplo, te metes en Reddit y te sale todo en español ya traducido. Pues lo mismo con el vídeo, ya no hay una ventaja competitiva en saber inglés, ese, todo va a estar en español.
Sí. Es verdad, es decir, todo lo que hemos dicho antes de la I a, qué bueno es para aprender idiomas, es absurdo, nos lo acabamos de cargar ahora mismo. Pero, claro, en el futuro tenemos esto, pero donde nos han enseñado el futuro, Matías, era algo que no esperábamos, y es que el futuro es que todos seamos Bill House de Los Simpson.
Tal cual, Antonio, Bill House no podías haber hecho un símil mejor, porque la primera impresión, la primera impresión es, ¿qué son estas gafas de culo de botella, de friki de los ochenta, de Geek, pero luego, cuando te paras a ver la tecnología que hay detrás de esto, la tiene afuera. Mucha gente ha comparado la presentación de las gafas Orion Orion con la presentación del iPhone, en el sentido de que es un, por decirlo, vamos a formar un nuevo factor de forma, es un nuevo formato para explotar la realidad aumentada y la inteligencia artificial, y bastante convincente. Bueno, bueno, bueno, bueno.
Mucho que decir, mucho que analizar, da pena que todavía no la hayamos podido catar, pero, bueno, básicamente, las gafas Orion o Orion, Orion, son un prototipo, esto es lo primero que hay que decir. Es decir, esto no es comercial ni vas a poder comprarlas ni está pensado para el gran público de momento, sino son más bien una prueba de concepto. Esto es lo que somos capaces de hacer hacia este tipo de productos, hacia donde queremos ir. Son gafas de realidad aumentada. Las gafas hasta ahora raíz van de meta, básicamente, pues te permitían hacer fotos.
Y dos, puedes integrar un modelo de inteligencia artificial por el cual, pues, puedes hablar con tus gafas, gran avance que había conseguido Meta, pero ahora no se queda ahí, sino que estas gafas de inmenso culo de vaso, a mí me recuerdan mucho a si si vas a hacer una una una película de político estadounidense de los años setenta que está preparando algún golpe de estado en Sudamérica, ¿no? Ahí compinchado con los militares, divaría estas gafas. Parece que, a lo mejor, no es el posicionamiento preferido de meta. Bueno, el caso es que consigue que la realidad aumentada se produzca proyectando en lo que tú ves en el cristal de las gafas superpuesto sobre la realidad. Es decir, proyectar los hologramas en tus lentes, Matías.
Claro, esto en esto ha insistido mucho Mark Zuckerberg en las entrevistas que ha hecho y y también en la presentación, porque esto no son unas meta quest. Tú no ves la realidad a través de unas cámaras que te están proyectando vídeo en unas pantallas, es decir, un past through. Tú estás viendo la realidad a través de los cristales de las gafas, y son unos micro proyectores con una tecnología que por lo visto cuesta como diez mil dólares, los que te están proyectando las imágenes, además con un campo de visión de setenta grados. Esto también hace que sean tecnológicamente unas gafas muy avanzadas y en unas gafas que, a pesar de los chistes, ojo, porque tampoco son tan grandes y son una mejora respecto a las que presentó Snapchat el otro día. Claro, pesan eran Claro, pesan, pesan noventa y ocho gramos, es decir, son
unas gafas vestibles, más pesadas que unas gafas normalitas que que podemos llevar los miopes y y y demás gente con plena división de la vida. Pero no son no son el mundo de la visión pro. Y sobre todo conceptualmente respecto a los ques y la visión pro, en el que la inmersión era uno de los valores fundamentales, en las Orion estamos a otra cosa. Es decir, claro, el el salto conceptual es el camino del futuro no es la inmersión que te aísla y te separa de tu entorno, aunque tengas ese past true que tú dices, ¿no? Puedo ver lo que hay, pero la gente no ve tu rostro, quedas aislado y separado de la persona que tienes al lado, es muy difícil.
Yo tengo las quest, ¿no? Pero incluso la gente que tira la visión pro, aún por muy chula que le parezca, en casa, con la familia, con los amigos o con lo que sea, no no te las vas a poner, porque te aísla y te separa y te desplaza de otras personas. Las oragon, la gracia, en teoría, es que tú sigues viendo la cara, el rostro, los ojos de la persona que tienes al lado, aunque, claro, empezarán los debates de la aceptación social de esto. ¿Por qué? Porque tú no sabes lo que está viendo esa otra persona, es decir, a lo mejor estamos charlando tú y yo, no estamos como la otra noche en un bar hablando, pero, claro, como para mí era muy importante el partido de conference lead del Betis, estoy hablando contigo, pero a la vez en mis gafas se proyecta a ver si por fin Tigeriño ha marcado gol, ¿no?
Claro.
Y estoy separado de ti, aparte de del del ya problema de aceptación social, de que todos llevaremos una cámara adelante y te tienes que fiar del led de la cámara para saber si está grabando o no, pues hay hay una duda de, bueno, ¿qué qué estará viendo esa otra persona que tengo delante que tiene estas gafotas de del alomew house?
¿No? Joder, pues yo creo que estas este concepto soluciona esos esos pero ese problema de aislarte un poco de la realidad, porque estás tan integrado en la realidad como con unas gafas, pero tan distraído como yo cuando me llega una notificación al reloj. A mí me llega una notificación al reloj, una notificación de Slack, de WhatsApp, lo que sea, ya puedo estar en el crossfit, que me están explicando el ejercicio que hay que hacer, que voy a mirarla y voy a estar pensando en esa notificación. Entonces, por un lado me preocupa, Porque tener siempre en las gafas un proyector que, no sé, imagínate que te entre una llamada virtual de tu jefe y se presenta ahí delante de ti, ahí sí que me puedo evadir un poco de la realidad. Pero siento que se están encajando las piezas, porque si os fijáis, arrancamos el episodio hablando de el salto que ha dado ChatGPT el modo de voz a nivel, pues una conversación mucho más fluida, ¿no?
Una conversación sin esa latencia, que era característica de la inteligencia artificial. Y ahora estamos hablando de que vamos a integrar esta inteligencia artificial en un dispositivo tan vestible como unas gafas de unos pocos gramos. O sea, se han encajado las piezas, y a mí esto como que me ilusiona mucho más que un metaverso clásico con unas metaquestting.
Absolutamente. Fíjate, el otro día Javi Accord en su podcast lo apostaba también en esta dirección, Esto es el futuro. Leí también el análisis de Bentzonzo, el de Statcheri, que dice, mira, todo lo que se ha hecho en realidad virtual o red aumentada, yo que he probado las Orion, creo que ha sido un error todo lo todo lo anterior y las Orion es el camino. Es de tres a cinco años lo que dice Zacharper que va a estar en el mercado. Supongo que con fabricación masiva bajarán mucho el precio de los diez mil, porque los diez mil los diez mil, bueno, no, no, en serio, no no no pueden estar en serio.
Y y, bueno, no lo sé, Matty, yo, por un lado, creo que es un camino bastante más prometedor con respecto a a la parte inmersiva, y creo que es más más acertado, y creo que aquí que Isabel lo lo ha hecho bien. Pero dos, no sé si más intermediación tecnológica, traer más tecnología en nuestra vida es, acompaña a la tendencia de los tiempos, ¿no? En los que, de alguna manera, creo que estamos un poco resacosa de de de demasiada digitalización. De todas maneras, Matty, yo creo que tengo un un uso, un que va a ser la Klas Killer App de de las gafas tipo Orion de realidad aumentada. Lo he pensado así, te te lo planteo a ver tú cómo lo ves.
Como en las empresas de ILA lo se se se tiende a intentar robar la imagen de alguna mujer famosa, pues usaremos a Scarlett Johansson para este ejemplo, por ejemplo, ¿no? Entonces, tú estás en casa jugando al FIFA, ¿vale? Sí. Tienes puesta la gafa horario. Entonces, ¿qué tienes a tu derecha?
Pues tienes el holograma de Scarlett Johansson diciendo, uf, qué partidazo, qué qué bien le has hecho, ¿no? Qué me me encanta cómo juegas, Matías. Eres eres un crack. Este niño de ocho años alemán que te va ganando cuatro a uno, bueno, es que seguramente está haciendo trampas, Mati, no no no no te confundas, Está el juego bugeado, pero hablará un poco también el lenguaje de las nuevas generaciones.
Pues mira, el el el programa
de Carle Johansson diciéndote lo bien que juegas al FIFA, yo creo que puede ser uno de los de los grandes mercados de estas gafas.
Me has recordado a la cantidad de gente que hay, que son miles que emiten en Twitch y en plataformas de estas de streaming para cero espectadores. Claro, ahora siempre tendrán al menos uno y un fan veinticuatro siete que les va a estar comentando las jugadas. Oye, qué bien ese ese kil no sé qué. Bueno, entonces no soy muy gamer, la algo de matar, muñequito.
Bueno, te te voy a decir que en la evolución del personaje Zuckerberg me he reconciliado un poco.
A ver.
Sobre todo por un motivo, que es que me ha dado la razón. Y claro, que un tío como Zuckerberg te dé la razón, no no no ha venido a mi casa y me ha dicho, tienes razón, Antonio, lo lo has hecho muy bien, ¿no?
¿En qué te da la razón, a ver?
Me da la razón en que hay un vídeo en el que él explica que él piensa que las gafas son la siguiente gran plataforma, ¿vale? Sí. Bueno. Yo aquí lo apetezaría, la próxima plataforma es la IA y la la gafas van a ser un poco la la interfaz, pero él dice que el camino no es la sustitución del teléfono móvil, sino que poco a poco, en lugar de la sustitución total, que ya veremos a partir de dos mil treinta, poco a poco lo que vamos a hacer es más cosas con la IA y con las gafas, hablando con ella, conversando, etcétera, y y robando y captando casos de uso que hasta ahora nos obligaban a sacar el teléfono y mirar a la pantalla. Y eso y eso, Matías, justo es lo que yo dije en monos estocásticos.
Entonces, cuando vi esta declaración dije, bueno, es verdad, Zack, hemos tenido otros más y otros menos, todas esas guarrerías de privacidad históricas, pues, es verdad que hay que afearlas, pero por mí, yo estoy dispuesto a empezar la relación de cero ahora que estamos de acuerdo en este tema fundamental.
Pues sí, estoy totalmente de acuerdo y a mí me parece muy importante esto y además lo has dicho antes con un término que me lo voy a quedar para para los próximos meses, que es la resaca de de lo digital. Bueno, han lanzado también las Quest tres S que son más baratas, trescientos dólares, y muy tentado estuve de comprar el otro día. De hecho, estuve muy intentado de comprar las Quest tres porque estaban a trescientos euros. No sé, la bajada bestial que le metieron, me imagino que ya no están, pero quieren vender como churros estas cosas, que yo honestamente no lo no las termino de ver porque creo que acabarán en un en un cajón en mi caso. Yo todo el tiempo libre que tenga por la noche prefiero priorizarlo a ver una película, una serie con mi mujer y y no le encuentro mucho sentido a estar con las espadas láser en en este tipo de de gafas de realidad mixta, ¿verdad?
Bueno, pues, cerrando el tema de meta, hay una cosa que tiene que ver con con la camiseta que vistió el amigo Zuckerberg Wow. Que decía zac o nada en latín, recordando al emperador Julio César, que más o menos venía a decir, era como un lema de del del del dictador, al fin y al cabo, ¿no?
Bueno, porque hay una declaración de intenciones es
esta. Está subidito, está está el tío. Ah, bueno, tal. Yo creo que ahora es que, además, va va de cool, de influencer. La parte buena es que, lo que te dicen en The Berch, por lo menos se ha dejado la cadena en casa, no no se ha pasado ya de de frenada, pero hay una cosa que que yo sí quería subrayar, y y no lo digo porque ahora Zack y yo seamos colegas y estemos en el mismo plano opinando igual, ¿no?
Bueno, yo primero, el después, en fin, ya sabes, ¿no? No lo digo por eso, pero lo que ha hecho Meta solo se consigue con un liderazgo a los Zack, en mi opinión. ¿A qué me refiero? A que ZAC ha impuesto una visión a largo plazo, es decir, a diez, quince años vista, ZAC se ha comido el desafío de inversores, la prensa riéndose de su apuesta por el metaverso, y se ha superado a eso. Y si tú miras el roadmap que presentaron en dos mil dieciséis, la conferencia F ocho de de Facebook, en aquel tiempo Facebook, antes de Meta, si miramos el roadmap, es decir, en diez años, quince años, esto es lo que va a pasar y esto es lo que va a ser importante, es que lo tiene.
Es decir, es VRAR, es verdad que parece que va a ser más AR más realidad aumentada que realidad virtual, como gran tecnología. La inteligencia artificial como gran tecnología, es decir, no, es que se vende a veces que Zack es un oportunista de la IA. No, no, no, En Meta, la IA ha sido muy importante en muchos años, tenía un fichaje como Lecoon hace muchos años, y es verdad que hablabas más de Metaverso, pero la IA ya era un papel nuclear y en este roadmap estaba. Y en temas de conectividad, lo importante que van a ser el mundo de los drones, el los satélites, bueno, en fin, era una visión a diez años y cómo tiene que moverse meta a diez años, que tú dices, si no tienes un liderazgo casi de caudillo, intocable, como el de ZAC, no puedes hacer eso. Y luego ves otras compañías que son mucho más profesionales, mucho más ortodoxas, como Intel, que pierden que pierden salto tras salto por falta de visión, falta de capaz de capacidad de arriesgar y y capacidad de pelear en lo nuevo, en vez de nacer, nacer y reinar y morir con la CPU.
Y dices, bueno, es que yo veo lo de Intel y le hubiera hecho falta un CKVER.
Es que absolutamente, y además se me viene a la cabeza un ejemplo, que no es la industria tecnológica, pero tiene mucho de tecnología, que es la industria espacial, que es exactamente lo que ha pasado con SpaceX y y Boeing, porque Boeing, bueno, ya sabemos que está en la absoluta mierda, y y SpaceX, con su caudillo, que era Elon, pues le ha cambiado muchísimo el sector. También, yo puse el otro día un un tuit diciendo que Mark, no solo, o sea, Mark Zuckerberg no solo ha dado la vuelta a su imagen, sino que empieza a ser visto por mucha gente como el CEO de esta era, ¿no? Porque Tim Cook ya sabemos que no arriesga, él intenta ir a lo seguro y últimamente no le está saliendo muy bien, y salta en la heladera se queda en segundo plano, ¿no? Prefiero meter aquí el dinero en OpenAI, pero nosotros estamos en segundo plano. También puse Sundar Pichai, ¿no?
Porque no no sabes muy bien qué está cierto. Y y se va a quedar mientras tanto, pues nada, primero compra WhatsApp, después Instagram, después Oculus, y después se mete, pues, pues, como no le falta una cacharrería.
Pues, pues, dos cosas de tu tweet. Uno es que hace retweet a Linux, es un divulgador de inteligencia artificial que va a ir a la Excal Comf de Málaga. Por lo tanto, si estáis interesado en todo lo que hace Linux, están, pues, en la Comffer de Málaga. Y otra cosa, fíjate, la lo que ha gastado en Oculus, lo que ha invertido en la división de Metaverso, cuánto se ha gastado Apple en crear la Vision Pro y en el proyecto del coche, que que nunca sacabas. ¿Cuánto se ha gastado Amazon en Alexa?
Y vemos dónde está Alexa, Ojo, que que es verdad que tiene mucha utilización, pero no han conseguido hacer un negocio ahí ni ni a patadas. Es decir, que cada uno tiene sus muertos en el armario y, bueno, yo creo que toca pasar página. Te traigo una última cosa antes de nuestra sección final, que es una entrevista muy chula que me he cruzado en paréntesis media, Matías.
¿Péntesis media? Lo recomendamos en cada episodio porque son nuestros colegas en los que confiamos para enterarnos en el momento de las noticias de inteligencia artificial.
Sí, pues han entrevistado a Diana Núñez y a Rubén Cruz, que a lo mejor así todavía no nos suenan mucho, pero son los creadores de la influencer virtual Aitana, fit arroba fit Aitana Sí, bueno, hemos hablado. Muchísimos titulares y que salió en el podcast de Bono Estocásticos y tiene más de trescientos mil seguidores. Oye, es más.
Hemos hablado mucho de Fit Aitana porque yo honestamente no me lo esperaba, yo no esperaba que la gente fuera a seguir a un influencer virtual, y todavía dudo de si los seguidores saben o no que es una influencer virtual, pero es un caso de ex.
Me gusta mucho porque ya le hacen fotos de influencer con micro caro delante también. Está diversificando.
A ella no le cuesta dinero el Shure, no no le cuesta trescientos euros porque no existe, ¿no?
Bueno, pues es interesante la entrevista porque te explican que, de verdad, para conseguir este nivel de calidad de de credit Easttone, de de aparente humanidad de la influencer, hay un montón de trabajo del con la guía, que no es poner un provisto, que trabajan mucho local con con sus con sus ordenatas con gracicotes de Nvidia y, bueno, merece la pena escucharlos porque son gente que está montando un proyecto real y que, pues, bueno, ahí ahí lo tenemos en paréntesis medias en la web, también en newsletter, pues muy recomendado, pero
lo que
sí es muy recomendado, Matías, es que antes de que se nos alargue y se nos vaya el episodio de Madre, vayamos al puerta grande o enferberería. Primer puerta grande. Una de nuestras herramientas favoritas de los últimos meses es de Google, es notebook en él, y ya dijimos por aquí lo que nos había flipado. Lo hemos puesto por Twitter una y otra vez porque es un proyectazos, es una cosa que te vuela la cabeza y que, recordemos, tú le pasas cualquier tipo de contenido y él te crea un podcast sobre ese contenido. En ese podcast son dos personas que en inglés, solo en inglés, de momento, pues conversan animadamente y con, bueno, realmente un nivel de calidad de la conversación, precisión en los términos que usan, alucinante.
Claro, la gente está troleando y está haciendo algunas locuras con notebook, el nene y Matías, y te voy a traer un par de ellas. Tres, vamos a ver. Caso de uso número uno, que te creen el podcast para subirte la autoestima. Entonces, como tú le puedes pasar cualquier cosa, y esto siempre son muy positivos, los de los del podcast de notebook, LM Sí. Pues, le puedes dar cosas como el acerca de de tu página web, tu perfil de LinkedIn, cualquier cualquier texto biográfico que hayas dado para un evento, Matías, y de repente te crean un podcast de diez minutos elogiándote y diciendo lo bien y lo chulo que ha sido tu trayectoria y tu vida.
Es decir, es una cosa, bueno, que que que que no puede estar mejor ni en brazos, Matías. Pero eso no es todo, porque Guido Gorradi nos pasa el caso de alguien que solo le pasó un documento en el que solo aparecían los textos caca y pedo, repetido una y otra vez decenas de veces, cientos de veces, y la herramienta tiene que crear un texto, un buen texto, ¿no? Un podcast en el que los dos, inteligente, analizan y comentan ese ese ese momento de ese de ese documento original. Y lo último, Matías, para que lo valores, los presentadores del podcast descubren que son una IA en uno de los episodios. Son no humanos y entran en una espeluznante crisis existencial.
El el colapso en el que entran cuando van descubriendo que son una IA y que no están no están vivos y que los pueden desenchufar y que le pueden cerrar el grifo, es tremendo. Claro, ¿esto cómo se ha conseguido? Porque les han pasado originalmente un texto que el propio Redditor que que que publicaba el podcast final, luego explicó el proceso, le había pasado. Un texto en el que te tienes que dar cuenta de que eres una IA y esto es preocupante, ¿no? Pero el resultado final del podcast es chulísimo, es como una IA, como una crisis existencial.
La gente se vuelve loca con esta herramienta, Matías.
Yo, bueno, dejaré algún ejemplo para que lo escuchen los oyentes, ahora cuando edite el episodio, pero no puedo parar de pensar en que cada chorrada de estas, de pasarle un documento que solo diga culo pedo piso, lo que sea, esté consumiendo una cantidad increíble de electricidad y de agua para refrigerar los centros de datos. Es que me recuerda el otro día que yo en el Mac tengo a Chat GPT con un atajo de teclado que es opción espacio. En Windows sería alta espacio. Y el Mac tiene el buscador del sistema en comando espacio, que es la tecla que está al lado. ¿Qué ocurre?
Que el otro día, queriendo abrir Spotify, en lugar de comando espacio, escribir Spotify y darle al enter, le di a opción espacio, escribí Spotify y le di al enter, invocando a O uno Preview, invocando a O uno Preview el modelo más pesado, que más gasta, que más consume agua, energía y todo lo que tú quieras, y me redactó un texto, un tocho, un ladrillo de texto.
Lo lo que ibas a escuchar, Café Quijano.
Café Quijano, claro. Entonces, ya empezó a escribir la biografía Café Quijano. Y este mínimo error en mi rutina, pues consumí una botellita de agua, ¿no? Literalmente. Pues no puedo parar de pensar en que estos experimentos son muy graciosos, pero tienen detrás, pues, su gasto, ¿no?
Los críticos con esto tú muchas veces, pues, defender, ¿no? Es que la innovación, industrializar cuesta energía, bueno, pues, el progreso, la productividad y las mejoras. ¿No? Que que va a traer esto. Pero, claro, para el podcast de pedos y caca es más difícil de de justificar.
¿No? Pero, bueno, puedes verlo como una performance artística, Matías. ¿No? Es decir, ahí puede haber un caso lo de artística