﻿WEBVTT
Kind: captions
Language: es

00:00:05.000 --> 00:00:08.000
Wanda, la comunidad de podcast independientes en español.

00:00:08.000 --> 00:00:14.000
Hola y bienvenidos a un nuevo episodio de Apple Coding Daily.

00:00:16.000 --> 00:00:21.000
Bien, ya tenemos w w d c, o como Apple viene llamándolo de una manera más

00:00:21.000 --> 00:00:26.000
molona, desde el año dos mil diecinueve la Davdat Dici, la WWDC o la

00:00:26.000 --> 00:00:31.000
World Wide Developers Conference o Conferencia Mundial de Desarrolladores

00:00:31.000 --> 00:00:36.000
de Apple, se celebrará el próximo los próximos días del diez al

00:00:36.000 --> 00:00:42.000
catorce de junio.

00:00:43.000 --> 00:00:52.000
En esta ocasión, por algún tema de fechas que, obviamente, nunca conoceremos el porqué, pues se ha retrasado a la segunda semana del mes de junio.

00:00:52.000 --> 00:00:57.000
Una WWDC que, por desgracia, también depende a quién le preguntes, pero,

00:00:57.000 --> 00:01:02.000
bueno, es cierto que creo que este año ya se confirma de manera oficial

00:01:02.000 --> 00:01:07.000
que la WWDC no volverá a ser nunca más, al menos por ahora, una WWWC

00:01:07.000 --> 00:01:13.000
presencial durante toda la semana.

00:01:14.000 --> 00:01:19.000
La mayoría de la gente sabe que la WWDC, o piensa que la WWDC, es

00:01:19.000 --> 00:01:25.000
solamente el lunes donde es la keynode inaugural, pero nada más lejos de la realidad.

00:01:25.000 --> 00:01:30.000
Ese lunes no solo es la KeyNote inaugural, también es la KeyNote Platform

00:01:30.000 --> 00:01:35.000
State of the Union, que es la inaugural para desarrolladores y, además,

00:01:35.000 --> 00:01:40.000
también es la entrega de premios de los Apple Design Awards, de los

00:01:40.000 --> 00:01:46.000
premios de las aplicaciones, las mejores aplicaciones del año.

00:01:46.000 --> 00:01:49.000
Y luego, al día siguiente, se publican una serie de vídeos que pueden

00:01:49.000 --> 00:01:52.000
llegar a ser unos doscientos, trescientos, aproximadamente, en los

00:01:52.000 --> 00:01:55.000
últimos años, donde se habla sobre todo lo último que hay sobre

00:01:55.000 --> 00:02:01.000
tecnologías Apple.

00:02:01.000 --> 00:02:05.000
Hace años, Apple, la última vez que lo hizo, lo que hizo fue cerrar el

00:02:05.000 --> 00:02:09.000
McKennedy Center en San José para reunir allí a cinco mil

00:02:09.000 --> 00:02:13.000
desarrolladores de todo el mundo.

00:02:13.000 --> 00:02:16.000
Tú tenías que elegir cuál de los de los escenarios querías ir y, por lo

00:02:16.000 --> 00:02:19.000
tanto, pues seguirlo y luego, pues las que no pudieras ver, pues las

00:02:19.000 --> 00:02:24.000
tenías en vídeo a los pocos días.

00:02:24.000 --> 00:02:28.000
Todo eso cambió con la llegada de la pandemia y, bueno, pues parece que se

00:02:28.000 --> 00:02:32.000
va a quedar, se va a quedar aunque Apple sí ha invitado o ha hecho, o va

00:02:32.000 --> 00:02:36.000
a hacer una especie de sorteo entre desarrolladores para invitar a algunos

00:02:36.000 --> 00:02:40.000
al Apple Park para una serie de eventos y presentaciones ese primer día,

00:02:40.000 --> 00:02:45.000
y entendemos que también lo hará con la prensa, igual que lo hizo el año pasado.

00:02:45.000 --> 00:02:51.000
¿Qué es lo que nos va a esperar en esta WWDC dos mil veinticuatro?

00:02:52.000 --> 00:03:07.000
Pues según Greg Joshweck, el SVP de marketing de Apple nos va a esperar algo absolutamente increíble a absolutamente increíble, a I.

00:03:08.000 --> 00:03:13.000
En fin, si quieren les hago un croquis, así que vamos a hablar de ello.

00:03:25.000 --> 00:03:29.000
Lo primero, y es algo que no tiene que ver con lo que es la inteligencia

00:03:29.000 --> 00:03:33.000
artificial en sí misma, pero es un cambio que ya estaba planificado desde

00:03:33.000 --> 00:03:37.000
hace bastante tiempo y del que hemos empezado a ver pequeñas cosas, y

00:03:37.000 --> 00:03:42.000
algunas no tan pequeñas, en los últimos meses años.

00:03:43.000 --> 00:03:48.000
Aquellos que tienen un dispositivo Apple conectado a su coche a través de

00:03:48.000 --> 00:03:53.000
CarPlay verían un cambio significativo en la interfaz en años Ios

00:03:53.000 --> 00:03:58.000
diecisiete, donde el botón devolver, el clásico botón volver de un

00:03:58.000 --> 00:04:03.000
maestro detalle dentro de Ios, pasaba de ser el chefrom hacia la izquierda

00:04:03.000 --> 00:04:08.000
con la palabra back o atrás, a ser un círculo con un check from y en un

00:04:08.000 --> 00:04:13.000
tipo de color distinto, es decir, con color blanco, un color más claro

00:04:13.000 --> 00:04:18.000
sobre lo que sería el, so si está en modo oscuro, sobre lo que sería el

00:04:18.000 --> 00:04:26.000
chef from nada más, insisto, dentro de un botón circular.

00:04:27.000 --> 00:04:32.000
Esto, que es bastante más práctico dentro de un entorno táctil tipo

00:04:32.000 --> 00:04:37.000
carplay, es no es más que un pequeño una pequeña prueba, beta, incluso

00:04:37.000 --> 00:04:42.000
diríamos alfa, del cambio que va a llegar, porque sí, Apple va a cambiar

00:04:42.000 --> 00:04:49.000
el lenguaje de diseño de sus sistemas de Flat Design a neomorphins, a neomorfismo.

00:04:50.000 --> 00:04:54.000
Básicamente, lo que va a hacer es adoptar el lenguaje de diseño que ahora

00:04:54.000 --> 00:04:58.000
mismo tiene Apple Vision Pro, un lenguaje de diseño que está

00:04:58.000 --> 00:05:02.000
parcialmente, es como una evolución del Flat Design, podríamos decir, en

00:05:02.000 --> 00:05:06.000
el que pasamos de tener interfaces limpias, sin ningún tipo de detalle,

00:05:06.000 --> 00:05:10.000
con botones como los que hemos tenido hasta ahora, simplemente, pues una

00:05:10.000 --> 00:05:14.000
un texto, ¿no?

00:05:14.000 --> 00:05:18.000
Con un color azul, que en los últimos dos años han cambiado a nuevos

00:05:18.000 --> 00:05:22.000
estilos con botones prominentes, con botones con, bueno, pues que estaban

00:05:22.000 --> 00:05:26.000
encapsulados dentro de un rectángulo con esquinas redondeadas o dentro de

00:05:26.000 --> 00:05:30.000
una cápsula, cápsulas que pueden estar rellenas o no, tener algún tipo

00:05:30.000 --> 00:05:34.000
de translúcidez, que son los cambios que hemos ido viendo en los últimos

00:05:34.000 --> 00:05:38.000
años, los estilos de botón que podemos usar en New Eggyd o en Suite UI

00:05:38.000 --> 00:05:44.000
desde hace un par de años o tres, ¿qué es lo que sucede?

00:05:44.000 --> 00:05:49.000
Pues que ahora todo eso va a dar un paso más allá llegando al neomorfismo.

00:05:49.000 --> 00:05:53.000
El neomorfismo, básicamente, es aplicar una un pequeño volumen en las

00:05:53.000 --> 00:05:57.000
formas, en los materiales, para que haya unas líneas de definición, las

00:05:57.000 --> 00:06:01.000
líneas que tienen transparencia, más que una transparencia, es como un

00:06:01.000 --> 00:06:05.000
material translúcido que se adapta a lo que tiene detrás, que además

00:06:05.000 --> 00:06:09.000
tiene un pequeño relieve, por lo que veremos que hay como esos pequeños

00:06:09.000 --> 00:06:15.000
relieves que nos destacan, ¿no?

00:06:15.000 --> 00:06:18.000
Lo que tenemos que pulsar o no, etcétera, y por lo tanto, pues se

00:06:18.000 --> 00:06:21.000
parecerá bastante más a lo que ahora mismo tenemos dentro de lo que es

00:06:21.000 --> 00:06:25.000
Apple Vision Pro.

00:06:25.000 --> 00:06:29.000
No es mimetizar cómo es Apple Vision Pro, porque Apple Vision Pro tiene su

00:06:29.000 --> 00:06:33.000
propia forma de estructura gracias a las ventanas traslúcidas, etcétera,

00:06:33.000 --> 00:06:38.000
pero será una adaptación a este lenguaje de diseño.

00:06:38.000 --> 00:06:43.000
De igual manera, ahora ya sí entrando en la inteligencia artificial, vamos

00:06:43.000 --> 00:06:48.000
a hablar de una de las cosas que más le interesa a la mayoría de los que

00:06:48.000 --> 00:06:53.000
están aquí escuchándonos, y es sí, señores, sí.

00:06:54.000 --> 00:06:59.000
Este año, SourceKit, nuestro querido amigo SourceKit, que funciona cuando

00:06:59.000 --> 00:07:04.000
quiere, y a veces cuando no quiere tampoco funciona, que nos da muchos

00:07:04.000 --> 00:07:09.000
problemas a la hora de autocompletar el código, que en ocasiones no

00:07:09.000 --> 00:07:17.000
permite acceder a la ayuda, y que sabemos que es una pequeña traba.

00:07:17.000 --> 00:07:23.000
Podríamos llamarlo, es una funcionalidad que Apple ha incorporado a SCODE

00:07:23.000 --> 00:07:29.000
para trabajar nuestra paciencia como desarrolladores no es un bug, es una

00:07:29.000 --> 00:07:35.000
función para trabajar nuestra paciencia, pero, bueno, por fortuna, esa

00:07:35.000 --> 00:07:41.000
función va a desaparecer en pos de un nuevo source kit basado en un

00:07:41.000 --> 00:07:47.000
modelo de lenguaje de inteligencia artificial.

00:07:47.000 --> 00:07:52.000
Este nuevo source kit estaría basado en un modelo experto de lenguaje

00:07:52.000 --> 00:07:57.000
entrenado específicamente para código y además entrenado

00:07:57.000 --> 00:08:02.000
específicamente para código en Swift, object IC y sobre todo con toda la

00:08:02.000 --> 00:08:10.000
documentación de todos los frameworks de Apple.

00:08:11.000 --> 00:08:16.000
Esto daría una nueva dimensión a el desarrollo, porque también tenemos

00:08:16.000 --> 00:08:21.000
que tener en cuenta, y si alguno de ustedes que nos escucha son

00:08:21.000 --> 00:08:26.000
desarrolladores en Python, por ejemplo, habrán visto que la proeficiencia

00:08:26.000 --> 00:08:31.000
de modelos de lenguaje como ChatGPT en Python es bastante buena, y el

00:08:31.000 --> 00:08:36.000
motivo es tan simple como que ChatGPT tiene un modelo experto en Python,

00:08:36.000 --> 00:08:41.000
por eso da unas soluciones muy buenas para este lenguaje y no es tan bueno

00:08:41.000 --> 00:08:46.000
con otros lenguajes, como por ejemplo, Swift.

00:08:46.000 --> 00:08:47.000
¿Por qué?

00:08:47.000 --> 00:08:51.000
Pues simplemente por el entrenamiento, porque si yo entreno un modelo de

00:08:51.000 --> 00:08:55.000
lenguaje con código específico, en este caso de Python, y creo un modelo

00:08:55.000 --> 00:08:59.000
experto con toda la documentación, con información de librerías, con un

00:08:59.000 --> 00:09:03.000
montón de código para que aprenda a relacionar y a construir ese

00:09:03.000 --> 00:09:07.000
código, pues al final lo que voy a tener es una solución muy buena para

00:09:07.000 --> 00:09:15.000
lo que es usar Python, y esto no ha existido hasta ahora para SWIFT.

00:09:16.000 --> 00:09:20.000
De hecho, si ustedes han probado, como yo, Github Copilot, verán que en

00:09:20.000 --> 00:09:24.000
SWIFT, pues, es uno de los lenguajes que, en fin, a ver, funcionar

00:09:24.000 --> 00:09:28.000
funciona bien, pero tampoco es que sea una ayuda, es decir, es más una

00:09:28.000 --> 00:09:32.000
ayuda para casos de evitarte copiar código redundante, más que el hecho

00:09:32.000 --> 00:09:36.000
de que entienda tu código.

00:09:36.000 --> 00:09:45.000
Porque aquí lo que estamos hablando es de un modelo de lenguaje de Apple que es el más longevo de todos los modelos de lenguaje que Apple ha creado.

00:09:46.000 --> 00:09:50.000
Este modelo de lenguaje es un modelo creado por Apple a mediados del año

00:09:50.000 --> 00:09:54.000
dos mil veintidós, cuando Copilot salió, cuando Github Copilot salió de

00:09:54.000 --> 00:09:58.000
la preview técnica el veintiuno de junio y, obviamente, los ingenieros de

00:09:58.000 --> 00:10:02.000
Apple quisieron usarlo para poder trabajar y poder ser más pro más pro

00:10:02.000 --> 00:10:08.000
eficientes dentro de su trabajo.

00:10:09.000 --> 00:10:10.000
¿Qué es lo que sucede?

00:10:10.000 --> 00:10:13.000
Que por lógicas restricciones de propiedad intelectual y propiedad

00:10:13.000 --> 00:10:16.000
industrial, Apple prohibió el uso de cualquier tipo de modelo de modelo

00:10:16.000 --> 00:10:19.000
de lenguaje en la nube que no fuera suyo.

00:10:19.000 --> 00:10:23.000
Así que ese fue el pistoletazo de salida para toda la inteligencia

00:10:23.000 --> 00:10:27.000
artificial que vamos a ver en esta w w w ya que este modelo, como digo, es

00:10:27.000 --> 00:10:33.000
el más avanzado que tiene Apple, el de ayuda de código en scode.

00:10:34.000 --> 00:10:38.000
Funcionará dentro de, como digo, integrado en la librería source kit y,

00:10:38.000 --> 00:10:42.000
además, será capaz de poder tener todo nuestro código como contexto,

00:10:42.000 --> 00:10:46.000
bien, al menos, una serie de ficheros y componentes relacionados, o

00:10:46.000 --> 00:10:50.000
probablemente todo el fichero dependiendo también del número de tokens

00:10:50.000 --> 00:10:58.000
que pueda tener.

00:10:58.000 --> 00:11:05.000
Tal vez la primera versión esté un poco más limitado y luego se irá expandiendo según vayan saliendo nuevas versiones.

00:11:06.000 --> 00:11:08.000
Eso sí, ojo con esto, ¿vale?

00:11:09.000 --> 00:11:13.000
Yo he estado realizando pruebas con distintos modelos gracias a la a la

00:11:13.000 --> 00:11:17.000
librería MLX, He sacado algunas conclusiones bastante interesantes sobre

00:11:17.000 --> 00:11:21.000
cómo funciona con Swift, modelos como Mixtral, modelos como, en fin,

00:11:21.000 --> 00:11:25.000
algún otro que he ido probando de LLM que se puede probar directamente

00:11:25.000 --> 00:11:29.000
desde los ejemplos de MLX de la librería que permite ejecutar modelos

00:11:29.000 --> 00:11:37.000
Python, modelos programados para Python, ¿vale?

00:11:37.000 --> 00:11:42.000
Directamente de manera nativa sobre motor neural, y no me extrañaría que

00:11:42.000 --> 00:11:47.000
la función de source kit mejorado requiriera al menos dieciséis gigas de

00:11:47.000 --> 00:11:54.000
memoria RAM en un Mac para funcionar.

00:11:56.000 --> 00:12:06.000
No lo descarten porque, realmente, este tipo de modelos suelen ocupar bastante memoria y Xcode, de por sí, ya consume bastante memoria.

00:12:07.000 --> 00:12:12.000
¿Podría ser que funcionara a través de la memoria de intercambio en un equipo con ocho gigas?

00:12:13.000 --> 00:12:17.000
Técnicamente sí, pero es probable que si aún así se permitiera este

00:12:17.000 --> 00:12:21.000
uso, que no lo tengo yo muy claro porque los LLLMs tienen que cargarse en

00:12:21.000 --> 00:12:25.000
un solo bloque a no ser que Apple aplique los modelos que él mismo ha

00:12:25.000 --> 00:12:29.000
generado, que ellos mismos han generado, para permitir que parte de un

00:12:29.000 --> 00:12:33.000
modelo esté en unidad de almacenamiento sólido y parte en la memoria RAM

00:12:33.000 --> 00:12:37.000
y no tenga que ser un solo bloque cargado en la RAM, porque puede cargar y

00:12:37.000 --> 00:12:41.000
descargar distintos modelos expertos en función o distintas partes del

00:12:41.000 --> 00:12:45.000
modelo del modelo experto en función de lo que necesite, bueno, si hace

00:12:45.000 --> 00:12:49.000
eso puede ser que funcionara en ocho gigas, pero yo no las tengo todas

00:12:49.000 --> 00:13:00.000
conmigo, creo que podría ser una restricción que Apple pusiera a partir de este año.

00:13:00.000 --> 00:13:06.000
En fin, veremos a ver, pero por las pruebas que he hecho no me extrañaría que pidieran esto.

00:13:06.000 --> 00:13:11.000
Desde luego, créanme que la experiencia de desarrollo en entornos Apple

00:13:11.000 --> 00:13:16.000
con scoth va a cambiar radicalmente en cuanto a ser más de mayor ayuda a

00:13:16.000 --> 00:13:22.000
la hora de escribir código y de ser más eficiente.

00:13:23.000 --> 00:13:28.000
También vuelvo a repetir lo de siempre, los modelos de lenguaje de

00:13:28.000 --> 00:13:33.000
creación de texto de lo que es código no son magia, no funcionan

00:13:33.000 --> 00:13:38.000
correctamente si tú no eres programador y eres capaz de valorar el

00:13:38.000 --> 00:13:43.000
código que te está sugiriendo que integres, porque el funcionamiento

00:13:43.000 --> 00:13:48.000
será muy parecido al de Github Copilot, te sugerirá en una forma de

00:13:48.000 --> 00:13:53.000
texto distinta el completado del código y tú podrás aceptar o no esa

00:13:53.000 --> 00:13:58.000
sugerencia, además de, y esto también estaría por ver, aunque

00:13:58.000 --> 00:14:03.000
técnicamente es posible, podrían llegar a incluir una especie como de

00:14:03.000 --> 00:14:08.000
asistente por voz o texto al que preguntarle cosas sobre código, como una

00:14:08.000 --> 00:14:13.000
especie de ayuda, un un copilot chat como el que tiene Guija copilot, o,

00:14:13.000 --> 00:14:18.000
por ejemplo, también sería posible hacer un análisis del código antes

00:14:18.000 --> 00:14:23.000
de ejecución para detectar de manera previa posibles errores en tiempo de

00:14:23.000 --> 00:14:28.000
runtime, como que, por ejemplo, intentemos acceder a un array en una

00:14:28.000 --> 00:14:33.000
posición cuarenta y el sistema se dé cuenta que el array en ese momento

00:14:33.000 --> 00:14:38.000
solo tiene veinte elementos y te advierta que si ese código se ejecuta va

00:14:38.000 --> 00:14:43.000
a dar un error porque no hay cuarenta elementos en ese momento de la ejecución.

00:14:43.000 --> 00:14:53.000
Todo esto, insisto, analizando nuestro código de forma, pues, en fin, lo que sería interpretándolo a nivel de texto, ¿vale?

00:14:53.000 --> 00:14:56.000
Esto, pues, la verdad que creo que va a ser algo muy interesante.

00:14:58.000 --> 00:15:02.000
Seguimos y, bueno, obviamente, vamos a tener ya para todos, ¿no?

00:15:02.000 --> 00:15:05.000
O sea, es decir, vamos a tener una funcionalidad de resumen y una

00:15:05.000 --> 00:15:08.000
funcionalidad de sugerencias que nos van a ayudar con todas las apps

00:15:08.000 --> 00:15:12.000
nativas de entornos Apple.

00:15:13.000 --> 00:15:17.000
Resumen de documentos, resumen de páginas web, resumen de emails, resumen

00:15:17.000 --> 00:15:21.000
de mensajes, resumen de noticias, de cualquier tipo de elemento que

00:15:21.000 --> 00:15:25.000
podamos ver o leer dentro de nuestro dispositivo podremos obtener un

00:15:25.000 --> 00:15:29.000
resumen que nos diga básicamente qué es de lo que trata eso, resúmenes

00:15:29.000 --> 00:15:35.000
que nos ayuden a ser más productivos.

00:15:36.000 --> 00:15:41.000
Además, también tendremos un modelo capaz de crear sugerencias, de

00:15:41.000 --> 00:15:46.000
creación de texto, vídeo e imágenes, a través de modelos propios como

00:15:46.000 --> 00:15:51.000
los que ya hemos hablado aquí largamente, como el Apple uno, modelo de

00:15:51.000 --> 00:15:56.000
lenguaje de modo experimental, que pretende conseguir la forma en la que,

00:15:56.000 --> 00:16:01.000
a través de un modelo más pequeño, pero mucho más pulido en cuanto a

00:16:01.000 --> 00:16:06.000
la calidad del dato, consiga que no haga falta tener modelos tan grandes

00:16:06.000 --> 00:16:11.000
como un modelo GPT cuatro, sino que con modelos más pequeños podamos

00:16:11.000 --> 00:16:16.000
conseguir mejor eficiencia, o por ejemplo, el modelo Matrioska Diffusion

00:16:16.000 --> 00:16:21.000
Model, modelo de difusión Matrioska que también presentó Apple ya hace

00:16:21.000 --> 00:16:26.000
unos meses y que permite la creación de imágenes y de pequeños vídeos

00:16:26.000 --> 00:16:34.000
que, bueno, pues dan una, parece ser, según el paper, una muy buena calidad.

00:16:34.000 --> 00:16:35.000
¿Esto qué es lo que llevaría?

00:16:35.000 --> 00:16:41.000
Llevaría a sugerencias en contestación de emails, llevaría a resúmenes

00:16:41.000 --> 00:16:48.000
de emails o resúmenes de una cola de emails dentro de una conversación, ¿no?

00:16:48.000 --> 00:16:56.000
Lo típico de no me acuerdo de qué va esta conversación que ya tiene veinte emails encolados, por favor, hazme un resumen de esto.

00:16:57.000 --> 00:17:02.000
Creación de texto, por ejemplo, para sugerirnos respuestas a través de mensajes.

00:17:02.000 --> 00:17:11.000
También para, por ejemplo, en notas tomar simplemente una pequeña anotación y que él nos sugiera más texto al respecto.

00:17:11.000 --> 00:17:17.000
En recordatorios, que nos cree recordatorios en base a elementos

00:17:17.000 --> 00:17:23.000
determinados o a eventos de calendario, etcétera, es decir, una serie de

00:17:23.000 --> 00:17:29.000
más las aplicaciones nativas del sistema y, por supuesto, a la suite

00:17:29.000 --> 00:17:35.000
iWork, es decir, pages, keynote y numbers, de forma que podremos tener una

00:17:35.000 --> 00:17:41.000
forma, pues, muy práctica, muy cercana a lo que es ahora mismo Office

00:17:41.000 --> 00:17:47.000
tres seis cinco, bueno, perdón, Microsoft tres seis cinco Copilot, ¿vale?

00:17:47.000 --> 00:17:54.000
Que ya no se llama Office, algo parecido a lo que hace tres seis cinco Copilot o lo que hace Windows Copilot, ¿de acuerdo?

00:17:54.000 --> 00:17:57.000
Una cosa parecida, integrada directamente en el sistema.

00:17:57.000 --> 00:18:09.000
Todavía no está claro si este, si estas funcionalidades dependerán de un de un LLM en la nube puesto por la propia Apple o no.

00:18:09.000 --> 00:18:13.000
Lo que sí está claro, al menos para mí, es que las negociaciones que

00:18:13.000 --> 00:18:17.000
Apple está teniendo con empresas como Google o como OpenAI para incluir

00:18:17.000 --> 00:18:21.000
sus modelos de lenguaje dentro del sistema operativo, de los sistemas

00:18:21.000 --> 00:18:25.000
operativos de Apple, se debe a que Apple, como ya comenté en un en un

00:18:25.000 --> 00:18:29.000
café Swift, que pueden escucharlo donde hablamos largo y distendidamente,

00:18:29.000 --> 00:18:33.000
largo y distendidamente, sobre todo lo que tiene que ver con la IA que

00:18:33.000 --> 00:18:42.000
Apple va a presentar, con mi amigo Arturo Rivas, ¿vale?

00:18:42.000 --> 00:18:45.000
En el podcast Café Swift, que lo tienen en este mismo canal, ¿de acuerdo?

00:18:45.000 --> 00:18:50.000
Les dejo por aquí la lista por si quieren oírlos, si son desarrolladores

00:18:50.000 --> 00:18:55.000
de Apple, les invitamos a escucharlo porque van a aprender un montón de

00:18:55.000 --> 00:19:00.000
cosas en cada programa, pues bien, resulta que cuando yo comenté en este

00:19:00.000 --> 00:19:05.000
programa que Apple no va a poner un chatbot propio, es decir, no va a

00:19:05.000 --> 00:19:11.000
haber un chat GPT o algo parecido, o un Gemini como elemento de chat, ¿de acuerdo?

00:19:11.000 --> 00:19:15.000
Dentro de lo que sería el los sistemas de Apple, ¿por qué?

00:19:15.000 --> 00:19:18.000
Pues porque aún no se ha resuelto el problema de las alucinaciones.

00:19:18.000 --> 00:19:22.000
Los modelos de lenguaje tienen alucinaciones porque se inventan las cosas,

00:19:22.000 --> 00:19:26.000
un modelo de lenguaje lo que pretende es completar texto siguiendo una

00:19:26.000 --> 00:19:31.000
coherencia en base a lo que ya se le ha dicho previamente.

00:19:32.000 --> 00:19:37.000
Por lo tanto, si tú le pinchas, puedes llegar a hacer que se invente cosas

00:19:37.000 --> 00:19:42.000
que no son verdad, y eso es un problema que aún hay que resolver, porque

00:19:42.000 --> 00:19:47.000
tienes que poner al menos un modelo experto capaz de validar esa

00:19:47.000 --> 00:19:53.000
información, y eso es bastante complicado.

00:19:53.000 --> 00:19:55.000
Entonces, claro, ¿qué es lo que sucede?

00:19:55.000 --> 00:19:59.000
Que creo que Apple lo que va a hacer es crear una aplicación de chatbot,

00:19:59.000 --> 00:20:03.000
una aplicación que va a permitir que tú puedas elegir libremente si

00:20:03.000 --> 00:20:07.000
quieres utilizar Gemini de Google o quieres usar ChatGPT o quieres usar

00:20:07.000 --> 00:20:11.000
Cloud o quieres usar Mixtral, o quieres usar cualquier otro modelo LLM,

00:20:11.000 --> 00:20:15.000
incluso, en el caso del Mac, creo que hasta podrían proporcionar la

00:20:15.000 --> 00:20:19.000
posibilidad de incluir modelos en local que tú pudieras descargar y

00:20:19.000 --> 00:20:28.000
actualizar a tu manera.

00:20:28.000 --> 00:20:30.000
¿Y en qué me baso para decir esto?

00:20:30.000 --> 00:20:34.000
Pues en cómo funciona la actual librería MLX creada por Apple y lanzada

00:20:34.000 --> 00:20:38.000
ya hace unos meses, que nos permite, que incluso tiene una versión para

00:20:38.000 --> 00:20:42.000
Swift, que nos permite poder coger cualquier modelo de modelo LLM, o

00:20:42.000 --> 00:20:46.000
incluso modelo de difusión, etcétera, de los que se crean en los

00:20:46.000 --> 00:20:52.000
últimos tiempos y cargarlo y ejecutarlo dentro de una aplicación.

00:20:52.000 --> 00:20:54.000
De esa manera, ¿qué es lo que tendríamos?

00:20:54.000 --> 00:20:58.000
Pues tendríamos la posibilidad de tener una aplicación dedicada a esta

00:20:58.000 --> 00:21:02.000
funcionalidad de chatbot, donde Apple pueda poner de una manera muy clara,

00:21:02.000 --> 00:21:06.000
esta aplicación puede cometer errores a través de alucinaciones, no

00:21:06.000 --> 00:21:10.000
confía takata no confíe en el contenido, etcétera, etcétera, los

00:21:10.000 --> 00:21:14.000
mismos disclaimers que puede haber en el resto de modelos y que puedas

00:21:14.000 --> 00:21:18.000
usar cualquiera de los modelos, tanto comerciales como de código abierto,

00:21:18.000 --> 00:21:22.000
que pueda haber disponibles, ¿de acuerdo?

00:21:23.000 --> 00:21:30.000
Pero no integraría, al menos creo que no lo va a hacer, los modelos de otros porque ellos ya tienen el suyo, ¿de acuerdo?

00:21:30.000 --> 00:21:33.000
Entonces, bueno, veremos a ver qué es lo que nos encontramos.

00:21:33.000 --> 00:21:37.000
Todo esto daría lugar a una capa de control por voz que ampliaría lo que

00:21:37.000 --> 00:21:41.000
ya tenemos a día de hoy, por lo que la nueva Siri sería capaz de, a

00:21:41.000 --> 00:21:45.000
nuestra petición, generar shortcuts o incluso Apple scripts que

00:21:45.000 --> 00:21:49.000
ejecutarán tareas de de mucho calado dentro del sistema, en el caso de

00:21:49.000 --> 00:21:53.000
iOS con shortcuts, en el caso del Mac podría hacerlo con Apple Scripts,

00:21:53.000 --> 00:21:57.000
de forma que pudiera hacer tareas más complejas, tareas como, por

00:21:57.000 --> 00:22:01.000
ejemplo, copiar un archivo, tareas como convertir un vídeo de un formato

00:22:01.000 --> 00:22:05.000
a otro o un o un fichero de audio, elementos de coge este documento

00:22:05.000 --> 00:22:09.000
conviértelo en un PDF, por ejemplo, peticiones a mayor nivel que tengan

00:22:09.000 --> 00:22:20.000
que ver con funciones dentro de los programas.

00:22:21.000 --> 00:22:25.000
Igual que ahora, yo puedo a través de Siri, a través de SiriKit, la

00:22:25.000 --> 00:22:29.000
librería de integración con Siri, poder integrar aplicaciones de

00:22:29.000 --> 00:22:33.000
mensajería para comandos muy concretos, imagínense, y esto es algo que

00:22:33.000 --> 00:22:37.000
Apple ya tiene hecho, todos los posibles comandos que puede haber dentro

00:22:37.000 --> 00:22:41.000
de un sistema, iOS, Mac o cualquier otro, dentro de shortcuts, dentro de

00:22:41.000 --> 00:22:45.000
atajos, por lo que dentro de atajos tendríamos la posibilidad de poder

00:22:45.000 --> 00:22:49.000
hacer casi cualquier cosa que quisiéramos.

00:22:50.000 --> 00:22:54.000
Y si eso es algo que es complicado para la mayoría de la gente, claro, si

00:22:54.000 --> 00:22:58.000
yo le pongo a esta nueva serie la capacidad de crear shortcuts a atajos en

00:22:58.000 --> 00:23:02.000
tiempo real, tendríamos una forma muy interesante de poder construir, al

00:23:02.000 --> 00:23:06.000
igual que hace ahora mismo ChatGPT, que tú le pides algo y él te

00:23:06.000 --> 00:23:10.000
construye un script de Python y hace lo que le estás pidiendo, yo he

00:23:10.000 --> 00:23:14.000
conseguido con ChatGPT coger un fichero JSON que yo ya tengo creado,

00:23:14.000 --> 00:23:18.000
pasarle a una página web, pedirle que me haga scraping de esa página

00:23:18.000 --> 00:23:22.000
web, que saque la información que yo quiero y que la incluya en el

00:23:22.000 --> 00:23:26.000
formato que yo le he dicho dentro de un JSON, y que solo anexe a un JSON

00:23:26.000 --> 00:23:34.000
ya creado y que me devuelva el JSON con todos los valores.

00:23:34.000 --> 00:23:35.000
¿Y eso cómo lo hace?

00:23:35.000 --> 00:23:37.000
Ejecutando scripts de Python.

00:23:37.000 --> 00:23:46.000
Por lo tanto, si esto lo puede hacer ya ChartGPT, ¿por qué no va a poder hacerlo Ziri a través del uso de atajos?

00:23:46.000 --> 00:23:49.000
Porque ustedes saben los que han trabajado con atajos que si me lo curro y

00:23:49.000 --> 00:23:52.000
hago un atajo lo suficientemente interesante y que ahonde a bajo nivel,

00:23:52.000 --> 00:23:55.000
pues, oye, puedo conseguir hacer casi cualquier cosa de las que yo

00:23:55.000 --> 00:23:58.000
necesite hacer dentro de un sistema operativo, ya sea, insisto, iOS Mac o

00:23:58.000 --> 00:24:04.000
cualquier otro.

00:24:04.000 --> 00:24:07.000
Así que, bueno, creo que esto es una opción que Apple incorporará.

00:24:08.000 --> 00:24:12.000
Esta funcionalidad, además, será clave con todo este tema de el uso por

00:24:12.000 --> 00:24:16.000
voz en Apple Vision Pro, en la que sería la versión dos punto cero de

00:24:16.000 --> 00:24:20.000
Vision OS, que incluiría, además de las experiencias compartidas, que

00:24:20.000 --> 00:24:24.000
por fin ya podríamos compartir y ver una película con gente dentro del

00:24:24.000 --> 00:24:28.000
cine de Apple o dentro de cualquier otra aplicación, etcétera, sino que

00:24:28.000 --> 00:24:33.000
además también va a permitir el uso de voz ampliado.

00:24:33.000 --> 00:24:36.000
Hoy día yo ya puedo usar comandos de voz en Apple Vision Pro y pedirle que

00:24:36.000 --> 00:24:39.000
me haga una captura de pantalla, pedirle que me abra una aplicación,

00:24:39.000 --> 00:24:42.000
pedirle que me active ciertas funciones de comandos del sistema operativo,

00:24:42.000 --> 00:24:48.000
darle órdenes a ese respecto.

00:24:48.000 --> 00:24:52.000
Pues bien, todo eso va a evolucionar de una manera en la que este nuevo LLM

00:24:52.000 --> 00:24:56.000
nos va a entender de una manera mucho más clara, mucho más precisa y,

00:24:56.000 --> 00:25:00.000
por lo tanto, dará soluciones mejores.

00:25:01.000 --> 00:25:02.000
¿Cómo funcionará todo esto?

00:25:02.000 --> 00:25:06.000
Pues hasta que no lo probemos, obviamente, no podemos saberlo, pero sobre

00:25:06.000 --> 00:25:10.000
el papel y con las pruebas que yo he estado realizando hasta ahora con

00:25:10.000 --> 00:25:14.000
todo lo que Apple ha ido sacando, créanme que puedo llegar a creerme lo

00:25:14.000 --> 00:25:18.000
que Apple dice de manera explícita, de que esta revisión de los sistemas

00:25:18.000 --> 00:25:22.000
va a ser una de las una de las más increíbles y de las más disruptivas

00:25:22.000 --> 00:25:26.000
que se han visto en los últimos años en los sistemas operativos de

00:25:26.000 --> 00:25:33.000
Apple, casi en toda su historia.

00:25:45.000 --> 00:25:48.000
Y poco más antes de nada, ¿vale?

00:25:48.000 --> 00:25:52.000
Alguno dirá, pues es que lo mismo te has flipado un pelín, ¿no?

00:25:52.000 --> 00:25:55.000
Lo mismo estás haciendo una carta a los Reyes Magos.

00:25:56.000 --> 00:26:00.000
No, no, realmente todo lo que les he contado son cosas que ya se pueden

00:26:00.000 --> 00:26:04.000
hacer hoy día, pero claro, para hacerlas hay que picar código o hay que

00:26:04.000 --> 00:26:08.000
picar línea de comando.

00:26:08.000 --> 00:26:12.000
Pero si le echan un vistazo a la librería MLX, si le echan un vistazo a

00:26:12.000 --> 00:26:16.000
los papers de Matrioska, a los papers de de uno, a cómo funciona el LLM,

00:26:16.000 --> 00:26:20.000
a las capacidades reales que tiene ChatGPT, más allá de pedirle que te

00:26:20.000 --> 00:26:27.000
cuente un chiste o que te haga el trabajo de religión.

00:26:27.000 --> 00:26:31.000
No, cuando realmente sabemos, como es mi caso, sacarle provecho, no me

00:26:31.000 --> 00:26:35.000
gusta llamarme así porque realmente me parece un nombre un poco asaltar,

00:26:35.000 --> 00:26:39.000
pero bueno, los llaman ingenieros de proms.

00:26:39.000 --> 00:26:44.000
Yo básicamente los llamaría personas que saben usar la herramienta, básicamente, ¿no?

00:26:44.000 --> 00:26:45.000
En fin.

00:26:45.000 --> 00:26:50.000
Pero bueno, el caso es que yo llevo ya mucho tiempo, desde mucho antes

00:26:50.000 --> 00:26:55.000
incluso de la salida de ChatGPT como servicio, trabajando con modelos de lenguaje.

00:26:56.000 --> 00:27:00.000
Llevo trabajando con toda la inteligencia artificial de Apple desde el año

00:27:00.000 --> 00:27:04.000
dos mil diecisiete, y sé perfectamente lo que puede o lo que no puede

00:27:04.000 --> 00:27:08.000
hacer, Y con toda esta información y toda esta experiencia que tengo, veo

00:27:08.000 --> 00:27:12.000
que todo lo que les he dicho no solo es posible, es plausible, dado el

00:27:12.000 --> 00:27:16.000
nivel que tiene a día de hoy Apple, a nivel técnico, de capacidad de lo

00:27:16.000 --> 00:27:20.000
publicado, de lo que ya sabemos, y de las capacidades técnicas que otros

00:27:20.000 --> 00:27:24.000
ya están incorporando en distintos sistemas y que, por supuesto, ¿por

00:27:24.000 --> 00:27:32.000
qué Apple no va a ser capaz de hacer lo mismo?

00:27:32.000 --> 00:27:33.000
Eso es un poco el kit de la cuestión.

00:27:34.000 --> 00:27:41.000
Así que, bueno, veremos, esperemos a ver qué es lo que nos encontramos y si cumple o no nuestras expectativas.

00:27:42.000 --> 00:27:46.000
Hasta entonces, un saludo y goad Apple Coding.

00:27:51.000 --> 00:27:59.000
Puedes escuchar más episodios de Apple Coding en Wanda punto com, la comunidad de podcast independientes en español.