﻿WEBVTT
Kind: captions
Language: es

00:00:05.000 --> 00:00:08.000
Wanda, la comunidad de podcast independientes en español.

00:00:08.000 --> 00:00:14.000
Hola y bienvenidos a un nuevo episodio de Apple Coding Daily.

00:00:16.000 --> 00:00:22.000
Bueno, pues ya ha empezado la w w w DC.

00:00:23.000 --> 00:00:26.000
Efectivamente, ya ha empezado, estamos grabando a miércoles, empezó el

00:00:26.000 --> 00:00:29.000
lunes y durará hasta el próximo viernes, donde Apple irá publicando

00:00:29.000 --> 00:00:32.000
más de, según ellos, más de cien vídeos, pero probablemente, según la

00:00:32.000 --> 00:00:38.000
agenda, estén por encima de los doscientos.

00:00:39.000 --> 00:00:47.000
Vídeos donde nos van a explicar todas las novedades a nivel de desarrollo y cómo poder usarlas, ¿vale?

00:00:47.000 --> 00:00:51.000
La, básicamente, pues la renovación que se hace todos los años.

00:00:51.000 --> 00:00:56.000
Entonces, desde aquí no vamos a hacer un resumen, es decir, si buscan un

00:00:56.000 --> 00:01:01.000
lugar que les explique lo bonito que es el nuevo centro de control o lo

00:01:01.000 --> 00:01:06.000
maravillosos que son los nuevos íconos tintados, han encontrado un lugar

00:01:06.000 --> 00:01:11.000
que no es el apropiado, porque aquí nos vamos a meter debajo del capó,

00:01:11.000 --> 00:01:16.000
como solemos hacer, y aquí vamos a hablarles en distintos programas y

00:01:16.000 --> 00:01:21.000
además en un podcast largo que ya estamos planificando para producir,

00:01:21.000 --> 00:01:26.000
donde les hablaremos en mucho más detalle.

00:01:26.000 --> 00:01:30.000
En estos podcast más cortos iremos más a explicaciones más rápidas,

00:01:30.000 --> 00:01:34.000
pero si quieren entrar más en detalle tendrán que escuchar el próximo

00:01:34.000 --> 00:01:38.000
los próximos podcast que hagamos en Apple Coding, donde ahí sí

00:01:38.000 --> 00:01:42.000
disponemos de horas para poder hablar tranquilamente y explicando cada

00:01:42.000 --> 00:01:49.000
elemento, cada cosa presentada, etcétera.

00:01:49.000 --> 00:01:54.000
En este caso, vamos a iniciar hablando de la novedad más importante,

00:01:54.000 --> 00:01:59.000
novedad que por ahora tenemos en una pequeña parte, muy pequeñita,

00:01:59.000 --> 00:02:04.000
puesto que estamos hablando de Apple Intelligence, y esto en su parte más

00:02:04.000 --> 00:02:09.000
grande, en su parte más importante, no estará disponible para los

00:02:09.000 --> 00:02:14.000
usuarios y no para todos los usuarios hasta el próximo hasta el próximo

00:02:14.000 --> 00:02:21.000
otoño, es decir, hasta finales de septiembre, primeros de octubre.

00:02:21.000 --> 00:02:26.000
Suponemos que con el lanzamiento de la nueva versión Mac OS Sequoia y las

00:02:26.000 --> 00:02:31.000
consecuentes versiones menores de iOS dieciocho y iPadOS dieciocho, para

00:02:31.000 --> 00:02:38.000
que así los tres sistemas estén lanzados al mismo tiempo.

00:02:39.000 --> 00:02:40.000
Insisto, suponemos.

00:02:40.000 --> 00:02:45.000
Así que, ¿qué es exactamente Apple Intelligence?

00:02:45.000 --> 00:02:49.000
Porque hemos escuchado mucha gente hablando del tema y no hemos visto, en

00:02:49.000 --> 00:02:53.000
fin, en lo que hemos mirado, a nadie que lo tenga realmente claro, por lo

00:02:53.000 --> 00:02:57.000
que vamos a meternos, repito, debajo del capó para ver exactamente qué

00:02:57.000 --> 00:03:01.000
es, cómo funciona y la la, digamos, la importancia que tiene Apple

00:03:01.000 --> 00:03:05.000
Intelligence dentro de la estrategia de Apple y todo lo que Apple ha hecho

00:03:05.000 --> 00:03:14.000
para que esto funcione.

00:03:15.000 --> 00:03:23.000
Así que vamos a ello.

00:03:28.000 --> 00:03:31.000
Es que el problema fundamental aquí es que los auriculares son una cosa

00:03:31.000 --> 00:03:34.000
milagrosa, te pones un par de auriculares y puedes tener la misma

00:03:34.000 --> 00:03:38.000
experiencia que con dos buenos altavoces, ¿no?

00:03:38.000 --> 00:03:41.000
Pero no existe nada como unos auriculares para vídeo.

00:03:41.000 --> 00:03:45.000
Para entender qué es Apple Vision Pro, hay que conectar los puntos hacia atrás.

00:03:46.000 --> 00:03:49.000
La semilla fue imaginar unos auriculares para vídeo hace más de quince

00:03:49.000 --> 00:03:52.000
años, incluso antes del iPhone, y luego vimos cómo Apple apostó por

00:03:52.000 --> 00:03:55.000
librerías de machine learning y realidad aumentada en un momento donde

00:03:55.000 --> 00:03:58.000
estas tecnologías aún eran desconocidas para el público general hace

00:03:58.000 --> 00:04:05.000
más de seis años, pero que fueron andando el camino.

00:04:05.000 --> 00:04:09.000
Hoy, Vision Pro continúa ese camino, un camino que Apple ha construido

00:04:09.000 --> 00:04:13.000
hasta aquí, y que ahora toca continuar a los desarrolladores que

00:04:13.000 --> 00:04:17.000
proporcionen apps, experiencias y contenido para la computación espacial.

00:04:17.000 --> 00:04:21.000
Porque, ¿qué es un iPhone sin sus apps?

00:04:21.000 --> 00:04:22.000
¿O un iPad?

00:04:23.000 --> 00:04:29.000
El dispositivo por sí solo no es nada, son los desarrolladores los que hacen que algo valga la pena.

00:04:29.000 --> 00:04:34.000
¿Quieres hacer que Vision Pro valga la pena y entrar en un nuevo mercado lleno de oportunidades?

00:04:35.000 --> 00:04:39.000
Aquí tienes la tuya con Vision Developer Program, una formación diseñada

00:04:39.000 --> 00:04:43.000
para desarrolladores en entornos Apple que quieran dar el siguiente paso y

00:04:43.000 --> 00:04:47.000
entrar en la computación espacial, además de ponerse al día con SWIFT

00:04:47.000 --> 00:04:51.000
UI o SWIFTDATA, Sumar todo lo necesario para construir apps que unan 2D y

00:04:51.000 --> 00:04:59.000
3D con RealityGit, ARGit, Reality Composer y mucho más.

00:04:59.000 --> 00:05:06.000
Ah, y no necesitas un dispositivo, con el simulador será más que suficiente, eso sí, necesitarás un Mac con Apple Silicon.

00:05:07.000 --> 00:05:12.000
No dejes pasar esta oportunidad porque la mitad de las empresas del Fortune cien ya están aprovechándola.

00:05:12.000 --> 00:05:16.000
Súmate al mayor cambio de paradigma de los últimos años y comienza desde

00:05:16.000 --> 00:05:20.000
ya a prepararte para el futuro con la única academia que lleva más de

00:05:20.000 --> 00:05:25.000
seis años formando en realidad aumentada machine learning en entornos Apple.

00:05:26.000 --> 00:05:35.000
Entra ahora en Apple Coding Academy e infórmate en acoding punto Academy barra vdp veinticuatro.

00:05:35.000 --> 00:05:38.000
La computación espacial te está esperando.

00:05:46.000 --> 00:05:50.000
Apple Intelligence, ¿Qué es Apple intelligence?

00:05:50.000 --> 00:05:57.000
Pues bien, es la apuesta de Apple por la inclusión de determinados modelos

00:05:57.000 --> 00:06:04.000
generativos, en este caso, de lenguaje y de imágenes dentro del sistema operativo.

00:06:04.000 --> 00:06:10.000
La gran novedad es, precisamente, esa, la integración en el sistema operativo.

00:06:11.000 --> 00:06:16.000
¿Hay algo que no hagan los demás que Apple haga con este Apple Intelligence?

00:06:17.000 --> 00:06:27.000
No, porque ya estamos cansados de ver distintos tipos de modelos de lenguaje y de generación de imágenes en otras soluciones.

00:06:27.000 --> 00:06:31.000
Aquí, la gran diferencia, porque a nivel funcional Apple no va a hacer

00:06:31.000 --> 00:06:35.000
casi nada nuevo, casi nada, lo realmente importante no es qué es lo que

00:06:35.000 --> 00:06:39.000
hace Apple, sino cómo lo hace, porque está integrado dentro del sistema

00:06:39.000 --> 00:06:43.000
operativo, esa es la gran diferencia y además sin ningún tipo de coste

00:06:43.000 --> 00:06:47.000
para los usuarios.

00:06:47.000 --> 00:06:52.000
Ahora, todo esto tiene truco, porque aunque estará disponible en iOS

00:06:52.000 --> 00:06:57.000
dieciocho, iPad dieciocho y Mako es quince, sequoia, sequoia, el nombre

00:06:57.000 --> 00:07:04.000
está cogido, espectacular, ¿qué es lo que sucede?

00:07:04.000 --> 00:07:12.000
Pues que solamente en en determinados dispositivos estará disponible esta inteligencia de Apple.

00:07:12.000 --> 00:07:20.000
Eso significa que los dispositivos que más van a sufrir y no van a llegar son los iPhones.

00:07:21.000 --> 00:07:25.000
Estamos hablando de que solo el iPhone diecisiete, el iPhone quince Pro,

00:07:25.000 --> 00:07:29.000
perdón, con chip a diecisiete pro, es el único teléfono que va a tener

00:07:29.000 --> 00:07:35.000
disponible este Apple Intelligence.

00:07:37.000 --> 00:07:39.000
Por dos motivos fundamentales.

00:07:39.000 --> 00:07:44.000
El primero, porque los iPhone quince Pro y quince Pro Max son los únicos

00:07:44.000 --> 00:07:49.000
dispositivos que cuentan con ocho gigas de memoria RAM suficiente para

00:07:49.000 --> 00:07:54.000
poder cargar de una manera sin ningún problema y sin que suponga un una

00:07:54.000 --> 00:07:59.000
bajada de rendimiento en el sistema operativo, lo que van a permitir que

00:07:59.000 --> 00:08:04.000
se carguen estos modelos generativos y, además, el A diecisiete Pro es el

00:08:04.000 --> 00:08:09.000
único motor neural dentro de un iPhone que tiene el motor neural de la

00:08:09.000 --> 00:08:14.000
serie m, es decir, un motor neural con una capacidad superior a treinta

00:08:14.000 --> 00:08:19.000
teraflops de cálculo en coma flotante de treinta y dos bits, que es el

00:08:19.000 --> 00:08:29.000
número de operaciones que puede realizar este motor neural ejecutando estos modelos.

00:08:29.000 --> 00:08:35.000
Como toda la implementación se entiende que es en local, gran parte de la

00:08:35.000 --> 00:08:41.000
implementación es en local directamente en tu velocidad, en cuanto a,

00:08:41.000 --> 00:08:47.000
digamos, privacidad, seguridad, etcétera, porque los datos nunca salen de

00:08:47.000 --> 00:08:55.000
tu dispositivo, pues en ese sentido tendríamos el Winwin.

00:08:56.000 --> 00:09:00.000
Pero claro, el único iPhone que tiene esta capacidad es el iPhone quince

00:09:00.000 --> 00:09:04.000
Pro, y suponemos que los próximos iPhones dieciséis también la

00:09:04.000 --> 00:09:08.000
tendrán, no sabemos si solo los Pro o también la gama básica.

00:09:09.000 --> 00:09:14.000
Entendemos que sí, que la gama básica también tendrá este motor neural de más capacidad y también más memoria.

00:09:15.000 --> 00:09:16.000
Ese es el primer punto.

00:09:16.000 --> 00:09:20.000
Luego, en los iPads solamente los iPads con chip m son capaces de ejecutar

00:09:20.000 --> 00:09:24.000
Apple Intelligence, por lo mismo, porque todos los iPad con chip m tienen

00:09:24.000 --> 00:09:30.000
al menos ocho gigas de RAM.

00:09:30.000 --> 00:09:35.000
En el caso del iPad con m cuatro, el iPad Pro, tenemos doce, donde cuatro

00:09:35.000 --> 00:09:40.000
de ellos quedan reservados para estos modelos y así tener mayor

00:09:40.000 --> 00:09:45.000
capacidad, y en el caso de MacOS, igual todos los modelos que sean Apple

00:09:45.000 --> 00:09:50.000
Silicon con chips m uno, m dos, m tres, m cuatro y sus variantes.

00:09:51.000 --> 00:09:55.000
Estos son los únicos dispositivos porque son los únicos que tienen motor neural.

00:09:55.000 --> 00:10:01.000
Los Mac con Intel no pueden, no tienen motor neural, por lo que no pueden ejecutar estos modelos en local.

00:10:02.000 --> 00:10:09.000
Y, de igual manera, tampoco pueden funcionar iPhones anteriores o iPads con chips de serie A.

00:10:09.000 --> 00:10:13.000
Para que se hagan una idea, en un Mac con Apple Silicon generando una

00:10:13.000 --> 00:10:17.000
imagen con Stable Diffusion, el modelo generativo de imágenes en su

00:10:17.000 --> 00:10:21.000
versión XL, tú puedes tardar aproximadamente unos tres a cuatro segundos

00:10:21.000 --> 00:10:25.000
en generar una imagen de una resolución limitada de doscientos cincuenta

00:10:25.000 --> 00:10:29.000
y seis por doscientos cincuenta y seis, como por ejemplo, lo que sería el

00:10:29.000 --> 00:10:33.000
equivalente a un yemoji, que sería la generación de emojis que luego

00:10:33.000 --> 00:10:43.000
hablaremos de ella.

00:10:44.000 --> 00:10:48.000
Entonces, si partimos de la base de que en un Apple Silicon puedes llegar a

00:10:48.000 --> 00:10:52.000
tardar segundos en generar una imagen pequeñita a través de un modelo

00:10:52.000 --> 00:10:56.000
generativo, no podemos olvidar, y de hecho les invito a hacer la prueba,

00:10:56.000 --> 00:11:00.000
que cuando lo ejecuten dentro de un Intel que no tiene motor neural, esos

00:11:00.000 --> 00:11:04.000
segundos pasan a ser minutos, por lo que, obviamente, Apple no puede

00:11:04.000 --> 00:11:10.000
utilizar estos equipos.

00:11:10.000 --> 00:11:13.000
Y, de igual manera, los chips de serie A, aunque cuentan con un motor

00:11:13.000 --> 00:11:16.000
neural, ese motor neural no tiene la potencia suficiente como para dar

00:11:16.000 --> 00:11:19.000
respuestas en un tiempo que sea, bueno, pues, prudencialmente correcto

00:11:19.000 --> 00:11:25.000
para que la experiencia de usuario sea la correcta.

00:11:26.000 --> 00:11:30.000
Por lo tanto, Apple se suma al resto de compañías que están en la misma,

00:11:30.000 --> 00:11:34.000
digamos, en la misma dirección, es decir, Android está ofreciendo

00:11:34.000 --> 00:11:40.000
modelos generativos en local, solo a los últimos dispositivos.

00:11:40.000 --> 00:11:47.000
Los que tienen más tiempo, no, porque necesitan componentes que están poniendo ahora, como los nuevos chips de Qualcomm.

00:11:47.000 --> 00:11:50.000
Microsoft saca nuevas funcionalidades y nuevos ordenadores, los nuevos

00:11:50.000 --> 00:11:53.000
modelos generativos que funcionan en local tampoco funcionan en ningún

00:11:53.000 --> 00:11:58.000
equipo que no sea nuevo.

00:11:58.000 --> 00:12:01.000
O, por ejemplo, Intel, que está sacando nuevos chips de generación

00:12:01.000 --> 00:12:04.000
catorce, pero que que estos sí tienen motor neural, pero que obviamente

00:12:04.000 --> 00:12:09.000
ni siquiera están en el mercado.

00:12:09.000 --> 00:12:12.000
Tendremos que empezar a comprar PCs que tengan estos chips para que la

00:12:12.000 --> 00:12:15.000
inteligencia artificial generativa en local de Windows empiece a funcionar

00:12:15.000 --> 00:12:20.000
directamente con ellos.

00:12:20.000 --> 00:12:31.000
Por lo que volvemos a lo mismo, a pesar de que, o sea, a ver, es una tecnología muy nueva, por lo que, en fin, el hardware no está preparado.

00:12:31.000 --> 00:12:36.000
Aún así, gracias a Jobs, podemos ver cómo Apple, que lleva más tiempo

00:12:36.000 --> 00:12:42.000
en este negocio, está dando soporte a iPads o Macs que tienen tres y cuatro años.

00:12:43.000 --> 00:12:46.000
Yo he estado probando los nuevos modelos generativos en mi Mac mini M uno,

00:12:46.000 --> 00:12:49.000
el primero que compré en noviembre del año dos mil veinte cuando se

00:12:49.000 --> 00:12:52.000
anunció la generación Apple Silicon, y funciona perfectamente, por lo

00:12:52.000 --> 00:12:55.000
que estamos probando esta inteligencia artificial generativa en equipos

00:12:55.000 --> 00:13:02.000
que tienen cuatro años, lo cual, pues oye, no está nada mal.

00:13:03.000 --> 00:13:08.000
Entonces, ese es el kit de la cuestión, no obstante, los iPhone son los que han pagado el pato.

00:13:08.000 --> 00:13:11.000
Pero, ¿podrían funcionar en la nube?

00:13:11.000 --> 00:13:16.000
Sí, podrían funcionar en la nube, pero como ahora después explicaremos,

00:13:16.000 --> 00:13:21.000
es imposible que Apple tenga la capacidad de centros de datos para dar

00:13:21.000 --> 00:13:26.000
servicio a los más de mil doscientos millones de dispositivos que pueden

00:13:26.000 --> 00:13:31.000
instalar iOS dieciocho, por lo que Apple ha tenido que descartar, ya que

00:13:31.000 --> 00:13:39.000
la nube que ellos tienen no está tan capacitada, ¿de acuerdo?

00:13:40.000 --> 00:13:42.000
En fin, vayamos al detalle.

00:13:42.000 --> 00:13:44.000
¿Qué es Apple Intelligence?

00:13:45.000 --> 00:13:52.000
Básicamente, Apple Intelligence es la forma de ejecutar dentro de los

00:13:52.000 --> 00:13:59.000
dispositivos modelos de lenguaje grande, LLMs, y modelos de generación de imágenes.

00:13:59.000 --> 00:14:05.000
¿Qué es lo que ha hecho Apple para permitir que estos modelos se puedan ejecutar directamente dentro de un dispositivo?

00:14:05.000 --> 00:14:10.000
Pues bien, ha creado varias técnicas que le han permitido afinar los

00:14:10.000 --> 00:14:15.000
modelos entre los modelos generativos entrenados para ciertas tareas muy

00:14:15.000 --> 00:14:22.000
específicas y que sean lo más eficiente posible ocupando lo menos posible.

00:14:23.000 --> 00:14:26.000
Según ciertos datos que no he podido confirmar al cien por cien, Apple

00:14:26.000 --> 00:14:29.000
estaría utilizando un modelo generativo de lenguaje OpenELM con un

00:14:29.000 --> 00:14:32.000
tamaño de tres mil millones de parámetros, lo que se conoce

00:14:32.000 --> 00:14:38.000
técnicamente como un tres b.

00:14:39.000 --> 00:14:44.000
Este modelo tiene una cuantización a cuatro bits, por lo tanto, su tamaño

00:14:44.000 --> 00:14:49.000
dentro de la memoria viene a ser aproximadamente un par de gigas más o

00:14:49.000 --> 00:14:55.000
menos, dependiendo del número de modelos expertos que esté cargado.

00:14:56.000 --> 00:14:57.000
¿Y esto qué significa?

00:14:57.000 --> 00:15:00.000
Pues bien, cuando yo tengo un modelo generativo, los modelos generativos,

00:15:00.000 --> 00:15:03.000
cualquier tipo de, ya no solo los generativos, cualquier tipo de modelo de

00:15:03.000 --> 00:15:07.000
machine learning tiene que ser cargado directamente en memoria.

00:15:07.000 --> 00:15:10.000
Si no está cargado en memoria, no puede funcionar, porque tiene que estar

00:15:10.000 --> 00:15:13.000
en la memoria RAM para que pueda ir gestionando, haciendo todo el paso a

00:15:13.000 --> 00:15:18.000
través de la red neuronal, etcétera.

00:15:18.000 --> 00:15:27.000
Apple lo que ha hecho ha sido utilizar una forma muy parecida a la que tiene ChatGPT, pero digamos que lo ha adaptado a las necesidades locales.

00:15:27.000 --> 00:15:31.000
Lo primero que ha hecho Apple es utilizar técnicas de find tuning por el

00:15:31.000 --> 00:15:35.000
que ha ido especializando los modelos con múltiples entrenamientos y

00:15:35.000 --> 00:15:39.000
descartando información redundante y dando información de mucha más

00:15:39.000 --> 00:15:43.000
calidad y mucho más enfocada en aquello que se pretende dar como

00:15:43.000 --> 00:15:51.000
funcionalidad para crear un modelo que no tenga tanta hemorragia.

00:15:52.000 --> 00:15:57.000
Al final, un modelo como ChatGPT es maravilloso, es estupendo, pero GPT

00:15:57.000 --> 00:16:02.000
Four, por ejemplo, GPT cuatro, tiene uno coma ocho t de parámetros

00:16:02.000 --> 00:16:07.000
totales, es decir, tiene un uno coma ocho billones con b, trillon, si

00:16:07.000 --> 00:16:13.000
habláramos en términos americanos, de parámetros en su entrenamiento.

00:16:14.000 --> 00:16:17.000
Esto es una auténtica burrada, porque no podemos olvidar que hemos dicho

00:16:17.000 --> 00:16:20.000
que el modelo de Apple es de tres b, es decir, es de tres mil millones de

00:16:20.000 --> 00:16:25.000
parámetros, y estamos hablando de un modelo de uno coma ocho billones de parámetros.

00:16:26.000 --> 00:16:30.000
Entonces, al final estos modelos tan grandes no tienen una depuración de

00:16:30.000 --> 00:16:34.000
fuentes, sino que se le da un montón de fuentes y se arriesgan a que haya

00:16:34.000 --> 00:16:38.000
un montón de datos duplicados, redundantes, datos que no aportan nada a

00:16:38.000 --> 00:16:42.000
la red neuronal, datos que prácticamente van a datos que van a crear

00:16:42.000 --> 00:16:46.000
caminos dentro de la red neuronal que prácticamente no van a ser

00:16:46.000 --> 00:16:50.000
recorridos casi en ningún elemento, Apple ha ido especializando los

00:16:50.000 --> 00:16:54.000
modelos, se ha ido optimizando durante más de un año y medio estos

00:16:54.000 --> 00:16:58.000
modelos para que así sean lo más eficientes posibles, para que cada dato

00:16:58.000 --> 00:17:02.000
recorra el máximo posible dentro de la red neuronal, analizando cómo

00:17:02.000 --> 00:17:06.000
funciona y que sea lo más eficiente a la hora de dar el objetivo, porque

00:17:06.000 --> 00:17:14.000
ese es el segundo elemento.

00:17:14.000 --> 00:17:19.000
Apple lo que ha hecho es algo parecido a los modelos expertos, a los a los

00:17:19.000 --> 00:17:24.000
mixtors of experts utilizan modelos grandes, creando lo que Apple llama

00:17:24.000 --> 00:17:29.000
los adapters, adaptadores que lo que hacen es utilizar los distintos

00:17:29.000 --> 00:17:35.000
pesados del modelo para tener una especialización dinámica.

00:17:36.000 --> 00:17:45.000
Es decir, que cuando yo, que esto es lo que hace ChatGPT, es decir, ChatGPT no está cargado todo el rato todo el modelo para dar soluciones.

00:17:46.000 --> 00:17:52.000
Si yo estoy hablándole de programación, tiene cargado el modelo general de entendimiento y tiene cargado el modelo de goding.

00:17:52.000 --> 00:17:56.000
Luego, si le empiezo a hablar de matemáticas, carga el modelo de Math, si

00:17:56.000 --> 00:18:00.000
le empiezo a hablar de temas de otro lo que sea, pues cargas, es decir,

00:18:00.000 --> 00:18:04.000
tiene lo que se conoce técnicamente, lo hemos comentado, como un mixture

00:18:04.000 --> 00:18:08.000
of experts, una mezcla de expertos, donde hay un montón de modelos

00:18:08.000 --> 00:18:12.000
expertos dedicados y entrenados a temas muy concretos que se van cargando

00:18:12.000 --> 00:18:16.000
o descargando de memoria según su necesidad.

00:18:16.000 --> 00:18:19.000
Pues bien, Apple ha hecho esto, ha utilizado adapters, que es como lo ha

00:18:19.000 --> 00:18:22.000
llamado él, para que en esa especialización dinámica los modelos vayan,

00:18:22.000 --> 00:18:25.000
o sea, modelos específicamente entrenados para ciertas tareas que se van

00:18:25.000 --> 00:18:31.000
cargando en función de lo que yo necesito.

00:18:31.000 --> 00:18:33.000
¿Que necesito hacer un resumen de un texto?

00:18:33.000 --> 00:18:35.000
Llama al modelo experto en resúmenes.

00:18:35.000 --> 00:18:40.000
¿Que necesito hacer un una generación de una conversación?

00:18:40.000 --> 00:18:41.000
Llama al modelo experto en eso.

00:18:41.000 --> 00:18:42.000
¿Que necesito un email?

00:18:42.000 --> 00:18:45.000
Pues llama al modelo experto para hacer emails, es decir, cada

00:18:45.000 --> 00:18:48.000
funcionalidad tiene un adapter que se encarga de hacer esa tarea de una

00:18:48.000 --> 00:18:51.000
manera más concreta.

00:18:52.000 --> 00:18:56.000
A todo esto le ha unido la compresión, los modelos están realizados con

00:18:56.000 --> 00:19:00.000
dieciséis bits de palabra, es decir, cada uno de los perceptrones, cada

00:19:00.000 --> 00:19:04.000
una de las neuronas de la red neuronal, tiene un tamaño en su

00:19:04.000 --> 00:19:08.000
entrenamiento de, en su entrenamiento real, de dieciséis bits, pero Apple

00:19:08.000 --> 00:19:12.000
lo que ha hecho ha sido cuantizar los modelos a cuatro bits en un proceso

00:19:12.000 --> 00:19:16.000
en el que ha optimizado el rendimiento de esta cuantización para que el

00:19:16.000 --> 00:19:26.000
nivel de eficiencia del modelo se reduzca lo menos posible.

00:19:26.000 --> 00:19:30.000
Ha ido analizando los distintos resultados y ha utilizado cuantización para esto.

00:19:30.000 --> 00:19:31.000
¿Qué es la cuantización?

00:19:32.000 --> 00:19:36.000
La cuantización es cuando yo cojo la representación de posibles valores

00:19:36.000 --> 00:19:40.000
de un perceptrón, de una neurona dentro de la red neuronal de dieciséis

00:19:40.000 --> 00:19:44.000
bits, que es capaz de representar sesenta y cinco mil quinientos treinta y

00:19:44.000 --> 00:19:48.000
seis valores distintos, y intento conseguir los mismos resultados dentro

00:19:48.000 --> 00:19:52.000
de una red neuronal en el que cada perceptrón solo es capaz de guardar

00:19:52.000 --> 00:19:57.000
valores de dieciséis posibles valores, cuatro bits.

00:19:58.000 --> 00:20:03.000
Esto, lógicamente, lo que hace es que la eficiencia del modelo se reduzca,

00:20:03.000 --> 00:20:08.000
pero si conseguimos que el modelo reduzca la eficiencia lo menos posible,

00:20:08.000 --> 00:20:13.000
imagínense en una predicción de una posible respuesta en un modelo

00:20:13.000 --> 00:20:18.000
generativo de lenguaje, yo cogería y diría, vale, yo pongo este modelo y

00:20:18.000 --> 00:20:23.000
le pido que me complete este texto, y ahora este texto que está

00:20:23.000 --> 00:20:28.000
completando resulta que el perceptrón tiene sesenta y cinco mil

00:20:28.000 --> 00:20:33.000
quinientas treinta y seis posibilidades de datos para sí mismo, que

00:20:33.000 --> 00:20:38.000
combinados con los otros perceptrones dará una salida aleatoria de x calidad.

00:20:38.000 --> 00:20:42.000
Si yo consigo que el resultado sea parecido y, a lo mejor, la predicción

00:20:42.000 --> 00:20:46.000
reduzca su eficiencia en un diez, quince por ciento, pero ahora ya no

00:20:46.000 --> 00:20:50.000
tengo que almacenar dieciséis bits, sesenta y cinco mil quinientos

00:20:50.000 --> 00:20:54.000
treinta y seis valores, sino que con dieciséis la red neuronal me sigue

00:20:54.000 --> 00:20:58.000
dando un resultado lo suficientemente bueno, pues he conseguido que el

00:20:58.000 --> 00:21:06.000
modelo neuronal, la red neuronal, ocupe cuatro veces menos de espacio.

00:21:07.000 --> 00:21:11.000
Esto unido a la propia optimización de el el proceso de cuantización

00:21:11.000 --> 00:21:15.000
eliminando elementos o partes de la red neuronal que puedan ser detectadas

00:21:15.000 --> 00:21:19.000
como redundantes, por lo que al final tenemos una ayuda, en este sentido,

00:21:19.000 --> 00:21:25.000
para hacer este funcionamiento, ¿vale?

00:21:26.000 --> 00:21:29.000
Es decir, son técnicas que, insisto, no son nuevas ni las ha inventado

00:21:29.000 --> 00:21:32.000
Apple, pero Apple las está aplicando de una manera bastante buena para

00:21:32.000 --> 00:21:35.000
que todo esto funcione en local, de hecho, prácticamente esto de la misma

00:21:35.000 --> 00:21:38.000
manera es lo que hará Google y lo que hará Microsoft también para

00:21:38.000 --> 00:21:43.000
ejecutar sus modelos.

00:21:43.000 --> 00:21:47.000
Además, para mejorar el rendimiento de la ejecución de los propios

00:21:47.000 --> 00:21:51.000
modelos, de lo que conocemos técnicamente como la inferencia, lo que hace

00:21:51.000 --> 00:21:55.000
Apple son algunas técnicas que mejoran dicha ejecución.

00:21:56.000 --> 00:21:59.000
Por ejemplo, estaríamos hablando de la decodificación especulativa, que

00:21:59.000 --> 00:22:02.000
básicamente es que yo, a la hora de generar posibles respuestas de

00:22:02.000 --> 00:22:05.000
completado, no olvidemos que el completado de texto, que es los modelos de

00:22:05.000 --> 00:22:08.000
lenguaje, no es más que coger un texto que está inacabado y completarlo,

00:22:08.000 --> 00:22:11.000
aunque yo crea que es una conversación, en realidad no lo es, la

00:22:11.000 --> 00:22:14.000
decodificación especulativa lo que hace es generar distintas

00:22:14.000 --> 00:22:22.000
posibilidades en una misma petición.

00:22:23.000 --> 00:22:27.000
Cuando yo le paso un texto y tiene que completarlo, lo que hace es generar

00:22:27.000 --> 00:22:31.000
varias posibilidades de ese texto, y en función del texto que, en

00:22:31.000 --> 00:22:35.000
función de esas propias posibilidades que ha dado, utiliza una serie de

00:22:35.000 --> 00:22:39.000
filtros que le dan la calidad de cada uno de esos posibles resultados y,

00:22:39.000 --> 00:22:44.000
por lo tanto, va a recoger aquel elemento que sea mejor.

00:22:45.000 --> 00:22:49.000
Es una forma de descartar posibles completados, posibles predicciones, una

00:22:49.000 --> 00:22:53.000
predicción es cuando yo completo el texto, posibles predicciones de más

00:22:53.000 --> 00:22:57.000
baja calidad, por lo que pide varias y filtra y decide cuál es la que

00:22:57.000 --> 00:23:03.000
tiene un una mejor calidad.

00:23:03.000 --> 00:23:06.000
Además, utiliza técnicas de poda de contexto, por lo que descarta

00:23:06.000 --> 00:23:09.000
determinados temas que no tengan que ver, o determinadas completados que

00:23:09.000 --> 00:23:12.000
no tengan que ver con la parte, es decir, si yo tengo un contexto muy

00:23:12.000 --> 00:23:15.000
grande sobre el que tengo que contestar, simplemente se centra en las

00:23:15.000 --> 00:23:18.000
partes más claras o las partes más principales de aquello en lo que

00:23:18.000 --> 00:23:21.000
tiene que contestar, descartando el resto y, por lo tanto, reduce la

00:23:21.000 --> 00:23:30.000
cantidad de contexto que tiene que utilizar para dar las respuestas.

00:23:31.000 --> 00:23:38.000
En fin, una serie de técnicas bastante interesantes que mejoran la eficiencia, la velocidad y el rendimiento de estos modelos.

00:23:38.000 --> 00:23:43.000
Además, estos modelos van a poder integrarse con las aplicaciones, ya lo

00:23:43.000 --> 00:23:48.000
comentamos, yo lo venía vaticinando desde hace bastante tiempo y así se ha confirmado.

00:23:48.000 --> 00:23:52.000
Apple Intelligence será capaz de utilizar las intenciones de Siri, los app

00:23:52.000 --> 00:23:56.000
intents, que son las capacidades que permiten a el sistema, a Siri, poder

00:23:56.000 --> 00:24:00.000
acceder a los menús de las aplicaciones e incluso al texto hay en

00:24:00.000 --> 00:24:04.000
pantalla, por lo que yo voy a poder pedirle cosas a Siri dentro de las

00:24:04.000 --> 00:24:08.000
aplicaciones que entienda lo que hay en la interfaz y que me conteste a

00:24:08.000 --> 00:24:12.000
partir de lo que hay en dicha interfaz o de lo que cierta aplicación

00:24:12.000 --> 00:24:17.000
está haciendo.

00:24:17.000 --> 00:24:21.000
Si yo como desarrollador le comunico a Siri qué es lo que mi usuario hace

00:24:21.000 --> 00:24:25.000
en los distintos elementos de mi app, o qué es lo que está completando a

00:24:25.000 --> 00:24:29.000
nivel de información, o qué información está viendo, entonces, Siri

00:24:29.000 --> 00:24:33.000
será capaz de entender de una manera mucho más concreta y crear todo un

00:24:33.000 --> 00:24:37.000
índice semántico de contenido que le permita entender de una manera

00:24:37.000 --> 00:24:41.000
mucho mejor qué es lo que mi usuario hace con mi app y ayudarlo en esa

00:24:41.000 --> 00:24:45.000
app, pudiendo incluso, en ciertos contenidos, acceder a los elementos de

00:24:45.000 --> 00:24:49.000
la propia aplicación y trabajar con ello, como, por ejemplo, un campo de

00:24:49.000 --> 00:24:53.000
texto en pantalla que yo dentro de una app le pueda pedir a Siri que haga

00:24:53.000 --> 00:25:02.000
cierta cosa y lo complete.

00:25:02.000 --> 00:25:07.000
Por lo tanto, todo esto va a permitir que Siri sea, por fin, un asistente

00:25:07.000 --> 00:25:12.000
real, un asistente que te permita hacer un montón de cosas muy

00:25:12.000 --> 00:25:17.000
interesantes, te permita hacer cosas como, por ejemplo, la generación de

00:25:17.000 --> 00:25:22.000
texto, la generación de texto con los modelos de lenguaje para utilizar

00:25:22.000 --> 00:25:30.000
técnicas de resumen de texto, corrección de texto, ¿vale?

00:25:30.000 --> 00:25:34.000
Es capaz de corregirte un texto, incluso gramaticalmente, generar cierto

00:25:34.000 --> 00:25:38.000
tipo de respuestas a partir del correo, a partir de los mensajes y

00:25:38.000 --> 00:25:42.000
mimetizar la forma en la que tú te expresas, y por lo tanto, todo eso va

00:25:42.000 --> 00:25:46.000
a permitir, con distintos adapters dedicados para cada una de estas tareas

00:25:46.000 --> 00:25:50.000
de control de texto, el hacer que estas estos elementos sean mejores, o

00:25:50.000 --> 00:25:57.000
por ejemplo, todo el tema de la generación de imágenes.

00:25:57.000 --> 00:26:01.000
Tenemos los emojis, la generación de emojis en tiempo real, emojis en los

00:26:01.000 --> 00:26:05.000
que, a partir de una descripción, se genera un pequeño emoji que

00:26:05.000 --> 00:26:09.000
represente lo que se está diciendo, a partir de un modelo entrenado que

00:26:09.000 --> 00:26:15.000
se cargará para dar solución a través del modelo Matrioska.

00:26:16.000 --> 00:26:20.000
Ya hemos hablado aquí del modelo Matrioska y adelantado lo que era esto, ¿vale?

00:26:20.000 --> 00:26:23.000
Les dejo por aquí el el programa, ¿de acuerdo?

00:26:24.000 --> 00:26:33.000
Entonces, en este programa ya estuvimos hablando de que Matryoshka son las muñequitas rusas que se pueden ir metiendo unas dentro de otras.

00:26:33.000 --> 00:26:37.000
Apple lo ha llamado así porque son distintos modelos de generación de

00:26:37.000 --> 00:26:41.000
imágenes para distintas cosas que tienen, en principio, tres

00:26:41.000 --> 00:26:45.000
funcionalidades que Apple ha declarado, la generación de emojis en tiempo

00:26:45.000 --> 00:26:49.000
real, la generación de prompts, de generación de imágenes a través de

00:26:49.000 --> 00:26:53.000
una nueva aplicación llamada image playground, que además yo como

00:26:53.000 --> 00:26:57.000
desarrollador puedo incluir dentro de mi aplicación, porque tenemos un

00:26:57.000 --> 00:27:01.000
image playground view para meter el SWIFT UI, y poder realizar la

00:27:01.000 --> 00:27:05.000
generación de imágenes a partir de prompts contextuales de distintos

00:27:05.000 --> 00:27:09.000
temas, donde yo simplemente pongo un tema y en una nube se van mezclando

00:27:09.000 --> 00:27:13.000
esos temas y se van generando imágenes de una muy buena calidad, a lo

00:27:13.000 --> 00:27:17.000
cual también se añade la posibilidad de coger una imagen ya hecha o

00:27:17.000 --> 00:27:21.000
incluso una fotografía de una persona y adaptarla tomándolo como guía

00:27:21.000 --> 00:27:30.000
de referencia contextual para generar una imagen.

00:27:30.000 --> 00:27:35.000
En principio, estos son las funcionalidades que Apple incluye, sin entrar

00:27:35.000 --> 00:27:40.000
dentro de las que ya por visión cálculos por por visión computerizada y

00:27:40.000 --> 00:27:45.000
que eso ya funciona a día de hoy, o como, por ejemplo, SCODE, que tiene

00:27:45.000 --> 00:27:50.000
un modelo generativo, que ahora mismo lo que permite es un completado de

00:27:50.000 --> 00:27:55.000
código inteligente que funciona realmente bien, yo ya lo he probado en mi

00:27:55.000 --> 00:28:00.000
Mac mini m uno de prueba, que necesita dieciséis gigas de RAM, pero que

00:28:00.000 --> 00:28:05.000
realmente es bastante espectacular.

00:28:05.000 --> 00:28:14.000
Pero todo esto son funcionalidades dentro de las aplicaciones, por lo que tenemos que distinguir muy bien los distintos pilares, ¿vale?

00:28:14.000 --> 00:28:18.000
Con esto vamos viendo lo que sería la conclusión final.

00:28:18.000 --> 00:28:22.000
El primer pilar de todos es el de las funciones de inteligencia artificial

00:28:22.000 --> 00:28:26.000
dentro de aplicaciones o servicios del sistema, como por ejemplo, SCODE

00:28:26.000 --> 00:28:30.000
con la parte de autocompletado, como por ejemplo la calculadora con la

00:28:30.000 --> 00:28:34.000
parte de el cálculo de operaciones escritas, o la parte de la el uso de

00:28:34.000 --> 00:28:38.000
la Apple Pencil para la escritura, en el que es capaz de copiar y pegar

00:28:38.000 --> 00:28:42.000
texto con mi propia letra e incluso mejorarla, y esto está disponible

00:28:42.000 --> 00:28:52.000
también en notas.

00:28:52.000 --> 00:28:55.000
De hecho, las notas matemáticas también podemos usarlas en notas, por lo

00:28:55.000 --> 00:28:58.000
que ese tipo de inteligencia artificial que ya está disponible, al menos

00:28:58.000 --> 00:29:01.000
las notas matemáticas, la del texto todavía no, pero al menos yo no he

00:29:01.000 --> 00:29:04.000
sido capaz de encontrar o de ver cómo funciona porque no me ha aparecido

00:29:04.000 --> 00:29:09.000
en el iPad, ¿vale?

00:29:09.000 --> 00:29:11.000
Pero, bueno, me dice que está, ¿vale?

00:29:11.000 --> 00:29:13.000
Pero yo no he conseguido que funcione, ¿ok?

00:29:14.000 --> 00:29:17.000
Entonces, el tema es que probablemente sea para una próxima beta.

00:29:18.000 --> 00:29:21.000
Entonces, el kit de la cuestión está en que esos son servicios del

00:29:21.000 --> 00:29:24.000
sistema, servicios que funcionan a día de hoy o que están dentro de una

00:29:24.000 --> 00:29:28.000
aplicación concreta como en el caso de SCODE con el modelo generativo, ¿vale?

00:29:28.000 --> 00:29:29.000
Que es un componente más y que además se va actualizando versión a versión.

00:29:29.000 --> 00:29:30.000
Perfecto.

00:29:35.000 --> 00:29:39.000
Ahora, el siguiente paso es el de Apple Intelligence, que se estará en

00:29:39.000 --> 00:29:43.000
otoño, y es el de la ejecución en local, iPhone quince Pro, quince Pro

00:29:43.000 --> 00:29:49.000
Max, todos los Mac con chip Apple Silicon, todos los iPads con chip M.

00:29:50.000 --> 00:29:57.000
Esos son los que van a poder permitir la ejecución en local con todo lo que hemos comentado, cómo funciona, etcétera.

00:29:57.000 --> 00:30:02.000
Esos dispositivos, en ciertas circunstancias, van a tener que salir a la

00:30:02.000 --> 00:30:07.000
nube, pero solo en momentos muy concretos, porque ahí será cuando entra

00:30:07.000 --> 00:30:12.000
en funcionamiento lo que llamamos el private cloud compute, elementos en

00:30:12.000 --> 00:30:19.000
los que ¿qué sucede?

00:30:19.000 --> 00:30:21.000
Pues bien, contexto.

00:30:22.000 --> 00:30:32.000
Cuando yo tengo un modelo generativo que tiene un determinado tamaño, una determinada calidad, se le puede sacar lo que se le puede sacar.

00:30:32.000 --> 00:30:35.000
Para hacer resúmenes, para contestar correos, para contestar mensajes,

00:30:35.000 --> 00:30:38.000
para generar texto, para hacer, en fin, todo ese tipo de cosas que hemos

00:30:38.000 --> 00:30:41.000
comentado que es capaz de hacer lo que sería el modelo de Apple

00:30:41.000 --> 00:30:47.000
Intelligence, el local, genial.

00:30:47.000 --> 00:30:50.000
Pero, ¿qué es lo que sucede cuando yo quiero que me procese un PDF de un

00:30:50.000 --> 00:30:53.000
montón de páginas que supera los, se calcula aproximadamente tres mil

00:30:53.000 --> 00:30:56.000
tokens, tres mil a cuatro mil tokens de contexto completo que puede llegar

00:30:56.000 --> 00:31:02.000
a tener el modelo en local.

00:31:03.000 --> 00:31:04.000
Repito, esto es una estimación, ¿vale?

00:31:04.000 --> 00:31:11.000
No se sabe con seguridad, pero en base a los modelos que ya teníamos, se calcula que sería más o menos ese.

00:31:12.000 --> 00:31:21.000
Si ese contexto de dos mil o tres mil tokens, cuatro mil como mucho, no es suficiente, porque estaríamos hablando, tokens son más o menos palabras.

00:31:21.000 --> 00:31:24.000
Si yo tengo mil tokens, pues vendría a ser, más o menos, unas mil cien

00:31:24.000 --> 00:31:27.000
palabras, porque los tokens son aquellas palabras que realmente son

00:31:27.000 --> 00:31:30.000
importantes dentro de un texto y que van a dar sentido al completado a

00:31:30.000 --> 00:31:36.000
partir del mismo.

00:31:36.000 --> 00:31:40.000
El contexto, por decirlo de alguna manera, sería la memoria, que es capaz

00:31:40.000 --> 00:31:44.000
de recordar o de concatenar ciertas peticiones de un lado o de otro, es

00:31:44.000 --> 00:31:48.000
capaz de que yo le pida a Siria una cosa, le vuelva a pedir otra, le

00:31:48.000 --> 00:31:53.000
vuelva a pedir otra y sepa de lo que le estoy hablando porque lo recuerda.

00:31:53.000 --> 00:31:57.000
Ese contexto tiene un tamaño, insisto, de dos mil, tres mil palabras, se

00:31:57.000 --> 00:32:01.000
estima, por lo que cuando yo necesito algo más grande, cuando yo voy a

00:32:01.000 --> 00:32:05.000
procesar más información, cuando necesito que la respuesta sea de más

00:32:05.000 --> 00:32:09.000
calidad, Apple sale a la nube propia, a una nube propia, solo para Apple

00:32:09.000 --> 00:32:16.000
Intelligence, ¿de acuerdo?

00:32:18.000 --> 00:32:23.000
Esto también porque, repito, podría funcionar en, esto podría hacer que

00:32:23.000 --> 00:32:28.000
dispositivos que no tienen la capacidad de los motores neurales funcionaran.

00:32:28.000 --> 00:32:32.000
El problema es que Apple no tiene la capacidad, ni Apple ni creo que casi

00:32:32.000 --> 00:32:36.000
nadie, tiene la capacidad de manera gratuita de ofrecer servicio a más de

00:32:36.000 --> 00:32:42.000
mil millones de dispositivos en el mundo.

00:32:44.000 --> 00:32:48.000
Sé que yo he defendido durante mucho tiempo que los dispositivos que no

00:32:48.000 --> 00:32:52.000
estén soportados irían en la nube, y sí, me equivoqué, me equivoqué

00:32:52.000 --> 00:32:56.000
porque no caí en ese pequeño detalle de que realmente Apple no tendría

00:32:56.000 --> 00:33:00.000
la capacidad, como casi ninguna empresa que no se dedique cien por cien a

00:33:00.000 --> 00:33:04.000
la nube, con un coste muy alto, a dar servicio a más de mil millones de

00:33:04.000 --> 00:33:08.000
dispositivos, por lo que Apple ha tenido que cortar aquí también, por lo

00:33:08.000 --> 00:33:12.000
que, en principio, no estaría disponible este cloud compute privado, nada

00:33:12.000 --> 00:33:16.000
más que aquellos dispositivos que sí son capaces de hacer las peticiones

00:33:16.000 --> 00:33:20.000
en local, porque Apple ya habrá estimado, a nivel de uso, que esta nube

00:33:20.000 --> 00:33:24.000
privada solo se usará en muy concretas ocasiones y, por lo tanto, habrá

00:33:24.000 --> 00:33:28.000
estimado cuántos dispositivos tiene y cuánto va a suponer a nivel de

00:33:28.000 --> 00:33:32.000
carga y cómo va a tener que cargar sus centros de datos para dar el

00:33:32.000 --> 00:33:44.000
servicio con garantías.

00:33:45.000 --> 00:33:49.000
Un servicio en el que se utilizan técnicas de cifrado de extremo a

00:33:49.000 --> 00:33:53.000
extremo, se utilizan técnicas de procesamiento de peticiones a nivel

00:33:53.000 --> 00:33:57.000
contextual de una manera concreta en el que cuando acaba se borra la

00:33:57.000 --> 00:34:01.000
información, en el que se garantizan los servidores a través de

00:34:01.000 --> 00:34:05.000
técnicas de update station para que, a través de firma digital, se sepa

00:34:05.000 --> 00:34:09.000
que esos servidores son los reales y no haya una suplantación, y todo

00:34:09.000 --> 00:34:13.000
esto además se ha puesto al servicio de la comunidad de de auditores de

00:34:13.000 --> 00:34:17.000
seguridad y de toda la comunidad abierta de seguridad desarrollo de

00:34:17.000 --> 00:34:21.000
software, para que ellos puedan auditar e incluso se les va a recompensar

00:34:21.000 --> 00:34:25.000
si encontraran errores que permitieran filtrar la información, porque

00:34:25.000 --> 00:34:29.000
Apple, toda esta tecnología, la ha hecho abierta para que los expertos en

00:34:29.000 --> 00:34:33.000
seguridad puedan auditarla y puedan dar la garantía de que todo esto

00:34:33.000 --> 00:34:49.000
funciona de manera correcta y que no hay trampa ni cartón por ningún lado.

00:34:50.000 --> 00:34:54.000
Por lo tanto, lo que tendríamos ahí con esas conexiones end to end, con

00:34:54.000 --> 00:34:58.000
esa no retención de datos, con una verificación pública de las

00:34:58.000 --> 00:35:02.000
imágenes, con estos modelos que dan recompensa si se encuentran problemas

00:35:02.000 --> 00:35:06.000
de seguridad, etcétera, lo que harían sería permitir que todo este

00:35:06.000 --> 00:35:10.000
Apple Intelligence funcione para, repito, cuando hay una petición que

00:35:10.000 --> 00:35:14.000
requiere más contexto, salimos a la nube a centros de datos de Apple con

00:35:14.000 --> 00:35:18.000
Mac Studio M dos ultras, que serán capaces de, a través de sus motores

00:35:18.000 --> 00:35:25.000
neurales, procesar la petición y devolverla.

00:35:25.000 --> 00:35:29.000
No será tan rápido, pero para cosas que requieran mucho más contexto se

00:35:29.000 --> 00:35:33.000
hará de esta manera, y Apple ya habrá estimado que esto probablemente

00:35:33.000 --> 00:35:37.000
suponga a lo mejor un cinco o un diez por ciento del total de peticiones

00:35:37.000 --> 00:35:42.000
mensuales, porque la gran mayoría se resolverán en local, ¿vale?

00:35:42.000 --> 00:35:47.000
Por lo tanto, ese sería el funcionamiento de esta parte de private cloud compute, ¿vale?

00:35:47.000 --> 00:35:57.000
Para poder apoyar a estos modelos generativos que no tengan la capacidad del local para manejar un contexto tan amplio, ¿de acuerdo?

00:35:58.000 --> 00:36:06.000
Así que eso sería, en resumen, lo que tendríamos que ver.

00:36:07.000 --> 00:36:09.000
Por último, ¿qué sucede con ChatGPT?

00:36:09.000 --> 00:36:13.000
Pues bien, lo de ChatGPT es algo que se ha cerrado en las últimas semanas,

00:36:13.000 --> 00:36:17.000
por lo que la única información que hay disponible a día de hoy con

00:36:17.000 --> 00:36:21.000
respecto a lo de ChatGPT viene de la propia página de OpenAI o viene de

00:36:21.000 --> 00:36:25.000
la propia presentación de la keynote.

00:36:26.000 --> 00:36:29.000
En los vídeos que Apple está liberando no cuenta nada de ChatGPT.

00:36:30.000 --> 00:36:35.000
Lo de ChatGPT, y repito, todavía no está confirmado, parece que podría

00:36:35.000 --> 00:36:40.000
ser que estuviera disponible para todo el mundo, Es decir, que tú

00:36:40.000 --> 00:36:45.000
pudieras, en un dispositivo que no soporte App Intelligence, pedirle a la

00:36:45.000 --> 00:36:50.000
Siri tradicional, la que ya tenemos ahora, no a la nueva, pedirle que

00:36:50.000 --> 00:36:56.000
cierta petición te la resuelva con ChatGPT.

00:36:56.000 --> 00:37:00.000
Es decir, es como mucha gente se ha habilitado un shortcut que permite ir

00:37:00.000 --> 00:37:05.000
directamente a ChatGPT a resolver, pues esto es como si ya estuviera integrado.

00:37:06.000 --> 00:37:10.000
Por lo que tenemos que tener en cuenta eso que, repito, no está

00:37:10.000 --> 00:37:14.000
confirmado, pero parece ser que sí todos los dispositivos, iPhones, iPad,

00:37:14.000 --> 00:37:18.000
etcétera, que tengan iOS dieciocho, iPad OS dieciocho, etcétera,

00:37:18.000 --> 00:37:25.000
podrían usar ChatGPT a través de Siri.

00:37:25.000 --> 00:37:29.000
En el caso de los dispositivos que tiene Apple Intelligence, que de hecho

00:37:29.000 --> 00:37:33.000
Apple ya confirmó en una entrevista con iJustin en la propia WWC que

00:37:33.000 --> 00:37:37.000
está integrando Google Gemini, por lo tanto, cuando esto salga no solo

00:37:37.000 --> 00:37:41.000
estará ChatGPT, también tendremos a Gemini de Google, lo que hará es

00:37:41.000 --> 00:37:45.000
que a ciertas respuestas de Siri, tú voluntariamente le dices, vale, pero

00:37:45.000 --> 00:37:49.000
ahora empieza a usar ChatGPT, contéstame a partir de ahora con ChatGPT o

00:37:49.000 --> 00:37:53.000
con Gemini, no me contestes como el modelo de Apple Intelligence, y

00:37:53.000 --> 00:37:57.000
entonces eso lo que hará será integrar las APIs de OpenAI y las APIs de

00:37:57.000 --> 00:38:08.000
Gemini, las APIs de Google.

00:38:08.000 --> 00:38:13.000
OpenAI ha dicho, y yo me lo tengo que creer, que va a borrar toda la

00:38:13.000 --> 00:38:18.000
información, que no va a guardar ninguna información de la que venga a

00:38:18.000 --> 00:38:23.000
partir de lo que es los dispositivos de Apple y, además, y esto lo

00:38:23.000 --> 00:38:28.000
confirmó Kreg Federiggi, se podrán utilizar tanto cuentas gratuitas como

00:38:28.000 --> 00:38:33.000
tienes cuenta de pago puedes acceder a las funciones más avanzadas que

00:38:33.000 --> 00:38:40.000
OpenAI vaya lanzando.

00:38:42.000 --> 00:38:46.000
Pero aquí no hay cifrado, es decir, no hay una integración con los

00:38:46.000 --> 00:38:50.000
servidores de Apple, de private cloud compute y tal, no, no hay

00:38:50.000 --> 00:38:56.000
absolutamente nada de eso.

00:38:57.000 --> 00:39:00.000
Simplemente es usar las APIs de OpenAI tal cual las usamos a día de hoy en

00:39:00.000 --> 00:39:03.000
cualquier aplicación de terceros, solo que va a estar integrado en el

00:39:03.000 --> 00:39:06.000
sistema operativo.

00:39:06.000 --> 00:39:09.000
Y lo mismo va a suceder con Yemini, por lo que ahí OpenAI ha firmado un

00:39:09.000 --> 00:39:12.000
acuerdo en el que se compromete a no almacenar ninguna información de de

00:39:12.000 --> 00:39:15.000
las peticiones que vengan de dispositivos Apple de manera nativa, y

00:39:15.000 --> 00:39:21.000
entiendo que Google hará lo mismo, ¿vale?

00:39:22.000 --> 00:39:24.000
Pero repito, esto hay que creérselo, ¿vale?

00:39:24.000 --> 00:39:26.000
Porque esto ya no depende de Apple.

00:39:26.000 --> 00:39:36.000
De hecho, cuando la respuesta viene de chat GPT, me pone de una manera muy clara, ojo que chat GPT se puede equivocar, ¿ok?

00:39:37.000 --> 00:39:43.000
Así que ese sería el, repito, resumen de lo que es Apple Intelligence.

00:39:43.000 --> 00:39:54.000
Nos queda mucho por ver, pero eso será en otro medio distinto porque aquí, pues, ya nos hemos ido a un programa, pues, un poco larguete, ¿vale?

00:39:54.000 --> 00:39:56.000
Pero bueno, es que había que hablar bien de todo esto.

00:40:08.000 --> 00:40:18.000
Y poco más, espero que les haya quedado claro, espero que les haya quedado más claro todo lo que es Apple Intelligence.

00:40:19.000 --> 00:40:25.000
A ver, a mí me parece bien que Apple Intelligence funcione solo en los dispositivos que funciona.

00:40:26.000 --> 00:40:27.000
Pues hombre, obviamente no.

00:40:28.000 --> 00:40:32.000
Obviamente no, porque yo tengo un iPhone catorce Pro y no voy a poder utilizar Apple Intelligence.

00:40:33.000 --> 00:40:37.000
De hecho, probablemente me tenga que cambiar de móvil, porque a nivel de

00:40:37.000 --> 00:40:41.000
trabajo yo necesito trabajar con Apple Intelligence, porque en la

00:40:41.000 --> 00:40:45.000
academia, en Apple Code in Academy, pues el año que viene el módulo de

00:40:45.000 --> 00:40:49.000
machine learning, pues va a ocupar mucho más de lo que ocupa este año,

00:40:49.000 --> 00:40:53.000
porque tendremos toda la implementación de Apple Intelligence, el uso de

00:40:53.000 --> 00:40:57.000
los de las intenciones de Siri, de los ABYTENS, etcétera, todo lo nuevo,

00:40:57.000 --> 00:41:01.000
y por lo tanto yo necesito un dispositivo iPhone, aparte del iPad que sí

00:41:01.000 --> 00:41:05.000
lo soporta o aparte de los Mac que también lo soportan, incluso el

00:41:05.000 --> 00:41:09.000
portátil, pero necesito también que eso funcione en un iPhone para poder

00:41:09.000 --> 00:41:13.000
probarlo para la academia, por lo que me tendré que comprar un iPhone

00:41:13.000 --> 00:41:17.000
dieciséis Pro, probablemente, probablemente, que no tenía pensado

00:41:17.000 --> 00:41:21.000
comprarme y que tampoco necesito, pero ahora sí, por esto.

00:41:21.000 --> 00:41:23.000
Por lo tanto, a mí no me gusta.

00:41:23.000 --> 00:41:26.000
Ahora, ¿entiendo que Apple haya tenido que hacer esto?

00:41:26.000 --> 00:41:30.000
Sí, lo entiendo perfectamente, igual que entiendo lo que ha hecho el resto

00:41:30.000 --> 00:41:34.000
de compañías, porque todo esto es demasiado moderno y el hardware no

00:41:34.000 --> 00:41:38.000
está preparado para hacer todo lo que tiene que hacer, y a a Jobs gracias

00:41:38.000 --> 00:41:42.000
el que los Apple Silicon de iPad y Mac sean capaces de hacerlo, incluso en

00:41:42.000 --> 00:41:48.000
dispositivos de hasta tres y cuatro años de antigüedad.

00:41:48.000 --> 00:41:49.000
Así que lo he dicho.

00:41:49.000 --> 00:41:52.000
Poco más, si les ha gustado, por favor, suscríbanse, compartan el

00:41:52.000 --> 00:41:55.000
episodio, ayúdennos a que se difunda la palabra de Jobs, que eso siempre

00:41:55.000 --> 00:41:59.000
nos ayuda mucho, y nos oímos pronto si Jobs quiere.

00:41:59.000 --> 00:42:03.000
Hasta entonces, un saludo y got, Apple Cody.

00:42:13.000 --> 00:42:20.000
Puedes escuchar más episodios de Apple Coding en Wanda punto com, la comunidad de podcast independientes en español.