﻿WEBVTT
Kind: captions
Language: es

00:00:05.000 --> 00:00:08.000
Wanda, la comunidad de podcast independientes en español.

00:00:08.000 --> 00:00:14.000
Hola y bienvenidos a un nuevo episodio de Apple Codyne Daily.

00:00:21.000 --> 00:00:25.000
A ver, se ha liado, bueno, en fin, se ha liado.

00:00:27.000 --> 00:00:33.000
El, si digo que el hype por la llegada de la w w w DC para el próximo día

00:00:33.000 --> 00:00:39.000
diez de junio, próximo lunes diez de junio, estamos ahora mismo grabando

00:00:39.000 --> 00:00:46.000
a viernes treinta y uno de mayo, por lo que básicamente, queda poco más de una semana.

00:00:47.000 --> 00:00:52.000
Esto implica, pues, que va a haber un montón más de rumores, un montón

00:00:52.000 --> 00:00:57.000
más de movimiento, un montón más de hype, gente con ansiedad, gente

00:00:57.000 --> 00:01:02.000
yendo al psicólogo tomando Tranquimazing, en fin, cosas normales previas

00:01:02.000 --> 00:01:07.000
a un evento de Apple, sobre todo cuando la propia Apple nos ha vendido,

00:01:07.000 --> 00:01:12.000
que es el un evento en el que va a haber la el mayor cambio en la

00:01:12.000 --> 00:01:17.000
experiencia de los usuarios de de la historia del Apple, del mundo, de la

00:01:17.000 --> 00:01:26.000
humanidad, nada ha cambiado tanto desde Gengis Khan, en fin, lo normal.

00:01:27.000 --> 00:01:29.000
Entonces, ¿qué es lo que sucede?

00:01:30.000 --> 00:01:35.000
Pues bien, que el el apóstol Mark Gourman, sabedor de la palabra de Jobs,

00:01:35.000 --> 00:01:40.000
pues cada vez que abre un artículo se lía, porque la gente, en fin, a

00:01:40.000 --> 00:01:45.000
ver, no termina de pillarle el punto a lo que Gourmand cuenta y Gourmand

00:01:45.000 --> 00:01:50.000
también, pues obviamente, quiere que pinches, que te suscribas a

00:01:50.000 --> 00:01:55.000
Bloomberg, esas cositas, porque en fin, el muchacho, pues, tiene que pagar

00:01:55.000 --> 00:02:03.000
a fin de mes una serie de facturas y tiene que vivir de esto, ¿no?

00:02:03.000 --> 00:02:11.000
Igual que cualquiera, tiene que vivir o pretender, o tiene el derecho de poder querer vivir o intentarlo de su trabajo.

00:02:12.000 --> 00:02:16.000
Así que, bueno, pues básicamente lo que ha tenido son una serie de

00:02:16.000 --> 00:02:20.000
rumores que nos dan pie a explicar, que es lo que vamos a hacer en este

00:02:20.000 --> 00:02:24.000
programa, toda la estrategia que Apple va a tener para la inteligencia

00:02:24.000 --> 00:02:28.000
artificial que tanto estamos deseando que llegue a los sistemas Apple

00:02:28.000 --> 00:02:32.000
inteligencia artificial generativa, porque la otra ya lleva muchísimos

00:02:32.000 --> 00:02:36.000
años, pero la generativa, la que la gente llama inteligencia artificial

00:02:36.000 --> 00:02:40.000
como si la otra no existiera, porque es tener, pues eso, un GPT, un

00:02:40.000 --> 00:02:44.000
Midjourney, un, en fin, generar cosas a través de la IA y que la IA haga

00:02:44.000 --> 00:02:53.000
cosas porque es muy lista, ¿vale?

00:02:53.000 --> 00:02:54.000
Pues ese es el tema.

00:02:54.000 --> 00:02:57.000
Así que es lo que vamos a contar en este programa.

00:03:10.000 --> 00:03:14.000
Es que el problema fundamental aquí es que los auriculares son una cosa milagrosa.

00:03:15.000 --> 00:03:20.000
Te pones un par de auriculares y puedes tener la misma experiencia que con dos buenos altavoces, ¿no?

00:03:20.000 --> 00:03:23.000
Pero no existe nada como unos auriculares para vídeo.

00:03:23.000 --> 00:03:27.000
Para entender qué es Apple Vision Pro, hay que conectar los puntos hacia atrás.

00:03:27.000 --> 00:03:31.000
La semilla fue imaginar unos auriculares para vídeo hace más de quince

00:03:31.000 --> 00:03:35.000
años, incluso antes del iPhone, y luego vimos cómo Apple apostó por

00:03:35.000 --> 00:03:39.000
librerías de machine learning y realidad aumentada en un momento donde

00:03:39.000 --> 00:03:43.000
estas tecnologías aún eran desconocidas para el público general hace

00:03:43.000 --> 00:03:47.000
más de seis años, pero que fueron andando el camino.

00:03:47.000 --> 00:03:51.000
Hoy, Vision Pro continúa ese camino, un camino que Apple ha construido

00:03:51.000 --> 00:03:55.000
hasta aquí, y que ahora toca continuar a los desarrolladores que

00:03:55.000 --> 00:04:00.000
proporcionen apps, experiencias y contenido para la computación espacial.

00:04:00.000 --> 00:04:03.000
Porque, ¿qué es un iPhone sin sus apps?

00:04:03.000 --> 00:04:04.000
¿O un iPad?

00:04:04.000 --> 00:04:10.000
El dispositivo por sí solo no es nada, son los desarrolladores los que hacen que algo valga la pena.

00:04:10.000 --> 00:04:16.000
¿Quieres hacer que Vision Pro valga la pena y entrar en un nuevo mercado lleno de oportunidades?

00:04:16.000 --> 00:04:20.000
Pues aquí tienes la tuya con Vision Developer Program, una formación

00:04:20.000 --> 00:04:24.000
diseñada para desarrolladores en entornos Apple que quieran dar el

00:04:24.000 --> 00:04:28.000
siguiente paso y entrar en la computación espacial, además de ponerse al

00:04:28.000 --> 00:04:32.000
día con SWIFT UI o SWIFTDATA, sumar todo lo necesario para construir apps

00:04:32.000 --> 00:04:40.000
que unan 2D y 3D con Reality Git, ARGit, Reality Composer y mucho más.

00:04:41.000 --> 00:04:48.000
Ah, y no necesitas un dispositivo, con el simulador será más que suficiente, eso sí, necesitarás un Mac con Apple Silicon.

00:04:48.000 --> 00:04:53.000
No dejes pasar esta oportunidad porque la mitad de las empresas del Fortune cien ya están aprovechándola.

00:04:54.000 --> 00:04:58.000
Súmate al mayor cambio de paradigma de los últimos años y comienza desde

00:04:58.000 --> 00:05:02.000
ya a prepararte para el futuro con la única academia que lleva más de

00:05:02.000 --> 00:05:07.000
seis años formando en realidad aumentada y machine learning en entornos Apple.

00:05:07.000 --> 00:05:16.000
Entra ahora en Apple Coding Academy e infórmate en acoding punto Academy barra v d p veinticuatro.

00:05:17.000 --> 00:05:19.000
La computación espacial te está esperando.

00:05:27.000 --> 00:05:34.000
Apple lleva desde el año dos mil diecisiete poniendo motores neurales en sus dispositivos.

00:05:35.000 --> 00:05:40.000
Empezó con el iPhone diez y, a partir de ahí, todos los dispositivos que

00:05:40.000 --> 00:05:45.000
ha ido sacando con sus propios chips han tenido una NPU, una Neural

00:05:45.000 --> 00:05:50.000
Processing Unit, una una unidad de procesamiento que es capaz de ejecutar

00:05:50.000 --> 00:05:55.000
inferencias de inteligencia artificial.

00:05:55.000 --> 00:05:56.000
¿Qué es una inferencia?

00:05:56.000 --> 00:05:58.000
Una inferencia es la ejecución.

00:05:58.000 --> 00:06:04.000
Un modelo neuronal, un modelo de inteligencia artificial tiene tres pasos.

00:06:04.000 --> 00:06:08.000
El primero es la creación de un paper científico que establece las normas

00:06:08.000 --> 00:06:12.000
matemáticas a partir del cual el propio modelo va a ser capaz de

00:06:12.000 --> 00:06:16.000
interpretar datos, generar una entrada, procesarla y obtener una salida, y

00:06:16.000 --> 00:06:20.000
todo esto es una investigación científica en un papel, no hay ni una

00:06:20.000 --> 00:06:26.000
sola línea de código.

00:06:26.000 --> 00:06:31.000
A partir de ahí, se hace el segundo paso, que es la codificación del modelo.

00:06:31.000 --> 00:06:36.000
Se codifica ese modelo y se genera un proceso de entrenamiento, un proceso

00:06:36.000 --> 00:06:41.000
a partir del cual se extraen, se recopila información, se le da como

00:06:41.000 --> 00:06:46.000
entrada, ese modelo se entrena, aprende a partir de esa información, y su

00:06:46.000 --> 00:06:53.000
resultado es un modelo entrenado, que es el tercer paso.

00:06:54.000 --> 00:07:05.000
La ejecución, usar ese modelo ya entrenado, programado y con datos de entrenamiento en un dispositivo es la inferencia, es ejecutar.

00:07:06.000 --> 00:07:12.000
Por lo tanto, lo que hacen estos modelos, estos chips npu, es esto, ¿por qué existen?

00:07:12.000 --> 00:07:16.000
Pues porque, básicamente, lo estamos diciendo todo de una manera muy

00:07:16.000 --> 00:07:20.000
básica para que sea fácil de entender, básicamente una CPU tiene

00:07:20.000 --> 00:07:24.000
registros de entrada, una CPU es como un microondas.

00:07:24.000 --> 00:07:31.000
Yo abro una puerta, pongo una cosa, cierro la puerta, le digo lo que hay, me lo procesa y me lo saca por otro sitio, ¿vale?

00:07:31.000 --> 00:07:34.000
Ese es el funcionamiento, insisto, a grandes rasgos, de una CPU.

00:07:35.000 --> 00:07:38.000
Las entradas de una CPU, de una unidad central de procesamiento, son

00:07:38.000 --> 00:07:41.000
números escalares, es decir, números de una dimensión, un diez, un

00:07:41.000 --> 00:07:44.000
veinte, un cuarenta, un doscientos cincuenta y cinco, un sesenta y cinco

00:07:44.000 --> 00:07:47.000
mil quinientos treinta y seis, depende del tamaño de la palabra, podrá

00:07:47.000 --> 00:07:54.000
tener más o menos números en un solo registro.

00:07:55.000 --> 00:07:59.000
Los chips que tenemos ahora mismo, que son de sesenta y cuatro bits,

00:07:59.000 --> 00:08:03.000
suponen que pueden tener números no enteros, es decir, números sin signo

00:08:03.000 --> 00:08:07.000
de hasta sesenta y cuatro bits o números de sesenta y tres bits en signo,

00:08:07.000 --> 00:08:11.000
es decir, dos elevado a sesenta y cuatro sin signo dos elevado a sesenta y

00:08:11.000 --> 00:08:15.000
tres, con signo, porque el último el signo más a la izquierda, el uno o

00:08:15.000 --> 00:08:19.000
el cero más a la izquierda, se usa para definir si es un valor negativo o

00:08:19.000 --> 00:08:23.000
positivo para representar un número entero.

00:08:24.000 --> 00:08:26.000
¿Esto es cómo funcionan las CPUs?

00:08:26.000 --> 00:08:31.000
Bien, una NPU lo que hace es utilizar registros tensores, es decir,

00:08:31.000 --> 00:08:36.000
números de hasta cuatro dimensiones, donde un solo registro tiene la

00:08:36.000 --> 00:08:41.000
entrada de hasta cuatro valores matriciales que luego tiene que sumar o

00:08:41.000 --> 00:08:46.000
procesar a partir de operaciones de matrices, haciendo que esa matriz se

00:08:46.000 --> 00:08:55.000
sume, se reste, se transforme, etcétera.

00:08:55.000 --> 00:08:58.000
Por lo tanto, como lo que tenemos que trabajar son números tensores de

00:08:58.000 --> 00:09:01.000
hasta cuatro dimensiones, por eso necesitamos este Neural Processing Unit,

00:09:01.000 --> 00:09:04.000
que también es conocido, también lo habréis oído hablar, como TPU, que

00:09:04.000 --> 00:09:07.000
es Tensor Processing Unit, unidad de procesamiento de tensores, porque es

00:09:07.000 --> 00:09:13.000
el tipo de número, ¿vale?

00:09:13.000 --> 00:09:16.000
No escalares, sino números tensores de hasta cuatro dimensiones.

00:09:17.000 --> 00:09:21.000
Por eso necesitamos un chip distinto, porque si yo utilizara la cpu para

00:09:21.000 --> 00:09:25.000
poder hacer estas operaciones de ejecución de de lo que serían modelos

00:09:25.000 --> 00:09:29.000
de machine learning entrenados, modelos de IA entrenados, lo que

00:09:29.000 --> 00:09:33.000
sucedería es que tendría que estar transformando, tendría que estar

00:09:33.000 --> 00:09:37.000
descomponiendo el valor tensor a escalar, procesarlos uno por uno cada uno

00:09:37.000 --> 00:09:41.000
de los factores y luego recomponer el tensor para obtener el resultado,

00:09:41.000 --> 00:09:45.000
por lo que es un proceso muy costoso que hace que las CPUs no estén

00:09:45.000 --> 00:09:49.000
preparadas para ejecutar modelos neuronales, motivo por el que, por

00:09:49.000 --> 00:09:53.000
ejemplo, toda la nueva IA que va a aparecer para Apple Silicon, o sea, lo

00:09:53.000 --> 00:09:57.000
que es toda la nueva IA que se va a presentar en esta WWC, no va a

00:09:57.000 --> 00:10:10.000
funcionar en equipos con Intel, solo en equipos Apple Silicon.

00:10:11.000 --> 00:10:16.000
Y entonces dirá alguno, de ciencia programada, dios mío, Apple quiere que cambiemos.

00:10:16.000 --> 00:10:21.000
A ver, obviamente sí, Apple quiere que cambiéis el equipo porque es una empresa, ¿vale?

00:10:21.000 --> 00:10:25.000
Chorprecha, pero ese no es el kit de la cuestión.

00:10:25.000 --> 00:10:30.000
Lo que quiero puntualizar aquí, y es el dilema, es el problema que se

00:10:30.000 --> 00:10:35.000
está planteando ahora mismo, y vamos con esta segunda parte, es que parte

00:10:35.000 --> 00:10:40.000
de los modelos, de los nuevos modelos de inteligencia artificial

00:10:40.000 --> 00:10:45.000
generativa, que van a ser capaces de resumir texto, de generar emojis

00:10:45.000 --> 00:10:50.000
personalizados, de generar imágenes, de generar documentos, de generar

00:10:50.000 --> 00:10:55.000
respuestas a nuestras conversaciones o a nuestros emails, de generar

00:10:55.000 --> 00:11:00.000
procesos dentro del sistema a partir de shortcuts generados en tiempo real

00:11:00.000 --> 00:11:05.000
para que Ciri sea capaz de ejecutar ciertas acciones en nuestro sistema de

00:11:05.000 --> 00:11:10.000
una manera en la que solo hay que pedírselo y ella, ella, el, elle, se,

00:11:10.000 --> 00:11:17.000
digamos, que se programa a sí mismo, ¿vale?

00:11:17.000 --> 00:11:21.000
Igual que haría ChatGPT con un script en Python o cualquier otro, o sea,

00:11:21.000 --> 00:11:25.000
en este caso ChatGPT es capaz de crear scripts de Python y ejecutarlos,

00:11:25.000 --> 00:11:29.000
por lo tanto, esta es una capacidad que va a tener Siri también a nivel

00:11:29.000 --> 00:11:33.000
de lo que es la creación de estos shortcuts, de estas automatizaciones,

00:11:33.000 --> 00:11:37.000
para interpretar cosas que nosotros le pidamos porque ahora su

00:11:37.000 --> 00:11:41.000
comprensión con respecto a lo que le a lo que le pidamos va a ser real a

00:11:41.000 --> 00:11:45.000
través de un modelo de lenguaje, ya no va a ser como hasta ahora donde

00:11:45.000 --> 00:11:50.000
Ziri no era una inteligencia artificial.

00:11:50.000 --> 00:11:59.000
Señores, despertemos de una vez, Siri, Google Assistant o Alexa jamás han sido una inteligencia artificial.

00:11:59.000 --> 00:12:04.000
Lo único que tienen de inteligencia artificial son los modelos de texto speech, ¿vale?

00:12:04.000 --> 00:12:08.000
O los modelos de transcripción de voz a texto, ¿vale?

00:12:08.000 --> 00:12:12.000
Es decir, de un lado hacia uno y el uno hacia el otro.

00:12:12.000 --> 00:12:15.000
Pero poco más, algún tipo de interpretación del lenguaje natural para

00:12:15.000 --> 00:12:18.000
saber más o menos qué es lo que le estás pidiendo, pero muy poco de una

00:12:18.000 --> 00:12:21.000
manera muy sutil y, desde luego, y lo hemos comprobado de una manera

00:12:21.000 --> 00:12:26.000
absolutamente inútil, ¿vale?

00:12:26.000 --> 00:12:40.000
Por lo que Siri, WelAssistant, Alexa, Bixby, etcétera, son asistentes de voz, son sistemas de control de voz, no son asistentes inteligentes.

00:12:41.000 --> 00:12:45.000
Los los asistentes inteligentes van a salir a partir de ahora, y Siri va a

00:12:45.000 --> 00:12:49.000
ser uno de los primeros que vamos a tener, curiosamente, porque Google

00:12:49.000 --> 00:12:53.000
Assistant, Alexa, etcétera, siguen exactamente igual, por lo que uno de

00:12:53.000 --> 00:12:57.000
los primeros que vamos a tener de los viejos conocidos sin contar ChatGPT

00:12:57.000 --> 00:13:01.000
en modo voz, pues va a ser Siri, esta capacidad de entender lo que le

00:13:01.000 --> 00:13:05.000
estamos pidiendo de una manera mucho más contextual y gramatical, y

00:13:05.000 --> 00:13:09.000
poder, por lo tanto, tomar decisiones en el sistema.

00:13:10.000 --> 00:13:15.000
Todo esto que se va a poder hacer, primero, va a aparecer todo con la

00:13:15.000 --> 00:13:20.000
palabra beta, porque todo va a ser algo que se va a ir construyendo sobre

00:13:20.000 --> 00:13:26.000
la experiencia de los usuarios tiempo a tiempo.

00:13:27.000 --> 00:13:32.000
No vamos a tener toda la funcionalidad aquí del rackaclax toma para ti, no.

00:13:32.000 --> 00:13:36.000
Esto va a ser beta, por lo que Apple tiene que ir mejorándolo punto a

00:13:36.000 --> 00:13:40.000
punto, porque nadie a día de hoy, salvo OpenAI en algunas cosas, o

00:13:40.000 --> 00:13:44.000
Midjourney en algunas otras, es capaz de dar unos resultados, entre

00:13:44.000 --> 00:13:49.000
comillas, un poco más fiables.

00:13:49.000 --> 00:13:54.000
La IA generativa está en proceso, la IA generativa no es perfecta, los

00:13:54.000 --> 00:13:59.000
modelos de lenguaje se equivocan, te dan respuestas erróneas, se

00:13:59.000 --> 00:14:06.000
equivocan con el código que te dan, se equivocan con la información, se la inventan.

00:14:07.000 --> 00:14:12.000
Toda la guía generativa está ahora mismo en proceso de investigación,

00:14:12.000 --> 00:14:17.000
por lo que Apple le va a poner la etiqueta beta porque sabe que todo lo

00:14:17.000 --> 00:14:22.000
que supone todo esto tiene que ir evolucionando poco a poco.

00:14:22.000 --> 00:14:23.000
Eso es lo primero.

00:14:24.000 --> 00:14:34.000
Lo segundo, parte de las funciones que va a tener esta guía generativa van a poder ejecutarse en local en los dispositivos.

00:14:35.000 --> 00:14:39.000
Serán modelos de lenguaje, modelos generativos, modelos de interpretación

00:14:39.000 --> 00:14:43.000
o de transcripción, etcétera, que serán capaces de ejecutarse en

00:14:43.000 --> 00:14:47.000
nuestros dispositivos.

00:14:48.000 --> 00:14:50.000
La gran pregunta aquí es, ¿en qué dispositivos?

00:14:51.000 --> 00:14:56.000
Pues bien, esa es la respuesta que a muchos no les ha gustado saber, porque

00:14:56.000 --> 00:15:01.000
parece ser que Apple ha determinado, palabras de Mark Gourman, que se van

00:15:01.000 --> 00:15:06.000
a requerir al menos ocho gigas de RAM para que se ejecute los modelos

00:15:06.000 --> 00:15:11.000
neuronales más complejos.

00:15:13.000 --> 00:15:17.000
Va a haber una parte de modelos neuronales, de modelos de degenerativa, que

00:15:17.000 --> 00:15:21.000
sí van a funcionar, pero otros no, otros no van a funcionar y, por favor,

00:15:21.000 --> 00:15:25.000
quiero matizar esto muy bien, en el dispositivo, es decir, que van a estar

00:15:25.000 --> 00:15:29.000
cargados en la memoria de mi iPhone y entonces van a ser ejecutados ahí

00:15:29.000 --> 00:15:37.000
sin tener que ir a Internet, ¿vale?

00:15:37.000 --> 00:15:42.000
Eso va a requerir ocho gigas de memoria RAM para la mayoría de los modelos más complejos.

00:15:43.000 --> 00:15:44.000
¿Esto qué significa?

00:15:45.000 --> 00:15:51.000
Significa que solo los iPhone quince Pro en adelante van a ser capaces de

00:15:51.000 --> 00:15:58.000
ejecutar los modelos generativos en el dispositivo, en local, sin salir a Internet.

00:15:59.000 --> 00:16:00.000
¿Y el resto?

00:16:00.000 --> 00:16:05.000
Lo tendrán que hacer en la nube, como venimos haciendo desde hace mucho tiempo.

00:16:06.000 --> 00:16:07.000
Nada más.

00:16:08.000 --> 00:16:13.000
Si usted tiene un iPhone once, doce, diez r, etcétera, no hay ningún

00:16:13.000 --> 00:16:18.000
problema, va a poder ejecutar todas las funciones de guía generativa,

00:16:18.000 --> 00:16:23.000
solo que en vez de hacerse en su dispositivo porque no tiene capacidad, se

00:16:23.000 --> 00:16:28.000
hará en la nube.

00:16:29.000 --> 00:16:34.000
Y ya, nada más, no hay drama, ¿de acuerdo?

00:16:35.000 --> 00:16:37.000
Porque, a ver, es lógico.

00:16:37.000 --> 00:16:39.000
¿Qué sucede con los Mac?

00:16:39.000 --> 00:16:42.000
Los Mac, todos los Mac, Apple Silicon a partir de M uno van a poder

00:16:42.000 --> 00:16:45.000
hacerlo, porque todos tienen como mínimo ocho gigas de RAM, por lo que

00:16:45.000 --> 00:16:49.000
van a poder ejecutar estos nuevos modelos.

00:16:49.000 --> 00:16:53.000
Pero incluso ahí yo tengo la teoría de que incluso SCOAD puede ser que en

00:16:53.000 --> 00:16:57.000
modelos de Mac con ocho gigas ejecute su modelo neuronal de autocompletado

00:16:57.000 --> 00:17:01.000
de código en la nube, mientras que si tienes un equipo con dieciséis

00:17:01.000 --> 00:17:07.000
gigas o más, lo haga en local, ¿vale?

00:17:07.000 --> 00:17:08.000
Esa es la diferencia.

00:17:09.000 --> 00:17:13.000
Por eso, Apple ha creado o va a anunciar, ¿vale?

00:17:14.000 --> 00:17:19.000
Un nuevo término de privacidad llamado computación confidencial,

00:17:19.000 --> 00:17:24.000
confidencial computing, es decir, una forma de cifrar la información es

00:17:24.000 --> 00:17:29.000
ejecutada a través de modelos computacionales en la nube para que sea

00:17:29.000 --> 00:17:34.000
totalmente privado y se conserve nuestra, insisto, privacidad, que

00:17:34.000 --> 00:17:39.000
nuestros datos no se compartan, que no se comparta lo que estamos

00:17:39.000 --> 00:17:44.000
pidiendo, etcétera, y que nosotros podamos optar de manera voluntaria si

00:17:44.000 --> 00:17:49.000
queremos que nuestras conversaciones, peticiones, etcétera, se compartan

00:17:49.000 --> 00:17:54.000
de manera anónima con Apple para que mejore los entrenamientos de dichos

00:17:54.000 --> 00:17:59.000
modelos de manera progresiva.

00:17:59.000 --> 00:18:08.000
Igual que sucede ahora con ChatGPT, que podemos decidir si queremos compartir nuestras conversaciones para que se reentren el modelo o no, ¿vale?

00:18:08.000 --> 00:18:13.000
Pues esto lo mismo, pero unido a una forma de cifrado y de unión a

00:18:13.000 --> 00:18:18.000
algoritmos de privacidad diferencial, como los que ya usa Apple, para

00:18:18.000 --> 00:18:23.000
garantizar nuestra privacidad en el uso de estos modelos en la nube.

00:18:23.000 --> 00:18:27.000
Si estos modelos tenemos un iPhone quince Pro o tenemos un iPad con chip M

00:18:27.000 --> 00:18:31.000
uno, M dos o M cuatro, que todos tienen al menos ocho gigas de RAM, pues

00:18:31.000 --> 00:18:35.000
entonces no habrá problema.

00:18:35.000 --> 00:18:43.000
De hecho, los nuevos iPad Pro M Cuatro no tienen ocho gigas de RAM, los modelos de doscientos cincuenta y seis y quinientos doce.

00:18:43.000 --> 00:18:53.000
Tienen doce, porque tienen dos chips de seis gigas cada uno, se ha demostrado en el en el lo que es en el descuartizamiento que hace IFixit.

00:18:54.000 --> 00:18:57.000
Ahí se ha visto que estos equipos tienen doce gigas de RAM.

00:18:57.000 --> 00:19:01.000
Pues porque Apple ha decidido poner esa zona de memoria fantasma de cuatro

00:19:01.000 --> 00:19:05.000
gigas más para que sirva de apoyo a la carga de estos nuevos modelos

00:19:05.000 --> 00:19:09.000
neuronales y, por lo tanto, que no consuman la memoria del dispositivo y

00:19:09.000 --> 00:19:13.000
que los iPad Pro con M cuatro funcionen aún mejor con todas estas nuevas

00:19:13.000 --> 00:19:17.000
funciones que están por llegar de inteligencia artificial.

00:19:18.000 --> 00:19:21.000
Así de sencillo y, de hecho, pasará algo parecido.

00:19:21.000 --> 00:19:25.000
Me juego lo que ustedes quieran en los próximos iPhones dieciséis, que

00:19:25.000 --> 00:19:29.000
también vendrán con doce gigas, de forma que ocho estarán para lo que

00:19:29.000 --> 00:19:33.000
sería el propio sistema y cuatro estarán reservados para la carga de

00:19:33.000 --> 00:19:37.000
estos modelos, para que así funcionen de una manera mucho más privada,

00:19:37.000 --> 00:19:41.000
mucho más eficiente, sin pausas de procesamiento en la nube, sin que, y

00:19:41.000 --> 00:19:45.000
esto puede que pase, y por eso también le han puesto la etiqueta de beta,

00:19:45.000 --> 00:19:49.000
sin que, por lo que sea, los servidores en ese momento estén caídos,

00:19:49.000 --> 00:19:53.000
como ya sucede con ChatGPT, que de vez en cuando los servidores están

00:19:53.000 --> 00:19:57.000
caídos incluso a nivel de pago y no funcionan.

00:19:57.000 --> 00:20:00.000
Pues esto puede pasar también en Apple, por eso le han puesto también la

00:20:00.000 --> 00:20:03.000
etiqueta de beta, porque puede ser que sus servidores se caigan o se

00:20:03.000 --> 00:20:06.000
saturen y no sean capaces de estar disponibles en momentos determinados,

00:20:06.000 --> 00:20:09.000
repito, como ya sucede con OpenAI, por lo que, y sucede prácticamente con

00:20:09.000 --> 00:20:15.000
todos los modelos, ¿vale?

00:20:15.000 --> 00:20:19.000
Por lo que aquellos que dependan de la nube no podrán usarlo porque hasta

00:20:19.000 --> 00:20:23.000
que se levante el servicio, mientras que los que tienen los modelos en

00:20:23.000 --> 00:20:27.000
local podrán seguir usándolo sin depender de la disponibilidad de la nube.

00:20:27.000 --> 00:20:29.000
Es así de sencillo, esa es la ventaja.

00:20:30.000 --> 00:20:35.000
En los Mac, obviamente, van a los Mac van a ser los mejores los más beneficiados igual que los iPad.

00:20:35.000 --> 00:20:38.000
Todos los iPad Air con M uno, todos los iPad pros, etcétera, todos los

00:20:38.000 --> 00:20:41.000
iPad Air con M dos, todos esos iPad van a funcionar fenomenal con la

00:20:41.000 --> 00:20:44.000
inteligencia artificial y van a funcionar con la inteligencia artificial

00:20:44.000 --> 00:20:49.000
en local, ejecutada desde el dispositivo.

00:20:50.000 --> 00:20:54.000
Todos los demás tendrán que hacerlo en la nube, porque no hay suficiente

00:20:54.000 --> 00:20:58.000
memoria y estos modelos ocupan mucho espacio, y Apple sigue trabajando en

00:20:58.000 --> 00:21:02.000
reducir su espacio, en reducir las exigencias de RAM, pero, lógicamente,

00:21:02.000 --> 00:21:07.000
necesita mucho más tiempo para que esto suceda.

00:21:07.000 --> 00:21:08.000
Es así.

00:21:09.000 --> 00:21:16.000
La última pata del banco, la última pata se llama OpenAI, puesto que Apple sí, señores, ha firmado un acuerdo con OpenAI.

00:21:17.000 --> 00:21:24.000
Quiere decir eso que toda la inteligencia artificial que Apple va a presentar nos va a depender de OpenAI, ni de coña.

00:21:24.000 --> 00:21:31.000
A ver, ¿qué es lo que pone ChatGPT cuando yo entro en la página?

00:21:31.000 --> 00:21:32.000
¿Qué es lo que pone abajo del todo?

00:21:32.000 --> 00:21:33.000
Lo han leído, ¿no?

00:21:33.000 --> 00:21:35.000
Espero que lo hayan leído.

00:21:35.000 --> 00:21:38.000
Pone, ChatGPT puede cometer errores.

00:21:39.000 --> 00:21:40.000
Georgia.

00:21:43.000 --> 00:21:54.000
ChatGPT se puede equivocar, y como ChatGPT se puede equivocar, esto lo que indica es que el modelo de chatbot no es perfecto, no funciona bien.

00:21:54.000 --> 00:21:57.000
Es perfecto en un noventa por ciento, podremos decir, pero tiene una parte

00:21:57.000 --> 00:22:00.000
un diez por ciento que se equivoca, que se inventa cosas, que te da

00:22:00.000 --> 00:22:04.000
respuestas equivocadas.

00:22:04.000 --> 00:22:07.000
A mí, cuando le pido código, muchas veces me devuelve código que no

00:22:07.000 --> 00:22:10.000
existe, clases que no existe, que se las ha inventado o que las ha cogido

00:22:10.000 --> 00:22:13.000
de alguna librería de terceros, o que las ha confundido con clases o con

00:22:13.000 --> 00:22:18.000
struts o con componentes nativos, ¿vale?

00:22:18.000 --> 00:22:26.000
Cosas así, o te da un código que no es correcto, o se me se mete en un bucle y te empieza a dar todo el rato la misma respuesta.

00:22:26.000 --> 00:22:32.000
Oye, esto está mal, ah, sí, es verdad, perdona, pum, y te vuelvo a dar el mismo código que está mal, ¿vale?

00:22:32.000 --> 00:22:33.000
O sea, ese es el nivel.

00:22:34.000 --> 00:22:42.000
Por lo tanto, el producto chatbot no es un producto final terminado, es un producto que está en una beta permanente.

00:22:43.000 --> 00:22:47.000
Así que Apple ha tomado la muy sabia decisión de no querer hacer un

00:22:47.000 --> 00:22:51.000
chatbot porque no están preparados, porque cualquier tipo de chatbot que

00:22:51.000 --> 00:22:55.000
Apple quisiera hacer está condenado al fracaso, porque nadie a día de

00:22:55.000 --> 00:22:59.000
hoy, salvo Anthropic con el modelo Cloud tres, ha sido capaz de hacer un

00:22:59.000 --> 00:23:03.000
modelo de lenguaje realmente competitivo y que pueda compararse con el de

00:23:03.000 --> 00:23:09.000
GPT Four O, que es el último modelo de OpenAI.

00:23:10.000 --> 00:23:14.000
Por lo que, ¿para qué se va a molestar en hacer un chatbot si puede

00:23:14.000 --> 00:23:18.000
llegar a un acuerdo con OpenAI para integrar los chatbots, para integrar

00:23:18.000 --> 00:23:23.000
ChatGPT dentro de los sistemas de Apple.

00:23:24.000 --> 00:23:26.000
¿Quiere esto decir que todo va a depender?

00:23:26.000 --> 00:23:28.000
No, no va a depender.

00:23:28.000 --> 00:23:39.000
Apple tiene sus propios modelos, pero la funcionalidad de chatbot sí va a pertenecer a OpenAI y vamos a usar esa funcionalidad.

00:23:40.000 --> 00:23:48.000
Funcionalidad que, de nuevo, también tenemos que estar preparados a que en determinados momentos no funcione, esté caído, etcétera.

00:23:48.000 --> 00:23:52.000
Yo entiendo que habrán llegado a algún acuerdo, pero hasta que no sepamos

00:23:52.000 --> 00:23:57.000
en la presentación qué es lo que supone, no sabremos, pues eso, qué es lo que supone.

00:23:57.000 --> 00:24:00.000
Así que esas serían las tres patas para el banco, ¿vale?

00:24:01.000 --> 00:24:07.000
La parte de la necesidad de las de los motores neurales, la necesidad de

00:24:07.000 --> 00:24:14.000
más memoria RAM, quiere eso decir que entonces los motores neurales, ¿para qué?

00:24:14.000 --> 00:24:18.000
No, estamos hablando que hay ciertos procesos que sí se harán, como por

00:24:18.000 --> 00:24:22.000
ejemplo las transcripciones con un modelo tipo Whisper, como por ejemplo

00:24:22.000 --> 00:24:26.000
las generaciones de los emojis, habrá ciertos modelos más pequeñitos

00:24:26.000 --> 00:24:30.000
con menos exigencias de RAM que funcionarán directamente en local, pero

00:24:30.000 --> 00:24:34.000
los grandes modelos generativos necesitarán más memoria RAM, veremos a

00:24:34.000 --> 00:24:39.000
ver cuáles son, ¿de acuerdo?

00:24:40.000 --> 00:24:41.000
Nada más que eso.

00:24:41.000 --> 00:24:45.000
Y luego, el tema de la de la asociación con OpenAI, que me parece perfecto

00:24:45.000 --> 00:24:49.000
porque nadie está a día de hoy al nivel de OpenAI, ni Apple, solo

00:24:49.000 --> 00:24:55.000
Microsoft, pero porque OpenAI es suya al cuarenta y nueve por ciento, básicamente.

00:24:55.000 --> 00:24:59.000
O sea que, pero en ese sentido, incluso para que se hagan una idea, el

00:24:59.000 --> 00:25:03.000
propio Satya Nadella se reunió hace poco con San Altman, con el CEO de

00:25:03.000 --> 00:25:07.000
OpenAI, y uno de los puntos es de los que hablaron fue, oye, este acuerdo

00:25:07.000 --> 00:25:11.000
de Apple me tienes que contar qué es lo que has acordado con ellos,

00:25:11.000 --> 00:25:15.000
porque lo que no quiero es que el que le dé servicio a Apple suponga un

00:25:15.000 --> 00:25:21.000
de una un problema para mí y mis servicios, ¿vale?

00:25:21.000 --> 00:25:24.000
Que yo soy el que te está poniendo pela, chavalín, ¿de acuerdo?

00:25:24.000 --> 00:25:28.000
Entonces, Assan Alman ha tenido que dar, y lo que es la parte de OpenAI,

00:25:28.000 --> 00:25:32.000
han tenido que contar cuál es el acuerdo que han llegado con Apple para

00:25:32.000 --> 00:25:36.000
que Satya Adela se quede tranquilo de que no va a haber un problema de

00:25:36.000 --> 00:25:40.000
disponibilidad de servidores, etcétera, dentro de la nube de Azure, que

00:25:40.000 --> 00:25:45.000
es donde corre todo lo que son los modelos generativos de OpenAI.

00:25:46.000 --> 00:25:50.000
Así que a mí me parece perfecto, la parte de la pata que Apple no es

00:25:50.000 --> 00:25:54.000
capaz de alcanzar, que es el del chatbot, la coge con los número uno del

00:25:54.000 --> 00:25:58.000
mercado, y el resto lo montan ellos para darnos las funcionalidades que

00:25:58.000 --> 00:26:02.000
permitan ir un paso más allá hacia el post PC, un paso más allá a no

00:26:02.000 --> 00:26:06.000
tener ni que preocuparnos de lo que queremos que haga el sistema, sino

00:26:06.000 --> 00:26:10.000
simplemente pedírselo.

00:26:10.000 --> 00:26:13.000
Y que poco a poco, porque esto es un primer paso, podamos ir automatizando

00:26:13.000 --> 00:26:16.000
cada vez más tareas, ser más productivos y consumir menos tiempo a la

00:26:16.000 --> 00:26:21.000
hora de hacer cualquier cosa.

00:26:22.000 --> 00:26:24.000
Ese es el kit.

00:26:24.000 --> 00:26:26.000
Así que poco más.

00:26:36.000 --> 00:26:42.000
Y poco más, espero que les haya gustado el episodio, sobre todo espero que

00:26:42.000 --> 00:26:48.000
les haya aclarado y que ahora mismo tengan las ideas más, pues eso, más

00:26:48.000 --> 00:26:54.000
claras de lo que Apple va a presentar y de cuál es su estrategia.

00:26:55.000 --> 00:26:58.000
Esa estrategia en la que, bueno, pues, obviamente, los modelos van a

00:26:58.000 --> 00:27:01.000
requerir cada vez, pues, van a requerir, no, es que requieren mucha

00:27:01.000 --> 00:27:04.000
memoria RAM para que se puedan ejecutar, Para que se hagan una idea, un

00:27:04.000 --> 00:27:07.000
modelo Whisper completo de transcripción de voz a texto viene a ocupar

00:27:07.000 --> 00:27:14.000
unos cinco gigas de RAM en memoria.

00:27:14.000 --> 00:27:23.000
Un modelo Stable Diffusion, el básico, viene a ocupar igual cuatro, tres, cuatro gigas en memoria para poder generar imágenes.

00:27:23.000 --> 00:27:29.000
Un modelo LLM muy pequeñito con muy poquitos parámetros puede ocupar fácil dos o tres gigas.

00:27:29.000 --> 00:27:33.000
Podríamos llegar a tener alguno con un giga o así, pero cuanto menos

00:27:33.000 --> 00:27:37.000
ocupen, menos capacidad y menos garantía de funcionamiento correcto van a

00:27:37.000 --> 00:27:41.000
tener, porque, repito, los modelos generativos son un software que está

00:27:41.000 --> 00:27:45.000
en permanente beta, no podemos pensar ni ahora ni nunca que va a ser un

00:27:45.000 --> 00:27:52.000
software cien por cien terminado, por eso la etiqueta beta.

00:27:52.000 --> 00:27:54.000
Así que lo dicho, poco más, si les ha gustado, por favor, no olviden

00:27:54.000 --> 00:27:56.000
suscribirse, seguirnos, darnos un like, compartir en redes sociales,

00:27:56.000 --> 00:28:00.000
etcétera, etcétera.

00:28:00.000 --> 00:28:03.000
Como siempre, les estaremos muy agradecidos porque nos ayudó muchísimo.

00:28:04.000 --> 00:28:06.000
Muchísimas gracias por el apoyo de todos los directos, que cada vez somos

00:28:06.000 --> 00:28:08.000
más también en los directos de los sábados, y derivados, y nos oímos

00:28:08.000 --> 00:28:12.000
pronto, si Jobs quiere.

00:28:12.000 --> 00:28:16.000
Hasta entonces, un saludo, e got, Apple COVID.

00:28:43.000 --> 00:28:50.000
Puedes escuchar más episodios de Apple Coding en Wanda punto com, la comunidad de podcast independientes en español.