📖 Wikimedia licenciará su contenido en tiempo real para entrenar LLMs. Un API que ofrecerán a partir de 100.000$ al mes con todo el flujo de cambios, ediciones y publicaciones en Wikipedia y otras publicaciones.
👉 Yo lo veo como una forma de reducir los crecientes gastos de que miles de ordenadores escaneen su contenido. Al fin y al cabo la apertura de los datos es la base de la fundación.
🗣️ TrueCaller añade tu propia voz a su asistente personal para recibir llamadas. La app permitirá a los clientes clonar su voz en el asistente, que podrá responder las llamadas identificándose como una versión digital suya (vídeo). No queda claro dónde ocurre la computación.
🔐 Reino Unido va a inspeccionar la privacidad de Windows Recall. La función de monitorización local constante será investigada por las autoridades británicas. Ha causado mucha polémica a pesar de las explicaciones técnicas de Microsoft. — A mí me parece útil.
🤖 Detenido un hombre por crear y enviar miles de imágenes sintéticas de abuso infantil. Está acusado de creación y distribución de este tipo de material. Al no ser fotografías reales, si no creadas con una versión especial de Stable Diffussion 1.5, queda por ver el recorrido judicial de este caso.
👉 Es el primer gran caso a nivel mundial. Las leyes y jurisprudencias de cada país pueden ser muy complicadas. Se juntan muchísimos factores técnicos y legales.
🎮 Kaplay será el sucesor de Kaboom.js tras los despidos en Replit. El sistema de creación de videojuegos seguirá siendo mantenido por la comunidad bajo este nuevo nombre. Llevaba tiempo olvidado y ya hay varios parches. — Se van a "centrar en IA".
🎶 Spotify inutilizará los Car Thing de todos los clientes en diciembre de este año. El cacharro fue un fracaso de márketing y ventas, pero que corten el acceso a los dueños me parece lamentable. Espero que reculen.
👉 El asistente DJ de Spotify tendrá versión en español, aunque parece que se llamará DJ Livi.
💬 BlueSky añade mensajes privados. La plataforma ahora permite el envío de mensajes entre usuarios. De momento son muy simples: no se puede añadir multimedia, no están cifrados, y no se permiten grupos.
📵 CNMC vuelve a alertar del uso de números tradicionales para dispositivos IoT. Aunque quedan años para que se agoten los números de móvil posibles en España (6/7 + ocho dígitos), la CNMC sigue insistiendo que deberían obligar a usar el prefijo (59 + once dígitos) para M2M.
👉 Es como la IPv6. Se espera que haya 145 millones de máquinas con número de teléfono propio en España.
🚗 Waze añade nuevas alertas para badenes, curvas cerradas y peajes. Parece que está disponible a nivel global en todas las versiones. No me queda claro de dónde sacan los datos de badenes, imagino que de la comunidad.
🪙 La sentencia escrita del juicio contra Craig Wright expande las decisiones del juez británico que dictaminó que no era Satoshi Nakamoto, creador de Bitcoin. Todas las pruebas son muy sólidas, pero desconocía que le pillaron editando el LaTeX (PDF, pág 111) en Overleaf.
👉 Exclusiva: el verdadero Satoshi Nakamoto se esconde tras el ID 3824675 de ICQ.
🌼 ICQ cerrará el mes que viene. Otrora un servicio popular de mensajería, dejará de tener espasmos el 26 de junio. En realidad supongo que los servicios de inteligencia de Rusia se han cansado de pagar los servidores. Pero que no salga de aquí.
🕹️ Atari compra la marca y derechos de Intellivision. Un titular que hubiera sido mucho más impactante hace 40 años. A día de hoy, tras innumerables bancarrotas y compraventas, es una mera anécdota. — De la nueva Amico seguimos sin saber nada, pero os dejo con esta cebolleteada (vídeo).
🚀 Una curiosa explosión en un Raptor 2 de SpaceX. No parece haber dañado al motor, que quedó envuelto por la deflagración (vídeo) apenas 15 segundos tras el encendido en una prueba de certificación. La compañía no ha comentado en público los motivos. — Starship parece que lanzará por cuarta vez la semana que viene.
----
🌐 ¿Quieres escuchar mixx.io sin anuncios? Apúntate en Patreon y descubre todas las ventajas ser colaborador.
- Camisetas
- Tazas
- Pegatinas
- Feed RSS exclusivo sin publicidad de todos los programas.
----
----
Y recuerda que puedes seguir mixx.io también en:
Para contactar conmigo, puedes:
Transcripción
Bienvenidos a un nuevo episodio de Mixio, podcast diario de tecnología. Hoy es veintisiete de mayo. Comenzamos a grabar un poco más tarde, ayer me estaba dando muchos problemas la webcam por algún motivo, y como ahora ya sabéis que lo estoy grabando en vídeo, los que me estáis viendo no es una sorpresa, si solo me estáis escuchando, que lo sepáis. Tenéis disponible los podcast diarios también en vídeo. Vamos a comenzar con las noticias tecnológicas, que como dice el título del del episodio, es un poco de meter máquinas por meter, la verdad, y precisamente uno de las empresas, o en este caso una fundación de las más afectadas para alimentar muchos de estos sistemas es Wikimedia, bueno, con toda la caterva de diferentes plataformas que tiene, principalmente, Wikipedia al respecto.
Y no es una sorpresa para nadie que, obviamente, pues, Wikipedia, gracias a la libertad que proporcionan sus licencias de contenido, han sido uno de los grandes ingredientes en estas recetas de muchas de estos GPTs, ¿no? Por decirlo así. Y claro, pues, ¿qué es lo que ocurre? Que se rastrea muchísimo Wikipedia, es decir, hay miles y miles de ordenadores constantemente visitando y extrayendo los datos en tiempo real que se están metiendo, que se están editando en Wikipedia en general y en todas las plataformas de Wikimedia. Entonces, ¿qué es lo que han sacado recientemente?
Pues esta parte de aquí, una nueva API en tiempo real que les va a crear una especie de gran tubo, una manguera, como se dice en largoz técnico, no es broma, se dice así una gran manguera de datos de según esté ocurriendo. Es decir, si, por ejemplo, Microsoft para sus Copilot o Google o quien sea, o cualquier empresa quiere tener una especie de conexión directa con todo lo que está ocurriendo, todo lo que se está añadiendo, quitando, modificando en Wikimedia en general, empieza la cifra en cien mil dólares al año. Es una cifra de dinero, es un montante muy pequeño comparado con lo que se supone que se ofrece, ¿no? Podrían seguir tirando de los de las copias diarias de Wikipedia, podrían seguir un montón de cosas, pero esto les da un montón más de datos estructurados. Es muy interesante, yo imagino que muchos optarán por ello, pero aquí también hay un poco de polémica.
Bueno, como siempre, con este tipo de decisiones, porque por una parte todos nos beneficiamos cuando, pues, más o menos, sé que hay algunas personas que nunca han colaborado en Wikipedia, a otras a lo mejor solo hemos editado algunas comas y unos pequeños párrafos, pero sí que es cierto que es como un esfuerzo colaborativo y que, por otro lado, sirvan para aprovecharse grandes empresas tecnológicas sin haber aportado nada en cierto sentido, ¿no? Pero ahí está, es decir, nosotros lo hemos creado, voy a asumir la humanidad en general, lo hemos creado para que esto se pueda licenciar. Y por otra parte, está la polémica de que al final los grandes y los altos directivos de Wikimedia, de la fundación, pues que a lo mejor siempre hay, ¿cómo decirlo? Unos intereses que a lo mejor están más hacia la parte financiera que hacia la parte de la misión original. ¿No?
De de Wikimedia. Pero si nos centramos en un punto de vista completamente cínico o meramente técnico, creo que esto reducir los costes de los servidores de Wikipedia y de el resto de servicios, porque al final les estás dando los datos según se cambian, específicamente los únicos que se cambian, en vez de tener que estar entrando con sus grandes arañas buscadoras constantemente a analizar toda la Wikipedia o todas las wikipedias y demás para buscar cualquier tipo de datos. Así que, aunque solo sea en aspecto técnico, creo que esto es beneficioso y así, pues, cuando donemos dinero para la Wikipedia o donemos conocimiento, podamos estar un poco más tranquilos de que ese dinero no se va a gastar en servidores que estén siendo abusados, vamos a decirlo así, por estos grandes aspiradoras de conocimiento. En fin, otra noticia de, como decía el titular, máquinas metidas en todas partes, me ha parecido muy interesante, y es que el asistente de trueColler, o al menos para los que pagan la suscripción mensual o la suscripción anual de trueColler, lanzaron hace unos meses un asistente que era básicamente un contestador medio inteligente. Cuando alguien te llama, tú le das a un botón y responde diciendo, hola, soy el asistente de Alex Barredo, ¿qué necesitas de él o qué ocurre?
¿No? Pues la otra persona habla y el asistente le responde, pues un poco como cuando nos dejaban un mensaje en el contestador, pero es capaz de crear una especie de chatbot mínimo. Bueno, pues la novedad es que ahora han metido un sistema para clonar tu propia voz, es decir, cuando ese asistente responda las llamadas, la voz que responda a esa persona que te ha llamado va a tener una voz muy similar a la tuya. No hay apenas detalles técnicos, la verdad, os dejo este vídeo para que veáis cómo se activa y cómo funciona, lo podéis escuchar en unos minutos, pero antes de que os lo reproduzca, que sepáis que no me queda claro o no he conseguido yo averiguar si esto se está ejecutando en local, es decir, si es tu teléfono el que está haciendo esa computación de analizar qué es lo que te están diciendo, qué voy a responder, el clonado de la voz, etcétera, o si va por ahí por servidores de Internet, que podría ser un poco más raro. Os dejo con la voz.
Pues, como podéis ver, se presenta como diciendo, hola, soy la versión digital de Pepito. ¿Vale? Eso está bien, es un poco más transparente en ese sentido, pero yo no sé si ahí gana la el hecho de tener tu propia voz o una voz sintética similar a la tuya. Es decir, es como cuando tú llamas a una casa y te contesta un familiar diciéndote, oye, pues mira, María no se puede poner o Pepito no se puede poner. Casi que prefiero que sea otra persona, es decir, no tiene sentido para mí que sea mi propia voz o una versión de mi voz.
Por una parte, está más personalizado, por otra parte, puede confundir a la persona que te llama, ¿no? Es decir, ¿cómo que no está disponible si me estás hablando tú? Porque no se ha enterado esa parte con la que se presenta, que dice soy la versión digital de Paquito. Es un poco es un poco rara. Y el siguiente tema, vamos a hablar de una función que Microsoft el que no tenemos fecha disponible, es decir, no sabemos cuándo va a llegar, sabemos el que no tenemos fecha disponible, es decir, no sabemos cuándo va a llegar, sabemos que va a estar limitado a unos procesadores o a unos ordenadores futuros con un tipo específico de procesadores, no es algo que todos los Windows once del mundo van a tener, y que es básicamente un un elemento, por los que no estuvisteis atentos al lanzamiento la semana pasada o al anuncio que no lo comenté yo, crea capturas de pantalla constantes de lo que vas haciendo, lo cual para mí me parece muy útil de la misma forma que, por ejemplo, pues el el el navegador me guarda el historial de de lo que he escrito, de lo donde he visitado o, por ejemplo, cuando estoy haciendo un documento de Word o de lo que sea, pues puedo tener rápidamente un historial de versiones, de cosas que he eliminado, cosas que he cambiado, es decir, ir pudiendo rebobinar en el tiempo para ver si hiciste algún cambio.
Esto lo hace el local. ¿Vale? Según Microsoft, completamente privado, no sé qué, no sé cuánto. Os dejo en las notas del episodio las especificaciones técnicas, al menos los detalles técnicos que ha dado Microsoft. Claro, yo entiendo que muchas personas de entrada no se fíen, porque al final hay muchas aristas a un software a pesar de su utilidad, más o menos para mí, aparente.
Y, por ejemplo, Reino Unido, o mejor dicho, la autoridad de privacidad en Reino Unido ha dicho que van a encargarse de hacer una especie de investigación pidiendo información a Microsoft de cómo va a estar implementado. Obviamente, al final, el hecho de que esto quede grabado en tu ordenador, en local, cifrado, no sé qué, vale, siempre puede haber un fallo técnico, ¿no? Con lo cual, vamos a estar todos bien seguros de que salimos ganando los usuarios, ¿no? Y que no tiene mayores agujeros. Y el siguiente punto, también tenemos que hablar de aprendizaje automático y de una de estas noticias terribles que sabíamos que iba a Stable Diffusion como código abierto, dando vueltas por por Internet, vimos que esto era imparable.
Y es que la noticia es que en Estados Unidos el FBI ha detenido a un hombre de unos cuarenta y dos años, si no recuerdo mal, al que acusan de haber generado, creo que decían trece mil imágenes de abuso infantil, pero que las imágenes no son reales, están generadas sintéticamente por una versión modificada de Stable Diffusion uno punto cinco, yo creo que la versión en la que se maduró bastante este software, y que su propia arquitectura permitía muchísimas más modificaciones, con lo cual empresas, organizaciones, universidades, individuos de todo el mundo, están tirando de Stable Diffusion uno punto cinco para modificarla para sus propias necesidades, ¿vale? Uno de estas modificaciones locas es generar este tipo de contenido, saltarse las protecciones pocas que tuviera puestas y diseñarlo para generarlas. Entonces, aquí entramos en lo que yo decía en el boletín, que era el primer caso a nivel mundial en el que vamos a ver qué recorrido judicial tiene esto. El FBI, las autoridades dicen que da igual que esto esté generado o que sean fotografías reales o sintéticas. Tiene otras acusaciones este señor, pero claro, ¿cuál va a ser la ley, cuál va a ser la jurisprudencia que se aplique en este posible caso?
Es decir, al final, ¿dónde están las diferencias? Por ejemplo, en Japón, famosamente, las actitudes legales hacia este tipo de contenido son que si está, voy a simplificar muchísimo porque desconozco el tema, si son dibujos, es un poco más gris, es un poco menos problemático. Aquí, ¿hacia dónde va a tirar la justicia? No solo la de Estados Unidos, sino de muchísimos países. Esto va a ser algo que se va a decidir los jueces, oye, ¿aquí realmente no se ha dañado a ningún niño?
¿O realmente la intención o las opiniones judiciales y legislativas van a ir por otro lado, por una perspectiva mucho mayor. Es muy complicado, porque luego, además, este va a ser uno de los primeros pasos. Seguramente, en el futuro veamos elementos en los que entren los psicólogos, los psiquiatras, los médicos diciendo x o y, ¿no? Con sus opiniones que no tengo ni idea al respecto, y es muy complicado, porque van a decir, yo que sé, es que no me quiero embarrar con con este tipo de de contenido porque me parece tan pérfido, pero creo que podéis ver un poco por dónde voy. Creo que son unos argumentos que ya se han utilizado en el pasado de, bueno, a lo mejor, si comparten este tipo de contenido, no están buscando y demandando el contenido basado en imágenes reales, con lo cual las mafias de la pornografía infantil se quedan sin esta demanda y sin demanda de ese tipo de vídeos, de ese tipo de fotos, a lo mejor se reduce la explotación.
Este es un argumento que hemos visto en el pasado, yo no me lo creo, sinceramente. Tenemos que volver también un poco al origen tecnológico de todo esto, Código abierto, no se puede tener, es decir, son una serie de ceros y unos que compartirlo tampoco hay mayor problema, no las imágenes generadas. Ojo, digo el Diffusion uno punto cinco, el software que crea esto, de la misma forma que no podrías prohibir Photoshop. Entonces, muy complicado a nivel moral, muy complicado a nivel legal y, sobre todo, muy complicado a nivel tecnológico. Ojito con este tema que vienen curvas y no va a ser el último caso.
Aquí comenta, además, unas cifras bastante importantes de el número de imágenes reportadas a las autoridades de Estados Unidos de contenido de abuso infantil que son reales y están en millones todos los años, y en dos mil veintitrés ya han empezado a recibir unas poquitas, unos mil de imágenes sintéticas, es decir, ya está circulando. Por ejemplo, a este tío le pillaron a través de Instagram. Entonces, seguimos con muchísimo, muchísimo que hacer. Volvemos un poco a otro debate tecnológico por donde han pillado a este tío, los mensajes de Instagram, la privacidad de los mensajes, el cifrado, hasta dónde tiene sentido dar herramientas tecnológicas para este tipo de de calaña. Entonces, es es muy complicado, francamente, y este es uno de los temas que creo que le he dedicado más tiempo del que del que debería.
Para quitarnos este mal sabor de boca, os voy a dejar con otras pocas noticias ya para acabar rápido el episodio, porque ya sabéis que hay muchísimas más en el boletín, que la podéis leer todas las mañanas, ¿vale? Y una de las noticias que creo que me ha resultado bastante interesante, es que Kaboom JS, esta plataforma framework para hacer videojuegos utilizando TypeScript o JavaScript, va a tener un fork o un sucesor que se va a llamar KPlane. Esto viene a los despidos de Replit, que era la empresa que había creado este software. No sé cómo de popular es Kaboom con respecto a Phaser o a otros métodos, digamos, relativamente sencillos para crear este tipo de videojuegos sencillos, pero viene este sucesor, este cap Play, viene con todo, es decir, incluso con el generador online, todas las librerías, etcétera. De hecho, la comunidad que está apoyando este desarrollo, ya ha añadido un montón de parches de cosas que se habían quedado ya viejitas o de fallos que no estaban corregidos por los empleados de Replit.
Así que, por una parte, me da un poco de pena, porque al final esto emana de los despidos de Replit, que para los que no conozcáis, es una empresa a medio camino entre Github y no sé qué decirlo, siempre lo hemos visto como una alternativa un poco a a Github, ¿vale? Y se están centrando mucho en inteligencia artificial, muy parecido a este copilot de Github. Jolín, es un software muy interesante, es algo que yo creo que para equipos de desarrollo puede ser y es, los, o sea, lo lo lo conocemos, gente que que lo usa a diario es muy importante. Así que, la verdad que Kaboom era una de las cosas más graciosas o más interesantes que tenía. También hablamos otra empresa que no me ha gustado lo que han hecho, la gente de Spotify va a, literalmente, desactivar los dispositivos car thing, este cacharvito que se podía escuchar la música desde tu cuenta de Spotify y que dejaron de venderlo hace unos meses, fue un fracaso, aquí dice wired, un rotundo fracaso, valía noventa euros, si no recuerdo mal, lo habían dejado de fabricar, ya os decía, pero es que ahora, a partir de el nueve de diciembre, va a dejar de funcionar, es decir, aunque tú tengas ese dispositivo que has pagado por él y mantengas tu cuenta de Spotify, te van a decir que te peines.
De hecho, las instrucciones que ha dado Spotify es de cómo reciclarlo. Me parece muy cutre, muy triste, muy lamentable esta decisión, sinceramente, porque además era, jolines, es el primer experimento con hardware que hace Spotify. Hay que darle un poco más de apoyo, hay que darle un poco más de tiempo a las cosas, hay que madurar las versiones. No sé, me parece muy triste, espero, como decía en el boletín, que recubre. Pero bueno, muchísimas más cositas en el boletín, como me he alargado con esto, lo dejamos por hoy, y nos vemos mañana con más noticias de tecnología.