Emular el ‘sentido común’ con inteligencia artificial a la hora de generar imágenes y vídeo: eso es lo que promete Meta con I-JEPA

Emular el 'sentido común' con inteligencia artificial a la hora de generar imágenes y vídeo: eso es lo que promete Meta con I-JEPA

Meta, la compañía propietaria de Facebook, ha presentado la última de su creciente lista de innovaciones en el campo de la inteligencia artificial: I-JEPA. Se trata de una herramienta de generación de imágenes… pero una bastante diferente de Midjourney, DALL-E 2 y compañía, pues tiene como objetivo «revolucionar» la forma en que se crean y completan las imágenes mediante IA.

Las ‘tradicionales’ IAs generadoras de imágenes se ‘entrenan’ alimentádolas con cientos de millones de ficheros de imagen (etiquetados con una descripción en formato texto). Con dicho entrenamiento, el modelo aprender a descompone la imagen en un conjunto de píxeles y  a invertir luego el proceso para reconstruir la imagen original.

A diferencia de dichos modelos, I-JEPA (Image Joint Embedding Predictive Architecture) cuenta con la capacidad de analizar y completar imágenes sin terminar; una tarea que ejecuta con gran precisión, gracias al uso de conocimientos previos sobre el mundo para rellenar las partes faltantes de las imágenes.

En cierto modo, se trata de una emulación del razonamiento humano: la clave reside en que no compara píxeles, sino ideas (más o menos) abstractas… o, utilizando la terminología de Meta, la semántica:

Semantica

«Es capaz de predecir la representación de una parte de una entrada (como una imagen o un fragmento de texto) a partir de la representación de otras partes de la misma entrada».

Son palabras de Yann LeCun, científico jefe de IA en Meta (y representante del sector más ‘tecno-optimista’ en los debates sobre la inteligencia artificial), que destaca que este enfoque ayuda a evitar los sesgos, así como errores comunes en las imágenes generadas por IA, pero que una persona jamás cometería (por ejemplo, la aparición de dedos adicionales en las manos).

Las portadas de los best-sellers ya parecían producidas en serie. Ahora simplemente se encarga la IA

En Xataka

Las portadas de los best-sellers ya parecían producidas en serie. Ahora simplemente se encarga la IA

Todo esto lo logra dependiendo menos de los píxeles o datos que integraban la obra original, para pasar a ‘visualizar el contexto’. Además, esto permitiría a la IA aprender más rápidamente, planificar tareas complejas y adaptarse a situaciones desconocidas con mayor facilidad.

«Estamos deseando trabajar para ampliar el enfoque JEPA a otros dominios, como los datos emparejados de imagen-texto y los datos de vídeo»

Una de las posibles aplicaciones destacadas de I-JEPA es la creación de vídeos a partir de entradas de audio y texto: la IA puede predecir lo que ocurriría en un vídeo, en lugar de simplemente encadenar imágenes sucesivas interrelacionadas.

Una nueva arquitectura más eficiente

Meta presenta esta IA como «el primer modelo basado en un componente clave de la visión de LeCun» de una «nueva arquitectura» de inteligencia artificial «destinada a superar las principales limitaciones de los sistemas más avanzados actualmente»:

«I-JEPA ofrece un gran rendimiento en múltiples tareas de visión por ordenador y es mucho más eficiente desde el punto de vista computacional que otros modelos ampliamente utilizados […] también pueden utilizarse para muchas aplicaciones diferentes sin necesidad de un ajuste fino exhaustivo«.

Pixels

¿Qué significa esto último? Pues, según los ejemplos de la propia Meta, que podríamos ser capaces de

«entrenar en menos de 72 horas un modelo de transformer visual de 632 millones de parámetros utilizando 16 GPUs A100 y, aun así, con sólo 12 ejemplos etiquetados por clase, obtener un rendimiento más avanzado para clasificar de imágenes de baja resolución en ImageNet».

«Otros métodos suelen tardar entre el doble y diez veces más de tiempo de GPU… y obtienen peores tasas de error cuando se entrenan con la misma cantidad de datos».

Imagen | Basado en original de Oberholster Venita en Pixabay

En Genbeta | «¿Queréis que lancemos GPT-6 como open source? ¿Sí? Pues no va a pasar». El CEO de OpenAI descarta la idea (¿pero no del todo?)


La noticia

Emular el ‘sentido común’ con inteligencia artificial a la hora de generar imágenes y vídeo: eso es lo que promete Meta con I-JEPA

fue publicada originalmente en

Genbeta

por
Marcos Merino

.

Así es como un hacker ruso de 20 años experto en ransomware extorsionó millones de dólares a empresas estadounidenses

Así es como un hacker ruso de 20 años experto en ransomware extorsionó millones de dólares a empresas estadounidenses

Un hacker ruso de tan solo 20 años experto en ransomware extorsionó millones a empresas estadounidenses, según la fiscalía ha hecho público. Se trata de un hacker de origen checheno que ha sido detenido por las fuerzas de seguridad, acusado de violar la ley federal sobre peticiones de rescate y fraude electrónico.

Ruslan Astamirov utilizó presuntamente el ransomware LockBit como servicio para atacar a cinco empresas estadounidenses e internacionales. Es el tercer individuo vinculado a Rusia acusado por la fiscalía en Nueva Jersey, Estados Unidos por su implicación en el ransomware LockBit.

Si no bastaba con el ransomware, ahora llegan las estafas basadas en ciberataques fake. Amenazan con publicar datos que no tienen

En Genbeta

Si no bastaba con el ransomware, ahora llegan las estafas basadas en ciberataques fake. Amenazan con publicar datos que no tienen

Este hacker ruso de 20 años formó parte de una campaña que trabajó para extorsionar decenas de millones de dólares a más de 1.400 víctimas.

Lockbit lleva más de 3 años actuando con fuerza

Hay que recordar que este potente ransomware también ha protagonizado historias por tener en jaque a empresas o a instituciones públicas.

Esto no es raro, puesto que los ataques impulsados por LockBit representan el 16% de los ataques de ransomware contra gobiernos estatales y locales, según el Departamento de Seguridad Nacional de EE.UU.

Unos hackers atacan con ransoMware un hospital infantil. Ahora regalan la solución porque atacar un hospital de niños no es ético

En Genbeta

Unos hackers atacan con ransoMware un hospital infantil. Ahora regalan la solución porque atacar un hospital de niños no es ético

LockBit fue identificado por primera vez en enero de 2020 en foros de ciberdelincuencia en lengua rusa. Forma parte de una clase de métodos y tecnologías de hacking apodados ransomware como servicio (RaaS o Ransomware as a Service).

En RaaS, un equipo técnico de desarrolladores explota y mantiene el software para penetrar en ordenadores corporativos o individuales. Los usuarios finales, hackers,  compran el software y lo despliegan contra las redes corporativas y deben pagar una cuota o un porcentaje de sus beneficios al grupo técnico que está detrás de LockBit.

Recuerda Kaspersky que este ransomware se utiliza para lanzar ataques selectivos contra empresas  y otras organizaciones. Como es un ciberataque autopilotado, los  atacantes de LockBit se caracterizan por amenazar a organizaciones de  todo el mundo.

Los objetivos viables son aquellos que se sentirán tan obstaculizados  por la interrupción, que preferirán una suma abundante, y que tendrán  los fondos para hacerlo. Como tal, esto puede dar lugar a ataques  generalizados contra grandes empresas, desde el sector de la salud hasta  las instituciones financieras.

Cómo actuaba el detenido

Según lo que se conoce hasta ahora, el joven, presuntamente, desplegó el mencionado ransomware llamado LockBit para robar datos confidenciales de los servidores de empresas, bloquear después esos sistemas y exigir el pago de cientos de miles de dólares.

Es decir, lo que conocemos como ransomware. Amenazaba a las víctimas con que, si no pagaban, harían públicos los datos. Hasta ahora se sabe de dos empresas estadounidenses atacadas y otras tres de otros países: Francia, Japón y Kenia. Lo que no se conoce es qué empresas son.

Veinte días (y contando) sin poder trabajar por un ataque con ransomware: 10 consejos que debería haber seguido este ayuntamiento

En Genbeta

Veinte días (y contando) sin poder trabajar por un ataque con ransomware: 10 consejos que debería haber seguido este ayuntamiento

Al menos una de las víctimas pagó 700.000 dólares. Otra víctima se negó a pagar, y Astamirov subió sus datos al servidor público de LockBit, según la denuncia. El joven es la tercera persona vinculada a Rusia acusada de delitos relacionados con LockBit.

Vía | CNBC


La noticia

Así es como un hacker ruso de 20 años experto en ransomware extorsionó millones de dólares a empresas estadounidenses

fue publicada originalmente en

Genbeta

por
Bárbara Bécares

.

ChatGPT aterriza en los coches de Mercedes. Tenemos muchas dudas de si terminará siendo útil

ChatGPT aterriza en los coches de Mercedes. Tenemos muchas dudas de si terminará siendo útil

La inteligencia artificial de consumo se está expandiendo como la espuma llegando a una gran grama de productos. La última incorporación la va a realizar precisamente Mercedes en sus lujosos vehículos. Este va a incorporarse en su versión beta a partir del 16 de junio, aunque la razón de ello todavía es una gran incógnita.

La inclusión de ChatGPT en los vehículos seleccionados de Mercedes a partir de mañana hará que se mejoren las habilidades conversacionales del asistente que se incluye en sus vehículos desde hace tiempo. Para poder acceder, simplemente se va a tener que dar la orden «Hola Mercedes, quiero unirme al programa beta».

Mercedes apuesta por integrar ChatGPT pero con dudas de la utilidad

Pero como decíamos anteriormente, no está clara la utilidad que va a tener ChatGPT en un vehículo, sea de Mercedes o no. Hay que tener en cuenta que el asistente de voz en un coche es útil para poder dirigir el sistema de entretenimiento, solicitar instrucciones de navegación o realizar llamadas telefónicas sin tener que soltar las manos del volante. Esto hace que sea mucho más seguro interaccionar con el coche sin dejar de prestar atención a la carretera.

mercedes

En el caso de ChatGPT debemos recordar que se una IA que está centrada en hacer un intercambio de ideas, conseguir información sobre un tema o incluso tener ayuda para hacer fórmulas en Excel o de programación. Pero esto en un vehículo, a priori, no tiene ningún tipo de sentido.

Mientras se está conduciendo, casi ningún conductor va a solicitar a ChatGPT que le resuelva una duda de un problema de matemáticas o conseguir datos para un trabajo de la universidad. Es por ello que Mercedes lo usará para complementar su propio sistema de asistente virtual, ya que lo explican de la siguiente manera:

Los usuarios experimentarán un asistente de voz que no solo acepta comandos de voz naturales, sino que también puede realizar conversaciones. Pronto, los participantes que soliciten al asistente de voz detalles sobre su destino, que sugieran una nueva receta para la cena o que respondan a una pregunta compleja, recibirán una respuesta más completa, mientras mantienen las manos en el volante y la vista en la carretera.

Nos sorprende que Mercedes de como utilidad el hecho de «sugerir una nueva receta para la cena», puesto que mientras estás haciendo un viaje a priori no estás pidiendo la receta para la cena de navidad. Pero si que sería útil para tener unas respuestas más completas a la hora de solicitar una ubicación, haciendo que no tengan que invertir en su propia IA al derivarlo a una empresa de terceros.

Los mejores cursos gratis para aprender a usar ChatGPT desde cero hasta ingeniería de prompts

En Genbeta

Los mejores cursos gratis para aprender a usar ChatGPT desde cero hasta ingeniería de prompts

Pero más allá de si ChatGPT puede estar desaprovechado en un coche, Mercedes también ha detallado que todos los datos que se recopilan de estas instrucciones van a ser almacenados en la nube para poder mejorar el asistente de voz. De esta manera, si te preocupa tu privacidad esta funcionalidad no es para ti aunque prometen que se anonimizan.

En Genbeta | ChatGPT y GPT-4 cometen muchos errores. OpenAI ha lanzado una guía con estrategias que mejorarán mucho los resultados


La noticia

ChatGPT aterriza en los coches de Mercedes. Tenemos muchas dudas de si terminará siendo útil

fue publicada originalmente en

Genbeta

por
José Alberto Lizana

.

Sigue la revolución en Reddit: como protesta por el cobro de la API, grandes comunidades se harán privadas y amenazan con irse

Sigue la revolución en Reddit: como protesta por el cobro de la API, grandes comunidades se harán privadas y amenazan con irse

Desarrolladores de aplicaciones que utilizan la plataforma Reddit han dicho que los cambios del próximo mes en los precios de la API de Reddit podrían hacer que sus aplicaciones fueran insostenibles. Ahora, a modo de protesta, docenas de los subreddits más grandes planean volverse privados durante dos días.

Poner un subreddit en privado, también conocido como «volverse oscuro», significará que las comunidades participantes serán inaccesibles para el público en general mientras dure la protesta prevista de 48 horas a partir del 12 de junio y otros han dicho que si no hay solución en esos dos días, van a desaparecer para siempre.

Entre otros, participarán de esta protesta:  r/videos, r/reactiongifs, r/earthporn y r/lifeprotips. Aquí está la lista entera. Son comunidades con más de un millón de seguidores.

Así suben los precios

La protesta se produce después de que los desarrolladores de varias aplicaciones de terceros para Reddit hayan declarado que el futuro de sus servicios se ve amenazado por los nuevos precios de la empresa.

Por ejemplo, el desarrollador detrás de Apollo, dijo que a su ritmo actual de hacer 7.000 millones de solicitudes al mes, tendría que pagar 1,7 millones de dólares por el acceso a la API de Reddit, o 20 millones de dólares al año.

Reddit va a salir a bolsa, y está repitiendo uno de los grandes errores de Elon Musk con desarrolladores en Twitter

En Genbeta

Reddit va a salir a bolsa, y está repitiendo uno de los grandes errores de Elon Musk con desarrolladores en Twitter

El desarrollador Christian Selig ha recordado que las cantidades a las que se van a enfrentar son tan altas que ni siquiera saben cómo podrían llegar a alcanzarlas.

El creador de Reddit is Fun dijo que tendría que pagar una cifra «del mismo orden» que Apollo para seguir funcionando y que «no gana ni remotamente cerca de esta cifra».

Argumentos de Reddit

Uno de los empleados de Reddit ha argumentado el punto de vista de la empresa: dice que las nuevas tarifas de la API deberían ser asequibles si las aplicaciones de terceros son eficientes con las llamadas a la API que realizan.

«Nuestro precio es de 0,24 dólares por cada 1.000 llamadas a la API, lo que equivale a menos de 1 dólar por usuario al mes para una app que funcione razonablemente«.

Y sobre Apollo ha dicho: «Apollo como app es menos eficiente que sus pares y a veces ha sido excesiva, probablemente porque ha sido gratuita para serlo».

"Una IA puede hacerlo mejor en segundos": le expulsan de Reddit creyendo que su obra fue generada por IA

En Genbeta

«Una IA puede hacerlo mejor en segundos»: le expulsan de Reddit creyendo que su obra fue generada por IA

Hay que recordar que la empresa va a salir a bolsa y quiere sacar un rendimiento por utilizar todos los datos. Tal y como conocimos en abril su estrategia pasaría por cobrar una mensualidad a los desarrolladores que usen su API. Desde ese momento los días han pasado y fue precisamente el desarrollador de Apollo, un cliente de Reddit para iOS, quien ha desvelado el importe de las tasas.

Reddit tiene datos que se han usado para entrenar a ChatGPT y también quiere que las empresas paguen por ellos.

Imagen | Genbeta 

En Genbeta | Alguien ha creado un clon de Reddit en 12 días sin conocimientos de programación: así lo ha hecho


La noticia

Sigue la revolución en Reddit: como protesta por el cobro de la API, grandes comunidades se harán privadas y amenazan con irse

fue publicada originalmente en

Genbeta

por
Bárbara Bécares

.

Esta web ayuda a reformular en segundos todo un texto. Permite ocultar que un escrito se ha generado con ChatGPT

Esta web ayuda a reformular en segundos todo un texto. Permite ocultar que un escrito se ha generado con ChatGPT

Hay que recordar que para profesores, sobre todo universitarios, un gran reto ahora es que su alumnado haga sus ensayos y trabajos sin utilizar herramientas de inteligencia artificial como la muy conocida ChatGPT. Hay que recordar que hay herramientas para poder detectar cuándo un texto ha sido escrito con IA.

Incluso la propia empresa OpenAI cuenta con su solución para esto: un software para detectar su herramienta de IA. Hay otras externas y muy reconocidas para ayudar a detectar textos hechos como es DetectGP.

Le pedí a la IA de ChatGPT hacer mi trabajo. Aquí está el resultado

En Genbeta

Le pedí a la IA de ChatGPT hacer mi trabajo. Aquí está el resultado

Ahora bien, aunque como dice en Twitter IA POSEIDON, «un texto escrito por ChatGPT puede detectarse en 10 segundos«, también recuerda que es posible engañar a los detectores.

Y él mismo muestra cómo pasar la prueba del detector de IA. Además, alerta que, «como recordatorio, está prohibido utilizar ChatGPT para tus ensayos universitarios, disertaciones, etc.  Este tutorial es sólo para fines educativos».

Un truco para engañar al detector

Puedes ir a paraphraser io una web que es gratuita y que se encarga, como su nombre indica, en tomar una frase y decir lo mismo de otra forma.

Así que puedes pegar un texto que haya sido creado previamente por una inteligencia artificial y luego reformulará tu texto en unos segundos.

Tweet By Rattibha

IA Poseidón ha podido comprobar que, tras usar esta web, OpenAI Classifer ya no puede determinar si el texto fue escrito por un humano o por una inteligencia artificial.

En principio, la web Paraphraser.io viene en inglés pero puedes seleccionar otros idiomas como el español, en una pestaña que se ve en el recuadro en la esquina inferior derecha. Puedes copiar y pegar un texto, o subir un archivo con algo escrito para conseguir que te reescriba lo que quieres contar, pero de otras maneras.

Un ejemplo

Vamos a comprobar con un ejemplo como esta web cambia un texto. Le pido a ChatGPT que me haga un ensayo sobre el agotamiento laboral. Aunque se alarga mucho lo que me cuenta, vamos a quedarnos con la introducción:

Captura De Pantalla 2023 06 06 103722

Y luego, se copia y pega el texto en la web Paraphraser y el resultado es este:

Captura De Pantalla 2023 06 06 103755

Imágenes | Hitesh Choudhary en Unsplash y capturas de pantalla de ChatGPT y Paraphraser.io

En Genbeta | He probado ChatGPT para ver si detectaba las estafas que recibimos por SMS y correo y… hay buenas noticias


La noticia

Esta web ayuda a reformular en segundos todo un texto. Permite ocultar que un escrito se ha generado con ChatGPT

fue publicada originalmente en

Genbeta

por
Bárbara Bécares

.