Enlaces rápidos
La aparición de chatbots basados en IA generativa ha popularizado el término “modelo de gran lenguaje”, la tecnología de IA subyacente que funciona entre bastidores. Los modelos de lenguaje grandes (LLM) generan resultados basados en un conjunto de lenguaje predicho en respuesta a la entrada del usuario, lo que hace que parezca que la IA es capaz de pensar por sí misma.
Pero los LLM no son los únicos grandes modelos disponibles; Los modelos de acción de gran tamaño (LAM) pueden ser la próxima tecnología revolucionaria en IA. Verificar Algunos grandes problemas con ChatGPT de OpenAI.
¿Qué es un Modelo de Gran Negocio (LAM)?
Un modelo de acción grande (LAM) es un modelo de inteligencia artificial que es capaz de comprender la entrada humana y realizar la acción correspondiente, lo que le permite interactuar con el mundo de forma humana. Este es un enfoque ligeramente diferente a los modelos de IA que se centran únicamente en generar respuestas. El término "gran modelo de negocio" fue introducido por primera vez por Rabbit Inc, desarrollador del Rabbit R1. En el vídeo de lanzamiento de Rabbit R1 de la compañía, se dice que LAM es un nuevo modelo fundamental que ayuda a que la IA pase de las palabras a la acción.
Los LAM se entrenan con grandes conjuntos de datos de acciones del usuario; Por tanto, aprenden imitando acciones humanas o mediante demostraciones. A través de la demostración, el modelo LAM puede comprender y navegar por las interfaces de usuario de diferentes sitios web o aplicaciones móviles y realizar acciones específicas según sus instrucciones. De acuerdo a ConejoLAM puede lograr esto incluso si la interfaz se cambia ligeramente.
Puede pensar en los LAM como una extensión de las capacidades existentes de los LLM. Si bien el texto generativo o la salida multimedia en LLM se basa en la entrada del usuario al predecir la siguiente palabra o token (usted hace una pregunta y el modelo LLM proporciona texto o salida multimedia), los LAM van más allá al agregar la capacidad de implementar... Trámites complejos a su nombre. Verificar ¿Debería utilizar un modelo LLM local? Ventajas, desventajas y mejores prácticas..
¿Qué pueden hacer los LAM?
Los LAM consisten en realizar acciones complejas en su nombre. Sin embargo, el punto crucial a tener en cuenta es la capacidad de realizar procedimientos complejos. Esto hace que los LAM sean más útiles para tareas avanzadas, pero eso no significa que no puedan realizar procedimientos más simples.
En teoría, esto significa que podrías, por ejemplo, pedirle al modelo LAM que haga algo en tu nombre, como pedir un café en tu cafetería local o un viaje en Uber, e incluso hacer una reserva de hotel. Por lo tanto, es diferente a realizar tareas simples como pedirle al Asistente de Google, Siri o Alexa que enciendan el televisor o las luces de la sala.
Debajo del capó, según la visión compartida por Rabbit Inc., el modelo LAM puede acceder a un sitio web o aplicación relevante como Uber y navegar a través de su interfaz para realizar una acción, como solicitar un viaje o cancelar uno si cambia su mente. Verificar ¿Por qué es más común que nunca lanzar productos tecnológicos incompletos?.
Los LAM superarán a los LLM, pero no están listos (aún)
El concepto de LAM es apasionante, quizás más que el de LLM. Los grandes modelos de acción (LAM) serán el futuro después de la IA generativa, lo que nos permitirá compensar tareas mundanas y centrarnos en otras actividades satisfactorias. Sin embargo, por muy emocionante que parezca, los LAM aún no están listos.
El primer producto comercial que prometió aprovechar LAM (Rabbit r1) no cumplió plenamente su promesa de marketing de realizar acciones en nombre de sus usuarios. El dispositivo falló tanto en su punto de venta principal que muchas revisiones de primera mano lo describieron como bastante inútil.
Peor aún, una investigación realizada por el YouTuber Coffeezilla, en colaboración con un grupo selecto de ingenieros de software con acceso a parte de la base de Rabbit r1, encontró que Rabbit usaba scripts Playwright para ejecutar acciones en lugar de LAM. Entonces, en lugar de que una máquina ejecutara un modelo de IA único, en realidad solo estaba ejecutando un montón de declaraciones If > then; Muy lejos del prometido modelo LAM.
Si hay algo que puedes aprender del Rabbit r1 es que sí, la visión está ahí. Sin embargo, es necesario trabajar antes de la implementación, así que no se emocione todavía. Ahora puedes ver Una guía completa para empezar y utilizar el modelo Llama 2 de forma eficaz.