Hugging Face afirma que su nuevo modelo de robótica funciona de manera eficiente en un MacBook

Hugging Face afirma que su nuevo modelo de robótica funciona de manera eficiente en un MacBook

Image Credits: Pixabay

Crear proyectos avanzados de robótica en casa es cada vez más sencillo. Esta semana, Hugging Face, una plataforma de desarrollo de IA, presentó SmolVLA, un modelo de robótica de código abierto.

Según la empresa, SmolVLA, entrenado con conjuntos de datos aportados por la comunidad con licencias compatibles, supera a modelos robóticos mucho más grandes tanto en entornos simulados como en el mundo real.

En una entrada de blog, Hugging Face afirma que «SmolVLA está diseñado para hacer más accesibles los modelos de visión-lenguaje-acción (VLA) e impulsar el progreso en la robótica de uso general». La empresa lo describe no solo como un modelo compacto pero potente, sino también como un marco para entrenar y evaluar sistemas robóticos generalistas.

Creación de un ecosistema robótico asequible
SmolVLA forma parte de la creciente iniciativa de Hugging Face para crear un ecosistema robótico de bajo coste. El año pasado, presentó LeRobot, un conjunto de modelos, conjuntos de datos y herramientas específicos para la robótica. Más recientemente, la empresa adquirió la startup francesa Pollen Robotics y lanzó varias plataformas robóticas asequibles, incluidos robots humanoides.

Hugging Face entrenó SmolVLA, un modelo con 450 millones de parámetros, utilizando datos de LeRobot Community Datasets, conjuntos de datos específicos para robótica compartidos en su plataforma de desarrollo de IA. Los parámetros, también conocidos como «pesos», son los elementos internos de un modelo que influyen en su funcionamiento.

Hugging Face afirma que SmolVLA funciona con una sola GPU de consumo, o incluso con un MacBook, y permite a los usuarios probarlo e implementarlo en hardware de bajo coste, incluidas las propias plataformas robóticas de la empresa.

Respuestas más rápidas de los robots gracias al procesamiento asíncrono
Una característica destacable de SmolVLA es que incluye una «pila de inferencia asíncrona» que, según Hugging Face, permite al modelo gestionar las acciones de un robot por separado de sus entradas sensoriales, es decir, lo que ve y oye. Este diseño, explica la empresa en una entrada de blog, permite a los robots reaccionar con mayor rapidez en entornos dinámicos y que cambian rápidamente.

Es importante señalar que Hugging Face no es el único competidor en el emergente espacio de la robótica abierta.

Nvidia ofrece su propio conjunto de herramientas de robótica abierta, mientras que la startup K-Scale Labs está desarrollando componentes para lo que describe como «humanoides de código abierto». Otros actores destacados en este campo son Dyna Robotics, Physical Intelligence (respaldada por Jeff Bezos) y RLWRLD.


Read the original article on: TechCrunch

Read more: New System Improves Machine Recognition of Facial Expressions

    Share this post

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *