MEM: Neues Memory-System erweitert KI-Roboter-Kontext auf 15 Minuten

Physical Intelligence Team präsentiert MEM: Multi-Skalen-Memory für Gemma 3-4B VLAs ermöglicht 15-minütigen Kontext für komplexe Aufgaben Lesezeit: ca. 12 Minuten Key Takeaways Aktuelle Vision-Language-Action (VLA) Modelle arbeiten meist nur mit einzelnen Beobachtungen oder sehr kurzer Historie und sind damit für komplexe Aufgaben limitiert. Das Forschungsteam von Physical Intelligence, Stanford, UC Berkeley und MIT adressiert diese […]

Continue Reading