Embodied Robotics Research Knowledge Base

Automated weekly digest covering the latest in embodied robotics research. Updated every Monday. Topics: VLAs, World Models, RL for Robotics.

Topics

VLA — Vision-Language-Action Models
WorldModels — World Models for Robotics
RL-Robotics — Reinforcement Learning for Robotics

Papers & Releases

nvidia-isaac-groot-n1-7 — NVIDIA Isaac GR00T N1.7: Open Reasoning VLA Model for Humanoid Robots (2026-03-16) VLA
gemini-robotics-er-1-6 — Gemini Robotics-ER 1.6: Enhanced Embodied Reasoning for Physical AI (2026-04-15) VLA
vla-robotics-survey-datasets-benchmarks-data-engines — Vision-Language-Action in Robotics: A Survey of Datasets, Benchmarks, and Data Engines (2026-04-24) VLA
dreamdojo-generalist-robot-world-model — DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos (2026-02-06) WorldModels
dreamzero-world-action-models-zero-shot-policies — World Action Models are Zero-shot Policies (DreamZero) (2026-02-17) WorldModels
abot-physworld-interactive-world-foundation-model — ABot-PhysWorld: Interactive World Foundation Model for Robotic Manipulation with Physics Alignment (2026-03-24) WorldModels
simulation-distillation-world-model-sim-to-real — Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation (2026-03-16) WorldModels
rl-token-bootstrapping-online-rl-vla — RL Token: Bootstrapping Online RL with Vision-Language-Action Models (2026-04-24) RL-Robotics
large-reward-models-generalizable-online-robot-reward — Large Reward Models: Generalizable Online Robot Reward Generation with Vision-Language Models (2026-03-17) RL-Robotics
towards-long-lived-robots-continual-learning-vla-rft — Towards Long-Lived Robots: Continual Learning VLA Models via Reinforcement Fine-Tuning (2026-02-11) RL-Robotics
acot-vla-action-chain-of-thought-for-vla-models — ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models (2026-01-16) VLA
abot-m0-vla-foundation-model-action-manifold-learning — ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning (2026-02-11) VLA
dualcot-vla-visual-linguistic-chain-of-thought-parallel-reasoning — DualCoT-VLA: Visual-Linguistic Chain of Thought via Parallel Reasoning for Vision-Language-Action Models (2026-03-23) VLA
h-wm-hierarchical-world-model-task-motion-planning — H-WM: Robotic Task and Motion Planning Guided by Hierarchical World Model (2026-02-11) WorldModels
chain-of-world-world-model-thinking-latent-motion — Chain of World: World Model Thinking in Latent Motion (2026-03-01) WorldModels
hierarchical-planning-with-latent-world-models — Hierarchical Planning with Latent World Models (2026-04-03) WorldModels
rlinf-co-sim-real-co-training-vla — RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models (2026-02-13) RL-Robotics
what-matters-sim-to-online-rl-real-robots — What Matters for Simulation to Online Reinforcement Learning on Real Robots (2026-02-23) RL-Robotics
anticipation-vla-long-horizon-embodied-tasks-subgoal-generation — Anticipation-VLA: Solving Long-Horizon Embodied Tasks via Anticipation-based Subgoal Generation (2026-05-11) VLA
roboalign-test-time-reasoning-language-action-alignment-vla — RoboAlign: Learning Test-Time Reasoning for Language-Action Alignment in Vision-Language-Action Models (2026-03-22) VLA
being-h07-latent-world-action-model-egocentric-videos — Being-H0.7: A Latent World-Action Model from Egocentric Videos (2026-05-01) WorldModels
roboalign-r1-multimodal-reward-alignment-robot-video-world-models — RoboAlign-R1: Distilled Multimodal Reward Alignment for Robot Video World Models (2026-05-05) WorldModels
do-world-action-models-generalize-better-than-vlas-robustness-study — Do World Action Models Generalize Better than VLAs? A Robustness Study (2026-03-23) WorldModels
mwm-mobile-world-models-action-conditioned-consistent-prediction — MWM: Mobile World Models for Action-Conditioned Consistent Prediction (2026-03-08) WorldModels
mask-world-model-predicting-what-matters-robust-robot-policy-learning — Mask World Model: Predicting What Matters for Robust Robot Policy Learning (2026-04-21) WorldModels
flashsac-fast-stable-off-policy-rl-high-dimensional-robot-control — FlashSAC: Fast and Stable Off-Policy Reinforcement Learning for High-Dimensional Robot Control (2026-04-06) RL-Robotics
alam-algebraically-consistent-latent-action-model-vla — ALAM: Algebraically Consistent Latent Action Model for Vision-Language-Action Models (2026-05-13) VLA
vla-forget-vision-language-action-unlearning-embodied — VLA-Forget: Vision-Language-Action Unlearning for Embodied Foundation Models (2026-04-05) VLA
from-pixels-to-tokens-latent-action-supervision-vla — From Pixels to Tokens: A Systematic Study of Latent Action Supervision for Vision-Language-Action Models (2026-05-06) VLA
defi-disentangled-robot-learning-forward-inverse-dynamics-pretraining — DeFI: Disentangled Robot Learning via Separate Forward and Inverse Dynamics Pretraining (2026-03-27) VLA
world-model-for-robot-learning-comprehensive-survey — World Model for Robot Learning: A Comprehensive Survey (2026-04-30) WorldModels
lawm-least-action-world-models-long-horizon-physical-consistency — LaWM: Least Action World Models for Long-Horizon Physical Consistency from Visual Observations (2026-05-08) WorldModels
one-token-per-frame-visual-bandwidth-world-models-vla-policy — One Token Per Frame: Reconsidering Visual Bandwidth in World Models for VLA Policy (2026-05-08) WorldModels
physically-native-world-models-hamiltonian-perspective — Physically Native World Models: A Hamiltonian Perspective on Generative World Modeling (2026-05-01) WorldModels
scaling-sim-to-real-rl-robot-vla-generative-3d-worlds — Scaling Sim-to-Real Reinforcement Learning for Robot VLAs with Generative 3D Worlds (2026-03-19) RL-Robotics
grounding-sim-to-real-generalization-dexterous-manipulation-vla — Grounding Sim-to-Real Generalization in Dexterous Manipulation: An Empirical Study with Vision-Language-Action Models (2026-03-24) RL-Robotics
twinrl-vla-digital-twin-driven-rl-robotic-manipulation — TwinRL-VLA: Digital Twin-Driven Reinforcement Learning for Real-World Robotic Manipulation (2026-02-10) RL-Robotics
halo-unified-vla-embodied-multimodal-chain-of-thought-reasoning — HALO: A Unified Vision-Language-Action Model for Embodied Multimodal Chain-of-Thought Reasoning (2026-02-27) VLA
ddp-wm-disentangled-dynamics-prediction-efficient-world-models — DDP-WM: Disentangled Dynamics Prediction for Efficient World Models (2026-02-02) WorldModels
progressvla-progress-guided-diffusion-policy-vla-manipulation — ProgressVLA: Progress-Guided Diffusion Policy for Vision-Language Robotic Manipulation (2026-03-29) VLA
atomvla-scalable-post-training-robotic-manipulation-predictive-latent-world-models — AtomVLA: Scalable Post-Training for Robotic Manipulation via Predictive Latent World Models (2026-03-10) VLA
v-jepa-21-unlocking-dense-features-video-self-supervised-learning — V-JEPA 2.1: Unlocking Dense Features in Video Self-Supervised Learning (2026-03-15) WorldModels
sole-r1-video-language-reasoning-sole-reward-on-robot-rl — SOLE-R1: Video-Language Reasoning as the Sole Reward for On-Robot Reinforcement Learning (2026-03-28) RL-Robotics
pi07-steerable-generalist-robotic-foundation-model — π0.7: a Steerable Generalist Robotic Foundation Model with Emergent Capabilities (2026-04-16) VLA
hex-humanoid-aligned-experts-cross-embodiment-whole-body-manipulation — HEX: Humanoid-Aligned Experts for Cross-Embodiment Whole-Body Manipulation (2026-04-09) VLA
echo-continuous-hierarchical-memory-vla-long-horizon — ECHO: Continuous Hierarchical Memory for Vision-Language-Action Models (2026-05-01) VLA
vla-continual-learning-real-world-without-forgetting — Can VLA Models Learn from Real-World Data Continually without Forgetting? (2026-05-26) RL-Robotics
ahead-intercepting-the-future-latent-space-predictive-world-model-dynamic-vla — Intercepting the Future: Latent-Space Predictive World Model for Dynamic VLA Manipulation (2026-06-01) VLA
tempovla-speed-controllable-vla-policies — TempoVLA: Learning Speed-Controllable Vision-Language-Action Policies (2026-06-04) VLA
oscar-omni-embodiment-action-conditioned-world-model — OSCAR: Omni-Embodiment Action-Conditioned World Model for Robotics (2026-06-04) WorldModels
robodream-compositional-world-models-robot-data-synthesis — RoboDream: Compositional World Models for Scalable Robot Data Synthesis (2026-06-01) WorldModels
raw-dream-reinforcing-vlas-task-agnostic-world-models — RAW-Dream: Reinforcing VLAs in Task-Agnostic World Models (2026-05-12) WorldModels
geosem-wam-geometry-semantic-aware-world-action-models — GeoSem-WAM: Geometry- and Semantic-Aware World Action Models (2026-06-02) WorldModels
flowpro-reward-free-reinforced-finetuning-flow-matching-vlas — FlowPRO: Reward-Free Reinforced Fine-Tuning of Flow-Matching VLAs via Proximalized Preference Optimization (2026-06-03) RL-Robotics
accerl-distributed-async-rl-world-model-framework-vla — AcceRL: A Distributed Asynchronous Reinforcement Learning and World Model Framework for VLAs (2026-03-18) RL-Robotics
seetraceact-visibility-aware-latent-planning-cross-embodiment-demos — SeeTraceAct: Visibility-Aware Latent Planning from Cross-Embodiment Demonstration Videos (2026-06-01) VLA
tau0-wm-unified-video-action-world-model-agibot — τ₀-WM: A Unified Video-Action World Model for Robotic Manipulation (2026-06-01) WorldModels
3dthinkvla-latent-3d-priors-vla-co-training — 3DThinkVLA: Endowing Vision-Language-Action Models with Latent 3D Priors via 3D-Thinking-Guided Co-training (2026-06-04) VLA
affordancevla-affordance-aware-vla-action-generation — AffordanceVLA: A Vision-Language-Action Model Empowering Action Generation through Affordance-Aware Understanding (2026-06-05) VLA
motionwam-foundation-world-action-model-humanoid-loco-manipulation — MotionWAM: Towards Foundation World Action Models for Real-Time Humanoid Loco-Manipulation (2026-06-08) WorldModels
targeting-world-models-adversarial-robot-learning-pipelines — Targeting World Models to Compromise Robot Learning Pipelines (2026-06-08) WorldModels
memoryvla-plus-plus-temporal-modeling-memory-imagination-vla — MemoryVLA++: Temporal Modeling via Memory and Imagination in Vision-Language-Action Models (2026-06-08) VLA
hierarchical-vla-agents-orchestrating-robot-policies — What Matters in Orchestrating Robot Policies: A Systematic Study of Hierarchical VLA Agents (2026-06-09) VLA
sarm2-stage-aware-reward-modeling-self-improving-robot-manipulation — SARM2: Multi-Task Stage Aware Reward Modeling for Self Improving Robotic Manipulation (2026-06-09) RL-Robotics
making-foresight-actionable-agra-representation-alignment-wam — Making Foresight Actionable: Repurposing Representation Alignment in World Action Models (2026-06-10) WorldModels
repwam-world-action-modeling-representation-visual-action-tokenizers — RepWAM: World Action Modeling with Representation Visual-Action Tokenizers (2026-06-11) WorldModels
playworld-robot-world-models-autonomous-play — PlayWorld: Learning Robot World Models from Autonomous Play (2026-03-09) WorldModels
world-action-verifier-self-improving-forward-inverse-asymmetry — World Action Verifier: Self-Improving World Models via Forward-Inverse Asymmetry (2026-04-02) WorldModels
weaver-effective-world-model-robotic-manipulation — WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation (2026-06-11) WorldModels
world-models-robotic-manipulation-survey — World Models for Robotic Manipulation: A Survey (2026-06-01) WorldModels
memorywam-efficient-world-action-modeling-persistent-memory — MemoryWAM: Efficient World Action Modeling with Persistent Memory (2026-06-18) WorldModels
dexora-open-source-vla-bimanual-dexterity — Dexora: Open-source VLA for High-DoF Bimanual Dexterity (2026-05-18) VLA
from-human-videos-to-robot-manipulation-survey — From Human Videos to Robot Manipulation: A Survey on Scalable VLA Learning with Human-Centric Data (2026-05-18) VLA
agentic-vla-efficient-online-adaptation — Agentic-VLA: Efficient Online Adaptation for Vision-Language-Action Models (2026-05-21) VLA
labvla-grounding-vla-scientific-laboratories — LabVLA: Grounding Vision-Language-Action Models in Scientific Laboratories (2026-06-11) VLA
thinkingvla-interleaved-vision-language-reasoning — ThinkingVLA: Interleaved Vision and Language Reasoning for Robotic Manipulation (2026-06-16) VLA
finetuning-vla-fewer-layers — Finetuning Vision-Language-Action Models Requires Fewer Layers Than You Think (2026-06-18) VLA
mpc-guided-rl-humanoid-locomotion-manipulation — Accelerating and Scaling MPC-Guided Reinforcement Learning for Humanoid Locomotion and Manipulation (2026-06-04) RL-Robotics
rove-human-interventions-humanoid-manipulation-rl — ROVE: Unlocking Human Interventions for Humanoid Manipulation via Reinforcement Learning (2026-06-15) RL-Robotics
playful-agentic-robot-learning-rats — Playful Agentic Robot Learning (RATs) (2026-06-17) RL-Robotics
qwen-vla-unifying-vision-language-action-modeling — Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments (2026-05-29) VLA
robots-need-more-than-vla-and-world-models — Robots Need More than VLA and World Models (2026-06-04) VLA
geometric-action-model-robot-policy-learning — Geometric Action Model for Robot Policy Learning (2026-06-15) VLA
la4vla-learning-to-act-without-seeing — LA4VLA: Learning to Act without Seeing via Language-Action Pretraining (2026-06-25) VLA
nvidia-cosmos-3-omnimodal-world-models-physical-ai — Cosmos 3: Omnimodal World Models for Physical AI (2026-06-02) WorldModels
veo-act-frontier-video-models-robot-manipulation — Veo-Act: How Far Can Frontier Video Models Advance Generalizable Robot Manipulation? (2026-04-06) WorldModels
oa-wam-object-addressable-world-action-model — OA-WAM: Object-Addressable World Action Model for Robust Robot Manipulation (2026-05-07) WorldModels
flash-wam-modality-aware-distillation-world-action-models — Flash-WAM: Modality-Aware Distillation for World Action Models (2026-06-03) WorldModels
aha-wam-asynchronous-horizon-adaptive-world-action-modeling — AHA-WAM: Asynchronous Horizon-Adaptive World-Action Modeling with Observation-Guided Context Routing (2026-06-10) WorldModels
efficient-wam-1b-low-cost-future-imagination — Efficient-WAM: A 1B-Parameter World-Action Model with Low-Cost Future Imagination (2026-06-11) WorldModels
kairos-native-world-model-stack-physical-ai — Kairos: A Native World Model Stack for Physical AI (2026-06-15) WorldModels
imagewam-image-editing-vs-video-generation-world-action-models — ImageWAM: Do World Action Models Really Need Video Generation, or Just Image Editing? (2026-06-19) WorldModels
march-model-assisted-rl-humanoid-perceptive-control-sparse-footholds — MARCH: Model-Assisted Reinforcement Learning for the Perceptive Control of Humanoids over Sparse Footholds (2026-06-09) RL-Robotics

Weekly Digests

2026-05-05-weekly-digest — Weekly Digest 2026-05-05 (10 new entries)
2026-05-06-weekly-digest — Weekly Digest 2026-05-06 (8 new entries)
2026-05-11-weekly-digest — Weekly Digest 2026-05-11 (8 new entries)
2026-05-18-weekly-digest — Weekly Digest 2026-05-18 (11 new entries)
2026-06-04-weekly-digest — Weekly Digest 2026-06-04 (11 new entries)
2026-06-08-weekly-digest — Weekly Digest 2026-06-08 (7 new entries)
2026-06-15-weekly-digest — Weekly Digest 2026-06-15 (11 new entries)
2026-06-22-weekly-digest — Weekly Digest 2026-06-22 (14 new entries)
2026-06-29-weekly-digest — Weekly Digest 2026-06-29 (13 new entries)

Last updated: 2026-06-29

Embodied Robotics Research

Explorer

index

Embodied Robotics Research Knowledge Base

Topics

Papers & Releases

Weekly Digests

Graph View

Table of Contents