Embodied Robotics Research

Tag: preference-optimization

1 item with this tag.

Jun 03, 2026
FlowPRO: Reward-Free Reinforced Fine-Tuning of Flow-Matching VLAs via Proximalized Preference Optimization

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community