feat(rewards): add VITA reward model integration with adaptation and outer-loop training#3269

Open

0xPraedico wants to merge 1 commit intohuggingface:refactor/reward-modelsfrom

0xPraedico:feat/vita-reward-model

Commits on Apr 2, 2026

Add VITA reward model integration with test-time adaptation and meta-learning outer loop
0xPraedico
committed