LongVPO: from anchored cues to self-reasoning for long-form video preference optimization2025年10月11日·Zhenpeng Huang,Jiaqi Li,Zihan Jia,Xinhao Li,Desen Meng,Lingxue Song,Xi Chen,Liang LiLimin Wang· 0 分钟阅读时长 引用 URL类型会议文章出版物Proceedings of the Neural Information Processing Systems最近更新于 2025年10月11日AuthorsLimin Wang南京大学← Gated integration of low-rank adaptation for continual learning of language models 2025年10月11日Loquetier: a virtualized multi-LoRA framework for unified LLM fine-tuning and serving 2025年10月11日 →