MobileViCLIP: an efficient video-text model for mobile devices2025年8月12日·Min Yang,Zihan Jia,Zhilin Dai,Sheng GuoLimin Wang· 0 分钟阅读时长 引用 URL类型会议文章出版物Proceedings of the IEEE/CVF International Conference on Computer Vision最近更新于 2025年8月12日AuthorsLimin Wang南京大学← Make your training flexible: towards deployment-efficient video models 2025年8月12日p-MoD: building mixture-of-depths MLLMs via progressive ratio decay 2025年8月12日 →