Taste more, taste better: diverse data and strong model boost semi-supervised crowd counting2025年1月1日·Maochen Yang,Zekun Li,Jian Zhang,Lei QiYinghuan Shi· 0 分钟阅读时长 引用 URL类型会议文章出版物Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition最近更新于 2025年1月1日AuthorsYinghuan Shi南京大学← Task preference optimization: improving multimodal large language models with vision task alignment 2025年1月1日TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning 2025年1月1日 →