大模型中心开展大模型系统架构、学习算法和领域应用的创新研究,为新一代人工智能提供核心技术。主要研究方向包括:面向大模型的可扩展系统架构、面向大模型的高效能机器学习算法与平台、大模型知识增强学习算法,以及语言大模型、多模态大模型、科学大模型、具身决策大模型、智能体系统,以及神经符号推理系统等。
大语言模型:人工智能语言理解与生成的新纪元 大语言模型(Large Language Models, LLMs) 是近年来人工智能领域最具突破性的技术之一。它们通过海量数据训练,能够理解和生成自然语言,在文本生成、翻译、问答等任务中展现出接近人类水平的能力,开启了人工智能语言理解与生成的新纪元。 核心技术突破 大语言模型的成功得益于以下关键技术的突破: 总而言之,大语言模型正在深刻改变我们与机器的交互方式,并为各行各业带来前所未有的机遇。 随着技术的不断进步和应用场景的不断拓展,它们将继续推动人工智能语言理解与生成领域的发展,为人类社会创造更多价值。
多模态大模型研究小组致力于推动多模态大模型的研究与应用,探索多模态信息融合、交互与推理等关键技术,推动多模态大模型在视觉、语音、文本等多模态数据上的应用,为多模态智能技术的发展提供技术支撑。
具身决策大模型研究小组关注具身智能前沿技术研究,围绕搭建可泛化的具身智能体整体目标,在具身表征建模、具身策略学习、具身分层规划与执行等方向开展系列研究工作。
南京大学大模型知识增强研究小组长期从事大模型知识增强、大模型可控生成、领域大模型构建等方向研究。
大模型机器学习算法与平台研究小组致力于探索高效能训练和推理机器学习算法,并构建相应的平台与系统,支撑大模型的高准确率、低成本训练和部署。
大模型软件与系统研究小组致力于探索大模型与软件、系统之间的双向互动关系。一方面,我们研究如何利用大模型来优化和改进软件与系统的设计、开发、测试、验证与运维;另一方面,我们也关注如何设计和构建高效的软件与系统来支持大模型的训练、推理和部署。通过这两个方向的深度融合,我们旨在推动大模型与软件、系统的协同创新,为人工智能驱动的未来计算生态提供技术支撑。
科学大模型研究小组致力于以先进计算模拟跨学科推动药物研发、材料创新和能源优化,助力破解复杂科学难题。
南京大学医疗影像大模型研究小组长期深耕医学影像智能领域,围绕大模型的高效训练和低成本微调,探索大模型在医学影像分割、辅助诊断、精准治疗等领域的前沿应用。面对医疗影像标注成本高昂的挑战,研究组专注于稀疏监督学习、数据高效利用和伪标签优化等方法,以减少对大规模人工标注的依赖,同时提升模型的泛化能力和稳健性。
大模型系统优化研究小组聚焦大模型系统前沿优化技术,围绕构建高精度、低延迟、可扩展的大模型服务框架核心目标,在大模型算子优化、自适应参数优化、多模态任务调度等方向开展系统性研究,取得如下代表性成果:
南京大学 NASA 课题组携手鹏城实验室、华为技术有限公司等知名单位开展合作,共同针对大模型训练与推理性能、功耗等关键课题展开了全面深入的研究探索。其研究成果不仅在计算机体系结构领域的顶级会议上发表,更是成功在相关企业中实现了落地部署,为推动技术从理论走向实践做出了积极贡献。