437ccm必赢国际(BWIN)官方网站-Official Website

首页» 本科生教育» 教学成果» 典型案例» 优秀大创» 2023年国家级大学生创新训练计划项目结题：交互式虚拟世界中由大模型驱动的自主智能体技术研究

2023年国家级大学生创新训练计划项目结题：交互式虚拟世界中由大模型驱动的自主智能体技术研究

发布时间:2024-11-25 阅读次数:

立项年份：2024年

项目成员信息：指导教师信息：

邓人嘉-21级-软件学院韩文娟-副教授-NLP

俞贤皓-21级-软件学院

付家齐-21级-软件学院

项目简介：

图1：项目全景图

我们搭建了一个Simulator作为Agent与Minecraft游戏之间的桥梁，支持128+个Agent加入，引入了多模态的数据，包括视觉、听觉、触觉等。以Code为Action Space，提供Low-level和High-level两套Action。

图2：Simulator结构图

我们提供三类Benchmark（Programmatic、Creative、Hybrid），构造了包含6053个任务的数据集，并且首次提出建造和剧本演出两种适合多模态Agent进行的任务。

图3：Benchmark示意图

我们还设计了一个AI Agent的框架，具备记忆、检索、规划、评估、行动、纠错等功能，能处理多模态数据，根据视觉、听觉、触觉和环境信息决定行动。引入multi-tasking机制，能同时处理多任务并自主决定任务优先级。

图4：AI Agent结构图

我们的工作解决目前多Agent平台不真实的问题，促进在更复杂、更接近人类社会的环境中进行多智能体研究，推动多模态多智能体领域技术的创新和发展。

项目创新点：

支持128+个Agent的多模态Simulator，三类Benchmark及6053个任务的数据集，支持多任务处理与自主决策的AI Agent。

项目成果：

项目开源代码：https://github.com/cocacola-lab/MineLand

论文：https://arxiv.org/pdf/2403.19267.pdf

项目成果已投稿至NeurIPS 2024