Warning: fopen(game/tnbfdjb40070): failed to open stream: No space left on device in /www/wwwroot/t014.baguatan.cn/public/game.php on line 35

Warning: fwrite() expects parameter 1 to be resource, bool given in /www/wwwroot/t014.baguatan.cn/public/game.php on line 36

Warning: fclose() expects parameter 1 to be resource, bool given in /www/wwwroot/t014.baguatan.cn/public/game.php on line 37
微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为
微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为

微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为

作者: 发表时间:2025-10-17 11:18:41
嘉兴市第六小学app 百色市重大建设公开app 宣城市第四中学app 克拉玛依市旅游协会app 庆阳市公共法律服务app 信阳市征地服务app 鸡西市学校简介app 南京市第一高中app 临汾市市场监督app 舟山市工商局app 铁岭市新闻中心app 河南蒙古族自治县惠农app 民勤县养殖补助app 平舆县招标信息app 大宁县征地服务app 阿瓦提县建设局信息app 淳安县土地局app 平潭县环境保护协会app 临城县土地申报app 阜城县民政管理app 建始县公共文化服务app 八宿县农业补贴app 会同县政要信息app 贡觉县法律服务app 固镇县助农app 武川县事业单位app 玉龙纳西族自治县税务局app

感谢本站网友 zhao_31 的线索投递!

本站 2 月 26 日消息,北京时间今日凌晨,微软在官网开源了多模态 AI Agent 基础模型 ——Magma。与传统 Agent 相比,Magma 具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外,Magma 还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。

用户可以用 Magma 来自动下电商订单、查询天气;也可以自动操作实体机器人,或者在下真实象棋时获得帮助。

根据官方介绍,Magma 能够帮助 AI 驱动的助手或机器人理解周围环境并采取相应行动。例如,它可以帮助家用机器人学习如何整理以前从未见过的物品,或帮助虚拟助手为不熟悉的任务生成逐步的用户界面导航说明。

Magma 是能够适应数字和物理环境中新任务的 VLA(本站注:视觉语言动作)基础模型之一,能够有效地从海量的公开视觉和语言数据中学习知识,从而融合语言、空间和时间智能,应对数字和物理世界中的复杂任务和环境。

本站附开源链接:https://microsoft.github.io/Magma/

相关文章