发布日期:2025-12-22 15:23 点击次数:74
新民晚报记者今天从大模子独角兽阶跃星辰获悉,其于11月29日开源GELab-Zero,初次将GUI Agent模子与好意思满配套基建同步盛开,撑捏“手搓党”一键部署。其中4B GUI Agent模子在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模子性能记载,取得SOTA(滥觞进水平)收成。此外,阶跃星辰还开源了基于委果业务场景的自建评测设施AndroidDaily,以期鼓吹GUI领域模子评测向示寂级、规模化控制发展。当今,企业级用户和迷惑者也曾不错通过GitHub和HuggingFace平台体验GELab-Zero。
阶跃星辰在ScreenSpot、OSWorld、MMBench、Android World多个开源基准测试上对GELab-Zero-4B-preview模子进行了全面评估,涵盖了GUI清醒、定位、交互等多个维度。测试后果显现,GELab-Zero-4B-preview在多项巨擘开源基准测试中卓绝其他主流模子,拿下同尺寸SOTA。同期,GELab-Zero-4B-preview的发达还卓绝了参数目更大的GUI-Owl-32B等模子,性能更优也更易部署。


阶跃星辰官方先容,GELab-Zero提供一键拉起即可取得相同开源GUI Agent MCP的体验,在腹地即可完成部署,并将推理链路皆备掌控在我方手里。就具体手艺而言,GELab-Zero可撑捏4B量级模子在示寂级硬件上开首,兼顾低蔓延与秘籍;与此同期,它还撑捏一键式多结尾部署,能自动处理环境依赖和迷惑治理;不错分发到多台手机并记录交互轨迹,达成可不雅测、可复现;并撑捏多模态智能体范式:涵盖ReAct闭环、多智能体融合以及定时任务等多种责任阵势。

在官方公布的控制场景示例中,GELab-Zero不错很好地施行复杂任务和依稀教导,比喻冒昧精确地完成一次跨品类、波及不同商品规格和数目的采购,也不错在接到“经典电影”“符合遛娃的所在”这类依稀和有主不雅色调的需求时,自行判断施行设施并胜利完成任务。
据了解,阶跃星辰研发GELab-Zero的初志,是贬责GUI Agent靠近的诸多工程侧贫苦——由于移动端控制生态极其碎屑化,GUI Agent在不同品牌、型号迷惑上开首时场景会在多迷惑ADB连气儿、依赖安设、权限树立、推理就业上线、任务编排与回放等方面出现工程问题,这意味着Agent迷惑者与MCP用户需要处理诸多工程基建责任,难以将元气心灵汇聚于计策翻新。
此前,阶跃星辰曾在2025天下东说念主工智能大会时代公开展示了“一键施行助手”AI手机贬责决策。接入该决策后,手机Agent助手不错基于用户教导自主施行包括追星打卡、点外卖、预约挂号、舆图导航、交纳社保、预订机票旅舍、写一又友圈案牍等多样任务,让手机Agent助手的手艺从“能对话”延展到“会干活”,进一步成为东说念主类奢睿伴生体。