阶跃星辰开源4B模子,腹地精真金不怕火部署,在你的手机上赶紧跑GUI任务!
新民晚报记者今天从大模子独角兽阶跃星辰获悉,其于11月29日开源GELab-Zero,初次将GUI Agent模子与圆善配套基建同步绽开,守旧“手搓党”一键部署。其中4B GUI Agent模子在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模子性能记载,取得SOTA(开端进水平)收成。此外,阶跃星辰还开源了基于真正业务场景的自建评测活动AndroidDaily,以期鼓吹GUI领域模子评测向破钞级、范围化欺诈发展。当今,企业级用户和开拓者仍是不错通过GitHub和HuggingFace平台体验GELab-Zero。
阶跃星辰在ScreenSpot、OSWorld、MMBench、Android World多个开源基准测试上对GELab-Zero-4B-preview模子进行了全面评估,涵盖了GUI意会、定位、交互等多个维度。测试效果浮现,GELab-Zero-4B-preview在多项泰斗开源基准测试中高出其他主流模子,拿下同尺寸SOTA。同期,GELab-Zero-4B-preview的进展还高出了参数目更大的GUI-Owl-32B等模子,性能更优也更易部署。


阶跃星辰官方先容,GELab-Zero提供一键拉起即可获取同样开源GUI Agent MCP的体验,在腹地即可完成部署,并将推理链路全齐掌控在我方手里。就具体智力而言,GELab-Zero可守旧4B量级模子在破钞级硬件上开动,兼顾低延长与隐秘;与此同期,它还守旧一键式多终局部署,能自动处理环境依赖和建立管制;不错分发到多台手机并记录交互轨迹,收场可不雅测、可复现;并守旧多模态智能体范式:涵盖ReAct闭环、多智能体互助以及定时任务等多种责任格式。

在官方公布的欺诈场景示例中,GELab-Zero不错很好地实际复杂任务和隐晦请示,比喻大致精确地完成一次跨品类、波及不同商品规格和数目的采购,也不错在接到“经典电影”“相宜遛娃的地点”这类隐晦和有主不雅色调的需求时,自行判断实际活动并顺利完成任务。
据了解,阶跃星辰研发GELab-Zero的初志,是搞定GUI Agent靠近的诸多工程侧穷苦——由于迁移端欺诈生态极其碎屑化,GUI Agent在不同品牌、型号建立上开动时场景会在多建立ADB集合、依赖安设、权限建立、推理干事上线、任务编排与回放等方面出现工程问题,这意味着Agent开拓者与MCP用户需要处理诸多工程基建责任,难以将元气心灵汇聚于战略改进。
此前,阶跃星辰曾在2025全国东说念主工智能大会时分公开展示了“一键实际助手”AI手机搞定决议。接入该决议后,手机Agent助手不错基于用户请示自主实际包括追星打卡、点外卖、预约挂号、舆图导航、交纳社保、预订机票旅店、写一又友圈案牍等各式任务,让手机Agent助手的智力从“能对话”延展到“会干活”,进一步成为东说念主类灵敏伴生体。