AI 大模型算得上是今年最火的话题,AR 眼镜作为 AI 最好的载体,Rokid 在 AI 方面的能力有了新的进展。
熟悉 Rokid 的朋友都知道 Rokid Glasses 是一款功能强大的 AR+AI 全天候智能眼镜,眼镜可以通过大模型能力实现搜索、识物、翻译等实用功能,去年发布会时我们也介绍 Rokid Glasses 搭载的是阿里通义大模型。
在如今 AI 大模型井喷的当下,只搭载一个 AI 大模型显然是不能满足用户对于 AI 的需求,所以 Rokid Glasses 再次进化。
截至目前,除通义千问外也集成了DeepSeek、豆包、智谱清言、纳米搜索等多个大模型,众多顶尖 AI 大模型的加入,让 Rokid Glasses 成为一个时刻待命的万能助理,以应对更复杂的任务。
Rokid Glasses 将这些大模型分类管理,分为基础模型、视觉模型、搜索模型等。
基础大模型负责整体 AI 能力,如对话,问答和调用产品功能等;视觉大模型负责处理视觉信息,如识别物体等;信息大模型负责搜索当下最新信息对所回答的问题进行信息整合与归纳。
Rokid Glasses 再次进化!搭载多款 AI 大模型,支持手动配置
每种模型都有自己的专长。Rokid glasses 会根据不同的场景将用户请求智能分发给不同的模型处理。
比如通义的风格是严谨客观,表现为专业的助理秘书的形象,豆包的风格更轻松俏皮,像一个好朋友,用户可以在 App 端选择自己偏好的大模型。
如果你对这些模型都不满意,也支持自定义配置自己的私有模型
简单来说,Rokid Glasses 以强大的硬件和算法为底座,支持用户换“脑子”和“眼睛”。
举个例子,当用户选择 DeepSeek 为基础大模型,通义千问为视觉大模型时,在唤醒 AI 后是 DeepSeek 作为“脑子”在与你沟通。
当涉及到调用视觉识别功能时,通义千问作为“眼睛”去识别对应物体从而进行判断和反馈。
在大模型喷涌的时代,目前还没有一款能力覆盖全面的大模型,更多的是某大模型在特定领域内表现出色。
所以多模型的协同使用或许是更优解,这种使用方式可以为用户带来更加全面、高效且个性化的体验。

Rokid Glasses 再次进化!搭载多款 AI 大模型,支持手动配置

Rokid Glasses 支持不同模型手动配置
当然,基于 YodaOS - Sprite 系统打造的 Rokid Glasses,大模型的种类绝不仅限于基础和视觉大模型两类。
随着大模型的发展,可配置的“卡槽”也会越来越多,Rokid Glasses 支持的大模型数量也会不断增加,用户也可以通过 openAI 标准的 API 调用自己的私有大模型,满足更多科研和专业领域的需求。
Rokid Glasses 再次进化!搭载多款 AI 大模型,支持手动配置

Rokid Glasses

多个大模型协同工作意味着 Rokid Glasses 的 AI 扩展性高,可根据用户场景和需求灵活配置不同大模型,同时也意味着对其系统的信息分发逻辑和意图分发算法要求更为严格。
在实际使用中,眼镜接收到的信息种类是多样且复杂的,如何保证快速准确地解读信息并给出反馈是研发团队首先要攻克的问题。
一般 AI 智能眼镜会把所有获取到的信息全部丢给云端大模型,让大模型自己判断,这种模式下大模型往往需要更多时间识别并做出回应,导致用户体验不佳,响应时间很长。
而 Rokid 凭借在 AI 语音交互领域的积累,在端侧集成自研的意图分类模型,可以在 2 毫秒内完成对意图的分类,再将请求分发给不同的模型。用户的体验就是 AI 响应速度快,处理效率高,交互体验丝滑顺畅。
举个例子,Rokid Glasses 搭载的意图分类模型,像一个机场入口的智能接待机器人,每一次信息的输入就像是机场来来往往的旅客。
当旅客拉着行李箱走进大厅的时候,这个接待机器人就开始工作了。
首先,它会扫描旅客的行李标签,这一步就是意图识别,识别旅客的行李是托运还是手提,从而决定给旅客指引到哪个方向。
也就是说在识别意图后,分类模型就会把对应的信息分发给所匹配的模型。
当然这个智能接待机器人还具备一些独特之处,它支持语言、图像或数据流等多模态的信号输入,也支持不用语言的意图理解,还能够根据实时负载情况动态调整服务窗口的开启数量。
这样一来的好处就是,来往的游客会秩序井然地办理业务,整个机场大厅不拥挤,效率也得到提升。
如果没有这个智能接待机器人,机场大厅中的旅客不知道自己需要做哪些动作,只能像无头苍蝇一样在各个窗口询问。
来往的旅客如果变多,那机场大厅会变得非常拥挤,且各个部门的运转效率低下。
Rokid Glasses 作为 AI 载体需要用更合理的处理逻辑和流畅的操作系统为不同 AI 提供展示实力的舞台,也能更好的让用户享受到 AI 带来的便利。
高效的分类模型配合不同种类的模型让 Rokid Glasses 处理效率得到很大提升,从而让用户的体验更顺畅。
同时凭借其具备 AR 显示的特性,结合 AI 能力,让它在科研、创作、办公还是日常生活中的各种场景中,都会提供前所未有的智能支持和流畅体验。

原文始发于微信公众号(Rokid):Rokid Glasses 再次进化!搭载多款 AI 大模型,支持手动配置

艾邦建有AR/VR产业链微信群,目前有HTC、PICO、OPPO、亮亮视野、光粒科技、影创、创维、佳视、歌尔、立讯精密、多哚(纳立多)、欣旺达、耐德佳,联创电子、至格科技、灵犀微光、舜宇光学、广景视睿、珑璟光电、京东方、海信视像、科煦智能、阿科玛、金发科技、思立可、新安天玉、四方超轻、大族激光、发那科、承熹机电等加入,也欢迎大家长按下方图片识别二维码加入微信群:
资料下载:
欢迎您点击此处加入AR/VR通讯录,目前已经有3000多人加入,如歌尔、HTC、OPPO、创维、PICO、字节跳动、黑鲨、联想、耐德佳、灵犀微光、立讯、领益智造、欧菲光、华勤、闻泰、立讯、珑璟光电、舜宇、深圳虚拟现实等,点击下方关键词可以筛选

作者 sun, keting