1. 首页 >> ChatGPT教程 >>

理想自研Mind GPT上车,让老人小孩也能轻松使用AI

理想汽车首个家庭科技日在常州智能制造基地成功举行。

chatgpt中文版 http://chatgpt.guige.xyz 

这是一个充满未知和探索的时刻。理想汽车的愿景是在2030年成为全球领先的人工智能企业,这是一个中国企业史无前例的愿景和目标,未来的十五年,我们每一个人都是见证者。

为何如此设定?何以支持这一野心?理想家庭科技日给出了自己的答案。

在我们的火伴中,有一群人也在不断挑战成长的极限,迫不及待讲述他们的最新成果和创新思路,展现科技的魅力和气力。

理想家庭科技日是如何践行理想汽车使命和价值观的?他们有一些话想说。

受访者:理想汽车智能空间团队

作者:张婉婷

01

勾晓菲介绍,智能空间已实现了空间交互2.0的质变,我们自研大模型,重构AI计算机时期的OS系统,重新定义智能空间的新一代交互,让任何人都可以轻松使用AI。

与空间交互1.0相比,“我们在三维空间的交互情势从‘以触控为主,对话为辅’到本次2.0最大的变革——‘以对话为主,以触控为辅’。”

怎样理解?想象在一个空阔的公路上,两个人坐在车上一路前行,有点无聊。其中一个人说:“我给你讲个嘲笑话吧。” 另外一个人表示同意。因而第一个人开始娓娓道来一个嘲笑话,讲完以后,第二个人不由感叹“好冷啊!”。

如果理想同学在场,它听到这句话可能会反应可能有两种,一种是打开空调并且调高温度,一种是接话继续开玩笑地说:“这个还叫冷?我来一个更冷的!” 。

两种反应的差别就反应出触控和对话交互体验在语音层面的区别,在以对话为主的交互情势下,理想同学不但能够理解前面所讲的嘲笑话,并且还可以够融会上下文信息,认为这个嘲笑话其实不足以表达出真实的“冷”,因而轻松地讲出了更加幽默的笑话。

“基于我们自研的大模型和OS系统,我们有机会把理想同学的上下文做得更完全。而这个上下文也不但限于对话,也包括场景,就是我们的环境是怎样样的,理想同学会像人一样去感知环境、认知学习、表达和互动,更像一名懂你的家人。”

另外,与「触控」相比,「对话」不存在距离限制和稳定性限制。随着汽车功能的不断增加,传统的触控式操作会让用户的学习本钱变得愈来愈高。而通过对话式的语音交互,用户只需要通过简单的语音指令便可完成操作,下降了用户的学习本钱和操作难度,另外,它还可以帮助用户更加安全地驾驶,减少对视觉和手部操作的依赖,避免分散注意力。

由此,依赖「触控」的机械式人机互动方式正在向更柔软、更自然的方向发展。

在勾晓菲看来,智能空间承载的核心其实很简单,就是和用户的沟通界面。“未来的语音交互也应当具有根据用户的意图生成独立界面的能力,并将类似功能的选项汇总到一张界面中,提高用户使用的效力和便捷性。”

“无需关注功能在哪里或怎么操作,只需简单地表达自己的需求,便可享遭到智能交互带来的便捷和乐趣,就像人与人之间的对话一样轻松愉悦,就像与密切的朋友分享生活中的点滴一般自然。”这是理想汽车智能空间团队向用户的许诺。

02

陈伟介绍,在ChatGPT问世之前,我们就已启动了全部大语言模型的训练。

早在理想汽车空间算法团队组建之初,我们就搭建了一个基于大模型训练的数据平台和训练平台。同时,我们也斟酌到了多模态数据的需求,包括语音、视觉和文本等多种情势。

“未来的算法演进趋势会向大模型发展,ChatGPT证明了这一点,它带来了全部通用人工智能领域的认知突破,而我们的方向也始终很明确:将代表底层基建能力的语言模型做得愈来愈大,对用户产生的价值也会越大。”

大语言模型带来对话能力上的跃迁,这让我们真正实现空间交互2.0的蓝图。

另外,我们的大模型具有拉齐到行业领先水平的四个特点:强大的文本生成能力、语言理解能力、知识问答能力和逻辑推理能力。大模型在回答问题时能够给出推导进程,并且愈来愈接近人类思考方式。

“除让大模型能力愈来愈强,我们还要让他更准确,包括连接外部能力来解决模型在某些方面的不足。所以我们使用控制器单元模型(Controller)来连接外部能力,比如自研搜索引擎,以获得实时信息。”陈伟说。

“在理想同学上,我们还加入记忆网络的能力,在和用户沟通中描绘用户画像,并把这些信息带入到与用户的对话进程中,让理想同学基于大模型将来能够愈来愈走向个性化,真的能成为每个家庭的数字家庭成员,并且能够伴随全家人一起成长。”

“人机交互的核心就是要用户的体验变得愈来愈自然,这是其终极状态。之前是人去适应机器,而我们通过车机算力去做更多理解、推理、记忆、学习层面的事情,要让机器来主动去适应人。”

在以后的OTA里,我们将陆续带来更加自然、更好服务全家人的AI功能,本源及保障则是我们全链路自研的能力。

“我们只用了差不多1年的时间就切换为全链路自研的体系,团队快速地将技术创新和能力利用到实际场景中,并通过快速迭代做出差异化的创新,这让我们的产品力及竞争力能够愈来愈强。”

而自研其实本质上是一个技术能力,这个技术能力又是一个非常底层的技术能力,要从底层一点一点往上搭,一点一点去替换提供商,理想同学全部架构里提供商非常多,所以这个进程非常艰巨,“大家的动身点不一样,动作就不一样,我们始终坚守用户价值,所以我们很坚定地去做这件事情。”陈伟说。

做成这件事只是第一步,人机交互包括感知、理解和表达,全自研让我们的感知能力走在行业前列,目前大多数公司也都在“卷”感知,但我们未来的重点将会是怎么提升理想同学的理解和表达能力。为此,我们引入大语言模型,从而使其变得更加聪明,并且让其表达能力更加丰富,比如通过视频图象等方式进行展现。

这是空间交互下一代的发展方向。“我们的终纵目标就是让任何人都能够轻松使用AI。”

03

从最初的基础模型到现在的深度学习和大语言模型,AI的发展势头不可阻挡,正以惊人的速度重塑着我们的生活和未来

可见的是,AI正不断以指数级增长速度自我进化、自我迭代,而围绕AI计算机生成式交互,理想汽车空间软件团队也正不断研究利用,以便其更好地实现服务人类的目标。

李涛介绍,在大语言模型上,我们在系统层面进行重构,在自然语言处理任务中提供更加高效和精准的解决方案,让理想同学更好地理解人类语言,并且能够生成更加人性化、流畅的语言输出。

基于大模型的突破,我们新增LUI(用户语言界面)交互方式,即通过自然语言交互的方式与计算机进行交换的用户界面。“比如你想吃个火锅,只需要给理想同学说,我们的车机界面就会生成火锅的图片供你选择,自动算好出行线路等实现一系列高效、自然的操作。”李涛说。

“基于全新的交互方式,我们同时还需要操作系统的支持。由API调用到结构化语言调用、买通APP和OS边界、提供系统服务原子级能力……我们的操作系统正实现更多可能性。”

另外,我们不断拓展AI为家庭用户服务的边界,同时为它设定函数的边界和不允许超过的范围,避免误调用,并便于组合多个能力为用户提供更广泛的服务。

“比如在大热天用户嘴瓢说错了座椅加热,那理想同学也会理解他的意图、情感或需求,get到实际上是想说座椅透风,并友好地纠正并打开座椅透风。”

最后,在最贴近用户的利用生态上,软件团队要斟酌得更多。由于大语言模型本质上是基础建设,它的突破拔高了软件的上限,但它本身没法直接为人服务,需要在此基础上生长出来的AI原生利用直接和用户对话。

另外,我们的AI从不刷存在感,我们在思考的是:甚么是AI,这样的价值能不能赋能于每个人?一切都是从创造用户价值角度动身的。

“我们基于大语言模型来给用户显现一个界面,一个对话的界面、一个交互的界面、一个沟通的界面、一个带图象的界面或带语音的界面。所有软件都需要基于大语言模型进行重构,所以我们开发系统软件适应大语言模型,再开发利用程序来适应大模型,这些改造进程使人兴奋。”

“基于大语言模型的突破,我们要为用户提供最好的场景和使用体验,这是我们软件团队要做的事情,也是我们理想汽车要做的事情。”

桂#哥#网#络www.gUIgege.cn

本文来源于chatgptplus账号购买平台,转载请注明出处:https://chatgpt.guigege.cn/jiaocheng/29229.html 咨询请加VX:muhuanidc

联系我们

在线咨询:点击这里给我发消息

微信号:muhuanidc

工作日:9:30-22:30

X

截屏,微信识别二维码

微信号:muhuanidc

(点击微信号复制,添加好友)

打开微信

微信号已复制,请打开微信添加咨询详情!