全球语音控制:车载一体机的“尚方剑”

人们在使用手机、平板、电脑时所处环境是安全的,可以专注于屏幕内容,但车载屏幕必须考虑用户驾车使用时的安全性,这意味着需要在交互上下苦工,以提升驾驶时的操作精度并尽量减少对用户的精力分散程度。...

在过去的一年里,围绕汽车和互联网发生了几件大事。

iOS in the Car 诞生,将苹果气质植入汽车中控;特斯拉风潮席卷全球,17英寸中控屏也尽显贵气。新年伊始,凭借奥迪等车厂实力组建OAA开放汽车联盟,誓要洗去行业低迷的氛围,创造卓越的车内生活体验。一时间,英雄林立,车上这块“第四屏”无疑会成为今年行业的热点。

不过,车载屏幕毕竟不同于传统屏幕。人们在使用手机、平板和电脑时处于安全的环境中,可以专注于屏幕内容,但车载屏幕必须考虑用户在驾驶时的安全性,这意味着他们需要在交互上下功夫,以提高驾驶时操作。准确性并最大限度地减少对用户的干扰。

这也是巨头们正在突破的地方,但归根结底,优化“触控交互”并不足以真正保证安全。最好的解决方案应该是“语音交互”——用户无需区分,用心看屏幕,只要说话就能实现所有功能,既保证了安全,又提高了效率。 iOS in the Car 主要是使用类似 Siri 的方式来完成控制,其意图完全一致。

围绕语音控制领域,目前有两个响亮的产品。其中之一就是沃尔沃在今年的CES大会上推出的概念车Coupe。虽然主要集中在 Voice 的概念上,但并未展示任何细节。具体如何交互,是说一句话还是几个具体的命令词,完全不知道;另一个是福特和微软推出的SYNC,主要强调车辆和移动通信设备之间的无线通信,但它的语音控制能力还很初级(比如开车时可以接收短信但必须手动停车)回复)。售后市场中的一些所谓的“语音控制”只是在其产品的本地功能中实现的。例如车载一体机上怎么下载软件,如果你想通过语音控制一个应用程序,你需要先手动打开它,通过几个步骤进入一个特定的界面,然后输入一个语音命令才能生效。此时,如果您想通过语音控制其他应用程序,则必须手动退出该应用程序,然后输入语音命令。打开一个新应用程序以发出语音命令。下达指令时也有具体的语音规则需要遵守,否则听不懂。

原因是自然语言处理是一项复杂而困难的技术。一是语音识别的准确性(如何将口述的单词变成正确的一段文字),二是语义理解的准确性(让语音助手“理解”文本中包含的用户需求),以及最后是提供有针对性的性行为。理解人们多样化的语言指令需要庞大的语料库来支持,因此这项技术往往只能在线实现。如果要离线使用,对语义分析来说将是一个巨大的挑战。受限于技术实力,业内现有产品只能实现本地语音控制(需要识别的命令比较简单一),这样的方案很不完善。

但是这个问题几天前终于解决了。北京智歌技术团队成功实现了全球语音控制功能,无需联网也能使用。这是该技术在全球首次应用于车载终端,智歌也是业内唯一敢于使用的企业。一家做硬件全球语音按键的公司(顺便说一句,志哥的老大就是据说是被带进中国的人,他在微软亚洲研究院工作的时候专攻语音识别和语义理解)。这意味着用户可以在任何时间、任何界面环境下,一键调出语音助手,实现任何想要的功能。比如听音乐的时候打开搜索歌手信息,听广播的时候打开百度导航,无聊的时候让语音助手讲故事,或者直接跟TA调情……相比之下,“其他厂商的本地语音”执行每一个功能都会多走几步,更容易出事故。

1.在听汪峰的歌曲时,如果想查找他的其他歌曲,可以一键调出语音功能,说“搜索汪峰的歌曲”:

语音在线搜索

2.语音功能识别命令并快速反馈:

在线搜索歌曲

3.自动跳转百度搜索汪峰歌曲页面

自动跳转到百度音乐

1.收听广播时,需要使用导航车载一体机上怎么下载软件,一键呼出语音功能,说“导航到中国传媒大学”:

导航目的地语音

2.语音功能识别指令后,打开百度导航,自动设置路线:

打开导航软件,搜索目的地

路径规划

3. 开始导航:

开始使用百度导航进行路径规划和导航

这个叫“小智”的语音助手也很聪明。跟他说话的时候不需要刻板。他可以按照自己的气质:“给你一首歌”——“我给你弹汪峰的《高地》”、“小智,我饿了”——“我在找附近的餐馆”、“小智是我女朋友好吗?” ——“亲爱的~有空调剧我还不如出去找个妹子”……不管你是小孩子新鲜还是非主流,傲娇还是宅男,小智都懂你。

据悉,该产品已进入量产期,即将在春节期间上市销售。

智格科技成立于2013年,是一家致力于平台-车联网一体机产品研发、生产和销售的高新技术企业。公司拥有强大的自主研发团队和强大的生产制造能力,对车机和互联网有着深刻的理解,专注于底层技术和用户体验。努力。

相关文章

发表评论