DuerOS度秘AI操作系统

网址简介:DuerOS是百度度秘事业部研发的对话式AI操作系统,拥有10大类目的250多项技能。搭载DuerOS的设备能够听清、听懂、并满足用户。

更新时间:5年前

访问次数:21294

详细介绍
gg
DuerOS是百度度秘事业部研发的对话式人工智能系统。
搭载DuerOS的设备可让用户以自然语言对话的交互方式,实现影音娱乐、信息查询、生活服务、出行路况等10大类目的200多项功能 [1]  的操作。同时,借助云端大脑,DuerOS可以不断学习进化,变得越来越“聪明”。
DuerOS广泛适用于音箱、电视、冰箱、手机、机器人、车载、可穿戴、玩具等多种场景及设备,目前已与国内外多家企业达成战略合作。同时,DuerOS还为不同类型的硬件厂商打造了小度智能设备平台;为开发者推出了小度技能开放平台。极大的降低使用门槛,加速产业升级。
DuerOS对话式人工智能系统,真正使AI高科技落地到现实生活,降低用户获取信息的门槛,为人类带来简单可得的便利。[2]  在2017年的百度世界大会,DuerOS正式升级为DuerOS2.0,这次全面的升级,包括升级的小度智能设备开放平台和全新发布的小度技能开放平台。升级后的DuerOS2.0,将会给用户和行业带来更好的“听清、听懂和满足”体验。 [3]  同时,百度还发布了三款搭载DuerOS2.0的人工智能硬件产品,渡鸦raven H 、raven R 及raven Q。 [4] 
2018年1月8日,百度 CES 发布会分享了其最新 AI 战略,以及 DuerOS 2.0 平台的最新进展,推出了基于 DuerOS 2.0 的三款智能产品。 [5] 
2018年3月16日,Coocaa OS与百度DuerOS在技术、内容、数据、运营四个方面进行深度融合。
DuerOS整合了百度的信息与服务生态优势,精心打造了10大类目200多项能力,用户可在不同场景下实现指令控制、信息查询、知识应用、寻址导航、日常聊天、智能提醒和多种O2O生活服务;同时支持第三方开发者的能力接入。 [1] 
借助开放共赢的合作生态理念,DuerOS未来将更多合作伙伴的接入,将技术、场景和设备相结合,创造更多可能。
与目前市面上的人工智能系统不同的是,除了通过自然语言进行对硬件的操作与对话交流,DuerOS借助百度强大的服务生态体系,能够为用户提供完整的服务链条。用户可以通过对话在多种场景下,完成从信息筛选到下单支付的“一条龙服务”,真正使人工智能的高科技落地到现实生活,为人类带来简单可得的便利。

深厚的技术实力积累

DuerOS是百度人工智能技术的集大成者,拥有业界领先的人工智能技术和先天优势。
  • 算法:拥有建立在超大规模神经网络、万亿级参数、千亿级样本上的人工智能算法; [7] 
  • 计算:数十万服务器和中国最大GPU集群的计算能力; [8] 
  • 数据:累计了全网万亿网页、数十亿搜索、百亿级图像视频和定位数据; [8] 
  • 语音识别:语音识别准确率97%以上; [8] 
  • 图像识别:人脸识别准确率99.7%; [9] 
  • 自然语言处理:能用自然语言与用户交流,理解用户意图; [9] 
  • 用户画像:拥有近10亿用户画像。

灵活便捷的解决方案

DuerOS拥有灵活分层的解决方案,为不同类型的企业及开发者提供一站式服务。极大降低了企业的生产、开发门槛。 [10] 

广泛的场景适用性

DuerOS可以广泛适用于家居、随身、车载等多种场景,支持音箱、电视、冰箱、手机、机器人、车载、手表等多种硬件设备。 [11] 

丰富完善的内容生态

借助百度生态资源的优势,DuerOS能为用户提供完整的服务链条。 [12] 
(1) 免费、低成本的正版内容:音乐、有声、视频、新闻等内容资源应有尽有
(2) 包罗万象的海量信息:百度搜索十余年来积累了海量信息,可满足用户全方位的信息查询需求。
(3) 庞大的服务生态:借助百度地图、糯米、外卖等服务生态体系,为用户提供完整的从信息筛选到下单支付的闭环服务。且支持第三方内容或资源方的信息接入。
DuerOS开放平台发布至今,已经实现了从1.0到2.0版本的快速升级。半年时间里,DuerOS已新增130余家合作伙伴,落地硬件解决方案超过20个,每月新增5款以上搭载DuerOS的设备。目前,DuerOS已与中信国安广视、小鱼在家、海尔、美的、联想、哈曼、TCL、小米、高通等众多产业链上下游知名企业达成合作,将DuerOS的对话能力广泛应用到智能家居、可穿戴和车载场景中。
DuerOS代表了人工智能的“中国速度”,也证明了“开放”是“中国速度”的关键。陆奇曾表示,AI的世界属于开发者,百度的将来必须建立在每个开发者共赢的基础上。“这是百度的承诺,是百度AI平台的核心价值观。AI时代的机会非常多,但是壁垒还很高,百度要为每一位AI开发者解除障碍、创造机会,提供工具、数据、基础设施,以及整体的支撑环境。” [13] 
DuerOS智能设备解决方案是DuerOS为厂商全新打造的分层解决方案。能够满足各个类型厂商不同层次的需求。
分为:核心接入组件、开发套件、参考设计三层。具有低成本、方便灵活等特点。
  • Client:核心接入组件
可让企业方便的调用ASR、TTS等技术,及DuerOS 10大垂类200+的技能能力,并能在Android、Linux等多个操作系统上顺利运行。 [1] 
  • Development Kit: 开发套件
适用于希望更便捷获取硬件的企业,包括芯片模组,麦克风阵列等硬件组成部分,会为企业提供不同种类的芯片和麦克风阵列等组合方案。
  • Reference Design :参考设计
是最省心的一套解决方案,包含完整的外观设计、结构设计和音腔设计方案,可让企业极大降低研发成本。
  • 小度之家App
企业方可通过该APP定制智能设备的控制方案,内容方可将打造的技能输出在商城中,供用户管理智能设备、设置支付方案、并享用资源及内容。
同时,DuerOS还为开发者提供了DuerOS智能设备解决方案平台使用参考——Sample App,代码完全开源,开发者可以通过开放平台下载,将其直接应用于各种终端设备上,使终端设备具有DuerOS核心层的全部能力。同时,开发者还能够根据自己的需求,对Sample App进行适配修改,进行二次开发。 [12] 

DuerOS核心层

DuerOS核心层相当于DuerOS的“技术大脑”,不仅拥有语音识别、语音合成等语音技术能力,也有深度学习、数据挖掘、自然语言理解等数据算法能力。可以通过API、SDK、兼容AVS方案三种方案向厂商传输。 [12] 

DuerOS能力层

DuerOS拥有10大类别的200多项自有能力
  • 影音娱乐:音乐、电影、电视剧、综艺、短视频、有声书、电台等
  • 信息查询:资讯、天气、股票、航班、体育、问答、图片等
  • 生活服务:美食、电影、外卖、酒店、购物、打车、充值等
  • 出行路况:地图、路线、路况、限行、违章、周边等
  • 实用工具:翻译、词典、计算、汇率、换算等
  • 个人助手:日程、闹钟、提醒、备忘、记事、推荐等
  • 知识教育:百科、故事、儿歌、成语、育儿、文库等
  • 聊天休闲:聊天、笑话、写诗、成语接龙、游戏等
  • 智能家居:指令控制、状态查询、使用手册、客服电话等
  • 语音助手(手机助手):打电话、发短信、设置闹钟、日程管理、通讯录查询、应用调起等
第三方技能:DuerOS接入了众多第三方资源和内容,如音乐、有声、新闻、娱乐等

开放平台优势

支持能力全;可接入设备多;接入门槛低;解决方案全免费
DuerOS 的整体架构包括三层:中间层为核心层,即对话系统;最上层为应用层,即智能设备开放平台;最底层为能力层,即技能开放平台
核心层,包括了从语音识别到语音播报再到屏幕显示的一个完整交互流程,以及背后支撑交互的自然语言理解、对话状态控制、自然语言生成、搜索等等核心技术,这些技术支撑着上下两层的实现。
应用层,是为第三方厂商提供包括核心接入组件、芯片模组、麦克风阵列等的开发套件,以及包括工业设计、结构设计、音腔设计在内的参考设计方案。
能力层,是面向开发者,提供了包括了原生技能和第三方技能在内的技能开放平台,开发者可以通过技能工具,来创建并发布基于 DuerOS 的技能。
三层之间的结合处,分别是对话服务和技能框架两个接口,也是整个 DuerOS 的核心接口,前者为终端设备提供了各项支持请求,体现 DuerOS 的终端能力,后者为第三方开发者丰富的创建方式,体现 DuerOS 的技能开发能力。
举例来说:
搭载 DuerOS 的电视,具备了屏幕显示的能力,当一个设备具备了屏幕显示能力的时,DuerOS 就可以响应这种服务的请求,识别之后通过屏幕告诉用户正确的答案。搭载 DuerOS 的手机,用户就可以通过语音操作打电话给家人或者向餐馆订餐。搭载 DuerOS 的汽车,具备车辆控制功能,你可以跟汽车说天太热了,把天窗打开,把空调调到19度。这是 DuerOS 支持的协议具备多种多样的终端能力。

针对技术框架,DuerOS 提供标准化的接口,第三方开发者甚至可以一行代码都不编写,就能创造标准化的技能,只要提供内容即可。针对需要个性化创造的开发者,DuerOS 提供了丰富的技能接入,开发者不需要懂自然语言处理和深度学习,就能创造非常自如的语音交互技能。

除了智能创建工具之外,DuerOS 还提供全套平台工具,覆盖从创建、配置到百度云部署、测试、发布的整个生命周期。通过 DuerOS 的技能框架,百度把 DuerOS 的原生技能开发能力、自然语言处理能力、对话管理能力等全部开放给了第三方开发者。 [14] 


2017年7月5日,在北京国家会议中心举办的“百度AI开发者大会”上,百度度秘事业部总经理景鲲正式对外发布DuerOS开放平台,该平台包括智能设备开放平台和技能开放平台,支撑这两个平台的则是DuerOS对话核心系统。通过帮助硬件厂商、开发者最大程度降低对话式人工智能系统的应用门槛,百度DuerOS正在逐步实现“唤醒万物”的愿景。 [15] 
开放平台打通智能语音生态 听清、听懂、满足用户需求
DuerOS开放平台的技术架构包含“对话服务”和“技能框架”两大基础协议。两大协议连通起来的对话核心系统、智能设备开放平台和技能开放平台,构成了完整DuerOS的智能生态系统。其中对话核心系统通过云端大脑自动学习,利用语音技术、自然语言处理技术、搜索技术、多轮对话技术等能力,基于领先业界的知识图谱、网页图谱、需求图谱等大数据,以及丰富优质和开盒即用的内容资源,为智能设备赋予人类的语言能力。朱凯华表示:“DuerOS是百度AI能力的集大成者,完整的生态体系加上对话核心系统的核心技术能力,DuerOS将成为能真正听清、听懂、满足用户需求的人工智能对话系统。
智能设备开放平台将面向传统硬件厂商和开发者输出软硬兼备的多层次解决方案,包括个人版、轻量版、标准版、参考设计等多样化解决方案,能够低成本、方便灵活地满足各个类型厂商和开发者不同层次的需求。百度葛行飞在演讲中称其为“最易上手的开发平台”。此外,DuerOS还推出“小度之家APP”,方便用户实现智能设备的统一管理、设置支付方案、共享AI资源及内容,也让开发者能够自定义开发新的技能。
百度现场宣布收购位于西雅图的人工智能创业公司KITT.AI,据悉,KITT.AI创始团队来自于约翰霍普金斯大学和卡耐基梅隆大学等世界名校,并曾被CB Insights评为AI 100强。KITT.AI公司CTO陈果果现场介绍了三句话定制设备唤起词等功能。DuerOS开放平台的能力得以进一步强化。
作为DuerOS生态中的技能平台,技能开放平台拥有丰富优质的AI内容资源,包括自有的10大类、100余种原生对话技能,支持接入第三方资源和内容,如音乐、有声、新闻、娱乐等,显著降低了开发成本,在保证进一步听清、听懂的同时,满足了用户的更多需求。
DuerOS开放平台的发布,在赋能传统企业和开发者的同时,更加速了DuerOS“唤醒万物”智能生态的构建。正如景鲲在百度AI开发者大会上表示,作为百度AI技术、数据、内容、生态的集大成者,DuerOS致力于赋能广大厂商和开发者,最大程度降低对话式AI的应用门槛,让所有智能语音设备能够真正听清、听懂,并满足用户需求。
据悉,DuerOS开放平台官网已经上线,全球AI开发者都可以在官网注册后接入DuerOS开放平台,使用DuerOS开放给第三方的所有能力。 [16] 
升级的DuerOS2.0,包括升级的小度智能设备开放平台和全新发布的小度技能开放平台。具体来说,小度智能设备开放平台在技术能力、解决方案、平台体系三个方面进行了全面升级。
技术能力的升级,包括准确快速的语音唤醒能力、流畅自然的语音识别能力、生动鲜活的合成语音以及更加智慧的AI能力。
解决方案的升级,包括更好的远场语音交互开发套件、全新的语音交互APP解决方案、全新的DuerOS for Apollo解决方案以及全新的跨场景跨设备解决方案。
平台体系的升级,包括新增的物联网设备云、智能设备质量认证支持,平台体系更加丰富。
新发布的小度技能开放平台将面向内容类、智能家居类、生活服务类合作伙伴,开放百度的自然语言理解、知识图谱及系统意图等核心AI能力,提供强大的技能开发工具链。目前DuerOS的技能生态已拥有超过200个技能。
此外,百度还在现场宣布成立人工智能交互设计院,同时“普罗米修斯计划”也正式起航。 [4] 
智能设备开放平台的目标是“上手”最容易的设备平台。同时,百度还是给出了几个版本的开发套件:

个人版-针对开发者

个人版开发套件基于 DevKit ,集成了 2Mic 兼容设计,同时也支持 4Mic,和 Crom 引擎合作完成。即日起就可以下载,不仅完善了硬件,还加上了系统对象和文档。
在个人版里,百度提供了一个趣味组装图纸,让开发者动手组装。个人版既保留了一些自主行性,也节省了大量的时间,非常容易上手。

标准版-针对产品厂商

针对产品厂商需要稳定、可靠、大规模生产的需求,百度给出了“标准”答案。标准版开发套件完全按照 产品级要求研发,包括 4Mic 拾音板、MTK8516 主板,Wi-Fi/BT+喇叭,终端软件为 Linux+DuerOS SDK+终端应用,它的目标是开箱即用。
此外,百度还联合设计团队推出了标准版产品的参考设计,同时由来自手机团队资深结构工程师专门做了结构化的设计,由资深的电声工程师调整了电路效果,甚至和音箱代工厂制定了完整的工艺,贴上商标就可以对外销售。

轻量版-针对特殊厂商

针对有些特殊要求的厂商,比如产品需要电池系统、需要低功耗、需要放到已有产品中,同时不希望增加成本等情况,百度则提供了轻量版开发套件。
发布会中提到了 ARM 和 DevKit 合作的两款专门支持 DevKit 和 ARMmbed 的解决方案,Cortex 为核心的解决方案,非常省电的,作为实时操作系统,配置也相当灵活,既有单板方案也有双板。套件里是高度整合的 SoC 系统,全部装在一个单芯片上,本身就保证了低成本,小体积,甚至只有硬币的大小。

第三方方案

除了上述三个百度提供的版本方案外,还和业界一些第三方厂商做了合作,让 DuerOS 融合第三方解决方案,这其中包括了声智科技、先声互联、Intel、Rockchip、Qualcomm 等,还有更多正在进行中

小度之家APP

与这些设备解决方案配套的,是一款基于手机的 App——小度之家。据雷锋网了解,在以语音交互为主的设备上,有两个很常见的问题,一是配网不方便,二是设置不方便。通过小度之家 App,这两个问题都可以得到彻底解决。在这个 App 上,一方面可以看到操作记录,另一方面也支持付费功能。更重要的是,将来会有更多的第三方技能会出现在这个 App 上。

技能开放平台

技能开放平台分为三个部分,一个部分是百度提供的原声技能,第二个部分是为第三方开放的技能工具,第三个部分是由开发者开发的第三方技能。

这些技能综合起来,就是为了让语音交互设备更好用,具有更多功能,让用户听懂并得到满足。百度的原生技能覆盖了从娱乐到生活,从信息到工具十个大类,超过100个子类,且还在不断增加。

通过开发工具,开发者可以开发第三方技能,百度还提供了标准的技能模板,可以帮助开发者无门槛的创建技能。从开始创建到最终发布,都有百度的技术支持。而上传到技能商店的技能,终端用户都可以根据自己的需要来选择或者购买喜欢的技能,平台中的“监控”功能,还可以为开发者优化技能提供决策数据。 [14] 


2017年3月30日,百度“万物语,智慧芯” DuerOS智慧芯片战 略合作发布会在上海成功举办,会上,百度发布DuerOS智慧芯片,并与紫光展锐、ARM、上海汉枫达成战略合作,将人工智能赋能传统制造业,助力产业升级,完善智能物联网生态,开启“可对话”智能设备时代

这款芯片搭载了DuerOS对话式人工智能操作系统,可以赋予设备可对话的能力,能广泛用于智能玩具、蓝牙音箱、智能家居等多种设备之上。百度公司首席架构师,度秘事业部首席技术官朱凯华表示,“DuerOS将搭建从硬件到软件的全栈能力,并将这些能力开放,为企业提供turnkey解决方案,降低企业使用门槛。让遥不可及的人工智能和未来生活,变的触手可及。” [17] 
此次合作将构建包括度秘大脑、语音解决方案、芯片/模组在内的三层结构,其中,前两层由百度度秘提供,赋予芯片DuerOS“可对话”的核心功能,包括10大类100多项功能,有日程管理、天气查询、答疑解惑、查找音乐等人工智能“保留项目”,也有像查找餐厅,订餐、买电影票等直接提供生活服务的“独门绝技”。芯片模组板块分别由紫光展锐、ARM、汉枫共同支持。[18] 

智慧芯片已将DuerOS与紫光展锐RDA5981完美集成,使芯片具有低功耗、低成本的特点,并提供丰富的IO接口,支持Wi-Fi/蓝牙多种连接模式;同时,采用了ARM公司mbed OS内核及其安全网络协议栈,实现了与云端的安全连接,降低了设备商应用开发门槛;在此基础上,物联网领先方案服务商汉枫科技也率先基于该芯片推出WiFi模组HF-LPB200U,集成了DuerOS智能语音交互功能,已经处于量产阶段。 [19] 

gzh

微信扫码关注

更新实时通知

猜你喜欢

网友评论

  • 2019-09-12 22:01:35

    好牛逼的系统啊