机器不会有思维能力?玩秘并不这样认为

动点科技 中字

很多人用 “机器不会有思维能力” 的理由来反驳人工智能威胁论,但是 NLP(自然语言理解)技术的出现又一次打破了这样的认知。机器通过数据训练,深度学习也可以理解人类表达的模糊的指令并自如的进行对话,目前它们能做到多聪明多智能?近期,有媒体接触了基于 NLP 技术的人工智能生活语音对话助理“玩秘”,创始人余轲曾经说过他们的愿景是:让人类把部分思考的工作交给机器。

玩秘隶属于北京轮子科技有限公司,是一家 NLP 语音对话助理服务商。玩秘于 2018 年正式服务于智能音箱小米小爱同学、天猫精灵,于 2019 年正式服务于小米手机。在 2019 年 8 月于上海举办的世界人工智能大会闭幕式上,玩秘作为 8 家被选中的优秀企业,与上海市人工智能产业投资基金完成了意向性签约。

玩秘通过语言对话与用户交互,与 Siri 等语音助手的简单百科式问答不同,玩秘强调思考和分析能力,能模仿人类复杂的决策过程,做出基于众多数据和因素的智能决策和推荐。

玩秘选择从生活消费和吃喝玩乐这个领域入手,余轲介绍说是因为与购物和资讯相比,本地休闲生活除了具备人性化需求和丰富供给的特点,还包含时间、地点、场景等更多维度,AI 个性化给用户创造的附加值更大,优于传统个性化推荐方法的人工智能架构功效也会发挥得更加充分。

目前,玩秘已经明确了三个主要的 B 端终端场景:手机、智能音箱、汽车。手机语音助手是玩秘主要的应用场景,针对手机语音助手,玩秘采用 GUI(图像交互)和 VUI(语音交互)相结合的展现形式,通过多条件指令识别、多轮对话、模糊指令识别等功能,为用户提供深度语义理解交互服务,让用户不用打开任何 App 即可完成院线观影、订酒店、外卖等服务闭环。

玩秘近期可以做到多智能?余轲举例说,在人性化升级完成后,比如用户发出指令:帮我买两张晚上十点在天幕影城的复联 4 的票。玩秘获取之后会根据已知的海量院线信息,输出自己的人性化建议:有一个场次是十点半的,但电影结束就凌晨 1:30 了,会不会有点晚,要不要换成 9 点半的场次?在此基础上,用户可以进行下一轮对话,比如:9 点有点早了;还有别的影院选择么?玩秘会根据进一步的指令做出下一个推荐。除了像这样多条件的指令,还可以向玩秘发起多样化或非模版式的指令,比如询问某个电影怎么样?附近有什么电影院推荐,价钱比对等,玩秘都可以一一作答。甚至用户搞不清想看电影的名字,只要说起其中演员的名字等比较模糊的指令,玩秘也可以理解用户的意图。具体而言,「玩秘」将根据用户特征进行类人脑推理,生成智能化的生活解决方案。随着深度学习训练,「玩秘」将越来越人性化,理解率和应答率也会逐渐提高。

余轲表示,做人工智能语音助理面临两大难点:NLP 语义理解和人性化推荐。团队核心的挑战以及技术壁垒便是 NLP 技术,即机器对人类指令的准确理解。“这是我们首先要做到的第一步,让机器更好的理解人类的意图。” 余轲说,人性化推荐则依靠数据和机器学习,核心是在于对用户和 POI 的刻画,标签经纬度要足够多、足够深,数据来源玩秘则通过与业内知名互联网票务平台、酒旅平台、外卖等合作来获取。

在盈利模式上,玩秘目前主要方向是在用户产生消费以后,从电影票务平台、酒店平台等内容提供商获得服务分成。

目前,玩秘已经覆盖全国 95% 以上的地级市,主要提供电影和酒店的服务信息。今年 6 月份,玩秘的功能在小米手机中上线(只需对「小爱同学」说 “电影助手” 即可通过语音对话的方式很便捷的购买电影票)。除了小米手机之外,中国四大手机品牌中的另外两家也已与「玩秘」达成合作,服务预计将于今年四季度上线。余轲表示,未来人类与机器以及机器人的交互形式一定会过渡到语音对话。与文字编辑、手动按键等现有的方式相比,自然语言传达的信息密度和效率要高得多。玩秘也将深耕吃喝玩乐的生活服务领域,打造生活全场景人工智能服务大脑。

据了解,玩秘目前已经完成了三轮融资,最近一轮是今年一月份由越榕资本领头的 A 轮融资。创始人兼 CEO 余轲牛津本科毕业,在斯坦福和普林斯顿分别完成了深度学习专业硕士和博士学位,有 10 年 NLP 自然语言理解与大数据分析行业领域研究和行业经验,曾任摩根大通公司的全球人工智能算法交易总负责人(能源与资源);其余核心成员来自平安集团陆金所、思必驰、豆瓣等公司。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存