互联网电视

您现在的位置: 首页 > 互联网电视 > 分析/视点

【广州论道】联想魏晋:联想电视的人工智能探索之路

作者:流媒体网    来源:流媒体网   发布时间:2017-06-08 09:36:25

  【流媒体网】消息:从IPTV到IPTV+的客厅未来,在于产品的进化、在于技术的演进、在于体验的改善,让越来越多的智能科技服务进入我们的客厅,借助科技产品连接构建成客厅智能业务的延展。2017年5月25日——26日举办的流媒体网第十三届电视新媒体产业峰会上,特设“IPTV+:迎接客厅智能未来”论坛,期望借助此论坛,探求科技与客厅经济的结合,寻求创新服务与电视新媒体IPTV的融合,使各种需求和智慧交互成为可能。为运营商的大屏未来提供更多可能。

  在该论坛上,联想智能电视产品营销总经理魏晋进行了《联想电视的人工智能探索之路》的主题演讲。

图片1.png

       以下为演讲全文:

首先跟大家分享一些联想电视的故事,2012年,也就是五年前,联想发布了第一台电视,那时联想在智能电视上,内部一直把它作为一个孵化业务。

  联想电视在人工智能方面的探索

  五年过去了,现在在电视这个行业发展的也很快,而且联想的变化也很大,在去年就提出了一个特别大的战略转型叫Devise+,加什么? 服务。Devise就是硬件,包括现在我们也承认联想是一个硬件比重大的公司,现在我们要把加号这边转移,就是要做更多的服务。在这个大帽子下,大家也看到了方向,智能家庭毫无疑问是重中之重的一块,智能电视又是智能家庭里非常重要的入口,所以我们这个业务是一个非常幸运的,是一个非常好的平台,今年也借助产业大升级,会有很多发力的可能性,所以我相信接下来大家听到联想电视的声音会多一些,首先我们看一段VCR。

  刚才那个VCR给了大家一个印象,因为我刚才说了好多人并不熟悉我们这块业务。其实看出来这块业务在联想内部应该说越来越重要,我们利用了联想有史以来在中国最大的一次科技巡展,目前已经从去年第一站西安站,12月28日的第一站,总共有15个城市已经做完了。今年的目标是准备在全国100个城市进行科技巡展,在科技巡展里面,总共2个小时的会,电视在里边的篇幅占到了10分钟,所以公司把它越来越的提高到战略上来。

  图片2.png

  成长性是界定人工智能的重要标准

  谈完联想电视,再谈一下电视跟人工智能的结合。什么是电视的人工智能?其实这个词很难界定,我在准备这个材料的时候我就觉得,比如屏幕上列的这块电磁,它是智能的吗?也算。它有点人工智能的感觉?也可以,但是你说它真是,好像还不够味道。比如说几年前就有人工查询,还有边看边做的事情,还有今年特别火的千人千面的UI,还有猜你喜欢的智能推荐,还有公司也发布产品不可流失的UI,包括语音控制音量。那这些到底算不算人工智能?不知道这些问题大家有没有思考过,至少我经过一些思考以后,我们团队做了一些探讨。

  我们的理解,人工智能电视应该是像成长中的人一样,如果把它拟人化,我们把它比作是一个成长中的小孩,它应该具备的能力应该是“听、说、读、写、作”,这是跟大家交流通俗的能力。但是还不够,它必须有成长性,所以我们觉得这六个词是最关键的,“听、说、读、写、作和成长”。我们分别看一下,听在技术上我们列了三点。1、噪音处理,现在近场比较容易,用摇控器。但是远场技术成熟了,现在还不太成熟,噪音处理这件事情还是会有很多麻烦。包括我们现在的产品在家里使用应该没问题,但是卖场里面,还是有些反馈,比如说有时候语音识别会出问题。2、语音识别,这个技术讯飞公司很早就实现了,能把你的声音最后识别成文字。3、语意理解,就跟小孩子一样,他可能听到了这个字,但是他不知道什么意思。如果大家有小孩,孩子会问你这句话什么意思,说明他听到了,但是他不懂,所以语意理解是非常难的,工作量也会非常大。

  紧接着他要“说”出来,说首先要解决的是智能搜索,比如说我们的论道,你听懂以后要在库里找出来,以前我们百度或者Web搜索,搜索完以后列了很多你自己选,但是这个不行,它的搜索是惟一性的。之后你要进行语音合成,你要把搜索出来的东西进行合成声音。因为很多人经常会说合成的声音有点像机器人,但是大家希望它是一个非常真人化的,所以这个工作也在不断完成过程当中。第三个是多轮交互,我们经常说的话,你不听上文,光听下文不懂什么意思,但是人懂,你跟一个人聊天,你有前文,他知道后面的话,这个话就可以用的很简短,但是机器有时候不懂,所以要做到多轮交互。

  再说一下“读”,我们列四点。比如第一个声纹识别,像我的声音是一个中年男性。然后是视频内容识别,比如说这个视频里面出现的场景,地标建筑是什么,他根据地标建筑就可以知道视频里讲的是什么地方,比如是巴黎还是北京。还有图像识别,比如说这盆花,他就知道这朵花是玫瑰或者是月季。然后是视觉识别,像我们做脸部搜索,这种就是视觉识别。

  第四个是“写”,这个就是大家说的关键词“千人千面”,另外一个是“消费弹窗”,我们认为电视上有可能做出一个弹窗的机制,怎么在不打扰你的前提下做到弹窗的互动机制。

  第五个是“做”,比如说通过ZigBee或者Wifi实现设备的互联或者是控制。

图片3.png
 

      最后是“成长”,现在有大数据、深度学习、神经网络,比如说阿尔法狗到底怎么像人的思维能够深度学习,不断的学习,然后去挑战人类的极限。最后是神经网络,可能以后他真有情绪了,现在大家跟他做互动的时候,他会跟你聊天。我们上次有一个人说这个音响好像设计的不是特别好,里边突然传出来一个,你这样对我很不礼貌,这个就让人很有意思,感觉他有一些类似于人的思维,甚至是情感,他的语气也是很生气的,你这样对我不太礼貌,我们当时觉得很惊讶,在这个实验室里面,这个是我们拟人化的总结。

  基于以上这些点,那么用户心目中的人工智能,似乎可以分为人工智能和人工弱智。

  人工智能方面,比如说我想看最近很火的鹿晗演的那个古装剧,他就能够判断出来,那个剧的名字,已经搜索到择天记,因为择天记最近很热嘛,又是鹿晗的,所以就选出来。然后你再问,里边的女一号是谁?即刻有一个语音告诉你是古力娜扎,同时有一个弹窗,告诉你这个女一号哪一天出生的,哪儿毕业的,有一个简单的八卦背景,这个就能够把用户的需求说出来。举一个例子,我问他明天出门要不要带伞,他会说明天天气很好,不需要带伞。

  右边是人工弱智,你现在搜这样一句话,他搜不出来择天记,他说的是电影消息一网打尽。第二个你问他女一号是谁?他说院线消失我全知道。第三个你问他明天出门需要带伞吗?他会回答你,刚好出门遇大雨。所以这些东西也似乎好像跟问话有关联,但是不是答案,不是人类真正的答案,所以我们认为人类需要的可能是左边的,而不是需要右边的。

  联想电视的AI探索之路

  联想现阶段可以做的一些具体的工作,分别是什么?

  1、人机交互升级;

  2、服务创新;

  3、丰富产品形态;

  4、人工智能实验室;

  5、战略联盟;

  第一点,我们来看一下,在交互的方式上,我们觉得最重要的是化繁为简,为什么这样说?因为以前电视不智能,也很简单,大家用摇控器,特别是最早的时候播广播的时代,后来到了点播VOD时代,基本上用户用上下左右的摇控器还能应付。但是大家再想想今天的摇控器,它的复杂度会越来越高,这种复杂度如果用一个上下左右,很难想象它能应付,所以需要做很多新的交互。

  左边这两项是目前联想产品的一些基础交互,左上角是一个空鼠操控,不是上下左右的操控,空鼠操控很多厂家把它作为高端或者差异化的点,但是联想是唯一一家把空鼠摇控器做成标配,而且是最低那一款也是用的是空鼠摇控器。空鼠摇控器可能比传统摇控器贵十倍,因为里面有蓝牙、陀螺仪,还有很多算法,所以它的复杂度是很高的,这是第一个联想在交互上的基因,我们需要保留。

  我们内部叫三明治UI,当然各家有各家的特色,我们是把视频分成直播、广播和应用商店三大类,然后像三明治一样,三层,不断的左右滑动,很快你就能找到想看的区域,这个是联想的特色。

  除此之外我们有三个新的交互围绕人工智能展开,第一个我刚才讲过了,智能远场语音,能识别、能理解、能回应,无论近场还是远场。

  第二点,千人千面,怎么样个性化的推荐。刚才张院长提到了,我有同感,比如说用今日头条,他那个是千人千面了,但是你看长了就会烦了,因为他推给你的是你看过的,导致你错过了新的东西。所以人工智能不是要推荐你看过的东西,而是要理解你这个人,也就是你这个人的画像准不准?他要通过声纹技术知道你是男的、女的,知道你的地理位置,你在北京还是在一个县里,这些是很关键的,与你的消费行为是相关联的,基于这个我们觉得才能做新的千人千面,这个时候协同算法和以前的简单算法就不一样了,以前的算法是基于你曾经的行为,但是协同算法可能你还没看过这个片,但是已经知道你这个人什么样,你的同龄人或者同类人在看什么片子,他会推给你,这个就很关键。这个东西要比刚才说的更加有吸引力,像我们这种千人千面的路也是蛮长的,要不断优化和更新。

  因为现在的交互不是点完一个片看就可以了,而是要有新的互动,因为机器更加智能了。就像我们现在的手机,它给人反馈的信息非常多,你触控之后有大量的信息反馈。电视也是一项,随着人工智能的发展,它不光是被动给你推荐一个片子,它以后的信息非常多,比如说我们“联想乐窗”,它能够实现业内比较流行的边看边买,边看边查,边看边聊天,边看边猜球赛比分,像这些工作都会在人工智能基础之上,我们在交互上也同样让你有更大的想象空间。

  联想的服务有两大类,一类叫视频内容相关的,我们内部词叫VBS(Video Based Service),这是第一类。第一类是家庭相关的服务HBS(Home Based Service)。

  第一类是你看视频的时候跟你互动;第二类是根据你家庭的地址,他知道你在某个小区或哪栋楼,他跟周边的医疗、商超联动进行服务。这种购物不是简单把京东网页放上去,一定是边看边买,比如说你看到这个包特别漂亮,然后沉浸式的跟他交互,当然这个工作量很大,今天我们写上去很容易,但是做起来很难,我们还是要归类,逐渐分布式的来实施。

  第三点,更丰富的产品硬件形态。大家可以看到我们在做智能电视、电视盒子,包括激光电视,都在我们的规划里面。另外我们的投影仪已经在市场中卖了,它里面的内容都是一致的,交互也是一致的。所以像这种投影、电视、盒子、智能BAR,都会在我们后续的产品形态里不断推出。

  第四点是联想最近的一个动作,在2017年3月成立人工智能实验室,这个实验室在未来四年将有专项的12亿美金投入,这件事情是芮勇博士主力来推进的,芮勇是我们现在的CTU,以前曾是微软亚洲研究院的常务副院长,他的学科背景是人工智能的专家。

  除此之外实验室的具体负责人也是业内的一个大咖级的专家——德国人工智能研究中心的技术领袖级别的人物徐飞玉。公司搭建了这样一个平台,刚好我来的前两三天,我跟徐博士专门为电视开了个会,谈了我们的想法和需求,她特别感兴趣,她觉得整个公司应该在这块进行更大的投入,成立联合的项目组,把实验室的东西尽快的落地。

图片4.png
 

     最后,其实光靠联想自己肯定不够,这个是今年3月我们在南昌召开的65寸分体电视发布会上,我们做了一个大屏内容服务战略联盟,包括百度、思必驰这些公司都在我们联盟里面,这个联盟会不断的做成长。我们很开放,把这个平台开放出来,把电视这条线硬件上,更多的去孵化人工智能。同时我们又会基于视频这条线,X轴跟Y轴,X轴是电视,Y轴是视频。因为电视主推的是视频,所以我们这个团队核心工作还要做视频。但是在联想内部视频不是孤立在电视上,今年很重要的工作是要把PC、手机跟PAD,包括电视要打通,所以这也是一个巨大的工作。我们希望在人工智能上做成一个新的线索,能够串在电视跟视频这两个轴里边,使得整个业务有新的创新,然后给用户更加完美的体验。

  我总结一下,关键词是两个,联想电视和人工智能,在联想电视里边我谈到了现在联想会在电视上做更多的露出跟曝光,这是联想新的战略,所以以后大家经常看到我就不要太奇怪。

  第二点,人工智能,我们自己内部讨论完,提到了听、说、读、写、作和成长。同时我们的人工智能应该是什么样。

责任编辑:胡思佳
版权声明:凡来源标注有“流媒体网”字样的文章,版权均属流媒体网站,如需转载,请注明出处“流媒体网”。非本站出处的文章为本站转载,观点供业内参考,不代表本站观点。

相关新闻

{$Hits}