今年8月,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会(简称GAIR)”。届时雷锋网(公众号:雷锋网)将发布“人工智能&机器人Top25创新企业榜”榜单。目前,我们正在拜访人工智能、机器人领域的相关公司,从中筛选最终入选榜单的公司名单。如果你也想加入我们的榜单之中,请联系:2020@leiphone.com

作为世界上最大的视频平台,YouTube 每天都会新增来自世界各地的数百万个视频。这些视频具有非常大的多样性,对 YouTube 来说,要将这些不同的视频和相关的音频都转换成人们可以接受的播放质量是一个相当大的挑战。此外,尽管谷歌的计算和存储资源非常庞大,但也总归是有限的,要以上传视频的原格式存储网络视频无疑会带来显著的额外成本。

为了提高网络视频的播放质量,关键是要降低视频和音频的压缩损失。增加比特率是一种方法,但同时那也需要更强大的网络连接和更高的带宽。而 YouTube 则选择了另一种更聪明的做法:通过优化视频处理的参数使其在满足最低视频质量标准的同时不会增加额外的比特率和计算周期。

要在视频压缩和转码时满足视频质量、比特率和计算周期的要求,一般的做法是寻找对大量视频(而非所有视频)平均最优的转码参数组合。这种最优组合可以通过尝试每种可能来寻找,直到找到最让人满意的结果。而最近,有一些公司甚至尝试在每一段视频上都使用这种“穷举搜索”的方式来调整参数。
YouTube 通过在这一技术的基础上引入机器学习而开发出了一种新的自动调整参数的方法。目前,这一技术已经在提升 YouTube 和 Google Play视频影片的质量上得到了应用。

并行处理的优劣

据 YouTube 的博客介绍,每分钟都有 400 小时的视频被上传到 YouTube 上。而其中每个视频都需要被不同的转码器转码成几种不同的格式,以便可以在不同的设备上进行播放。为了提高转码速度,让用户更快看到视频,YouTube 将上传的每一个文件都切割成被称为“数据块(chunk)”的片段,然后再将其每一块都独立地在谷歌云计算基础设施的 CPU 中同时进行并行处理。在这一过程中所涉及到分块和重组是 YouTube 的视频转码中的一大难题。而除了重组转码后数据块的机制,保持每一段转码后的视频的质量也是一个挑战。这是因为为了尽可能快地处理,这些数据块之间不会有重叠,而且它们会被切割得非常小——每段只有几秒钟。所以并行处理有提升速度和降低延迟的优势,但它也有劣势:缺失了前后临近视频块的信息,也因此难以保证每个视频块在被处理后都具有看上去相同的质量。小数据块不会给编码器太多时间使其进入一个稳定的状态,所以每一个编码器在处理每一个数据块上都略有不同。

智能并行处理

为了得到稳定的质量,可以在编码器之间沟通同一视频中不同分块的信息,这样每一个编码器都可以根据其处理块的前后块进行调整。但这样做会导致进程间通信的增加,从而提高整个系统的复杂度,并在每一个数据块的处理中都要求额外的迭代。

但“其实,事实上我们在工程方面都很固执,我们想知道我们能将‘不要让数据块彼此通信’的想法推进多远。”YouTube 博客说。

下面的曲线图展示了来自一段使用 H.264 作为编解码器的 720p 视频的两个数据块的峰值信噪比(PSNR,单位:dB每帧)。PSNR值越高,意味着图片(视频每帧)的质量越高;反之则图片质量越低。可以看到每段视频开始时的质量非常不同于结束时的质量。这不仅在平均质量上没有达到我们的要求,这样剧烈的质量变化也会导致恼人的搏动伪影(pulsing artifact)。

机器学习如何帮助Youtube 实现高效转码?

机器学习如何帮助Youtube 实现高效转码?

renyonggang 17


图片来源: Corporate-IR

编者注:Kevin Krewell是Tirias研究机构首席分析师,并为《福布斯》杂志供稿。他在电子产品行业有数十年经验,在大学期间的Intel 4040起便参与微处理器实践工作,1999年加入《微处理器报告》成为科技分析师,曾在NVIDIA公司工作五年,关注数字产品的技术、设计、市场及研究。

 

无人车技术听起来非常遥远,但是最近频繁地出现在新闻上,让你感觉这项远在天边的技术也许就近在眼前了。你的感觉没错。本周,在美国奥斯汀举行的FTF技术论坛上,使用NXP部件的技术不仅进行了展示,而且已经出货。

无人车一直被当做一项奢侈品技术,但实际上这是一项重要的安全技术,每年可以拯救几千人生命。NXP引用了一项2015年的NHTSA报道(Nass国家机动设备车祸伤亡调研),称94%的道路交通意外是由司机的技能不足或出现失误而引起的。如果使用自动驾驶技术控制车辆,能够管理车辆运行、预防事故情况,这样许多事故都可以避免。要达到这样的及自动驾驶水平,额外的传感器和更强的处理能力是必须的。许多公司都在努力研发这项技术,而NXP的自动驾驶平台已经准备好上路了。

在FTF论坛,NXP的系统演示融入了公司的BlueBox中央计算引擎,专为自动驾驶设备而设计。BlueBox结合了雷达、LIDAR(激光探测与测量)、视觉传感以及车联网(Vehicle to Everything, V2X)系统,将车辆周围的情景进行建模,做出安全决策,从而保护车辆及乘客。所有的计算元素都使用了量产或样本的NXP硅,让系统做好了上路准备。

远在天边、近在眼前,人工智能安全无人车不是梦

远在天边、近在眼前,人工智能安全无人车不是梦

renyonggang 15

Google新的语音助手叫Google Assistant,可以看作是Google Now的升级版。Google Assistant的直接竞争对手是Apple的Siri、Amazon的Alexa、MS的Cortana以及Facebook的M;但差别可能在于它是所有大厂里搜索做得最好的一家。

在Google Now的基础上,Google Assistant一个明显的升级是对语境的理解。用户可以提出一个问题,再追问一堆问题;Google Assistant会把对话解析,理解语境,再返回正确的答案。比如你问XX电影的导演是谁,他还拍过哪些片子?

过去Google Now主要出现在手机和PC上,Google Assistant则开始融入各种设备——Google Home便是音箱版的Google Assistant,Allo便是聊天机器人版的Google Assistant。

Google Home

Google Home的体积比成人手掌略大一点,它的顶部是一个斜面,底部是若干随着音乐舞动的LED,内部则是一枚音箱。Google Home就是冲着Amazon Echo来的。

虚拟助手、Daydream VR、AI与机器学习:Google的当下和未来

虚拟助手、Daydream VR、AI与机器学习:Google的当下和未来

renyonggang 12

图片来源:GETTY IMAGES/ISTOCKPHOTO

Giannandrea 的这句话,和常见的人工智能寒冬论恰好对立,寒冬论认为,目前人工智能的研究进展已趋于停滞。 

在本周五举行的谷歌 I/O 全球开发者大会中,Giannandrea 宣布加入谷歌,成为高级副总裁(SVP),领导 Aparna Chennapragada 的产品部门以及 Jeffrey Dean 的谷歌大脑,并在会上聊了聊机器学习及人工智能将如何改善现有产品。

谷歌机器学习高管:现在是人工智能的春天

谷歌机器学习高管:现在是人工智能的春天

renyonggang 13

机器人——这个词是不是每天都会出现在你的科技新闻推送中?从Facebook的机器人开发平台、到微软的机器人框架、到Taco Bell的Slack机器人。新闻也没法免疫。例如Quartz和Purple等平台都使用了机器人,使用了移动APP和短信界面来为新闻增添聊天一样自然的体验,而CNN的机器人会直接通过Facebook Messenger来给你发送定制化新闻。

机器人的诱惑力在于,新闻消费者可以以聊天一样的方式与其互动。但是,要自己打造机器人——这对于新闻媒体机构(以及所有非科技公司)来说,感觉都太惊悚了,不知道从哪儿入手。

此时你需要Wit.ai。它是一个很好的工具,可以帮你快速打造可以与人聊天的APP。它将所有复杂的细节都隐藏,所以你只要专心打造能用的东西就好,不需要自己动手去学习、编写世界上最尖端的机器学习和自然语言处理软件。

那么问题来了,用Wit.ai自己DIY一个聊天机器人,一共分几步?

1、  项目设立

首先,你需要设立机器人的基本架构。从我的经验来看,要利用Node.js和Express设立一个简单可用的Messenger机器人,可以去查看Facebook的“开始”(Getting Started)文档,非常有用。点击链接可以看到Github教程,例子中有一个完全可用的代码。如果你想用Python来打造自己的机器人,可以点击链接使用这个Flask例子。还有很多非常有料的Slack机器人教程,例如Scotch.io上面,点击链接看看如何用Node.js打造Slack机器人。是不是有非常多的干货?

这样,你就有了设立机器人的代码,你只要好好利用,让Facebook或者Slack可以与之互动就行。用Heroke来利用代码是一个比较方便的办法,传送门在此。

2、  在Wit.ai上启动APP

现在,我们就该进入Wit.ai了。首先创建一个账号,然后创建一个新申请。 干货 | DIY一个聊天机器人,一共分几步?

干货

renyonggang 11

量子计算,可商用化之路还有多远? | 亿欧问答

量子计算,可商用化之路还有多远? | 亿欧问答

renyonggang 9

慧川智能康洪文:AI云视频制作,将颠覆视频制作商业模式

慧川智能康洪文:AI云视频制作,将颠覆视频制作商业模式

renyonggang 12