语音人工智能和交互革命，将终结APP？

移动场景革命下，声音为王，APP将终结。

文：转载自“董老师在硅谷”公众号

请看如下场景：

“Alexa，请为我播放Blake Shelton的Hillbilly Bone。”

“Siri，给Alex发个短信，告诉他我可能会晚点出席会议。”

我的iPhone屏幕已经快被50多款APP给挤满了，而当我完成以上这些对话时，我并没有打开其中的任何一款。于是，我开始思考：“移动应用作为独立交互终端的设计理念似乎已经过时了。”行业开始转向语音、自然语言、消息提醒、API以及对话交互等领域。这会对现在依赖于移动应用的商业模式产生巨大影响，也会改变人在未来设计和打造产品的方式。

在你觉得这有点不可思议之前，让我们先看看下面这些事实：

人们越来越难发现能够满足自己的移动应用或者功能。在苹果应用商店中有超过300万的应用，但是人们真正需要的却并不是某个应用或者功能那么简单。
智能手机用户每个设备平均会安装42个应用，但是他们90%的时间都花在其中9到10个应用中。
全球的软件公司每年都会花数十亿美元以刺激用户下载安装自己的应用并增加黏性，然而其中的25%，用户只会使用一次，而75%的用户会在安装的头3个月卸载软件。
移动手机的快速增长及其以应用软件为中心的模式与万维网恰恰相反，这其中并没有一个类似于PageRank的排名体系以搜索移动应用软件。
移动端的UI界面往往十分拥挤，这种主流的设计模式低效并且逐渐过时。
基于语音控制和人工智能技术的发展，应用和设备交互已经开始转向“无界面交互”。例如，在百度上已经有超过15%的指令是通过语音体系输入的。

这些趋势都在对移动产品和依赖于应用软件的商业模式产生影响。语音科技和人工智能取得的巨大进步让我们正经历一场人与科技的交互变革，及改变传统对于UI以及人机交互的理解。如苹果的Siri、Google Now、微软的Cortana、亚马逊的Echo、Google的Nest，以及Facebook M，你从中就可以看到这个趋势。

所有的这些成就引发了一系列的新问题：对话式交互会成为下一个风口吗？更重要的是，如果设备较终能够比我们更好地了解我们自己，将会发生些什么？

步入极简UI交互环境

让我们回顾下科技历史的一条重要线索：知识的传播和继承。知识的传播和继承经历了三次重大的范式演进：（过去）从人到人，（现在）从人到机器，（未来）从机器到机器。这是有史以来第一次，新知识的传播和继承脱离了人类。物联网、人工智能以及机器人科学的进步使得新知识和技能的传播和继承不再指向人类，而将直接从机器传播给机器（M2M）。

智能手机、联网轿车、可穿戴设备和摄像头等设备将会使人们以从未设想过的方式进行交流。Google Mind等虚拟现实及无人机等都只是全豹一斑。

对于科技的沉浸式体验大行其道，而软件应用作为终点的理念也不再重要。很快，与应用之间进行交互的主要界面也将超出应用本身。

我们正进入一个“应用即服务”的时代，软件应用日趋智能化，以用户意图为导向，可以搜集诸如位置、硬件传告、过去的使用历史等场景信息，并且能够进行预测性计算。它们会在我们需要的时候对我们进行回应，向我们呈现了与设备之间的新交互模式。

因此，用户和应用之间的交互正经历巨大的范式变革，而下面的因素是这些变化的主要助力：

新的方向——情景、对话与Human UI

由于在移动终端平台上通讯类软件应用要比其它应用使用率更高，充分利用NLP（自然语言处理）正在成为一种潮流，而会话机器人和对话式UI的崛起正是其中的典型代表。对话式UI内部搭载的是综合智能系统而不是像微信、MSN这样的短信APP。

这种转变的原因很简单：人类天性。对话界面可以让用户在电子和现实世界都能依靠自然对话提出问题，接收答案，甚至是完成很复杂的任务。人类天生就会自我调整以和他人对话。这是我们分享信息和情感以及自我规划的方式，语言则是人类千百年来存在的基础之一。

中国和一些东南亚国家的用户会使用微信或者支付宝等来订车票、电影票、查询航班和进行支付等，这些都佐证了我之前所说的几点：“注意力经济”的未来，在对话和语音基础上，通讯、支付、还有商业平台将会成为主流，音乐和娱乐也不可小觑。

这些应用程序不适用传统的用户界面作为交互方式。相反，整个APP都围绕单一的消息屏幕来设计，所以，他们是所谓的“无界面”或者“对话”式应用程序。这些APP都支持一系列不同功能，从银行账户查询、安排会议、预定餐厅到旅行助理，但是他们都有一个共同点：信息是交互的核心。

不论是Facebook和MSN还是微信，这些代表性的通讯类APP都在快速转型成为一种全能平台，能够让用户进行购买产品和服务、支付、商务洽谈等活动，从而在这些平台内集合了所有的情境和交易。

另一个需要注意的方面是，“场景”变得越来越重要。以户外出行场景为例，听音乐就是用户对他们所在场景的有机延伸。我们本来是要根据所在的场景寻找音乐的，但现在“点播”和“购买”会随之出现。在这个方向上很重要的一步跨越就是较近FB和Uber的合作，现在我们可以在通讯APP上使用Uber打车了。

我们在对话交互中看到了很多这样的趋势，像Operator和Majic这样的公司都是领头羊，他们设计的产品可以让用户直接与产品产生丰富的交互体验。

发展对话式交互，这是一个新的开始，它明白UI并不只是UI，他更是让用户能够接触到多种产品的一个脚手架，这又引入了我们的下一个关键趋势。

人工智能技术发展让“无界面交互”终结显示屏时代

我们真的处于Zero UI的时代吗？“不完全是，但我们很接近了。”

Fjord的集团董事Andy Goodman创造了“Zero UI”这个词，并且给了它这样的定义：当我们的交互界面不再被显示屏束缚，而是变成了触觉的、自动化的、融入环境的交互界面时，一种与之相适应新的设计范式就应运而生了。

Zero UI 的意思是通过清除人与设备之间的障碍，借助科技达到无缝的交互。典型的例子比如我们直接通过触屏或者不直接的远程控制进行与设备的交互活动。然而，Zero UI更是一种与将人与设备进一步融合的推动力，比如Amazon Echo中的无触碰技术。

这些年，计算和AI领域里有关计算机理解和使用人类语言的方面，即自然语言处理上迈进了一大步。第一次将科幻小说的内容，在机器学习和语音控制领域有了实现，这使得语音交互更加成为可能，而且这也让人类和设备之间的交流更加容易。

如FB推出了私人“智能助理”M，与MSN结合来帮助用户做各种事情，Alexa、微软小冰、百度也是。中国一些新兴的硬件公司，比如家庭机器人Rokid、智能手表TicWatch、VINCI智能头机等都在研发基于特定场景的“智能助理”，并试图将某些垂直的生活服务整合进去，比如音乐和电台订阅、通信、导航等等。

所有的一切都是为了用更自然的方式进行人机交互：声控和人工智能、触控，以及机器视觉。

也许下次你会说：“Alexa，帮我买Taylor Swift的新单曲，用VISA卡！”