“想法迷宫”指的是一张地图,上面有新兴企业在有限的空间内需要做的所有关键决策和权衡:

一个优秀的公司创始人能够预料出公司走的每一步是通向成功还是失败,而平庸的创始人只会集中力量于电影、音乐、文件分享、P2P或是照片共享这些事,从来不知道产业的历史、迷宫中的玩家、过去的伤亡人数以及能够消除隔阂、改变思想的科技。– Balaji Srinivasan,负责市场调查、现况构图和设计。

我认为以自己感兴趣的领域中的一个想法迷宫为例很是有趣,即人工智能领域的新兴公司。以下是这座迷宫的简图。我在这里详细解释了每一步。

给人工智能领域新兴企业的一张“想法迷宫”

准确度达80%-90%的最小化可行产品。人工智能领域有句老话:“人工智能能够在一定程度上为任何问题提供解决方案。”对大部分问题而言,建立准确度80%-90%的模型相对容易。之后时间、资金、脑力、数据等的回报急速减少。简单来说,你会花几个月的时间完成前面80%,剩下的20%需要花费的时间可能是几年,可能是一辈子。顺便说一句,这就是为什么你看到自动驾驶汽车的部分模型时感到收获不多的原因——你要看的应该是剩下的10%-20%的极端情况,比如一条狗在光线不佳的情况下突然跳到车前的时候。

走到迷宫的这步,你会有一个选择。你可以1)把准确度提升至100%。或2)即使准确度有限,但仍然制作一个有用的产品。可以通过创造一个叫做“误差容忍用户体验”来实现这一点。

“创立一个误差容忍的用户体验环境。”比如IOS的自动纠正系统,以及在谷歌搜索时的自动提问“你要寻找的是不是X?”也可以说谷歌搜索本身就是误差容忍的用户体验:搜索时,谷歌会显示10个链接,并非直接出现热门搜索结果。这就使机器出现排序错误时人类得以驾驭机器之上。建立误差容忍的用户体验并非是一种失败,而是反映了不同的产品需求。值得一提的是,人类和机器合作时潜在因素非常重要,总体会影响到技术架构。

好了,下面我们假设你想要100%的准确度。如何到达这一步?通过计算不可能完成最后的10%-20%,能够完成最后的这步需要更多的数据来构建你的模型。数据是人工智能的关键是因为:1)数据是缺失成分。我们拥有很棒的算法,现在也拥有无穷无尽的计算资源。但是2)算法是研究界的共享资源。公共数据总体而言并不精确,而详尽的数据根本不存在,又或者只为个人所有。

“缩小范围。”你需要的数据量和你想解决问题的宽度相关联。所以在你开始收集数据前,你应当缩小范围。不要试图制造一个万能机器人,你应该制造一个只帮助人设定会议时间的机器人。不要构建一个能预测所有事情的云服务,建立一个能够预测欺诈性交易的云服务。以此类推。

“进一步缩小范围。”你缩小范围后,再进一步缩小范围!即使你的目标是建立X,有时你需要建立的只是X的一部分,这才是最终创造X的最佳方法。我建议一直缩小范围直到不能再缩小为止,但不能让产品范围缩小到没人愿意使用。这样做因为虽然你在不断缩小范围,但将来总是可以再将范围扩大的。

“如何获取数据?”广义来讲有两种方法:自己开发数据或把数据众包。谷歌地图和Waze之间的对比非常明显。谷歌雇佣了上千人实地绘制道路、大楼和交通地图。Waze想出了让几百万的人替它做这件事的办法。如果想用谷歌的方法,你需要很多的资金,几亿到几十亿美元不等。这对试生产阶段的新兴公司而言完全不可行。

新兴企业获取数据的方法就只剩两种:1)从公共资源获取。2)尝试获取群众帮助。

最常见的方法有:1)查询网络,或像维基百科这种大网站。你或许会说这就是谷歌搜索用的方法,即利用链接作为搜索排名的信号。许多公司都试着开发维基百科,但据我所知,这种方法收获颇少。

对新兴公司而言最可行的方法就是众包数据。这就可以把复杂过程简化,只需设计出一种服务,鼓励用户回馈信息提升系统体验。制造群众外包产品就是唯一要做的事。但我会提供一种去年投资的一家网站Wit.ai曾试过的方法。Wit的想法是为开发者开发语音识别和自然语言处理提供服务。V1.0系统语音回答基本正确,但并非屡试不爽。但是该系统还提供了一个仪表盘和应用程序界面,开发者可纠正错误并提高准确率。对于能够使用这项免费服务的开发者来说,他们的改进可以得到回馈以提升整体系统功能。Facebook收购了Wit成为了更大的公司,它们的命运从此息息相关。Wit采取的方法非常机智,其他人工智能领域也可使用。

这就是我对人工智能新兴企业想法迷宫的大致观点。有几个要提醒你的地方:1)我也许有错误之处,抑或忽视了迷宫中的其他路径。想法迷宫是为了提供帮助,不是绝对真理。2)正如Balaji所说,科技进步能够“消除隔阂、改变思维”。特别要注意新兴的基础设施科技,如互联网、智能手机、云计算、比特币等等,它们能在许多不同的想法迷宫中开辟新道路,即使这些路径开始看起来毫不相关。

(编辑:Zoey)