李志飞少谈算法,多想想AI商业落地

来源 :南方人物周刊 | 被引量 : 0次 | 上传用户:xiehao2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一谈到AI,大伙儿好像就很难坐在一块儿好好说话了——
  去年还是暴热的话题,投资人打破了头想要进场,转眼间算法红利时代已经宣告终结,媒体预警AI创业者将遭遇资本寒冬,计算机视觉和 AI 领域专家 Filip Piekniewski也发出了《AI Winter is Well on its Way》的推文……
  “今天把你捧到天上,明天把你扔到地上,”出门问问创始人兼CEO李志飞笑着摇头,他说这种180度大反转的剧情适合出现在电视剧里,对于公众建立“正确的科技观”却没有半点儿帮助,“正确的科技观是你要知道科技的边界,建立正确的认知。”
  与大多数国内一线AI企业在To B生意中隐姓埋名不同,估值达到10亿美金的出门问问,几乎所有收入都来自直接面对用户的消费电子产品,这些看得见摸得着用得上的AI产品包括智能手表、智能音箱、智能耳机与智能后视镜。
  “我们既不是硬件公司,也不是纯粹的软件公司,在AI企业里是独一无二的。”资本市场青睐这只特立独行的“独角兽”,C轮他们曾获谷歌数千万美元的融资,去年4月初得到大众汽车(中国)集团 1.8 亿美元独家 D 轮融资。
  今年5月出门问问推出了与杭州国芯科技合作开发的AI 语音芯片模组“问芯”,这款已经可以量产的AI芯片模组直接面向智能电视、机顶盒、机器人等企业级市场。
  两次人机大战,AI热潮无远弗届时,李志飞格外冷静,谢绝了各种峰会,专注于产品升级。去年接受本刊采访时他表示,“今天的AI还是非常基础的,”那时他就担心AI被玄虚空谈和市场虚火所误,“我们还是踏踏实实用它来解决一些具体问题吧,如果AI技术能够给社会带来价值,也许人们会对它有一个更正向的认识。”
  今年春天“人工智能衰退论”初起时,他却以AI独角兽企业创始人的身份多次站到台前,“不是为自己的产品做广告,是布道”——
  “AI到底用在什么地方?商业化怎样能够形成一个正向循环?一个科技公司如何才能在发展中越来越关注科技本身?”
  “我不是口才很好的人,但我愿意毫无保留地分享自己的思考,”所有表述的核心只有一个指向,“set up正确的认知。”

算法不能当饭吃


  李志飞算得上是国内AI创业的先行者,2012年他从硅谷回到北京,除了霍普金斯博士头衔和谷歌总部工程师的履历,“(产品、商业模式)什么都没有,红杉就给了我一千万。”
  “红杉还有徐小平老师的真格基金早期投我的时候,人工智能还不是一个热词,我也只能告诉他们,我看到了一座美丽的山峰,云雾缭绕,如果登临,一定有绝美的风景。但是怎么到达哪里、用什么交通工具、有哪几条可以走通的路径,其实我也是不知道的。”
  他所说的“美丽山峰”,正是人工智能的重要研究领域语音识别和自然语言处理的“技术落地”。
  “AI是个技术,不是产品,就像灵魂需要肉身一样,AI也需要找到自己可以施展的场景,找到了合适的场景,就是‘灵魂附体’。找不到,则只能是一个飘荡的‘无脚鸟’。”
  洪泰基金副总裁宋楠在接受“钛媒体”专访时表示今年投资标的“已经从算法转向了应用”,他提醒人工智能领域的创业者“少谈算法,多接地气”,“算法、算力上的技术优势反馈到客户那里,可能会有3%-5%准确率的差别,但这种差异很难去做一个定量的横向比较。AI 公司去拿单的一个核心因素是商业的服务能力。而在实际的项目落地层面,客户真正需要的,与 AI 行业讲究的所谓高大上的算法、豪华的团队又完全不是一回事。”
  李志飞毫不讳言自己当年正是因手握高大上的算法而获得资本青睐,但“算法只是起点,是一块敲门砖,快速把它商业化,至少能看到一个朝向正向循环的过程,从创业第一天(我)就是这样想的。”
  以语音识别技术为核心来“定义下一代人机交互”是他的雄心和愿景,五年多的“地推”经验让他感慨,说话看起来是最自然最轻松的交互方式,但实际上“让人开口其实很难”。
  “刚需加私密,才是语音交互能够获得价值的地方。”
  外界认为出门问问的产品线过于分散复杂,他也在新品发布会上笑言,“五年多来我们智能手表竟然累计做了十多个单品,但我们真的不是一家表厂。”所有的产品都只有一个企图,就是抓住语音交互的真场景——车里、家里、路上,“我们做过很多尝试,只有这三个场景才是‘刚需加私密’。”
  2012年我刚回国的时候,主要精力投入在算法的研发。因为我以前是做自然语言处理和机器翻译的,对非常复杂的算法很了解,所以花了 8 个月就做到了端到端的语音交互,完成了AI技术积累。
  为了尽快实现商业化,2013年我就用研发出来的语音交互算法做了微信公众号“出门问问”,也做了手机上面的语音助手。但是这些东西没有形成闭环,因为没有用户量,也没有任何营收。
  后来才理解到手机上的语音交互其实是很难火起来的,因为用户习惯已经在那里了,一个公司很难改变,在这个问题上我们不要太狂妄,即便是Apple也很难。
  语音交互真的只是交互方式之一,要么就是在比較偏垂直的场景,要么就是偏年轻一代的人群,只有通过这两种方式才能慢慢地把语音交互变成主流交互方式之一,只是之一,不是唯一甚至不一定是最主要的。
  我们一直在找各种应用场景,手机上的语音交互没有黏性,我们又做了谷歌眼镜上面的语音交互,那个有黏性,但是这个设备本身没有流行起来。
  2015年决定做智能手表,当时有人说你一个高大上的算法公司做这个干吗呀?这简直是跪着都不能挣钱。
  一个独立的AI企业要想存活下来,就应该在算法的基础上,尽早找到可以掌控的场景,建立技术、产品、商业的闭环,然后在更大的规模上循环、迭代。   今天的现实主义是为了支撑明天的理想主义。一个算法到商业化,中间有很长的路,你把90%资源都投在AI研发上,不商业化的话,你可能明天就挂掉了!

抵制情怀和虚幻的情绪


  2015年,出门问问开始做智能手表,“物理世界太复杂了”,李志飞跟同事到南方跑工厂,“先不谈智能不智能,那个产品本身就非常粗糙,我们还需要在上面运行软件,你可以想象一下那种绝望。”“创新可能未必是那些科幻小说里写的天马行空的东西,而是从很小但对用户而言是实用的方面踏实累积起来的东西。”李志飞说。手表电量少、体积小、天线难做,在手机中易于加入的3G、NFC、GPS等模块在手表中极难加入。“技术的突破有很多层次,有的是在特别底层算法的突破,有的是把算法去变成一个产品,或者变成一个工具。我们更多还是在这个第二层。”
  借着Apple Watch对智能手表市场的开启和引领,出门问问推出的智能手表Ticwatch,销量迅速达到了 30 万台,占据了 30% 的市场份额,第一次实现了技术、产品、商业的闭环。“交互方式的领航者我觉得还是苹果,我们不要太狂妄。Apple watch出来,对整个市场的教育是比较大的。所以那个时候我们去选择智能手表这样的设备,既符合我们推广语音交互的初衷,也看到这个市场是一个可以规模化的场景。”
  2016年,在软硬件能力、供应链管理、商业推广和营销能力都大大提升之后,他们又逐步推出了车载、家居、耳机,覆盖更多场景,在更大的规模上循环、迭代。
  现在智能手表仍然是他们的主力产品,海外市场占到一半,2018年全球销售目标为100万只。
  今年公司目标营收为10亿,李志飞表示如果顺利达到目标,公司就可以实现盈亏平衡,“在AI公司里,这个营收规模可以排到前几位。看第一、第二季度的数据,是可以达到这个目标的,第三、第四季度会更好,对于海外市场来说,是消费电子的旺季。”
  对于外界传言的“钱荒”,李志飞很平静,“反正我们目前不缺钱。”“其实一个AI公司要死也没那么容易,少养几个工程师就行了。但是一个公司如果不发展,跟死亡没有区别。”
  大家都认为你一个算法公司做智能手表不是一条正确的路,但如果你自己能够认清楚本质,你知道未来大概会怎么演化,就可以做出自己的决定。
  在某一个阶段我可以不去关注学术,我可以不关注这个AI在产品里的实现。因为我知道如果明天我的商业化很成功,我要做AI我转身就来啊!这个过程就是理想跟现实的一个平衡。我一直说我没有算法迷信,一直以来我考虑最多的是商业化。
  我们公司是一个技术型公司,我的所有诉求还是希望通过一个很牛的技术或者产品去占领市场。我不喜欢讲情怀,而且我特别反感讲情怀。每次新产品发布会我一定要求做DEMO,让大家真正看到产品,而不是打一句话喊口号。
  现在传播渠道太发达,特别容易煽动大众的情绪,比如说区块链的时候,大家天天关注,我也研究了一个星期,沉浸在其中,放大自己的想象,觉得这个世界已经变了,或者说马上就会完全不一样了。
  但是某一天我下楼,到街上一看,发现这个世界没有任何变化。这种虚拟的情绪特别容易放大,因为它不需要经过物理世界的碰撞跟检验,就脑海里面不停不停地想。
  在混沌大学讲课时我在现场做了一个调查,我说,“三年前每天或者每周用过一次语音的举手”,很少,只有一两个人。我又问,“今年,每个星期用过一次语音的举手”,现场有1/3的人举手。这么短短的一两年变化很大,AI变得让更多人能够真切感受到了。
  我也很开心AI业界今年发生了变化,无论是各种论坛还是媒体都开始讲场景了,现在大家关心你有多少营收,你在这个场景里边到底怎么做,你主要应用在什么地方?
  在这之前的话,还都在拜神阶段,什么深度学习三巨头,什么你的算法多牛,赢了什么比赛,发了什么论文,有几个大牛科学家。以前大部分是讲那些东西。
  可能我早就已经move on了,特别不喜欢听那些虚空的东西。我也从来不相信什么五分钟之内在电梯里搞定融资这样的神话,那种论坛我很少参加,如果大家在一起没有认真地分享跟讨论,就看谁的口才好,谁的煽动性强,没有意义。
  哪个企业的商业化不复杂?这本来就不是简单的事情,我愿意拿出两、三个小时分享我们的逻辑。今年大家回到场景,来寻找场景,会发现你的场景都是别人掌握的。所以我上次在混沌大学分享时最核心的观点就是“AI商业化的关键是找到可掌控的规模化场景”。

硅谷三年改变我最多


  不爱拿算法说事儿,不代表在技术的护城河上吝于投入。出门问问70%的费用投入在研发上,其中核心算法占到了三分之一。对于一个商业模式偏消费电子的企业来说,绝对称得上是高配比。
  高投入获得的AI技术能力在To B中得到了充分的价值释放,巨头都在争夺的AI 汽车市场,出门问问已跻身其中,他们的语音交互系统已经进入了大众汽车的前装,“这里面是大量的算法研究跟裁剪优化,端到端能够进行互联网检索,并且要充分考虑到汽车使用时的实景,开车过程中可能会信号不好了,没有网络了,你所有的算法可能都要直接在本地设备上就能够跑。”
  “外资汽车出于安全性和品牌的保证,标准比较严格,我们能够达到标准,这是过去一年非常重要的突破。”
  李志飞预言未来一两年智能家居市场将会爆发增长,他拿出一个美国生产的智能灯泡,“你看在美国,这种灯泡、插座全都可以通过语音控制,只要芯片能够做得足够便宜,电视机、空调、洗衣机……家里绝大部分设备都会语音化。”
  在产品覆盖到了自己所能想到的核心场景之后,他还是会常常问自己,“AI到底用在什么地方?”
  当初跟早期投资者描绘的那座美丽山峰,经过五年多的探寻,“雾已经慢慢散了”,“现在已经看得清楚语音交互其实就那么几个场景,别想得天花乱坠。上山就是有这么几条路,旁边有什么障碍,也都比较清晰了,你要做的事就是克服这些障碍,在过程中有老虎、有野兽什么的,就得把它干掉。”
  在整个AI产业商业规模还偏小的当下,李志飞能做的是尽量不错过“明显属于我们的机会”,但他也还是有不安,担心某一个天才人物在自己的盲区里破局。“AI是一个基础技术,它的应用有可能在这儿,有可能在那儿。现在没有一个人能够突破全局,可能真的有一个很creative的人出现,他可能突然之间就找到了一个很牛的变现方式,那他就成了,我们就输了。”
  我觉得我们做公司,肯定要做正确的事情,要认这个对错,但我们也还是要争输赢。
  我最大的改变是在Google工作的那几年。以前我是特别偏学术的,我的论文就是我们那个领域能看懂的也没几个。但是在硅谷不到三年的时间,给我的认知,不是说它早期的算法有多牛,其实它最强大的还是有一个特别牛的商业模式,使得每天就是全公司放假,钱都可以照样进来,就跟印钞机一样,这样它才可以去正向地滚动起来。
  他们早期做搜索引擎,产生了一个特别好的商业模式,然后可以做无人驾驶、基因监测、机器人……做各种各样的东西。
  拉里·佩奇(谷歌聯合创始人)经常给我们讲尼古拉·特斯拉的故事,这个人跟爱迪生齐名的,一生独立开发并取得专利700种,合作开发的专利1000种以上,绝对的科学狂人、科学强人,最后却死于贫穷。
  拉里·佩奇自己也是斯坦福的博士,他一直讲这个故事,这个对我印象特别深刻,他一直强调我们做学术的一定要避免那个悲剧。
  做科研出身的,如果创业,你不要过于痴迷自己那个东西,要想着怎么把它商业化,形成一个正向循环,还是那句话,你今天的实用主义、现实主义就是为了明天的理想主义。
  (实习记者凌晨亦有贡献)
  李志飞
  语音搜索应用“出门问问”创始人兼CEO。美国约翰·霍普金斯大学计算机系博士,前Google总部科学家,自然语言处理及人工智能专家,世界主流机器翻译开源软件Joshua主要开发者。
其他文献
追求廉价产品,是这个国度历来的传统  印度人莫希特·戈埃尔最近陷入了麻烦。2月23日晚,他因涉嫌欺诈、伪造等罪名被印度警方逮捕。他是手机制造商响铃公司的前总经理,一家分销商亚杨公司状告其收款后不如数发货。  亚杨在2015年11月向响铃公司预付了300万卢比(约30万元人民币),在数次提醒对方发货后,获得总价值130万卢比(约13万元人民币)的手机。警方发言人说,类似亚杨公司的指控,在其他地方也有
“薛教授!”  电梯门打开,迎面走来一位年轻人,他认出了正要进电梯的薛兆丰。  薛兆丰愣了一下,随即反应过来。因为正在热播的《奇葩说》,他在街头巷尾的辨识度大幅提升,成为年轻人喜欢谈论的明星教授。  观众逐渐接受了他不懂娱乐圈、不煽情、不讨好的形象。而在薛兆丰与蔡康永关于“是否赞成实现知识全部无偿共享”的辩论中,他们更是看到了薛兆丰身上的理性和思想。许多观众留言,说这场经济学教授与综艺天王的理性与
8月13日,埃及吉萨市Boulaq El-Dakrour街區,房屋顶上装满了卫星电视接收器。
女儿啾啾满周岁时,她拥有的玩具已经超过了她爸妈从小到大所有玩具的总和。  小孩玩具难买,首先必须安全。有小零件不可,会误吞。有尖锐突出不可,会扎伤。有绳圈不可,会缠绕窒息。相关新闻每条都像深夜恐怖故事:从前有个小朋友爱啃喷漆玩具,铅中毒了!有个小朋友吞了玩具磁铁,肠穿孔了!有个小朋友拿着氢气球,遇到明火爆炸了!有个小朋友爱玩模型车,跌了一跤,天线插进了眼球!还有些小朋友吃了纽扣电池/成分是硼砂的“
【美】《纽约客》12月17日  人脸识别与指纹识别和虹膜识别的一个根本不同在于,后两种技术需要和已经保存下来的属于某个人的指纹或虹膜进行比对才能做出判断,人脸识别则不需要,它会自动搜索并拍摄用户的人脸图像,因此可以进行远程监控。执法部门可以通过在示威现场拍下的影像识别参与者,雇主可以通过电梯摄像头拍下的雇员身体的轻微颤动识别他的健康状况,这些都牵涉到个人隐私,而这些个人信息属于谁?该如何保管?目前
每到法定长假的时候,都可以在微博或者微信朋友圈里,看到各大景点出现人山人海的状况。  以前碰到这种情况,我都非常想不明白:游客在出发之前,肯定知道假期的景区就是这副模样,为何还要主动来受这等苦?  直至今日,我自己依然不喜欢在假期里去逛景点,但总算觉得能够理解这些旅客了。他们并不是傻瓜,在这种自愿吃苦的行为背后,有一个符合人性的地方,那就是:年纪越大,越要亲近山水。  那些汹涌的游客,表面上是逛景
首先让我感兴趣的是戏中戏的结构。  一对伊朗演员夫妇,在片中演了一出家喻户晓的美国戏剧,仅此而已。没有推销员,也没有推销员之死,更没有人们期待的平行叙事。  那为什么要把这两个异质元素搭在一起呢?  “当今的媒体都试图呈现我们彼此之间的不同和隔膜。但是我相信,我们之间的相同之处远远多于差异。”导演阿斯哈·法哈蒂在回答西方记者提问时这样说,“表面看来,《推销员之死》是一部关于推销员的戏剧,但是它已经
3月22日发生在英国议会大厦外的恐怖袭击事件让许多英国人感叹,“恐怖主义的靴子终于在英国落地了。”袭击发生时,我碰巧在伦敦市中心的英国议会大厦内采访。    下午两点四十分左右,議会内部的电视屏幕突然显示一行红色的滚动提示:“议会外有安全事件发生,议会暂时休会。”几乎同时,手机上开始推送“议会外发生枪击事件”的消息。  所有记者都开始往编辑部打电话,口述消息,并不断询问身边的议会工作人员:“发生了
“别看他被叫作‘恐怖伊恩’,他的人可一点也不黑暗。”在北京的一场活动开始前,伊恩·麦克尤恩的妻子安娜莉娜·麦卡菲冲着丈夫做了个鬼脸,回过头来对我说。此时,麦克尤恩在长桌的另一头签完了一摞新书,正带着友好的表情用牙齿撕拉肉串。那是主办方为他们准备的特色午餐。安娜莉娜瞄上了丈夫手边的面条,麦克尤恩马上把那碗面端了过来。  五天后,面对读者提问,麦克尤恩发出自嘲般的反问:“我写了那么多有趣的笑话,好像很
你很难去定义一个典型的中国式创业者,因为在人和环境的互动中,任何的范式都是空洞的,但在这样一个非典型成功创业者的身上,或许可以看到某种创业群体所共有的对于对抗和坚守的理解和践行方式。  “我花了两天时间就把《未来简史》看完了,你能不能理解,你看一本书的时候,和一个陌生人取得了观点的一致,那种感觉,你知道,就是立刻想抱着他亲,太感动了。”  黄允松两眼放光,感冒陪着刚刚出差归来的他,从广州回到北京,