百度阿里腾讯进入语音识别 这家创业公司押宝物联网对抗巨头
>
A5联盟
2016年3月,围棋人工智能程序AlphaGo击败李世石,再次引发人工智能关注热潮。“坐了十几年冷板凳”的云知声CEO黄伟,顺着物联网兴起的兆头,也许迎来语音识别最好的发展时机。
![]()
云知声CEO黄伟 2003年前后,这个行业曾经经历过一次高潮,因为语音识别实验室识别精确度达到90%以上水平,大小公司蜂拥而至。2005年全球领先的语音识别公司Nuance上市,市值最高突破90亿美元。2008年,科大讯飞(002230)上市,国内市场占有率一度占到70%以上。 但是,只有极少数公司在这一波浪潮里突出重围。语音识别在实际使用场景精确度降到很低,短时间内技术解决基本无望。大公司纷纷关闭语音识别相关部门,热潮不过昙花一现。 平台化实现弯道超车 移动互联网的兴起、机器深度学习(AlphaGo的主要工作原理)的发展,让语音识别再次呈现上升之势。苹果2亿美元收购Siri Inc.公司,2011年发布Siri语音助手。同年,谷歌连续收购语音通信公司SayNow和语音合成公司Phonetic Arts,亚马逊收购语音识别公司Yap。 2012年6月,梁家恩创立云知声。这个时候,科大讯飞已经在国内语音识别市场筑起了深厚的壁垒。要想实现弯道超车,梁家恩想得很清楚:第一是算法;第二是数据。如果算法是引擎,那么数据就是燃料。哪怕算法得到极大提升,如果没有油的话,车还是跑不起来。
![]()
左起:云知声董事长兼CTO梁家恩、云知声CEO黄伟 梁家恩决定做开发者平台。对于一家创业公司而言,平台包袱无疑很重,团队也有过纠结。“我们必须把平台先做起来,让市场看到云知声的能力。”语音识别技术最关键的是先要有充足的语料积累,不光是找人去录语音,更需要用户真实的数据。而做平台能够在短时间内完成大量的语音数据积累,以实现弯道超车。 淘宝上买机器、普通游戏显卡,10个人不到的工程师团队,自学深度学习算法,3个月平台上线。 “没有人想到这样一家刚成立的小公司真的能做出来。”云知声董事长兼CTO梁家恩现在说起来还颇为得意。2012年9月云知声发布的语音平台,当时精确度只能做到85%,如果真正应用到实际场景,甚至会降到60%。到2013年底,语音数据已从最开始的800小时积累到3000小时,精确度提高到95%,平台上的开发者大大小小已有8000多家。4年以来,云知声开发者平台每年保持400%的增长量,目前每天调用量在1.5亿到2亿次之间。 平台也打出了云知声的名气,语音识别技术在人工智能领域相对成熟,这家公司开始考虑商业化。一开始,他们就选择了从B端切入。云知声CEO黄伟始终认为,在人工智能领域,B2C在中国很难实现,这也是黄伟一直坚持不做单品的原因。 和搜狗合作,云知声一战成名。 当时搜狗和百度都在抢时间点,想率先发布语音助手。但搜狗本身并没有这部分技术,将市场上各家的产品一一测试,综合价格因素,一周时间便与云知声达成合作。 小i机器人(300024)也是云知声早期的客户。对方给银行提供服务,之前都是文本,后来逐渐拓展到语音领域。科大讯飞是它当时的服务提供商,收费很高,小i机器人便找到云知声。云知声以相对低的价格拿下客户。 黄伟说:“在市场、技术不成熟的前提下,过高的使用门槛无疑是杀鸡取卵。” 和乐视的合作,除了技术上的相对优势以外,乐视当时也处于起步阶段,而科大讯飞更愿意围绕运营商来提供服务。当乐视自身尚没有证明自己能力时,科大讯飞相对是保守的,这就给了云知声机会。 云知声早期合作公司多为互联网公司,他们更敢于尝试新的东西,快速迭代。传统公司相对保守,除了产品本身好坏,出身等其他因素也会被纳入考量。 “在云知声规模还很小的时候,对于客户而言,如果选择大厂商,出了问题是大厂商的责任。但如果选了云知声,出问题的话,决策者自己需负很大责任。”黄伟告诉“”。 2013年初,先后供职摩托罗拉中国研究中心、Nuance,一手创立盛大语音创新院的黄伟加入云知声,担任CEO。“从读书的时候开始,之后10年工作,我终于等到一个可以放手去做这件事情的机会。”黄伟穿着深绿色衬衣,牛仔裤,戴着无框眼镜,头发抓得一丝不苟。谈话之间偶尔取下手腕上的佛珠拨弄。 “商业上的技巧我们确实吃过很多亏,我们不是商务驱动型的公司,最开始就是拿产品过去,实打实地测试,比识别率、比响应速度等。” 差异化赢得时间 云知声IoT事业部副总裁康恒说:“平台给云知声带来的另一个收获,我们得以发现市场所聚焦的需求。通过不同行业用户在平台上的使用频度,能够精准捕获市场需求。”车载、家居、医疗和教育,是云知声的四大重点领域。 2014年,市场上已有汽车厂商将安卓系统和车载设备相结合,黄伟隐约看到车联网的兴起之势。很快,云知声成立专门的车载语音技术团队。 从整个车载语音设备行业来看,前装市场规模大,但产品周期长,且科大讯飞深耕已久。后装市场满足用户购车后的个性化需求,市场规模小,但少有入局者。 当时的后装市场鱼龙混杂,大大小小的厂商遍地都是,质量良莠不齐。黄伟也是摸着石头过河,只能一再谨慎,尽可能选择优质厂商合作,采取统一授权以减小风险。 截至2016年上半年,云知声车载行业的产品激活量近两百万台,收入规模达千万级别。 智能家居是云知声的又一重镇。 随着物联网概念的兴起,几乎所有的家居厂商都在探索智能家居的未来。语音识别在智能手机上的应用并不是刚需,触摸已经能够解决大部分的应用场景。对于鲜少拥有触控屏幕的家居产品,语音交互很快成为厂商间的共识。 早在2014年,云知声和一些家电巨头就有过接触,但先期落地的产品主要集中在创业公司。这些创业公司希望生产一些智能化的产品,虽然量都不大,云知声技术团队仍全力配合开发,不断试错,打磨技术。 “2015年,我们在家居行业的策略是和小公司玩;从2016年起,我们也要和巨头共舞。”黄伟说。 美的一直看重智能家居,尤其空调这个单品,从2012年起便不断寻找智能化解决方案,和科大讯飞、韩国Powervoice都有过合作。 2014年底,云知声开始和美的接触。对方要求明确:第一、用户直接通过语音方式控制空调,且不受噪声影响;第二、一定距离的远场语音交互得以实现;第三、方案成熟,成本控制。 远场语音交互是关键中的关键。 当时市场上普遍解决方案都是八个麦克风收音,虽然语音识别准度得以提高;但能耗、安装等问题却接踵而来。 云知声团队做了大量先期工作,发现像空调这类产品,它永远都是贴墙放,八个麦克风在实际应用上是多余的。云知声提出双麦克技术,两个麦克风间距不过三厘米,在任何产品上均可自然适配,即插即用。 一下少了六个麦克风,如何保证远场语音交互能达到测试要求,云知声花了一年半来解决这个问题,2015年底投入生产。 2016年8月1日,美的智能语音空调正式发布。 从2015年开始,云知声涉足医疗领域。2013年前后,云知声就想往医疗方向发展,初步接触下来,当时的时间点太早,需求尚没有爆发。 (编辑:佛山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |