12月22日,素有“逃犯克星”称号的张学友在江门市举办演唱会,不出意外,又有一名在逃人员在演唱会上落网。据不完全统计,今年在张学友演唱会被抓捕的在逃人员约25名,其他犯罪嫌疑人约68名。
这背后,是基于深度学习的人脸识别算法“立功”。人工智能(AI)不仅可以识人,还可以识物。在深圳码隆科技展厅的无人售货机,消费者扫码打开柜门、取出商品、关上柜门,系统自动结算。相比传统的自动售货机,不再需要把商品“规规矩矩”摆列,消费者也不用隔着玻璃点击购买。
在计算机视觉领域,先后涌现出云从、商汤、旷视、依图、云天励飞等人工智能创业公司,它们从人脸图像识别起步,进而在新零售、工业、芯片、智能终端等领域走出各自差异化道路,打开了广阔的应用空间和发展前景。
抢占摄像头入口城市大脑装上“智慧之眼”
在深圳,超过2万民警使用的警务云终端上,一款叫做云天“深目”的动态人像App,经过一定的权限管理系统,民警们可以对犯罪嫌疑人在2秒内,检索他从深圳的机场到地铁,到南山、福田、罗湖、龙岗跨区域的活动轨迹,落地他的身份、查询他的前科。
这套系统在深圳上线后,就协助公安破获了经侦、技侦、网警、打拐、缉私等等各类案件突破1万多件,协助找到了上百名走失的儿童和老人。
对很多人来说,安防监控并不陌生,但传统的安防监控虽然实现了记录功能,但不能准确识别视频中的人、物和场景,民警往往需要花费大量的时间精力从海量的视频监控中获取到需要的信息。
云天励飞依托“云+端”人像智能解决方案,前端实现人脸检测跟踪、抓拍采集,后端引擎通过深度学习实现人像结构化特征值提取,结合人像识别应用平台实现动态、开放、多场景下的人像精准识别和布控。“以前20个民警看一个星期的视频,现在只需要几秒钟就可以完成。”云天励飞战略规划总监张旭媚说。
而在张学友今年以来的演唱会中,就有广州云从科技、云眼大视界等AI公司“立功”的身影。各大AI公司都在抢占安防市场,而摄像头正成为智慧城市的“入口”。张旭媚说,传统摄像头的安装都希望架得高、辐射面积大,但现在更清晰的人脸采集摄像头架设更低,在实际应用中,各家的算法不同,对摄像头的调试、架设的角度、高度标准以及售后服务等都不一样,一旦抢先布局了摄像头,就有一定的排他性,未来短期内不太可能再重新架设一套摄像系统。
尽管人脸识别站上了产业风口,但对实战要求却很高。据了解,在深圳举行的高交会上,安检门同时采用了2套系统,分别负责一个入口,结果其中一个系统崩溃了,因为实验室拍照的样本非常清晰,但实际中经常要侧脸抓拍等方式,这和以前训练的方式不一样,时间一长系统承受不住了。
从“刷脸”跨向“识人”AI与用户互动还能帮助决策
人脸识别系统不仅可以“刷脸”,还在朝着“认识人”迈进。2018年10月底,云从科技宣布,在语音识别技术上取得重大突破,他们融合图像识别与语音识别的优势,推出全新Pyramidal-FSMN语音识别模型。
在技术研究的“最后一公里”,每0.1个百分点的进步都异常艰难。全新Pyramidal-FSMN语音识别模型在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率降低至2.97%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原先纪录。
让外界有些不解的是,以人脸识别闻名的云从科技,怎么就切入到了语音市场。事实上,语音识别技术同样是智能感知中一个重要的部分,通过语音识别,机器可以像人类一样听懂说话,进而能够理解、思考与反馈。
“云从的技术围绕人为主要方向,不仅仅是认识你的脸,还要认识你这个人;不仅在人脸识别上更快,而且能看出你的神态、步态、衣着。”云从科技高级副总裁伍楚芸说,如果单纯在人脸识别上竞争,虽然一开始差距挺大,但最后只是99.8%和98.9%准确率的差异,这点差异在大部分应用场景上可以忽略,而云从要做的是从感知、认知到决策的闭环,云从进军语音识别,从而更好地进行人机交互,“除了我认识你,还要与你语音互动,能听懂你的意思,甚至还能帮助到你”。
如今,用户的需求也不仅仅局限于“美颜”,对人识别的要求还发展到了美体。商汤科技应用创新AI技术,将AR识别和绘制能力从“脸部”延伸至“全身”,在原创的SenseAR增强现实感绘制平台上,推出了全新功能模块——SenseAR美体塑形,不仅可以针对头、肩、腰、臀、腿等部位及身高比例进行调整,还可以轻松实现一键式全身美体塑形。
从“识人”向“识物”迈进开拓一个智能识别的新兴市场
在码隆科技的展示区里有一个显示屏,当用户路过摄像头前屏幕上就会出现此人所穿衣服的种类、颜色和风格;而在无人售货机的改造上,一个简易货柜架上一个普通摄像头,1分钟就可把普通货柜改造成智能货柜,而成本仅为此前货柜的一半。
“识物”正在成为AI公司新蓝海。今年12月,联发科在深圳发布了主打AI性能的新一代Helio P90系统单芯片,在这款被称之为“全球首款AI识物芯片”的背后,站着一众人工智能视觉公司,包括商汤科技、旷视、码隆科技等。
码隆科技嵌入Helio P90芯片的物体识别技术已经集成了针对服饰的识别,可以准确识别衣物的类别、款式、风格、元素等特征,将有力地支持Helio P90从本地端更好地服务于智能手机厂商以及视频和图像等应用领域。“从数量来说,包括商品在内的物品,要远比人脸更多,想象空间也更大。”码隆科技运营副总裁刘念说。
商汤科技联合创始人、副总裁杨帆说,计算机视觉产业可以从图片和视频中提取的要素通常有人脸、人体、衣物、步态、车辆等,未来,图片和视频将成为最重要的信息载体,因为其涵盖的有效信息量最多,而通过对这些信息的分析,也将诞生新兴的科技巨头公司。
与传统行业结合找差异化拓宽自身边界
云从、商汤、依图、旷视在计算机视觉行业,AI公司风起云涌、攻城略地,在走过了最初安防领域的应用后,各大AI公司也在不断拓宽自身的边界。
在行业纵深方面,如在银行业,云从科技已成为人脸识别应用的第一大供应商,未来还将逐步深入到更多业务领域,包括银行智慧网点的转型、银行风控的管理提升等,以人脸识别业务为切入点,利用人工智能技术帮助银行业务的全面优化升级。
而在最近的高交会上,云天励飞携成功流片的AI芯片亮相,计划在明年正式商用。未来,云天励飞还将探索芯片商业模式的创新,力推“芯片+服务”的新模式,打造芯片共享平台。
在横向拓展方面,AI公司纷纷布局智慧零售、智慧社区、智慧教育等,由于落点不同,相互间避开了同质化竞争,如在零售领域,相比擅长做硬件的友商,云从比较着重做零售大脑,软件或平台相关等;云天励飞将线下信息结构化,消费者在商店买了哪些东西,其兴趣点在哪儿,以前只能通过互联网建模的商业模式,现在在线下也能做;今年5月,商汤还联手华东师大,推出第一本人工智能教材,入局智慧教育。
“AI一定要与行业结合才是有生命力的。”刘念说,传统行业与AI结合,需要数据确定模型,但在服装等行业连基本的数据都没有,也没有IT架构,“比如客户和我们洽谈的时候非常兴奋,对AI的需要很强烈,但一谈到落地就遇到很多问题,纯视觉的方案根本解决不了,这都需要AI公司帮助企业将数据整理出来”。
杨帆则表示,新事物层出不穷,行业风口不断变迁,但回归到事情本质其实是很简单的,整个信息产业依然是非常关键的五个关键环节,分别是对采集、传输、存储、分析计算和反馈的利用、整合和技术的进步。AI公司虽然一开始比拼的是信息采集环节,在采集环节实现了高度自动化后,比拼的是对信息的分析和反馈,才能建立起一个完整的闭环,“摄像头是非常重要的采集环节,也有一些AI能力建立在摄像头上,但最重要的还是在后端,分析环节将创造巨大价值。”
专家点评:
广州市社会科学院产业所副研究员 陈峰
政府应主动推进 数据资源整合 让企业合规利用
我国计算机视觉从2010年开始加快发展,目前市场已具备一定集中度,据IDC报告,2017年计算机视觉“四小龙”——商汤、依图、旷视、云从占总体市场份额高达近七成。安防、金融、手机是计算机视觉技术最大的应用场景,预计未来在医疗影像、自动驾驶、机器人、智能制造等场景下,计算机视觉技术应用前景广阔。
政府是加速人工智能技术落地应用的重要推动力量,为进一步推动计算机视觉产业的快速健康发展,在让市场在资源配置中起决定性作用的前提下,政府应积极有为,在数据开放和应用场景供给方面发挥统筹、引领作用。
大数据对促进计算机视觉的识别与认识能力至关重要,所有的计算机视觉企业都需要大量的数据来训练、迭代自己的产品。在目前计算机识别技术各家差别不大的情况下,数据是业内企业发展的一个重要竞争优势来源。我国政府、央企手中掌握着全社会最大、最核心的数据。政府应积极主动推进数据资源的整合、开放与应用,组织界定数据采集、应用的范围和方式,出台公共数据采集与使用规范,明确相关主体的责权和义务,为公共数据开放扫清障碍;引导市场主体、各企业之间合法合规开展数据资源的合作与交易;加快研究、制订相关法律法规,从法律层面到执行层面确保信息安全和个人隐私得到充分尊重,为计算机视觉产业健康快速发展创造条件。
计算机视觉是AI最热门的融资领域,据不同机构的数据,计算机视觉融资占AI的比重基本都能排进前三,其中人脸识别、图像识别、视频识别三大方向,是资本市场炙手可热的明星,业内头部企业——计算机视觉“四小龙”,融资和估值节节攀升。但是,回到技术落地和商业变现,行业整体情况并不乐观,绝大多数企业依然处于前期烧钱阶段。目前,安防、金融、交通是计算机视觉技术商业落地的主要应用场景,业务主要来自公安、机场、边检、海关、火车站、银行等,政府在行业早期市场培育方面给予了极大的支持。未来,政府在应用场景供给方面仍有很大的深化、优化空间,在智慧政务、智慧校园、智慧医疗、智慧交通等领域,会有越来越多的应用场景被挖掘出来,各级政府在推进智慧城市建设、应用示范项目建设中,可将符合条件的计算机视觉产品(服务)纳入首购应用,支持计算机视觉技术、产品、模式的应用推广。