【51CTO.com原创稿件】2016 年11月25-26日,WOT2016大数据峰会在北京粤财JW万豪酒店召开,50多位大数据领域一线专家、数据技术先行者齐聚现场,在围绕数据智能、大数据商业、区块链、实时计算、系统架构、NoSQL等前沿技术话题展开深度交流和沟通探讨的同时,分享大数据领域最新实践和最热门的行业应用。
在WOT2016大数据技术峰会算法与模型分会场, 蘑菇街图像视频算法负责人 张洪明(民达) 做了主题为“人脸技术在电商平台的应用实践”的演讲,51CTO记者在峰会现场对其进行了专访。
张洪明(民达)· 蘑菇街图像视频算法负责人
张洪明(蘑菇街花名:民达)2015年加入蘑菇街,负责美丽联合集团图像技术的研发工作,创建和带领一个算法团队,与工程和业务团队合作,为集团提供图像技术支持。主要工作包括:图像搜索、图像识别、商品图像内容分析等;业务涉及电商导购、直播等场景。在加入蘑菇街之前,分别在NEC中国研究院、阿里巴巴集团,从事图像技术和机器学习的研究和应用。
张洪明表示,近几年,随着深度学习的流行,基于深度学习的人脸技术开始逐渐出现,并取得了不错的成绩。如基于Faster-RCNN的人脸检测算法在FDDB上名列第一、Google的FaceNet在LFW上取得了99.63%的人脸识别最好成绩、Face++基于CNN的人脸特征点定位算法也在公开数据集300W上取得了第一的成绩。然而,深度学习对于大量计算资源的需求和复杂的模型(几十MB到几百MB),使得上述技术难以应用在移动端,传统算法虽在性能上不及深度学习,但其计算资源消耗少、模型简单的优势,更适合应用在目前的移动设备上。因此,基于传统算法和基于深度学习的人脸技术目前在业界处于并存状态。但随着处理器的发展和针对深度学习的优化技术逐渐成熟,基于深度学习的人脸技术势必在将来更加普及。
蘑菇街自2015年起,开始人脸技术的自主研发。已完成人脸检测、人脸特征点定位、人脸识别等多种技术的SDK、服务开发。主要服务于图片社交、电商直播、支付金融等业务。
蘑菇街作为电商的APP,女性用户相对较多一些。用到人脸技术的场景也很多,如直播频道、后续特效、针对电商选品,模特红人视觉等。
张洪明表示,时间和效果的问题更加突出在移动端开发上,尤其是直播部分需要实时播放,这样对性能要求会更高。在整个处理过程中,除了做人脸图像处理,还需考虑到视频编码、转码、播放等业务流程。做人脸检测、特征定位等技术用时当然是越小越好,目前电商直播环境下蘑菇街的人脸技术在人脸前期处理上10毫秒之内就能够完成,
这是怎么做到的呢?民达表示,蘑菇街会对算法做很多优化,如参数和计算定点化技术。最主要是在算法模型上做深入优化,在速度和效果之间达到一个平衡。在直播当中,并不一定要用最好的识别性能,但保证时间效果比较关键。
从算法分类来讲,当下在业界,基于深度学习人脸图像技术性能相对较好,而且效果已经远远超出传统的方法。但不足的是其模型较大,对计算资源的消耗也较大,导致在移动设备上还有挑战,在这种情况下,现在在移动端还是用传统的方法来解决业务的问题。
在将来,随着深度学习本身技术的优化,随着硬件条件不断地提升,在移动端能够把深度学习这样的一些技术也运用在实时的场景下,这是蘑菇街接下来重点突破的,不管在理论还是实践都要面临的课题。
采访最后,张洪明说道:“针对人脸技术来说,对于初创企业,要先满足业务,用一些开源算法或第三方采购算法,把业务先做起来,然后再去开发自己可以独立掌握的技术。根据公司的技术水平,可以从简单到复杂的路径,我们可以从相对简单传统的算法开始,再涉及到更复杂需要资源消耗深度学习的算法,这样逐步的去迭代。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】
【责任编辑:wangxueyan TEL:(010)68476606】