转载

【BDTC先睹为快】华为诺亚方舟实验室曾嘉:充分挖掘时空数据是电信大数据关键挑战

12月10-12日, 2015中国大数据技术大会  将在北京召开。会议前夕,我们特采访了本次会议网络与通讯大数据分论坛讲师曾嘉,以期对其从事工作和演讲内容有进一步的了解。

【BDTC先睹为快】华为诺亚方舟实验室曾嘉:充分挖掘时空数据是电信大数据关键挑战 曾嘉

目前担任华为诺亚方舟实验室高级研究员,聚焦电信大数据智能分析平台研究,包括推荐引擎和时空分析引擎平台组件。曾嘉于 2002年从武汉理工大学获得学士学位,2007年从香港城市大学获得博士学位,主要研究兴趣包括机器学习算法和时空数据挖掘问题,近期特别在大规模概率主题建模算法做出一系列改进。

CSDN:能介绍下目前您的主要工作、部门职责和你研究方向吗?

曾嘉:我在华为诺亚方舟实验室主要负责开发电信大数据平台中的数据挖掘模块,为运营商构建具有竞争力的大数据业务解决方案。我的主要研究方向是数据挖掘系统,设计分布式机器学习算法构建业务模型,提升业务决策准确率和系统自动化率。

CSDN:在你的研究项目中用到哪些大数据技术?您对这些技术满意的地方和不满意的地方分别有什么 ?

曾嘉:主要用到大规模数据清洗、整合和挖掘技术。满意的地方是大部分挖掘算法业界已经充分验证,技术选型方面比较成熟。不满意的地方在于大数据清洗仍然没有合适工具,无法自动检测或者恢复错误的字段。很多数据异常无法解释(数据采集涉及很多硬件)。数据整合经常遇到不同来源的数据的一致性存在问题。特征工程缺乏自动化,很多和业务紧耦合,可复制性不强。

CSDN:能否谈谈大数据在您的行业落地目前主要遇到哪些挑战?

曾嘉:电信大数据的关键技术挑战来自如何充分挖掘时空数据实现业务转型。运营商用户每天产生大量时空数据,例如和基站连接,可以大致知道用户的位置。如何充分发掘时空数据的价值存在诸多挑战。

CSDN:大数据领域的新技术发展很快,从整个大数据产业来说,您认为哪些技术趋势值得关注?

曾嘉:高效的特征工程和特征管理技术值得关注,深度学习是非线性特征工程的一个有力工具。

CSDN:针对您所在的行业,哪些技术是您目前主要观察和研究的,您为什么看好这些技术?

曾嘉:时空数据挖掘技术,因为用户生活在时间和空间维度,很多行为都能通过时空进行连接,时空数据挖掘能够洞察和满足用户需求,激发新的业务形态。

CSDN:根据您的了解,技术人员容易犯哪些错误导致大数据实践的失败?

曾嘉:大多数失败在于对业务流程理解不足或者不理解业务通点,因此不能很好的将数据挖掘系统融入到业务决策过程中,产生不了预期的效果。

CSDN:请谈谈您在这次大会上即将分享的话题。

曾嘉:即将分享在电信时空数据挖掘方面的体会和讨论其中几个技术挑战。

CSDN:哪些听众最应该了解这些话题?您所分享的主题可以帮助听众解决哪些问题?

曾嘉:我分享的主题通过实践案例来讨论电信大数据的技术挑战,运营商或者对运营商大数据感兴趣的听众会感兴趣,能帮他们解决问题例如如何部署数据挖掘系统来支撑业务。

CSDN:能否谈谈您对 BDTC2015、其他的讲师分享的话题有什么期待?

曾嘉:很期待听到运营商在电信大数据挖掘实践方面的话题,希望能够了解数据挖掘在面向业务痛点的灵活解决方案,以及可能应用到的创新技术,例如深度学习。

90+位讲师,16大分论坛,Databricks公司联合创始人、Apache Spark首席架构师辛湜,Hadoop、HBase和Thrift项目的PMC成员和Committer、Kudu的发明人Todd Lipcon等海外专家将亲临 2015中国大数据技术大会 ,票价折扣即将结束, 预购从速 。

正文到此结束
Loading...