转载

Quora是如何应用机器学习的?

Quora 是一家以“分享和推动全球知识增长”为己任的网站。 Xavier Amatriain 是Quora的工程副总裁。近日,他撰文 介绍 了Quora如何应用机器学习。

Quora希望提供一个高效且有吸引力的知识分享平台。他们非常关注下面三个维度:

  • 相关性:确保每个人都获得了他们最感兴趣的那类知识;
  • 需求:确保许多人都有的问题得到好的回答;
  • 质量:确保知识的高质量。

在数据上,可以将Quora看作是一个知识库、主题兴趣网络和社交网络的结合体,如下图所示:

Quora是如何应用机器学习的?

可以看出,Quora创建了一个可以用于机器学习的数据及数据关系生态系统。例如,一个用户可以在特定主题上跟随并支持另一个用户,一个用户可以关注一个主题,等等。这个复杂的生态系统为Quora利用数据改进产品和用户体验提供了许多机会。Quora的数据科学团队已经在这方面做了许多有趣的研究( 1 、 2 )。

Quora的许多功能都使用了机器学习算法,以下是其中的部分功能:

  • 答案排序
  • 订阅讯息排序
  • 主题推荐
  • 用户推荐
  • 邮件摘要
  • Ask2Answer
  • 重复问题
  • 相关问题

上述每一种解决方案都需要不同的数据用于不同机器学习模型的训练、测试和特征生成。下面是Quora用到的部分机器学习模型:

  • 逻辑回归
  • 弹性网络
  • 梯度步进决策树
  • 随机森林
  • (深度) 神经网络
  • LambdaMART
  • 矩阵因子分解
  • LDA

他们之所以用到了这么多模型,是因为不同的模型都有其最适合的场景。

感兴趣的读者,还可以查看关于该主题的 博文 、 视频 和 幻灯片 。

感谢郭蕾对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入InfoQ读者交流群 Quora是如何应用机器学习的? (已满),InfoQ读者交流群(#2) Quora是如何应用机器学习的? )。

正文到此结束
Loading...