网站前端架构技术一直在不断的优化,而要做到全栈优化,就必须要运维、后端架构研发、前端模板渲染研发、系统和网络等各个部门的协作。同时,安全又是网站建设话题中避不开的梗,从2015年年初开始,HTTPS安全协议就已经遍布各大网站的网址里了,而百度是国内第一家推行全站HTTPS的大型网站,这其中就有很多关于站内优化和站内安全的经验分享。以下内容是对第61期百度技术沙龙的三位资深运维工程师的采访。
陶春华:百度资深运维工程师,百度Golang委员会成员 & Code Master,工作中主要方向在百度接入的Go项目。
陶:BFE架构能做到这一点主要依托了Golang对并发访问的支持:goroutine机制在并发处理上非常高效;编程模型也是大家熟悉的线程模型,容易掌握。
陶:对访问日志我们采用两个手段处理:一是开发了一个专用的Reader程序,解析出部分关键请求信息,通过实时接口发送到后台汇聚服务,用于实时的流量识别与调度。二是公司有日志收集系统,统一进行日志的收集、统计与存档。
陶:安全主要是通过WAF服务来保障。WAF Server是和BFE同机部署的应用层防火墙,BFE会把流量转发到WAF服务程序。根据安全规则,WAF服务对访问数据进行检查,一旦发现违反安全规则的访问,则立即封禁该访问。这个过程独立于BFE的其他处理逻辑。
陶:目前有部分是自动化接入产品线的,主要是出于为部分重要配置的审核考虑,才使用了自动化接入。
陶:流量调度分为外网调度和内网调度两个层次。
外网调度,主要考虑如何控制DNS系统,将用户引导到合适的入口IDC。内网调度,主要考虑在业务集群间的负载情况,将流量从一个BFE集群,分流到多个等价的业务集群,权重是根据负载情况实时计算得到的。
陶:对BFE的应用场景来说,主要是GC带来的不确定的延迟。为此我们设计了多进程轮转的解决方案,基本思路是当前服务的工作进程关掉GC,服务一段时间后,其他进程替换工作。
许霞:百度资深运维工程师。曾负责反作弊、超链分析、用户行为分析等离线计算系统维护工作。最近两年来专注于网页搜索无线访问速度与接入体验方向。
许:网站速度的提升在公司内部是一个主题方向,并且有一个独立的项目组进行工作开展。项目组中包括网络、服务器、搜索架构等基础技术的工程师,也包括前端渲染、交互设计方向的工程师。整个项目组会整体对网站的优化进行负责,从而实现从各个层面进行速度的优化。而运维部作为一个衔接基础技术和业务的技术部门,就承担了整体分析设计与驱动全栈优化的角色。
许:网站性能的监测手段选择主要是两方面的。
首先是基于JS的监测数据,这部分数据优点是数据规模大,数据可以根据目的性进行自定义。当然缺点是很难覆盖竞品的情况下对竞品情况的了解,我们会选择第三方监测,包括基调、博瑞,以及海外的同行。通过购买第三方监测服务来覆盖我们在竞品测监测数据,同时也保证了客观性。
陈曦洋:百度资深运维工程师,近3年作为主要技术负责人,处理网页搜索的可达性,访问速度,安全搜索等方向事务。
陈:需要保护隐私,防止劫持和嗅探,和钱/账户打交道的都应该优先上。在这些领域,对用户流量的劫持已经让用户难以忍受,甚至一些临时工写出来的劫持代码会直接让页面功能不可用,可以从用户反馈渠道看到大量的抱怨。另外一方面,一些非法的行为会直接嗅探用户浏览网页的的隐私,获得用户需求信息,甚至直接电话骚扰用户。不安全的浏览会给坏人可趁之机,入侵用户账户,造成财产或者名誉等损失。
百度在上线HTTPS之后,用户反馈的页面由于劫持而造成的功能问题减少了一个数量级。之前大家没有上线HTTPS,很多是在顾忌复杂性,资源成本,和访问延迟。这些问题都会逐渐得到解决,建议大家尽量都改造为HTTPS。另外看看今年上线HTTPS有哪些网站就知道效果如何了。
陈:HTTPS目前在百度主要在搜索支付金融账户等业务,也正在推进支持所有的产品。使用HTTPS代表不了完完全全的安全,但是能解决很多问题,也极大的增加了攻击者的成本。但没有“完全的安全”这个说法。一个实际使用中的完整系统总是非常的复杂,用户浏览网页的过程也是一样,在很多环节上,都有各种各样的风险。
网上有清华大学段海新教授对网银及其他使用HTTPS网站的攻击演示。光是百度部署HTTPS,也没有办法完整的保护浏览的整个环节,因为你最终还是要通过百度访问到你感兴趣的网站上去的。而我们发现有些网站为了获取用户的信息,会购买一些非法的服务,可以拿到你的大量信息,甚至电话号码。
而在第61期百度技术沙龙现场活动中,陈曦洋还会跟大家分享百度在使用HTTPS安全协议之初,都曾遇到过哪些问题,使用了什么样的解决方案等精彩内容!