我叫庞俊英,来自阿里巴巴技术保障部,整个阿里集团所有的支付宝、淘宝、阿里云都是在我们之上的业务。我两年前来过这里,去年我没来,因为觉得去年没什么可讲的,所以我向大家汇报的是有一个连续性的,就是我前年提了哪些问题,这些问题我现在解决了吗?然后还有哪些问题还需要解决,我希望业界帮我们做什么,所以我是这样一个思路来讲的。
我是个工程师,所以我的 PPT 里面如果有很漂亮的图,一定是盗图,如果有横的一定是我画的。今年的问题是不是还是存在的?第一个网络的复杂性带来网络一直的停滞不前,是不是还存在?原来像计算、存储是不是有变化。第二个,很多复杂的东西,今天是不是还是这么用呢?第三个,提了这么些年弹性,是不是解决这个问题了。大家讲这个会不会便宜,因为我在阿里巴巴差不多五年前就在做资源交换机,很多人问这个问题,这个事情是不是今天还存在呢?所以想跟大家汇报一下。还有一个问题,这张图也是两年前大家见到的,大家说不清楚 SDN 是什么,说不清 OPENFLOW 是什么,后来又说 SDN 和 NFV 是什么关系,有个天才画出这么一张图,反正各说各话。我想这个答案是什么呢?半信半疑,可能到今天也是一个半信半疑。因为能看到的东西,也看到了,所以我们相信了,没看到的东西还是没看到,所以我们怀疑。这没关系。 我今天跟大家汇报的是一个真正的,它正在发生的一个事情,一个网络的变化,你说是变革也好,但是它的的确确在发展,给大家一个信心,也是给产业链一个信心,这件事情是可以做的,我们自己也是有收益的,我们自己还是满意的。我们在很早之前就考虑,数据中心内部 OPENFLOW 是不可以用的,有很多原因,也在争吵这一层应该怎么做,大家都在争吵。那我们也在思考,就是这个东西能不能用,我们会遇到哪些问题,所以我简单的列了几点,一个我们真正的思考和我们要解决的驱动力,我们考虑在数据中心网络里面用 OPENFLOW 和 VxLAN 做驱动力有哪些,这些动东西是不是今天面了现实。
第一个是大规模的区域的部署。在规模小的时候,二层就解决了,就会有人提大二层,当然我们也是一步一步走过来的。现在你一出门都是万台服务器或者几万台服务器,都是在 EV 多少多少以后,任何一种,我们跑了几年的二层技术都是不成的。很现实的一个问题,就是 VM 一定要迁移,怎么办?那这就是我们必须从传统的二层技术向这个变迁,那我们该选择哪种技术? 第二个是扩展性的问题,五是因为这些问题,你做很多小集群,你的池化的能力一定会被降低,你要做一个大的集群,你今天所面临的所有问题都是存在的,那这个 Overlay 必须要分离。如果说你一层到 BN 了,你二层没办法做了,上面一定要有 Overlay 。怎么能够快速的部署,如果能够迅速的战略市场,你的 VM 的成本比较低,你的管理成本也要低,你的供应链的成本也要强,这个就是你的弹性和兼容性的问题,你如何做自动交付和变更。因为很早之前就做变更,最后一个需求就是到今天为止,我们一定要面对的一个问题,就是混合云是存在的,有的物理服务器就是不能够云化,你不能把它做虚拟化,但是这个物理服务器跟你的云之间一定要联通的,所以是怎么连的问题,所以混合云是一个很刚性的需求。
就这样几条原因,促使我们做网络自动化的驱动力。 这张图比较明确的讲了我们做的。这一点是 Overlay 和 Underlay 是分离的,其实物理是在一起,然后在上面有我们阿里云的管控系统,原理是这样的,当一个 VM 创建的时候,我们的管控系统会告诉我们一个 VM 要构建了,当这个 VM 被点亮。这个相关的转发表项就会到物理网络当中来,原理就是这么简单。所以从云的角度去看, Overlay 能够提供的是它自己的这样一个特性,是能够在 Overlay 里面去满足的。 Underlay 就是做交付、变更、配置,它是非常简单的,一次做完就 OK 了。这是一个 Overlay 。这一点是要明确告诉大家的,就是 Overlay 这一层,大家可以看一下,这里画的有蓝色的,有绿色的,有橙色的,这是一个二层域,用 VxLAN 隔成的二层域。网关是放在最上面的那个。然后这个用这样几个接口做的 OPENFLOW 。
我们总结一下,我们用到的东西。第一个,我们用的就是今天用到的芯片,商用芯片,没有什么特别的东西。然后交换机是一个商用交换机。然后 Overlay 这个平面,中间有一个节点,你一定见过 face book 的中间节点,你自己管的了它就可以,它中间是没有要求的,一头一尾是一定要做 Overlay 的,我们是在上面一层做了 VxLAN 的。物理网这一块,我们的集群比较大,对于吞吐要求是比较高的,所以我们的容量很大。在管理这一块,很清楚的大家可以看到,就是用一个 API 去做部署、管理。关于 VM 的迁移域,我们是面向自己云的控制系统和交付系统,南向有两层。因为我后面也会讲。 ARP 这一块,我们没有用到任何机制,就是用 ARP 的管理,就是用静态的方式从控制系统下发。这个是我心里的一个愿景,就是 SDN 的全景图,你可以构建自己的虚拟网络。现在这个虚拟的网络,今天看不过是在一个 IDC 的内部,然后不同的区域之间,北京、上海、广州之间,这些不同的 IDC 怎么去构建还没有完全想好。但是在 IDC 内部已经搞的比较清楚了。然后你什么东西都可以跟你的 SDN 进行互动。无论你是一个物理服务器,比如说 IBM 的主机,你是支持 OPENFLOW 和一种虚拟化, Overlay 协议的,比如说 VxLAN ,那也是 OK 的。如果说数据库,这个交换机外面可以去实现。然后很多 BOX 都是在 X86 上实现的,路由器、交换机,然后做的 PCEP ,都 OK 的。包括 BOX ,光这一层也可以做,跟 SDN 和你的 IP 网、传输网做一个统一调度,统一视图和流量管理。所以从 SDN 的全景图来说,任何的网络设备,任何一个网络设备,就即使是一个数据库也要接到网络里面来,如果你自身不具备能力,我可以放进去。如果你可以虚拟化,那也是 OK 的,都可以进行 SDN 的调度。所有的东西放在一起,就是这样的一个愿景图。
将那张图对应一个混合云的网络架构里面,就是我这里画出来的,我可以通过 VxLAN 做租户的隔离,这里有蓝色的租户,有红色的租户,大家可以看到,用 VxLAN 做一个 Overlay 是没有任何问题的。这个黑色的点是我们今天的用法。比如你的用户就是今天的网络,这个传统交换机不支持 VxLAN ,它没有 OPENFLOW 的接口,怎么办?那也没有问题,也可以实现,这样就非常灵活了。中间服务器那边, X86 服务器也可以做一些服务链的工作。如果你希望 Overlay 搭建在一个物理网络之上,你可以到一个网关上去,也可以到某一个核心交换机去,也可以沉到服务器。这是一个非常非常灵活的混合云的架构。 这是我们所倡导的 P+V 的理念和体系架构,路由器、交换机, X86 ,可以放在服务器里面,也可以放在你自己定制的服务器里面都是 OK ,这一层网络设备只要能够支持 VxLAN 这个协议,支持 OPENFLOW 的接口,就可以做到我前面那张图讲的,我们都是可以做的。在这及之上都可以构建自己的虚拟的网络层。
再往上,因为 NFV 是介于业务和基础架构之间的特殊的一层,所以把它放在中间的一层。如果是传统的网络和业务是可以进行承载的。在上面我们看到的业务系统,云的业务系统,流量调度系统,还有运营商所提供的那些服务都是可以的。这是我们倡导的 P+V 的虚拟网络架构的这样一个框架。在我们的实践里面,解决了哪些问题,大家也可以看到,我的 Operational ,这两层的分离是很灵活的,你今天可以提供一个整网,一个二层域,你也可以把它拆分,比如说明天跑完了,明天面对 100 个租户,都是可以的。原来网络的链路的探测都是非常非常难做的,我用 SIP 这种方式做检测,模拟业务流从一个服务器打到另一个服务器,都用这种方法去做。只要在物理链路上这样做,不一定把所有的网络都仿真出来,今天有了这个机制以后,我们发现非常非常容易,原来不敢想像的网络数据,现在都已经可以实现了,非常容易做。还有我们没有做到的事情是什么呢?
没有以前想像的做一个 SDN 可以省钱,我是这么来看待这件事情的。前面五条我都看到了,我并没有多花钱,这个就已经可以了,今天这么去做没有比传统的网络便宜,但是也没有贵,但是你却可以得到前面的五项好处,这是现在的情况。仍然存在的问题,今天我跟大家开放的讲这个事情,就是希望产业链的这些同仁们,还有其他的用户来共同倡导这样一个理念,就是大家慢慢都去做,原来大家都不相信 OPENFLOW ,然后也都觉得用 OPENFLOW 有问题,当然我们也是觉得 OPENFLOW 是有问题的。但是我们觉得这条路是可以走下去的,产业的这么多同仁都来做,其实真的可以把这个事情做的很好的。如果那一天发生的话,我们没有把这个锁定去掉的话,这样自然而然可以便宜下来。因为在转发面,我们还是用了传统的方式。然后在控制面做了一些调整。所以所谓的对业务中段的,当时在 SDN 框架里面讲的几大好处这个好处其实是没有拿到的,这一层还没有完全做到,这点要是能够做到的话,还是需要向 OPENFLOW 去发展。是不是到了某一天,它叫 OPENFLOW ,我们也不用纠结,这个产业会往前走,但是我们今天的确在用 OPENFLOW 这个接口。
现在我们提到的还有南向的标准化,其实南向和北向的标准化都有这个问题,南向还好,但是今天的北向,大家都说用户不一样,业务不一样,也会带来这个问题,其实标准化还是做的不好。那也会阻碍这件事情往前做好的一个点吧。 还有一个,我觉得我可以建议大家,可能各个公司,还有传统的公司,就是关于做一个高性能的,更标准的接口是很重要的事情。还有一点。当真的 FLOW 做好了,这个想象空间会更大。
我们发现我们的网络架构缺少一个,真的是软件太软,硬件太硬。前段时间参加培训,跟很多小孩在一起的时候,我非常担忧,他们对网络的理解非常非常少,做网络的人不理解网络。我们已经这样自学习了这么多年,所以我觉得这个理念一定要消除,怎么消除呢?我们缺少一个全站的架构师。 最后因为时间也到了,这件事情是我非常想做的,我也会在行业里面和在我的同事去倡导这样一个思想,第一个 NETops 一定会向 DEVTops 转型的。谢谢大家。
本文转载自 SDNLAB , 更多 2015 全球未来网络暨 SDN 技术大会演讲文章请关注 SDNLAB 。