转载

发表于 2016年03月06日
浏览 (772)
评论 (0)

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

标签： 阿里巴巴 开源项目 | 发表时间：2016-03-05 10:29 | 作者：

出处：http://agapple.iteye.com

背景

08年左右，阿里巴巴开始尝试MySQL的相关研究，并开发了基于MySQL分库分表技术的相关产品，Cobar/TDDL(目前为阿里云DRDS产品)，解决了单机Oracle无法满足的扩展性问题，当时也掀起一股去IOE项目的浪潮，愚公这项目因此而诞生，其要解决的目标就是帮助用户完成从Oracle数据迁移到MySQL上，完成去IOE的第一步.

项目介绍

名称: yugong

译意: 愚公移山

语言: 纯java开发

定位: 数据库迁移 (目前主要支持oracle -> mysql/DRDS)

项目介绍

整个数据迁移过程，分为两部分：

全量迁移
增量迁移

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

过程描述：

增量数据收集 (创建oracle表的增量物化视图)
进行全量复制
进行增量复制 (可并行进行数据校验)
原库停写，切到新库

架构

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

说明:

一个Jvm Container对应多个instance，每个instance对应于一张表的迁移任务
instance分为三部分
a. extractor (从源数据库上提取数据，可分为全量/增量实现)
b. translator (将源库上的数据按照目标库的需求进行自定义转化)
c. applier (将数据更新到目标库，可分为全量/增量/对比的实现)

方案设计

全量方案

业界常用的全量方案有：

数据文件导入/导出，比如EXPDP/IMPDP, mysqldump/source, xtrabackup等
ETL数据导入/导出，主要原理为使用JDBC数据查询接口

yugong在项目设计之初考虑去IOE数据迁移的灵活性和自定义能力，最终选择的方案为基于JDBC接口遍历数据.

相比于数据文件导入/导出，其优点：

灵活数据同步
支持异构数据
实现相对简单

缺点:

全量拉取需要配合增量使用，会有部分数据重复同步
性能和影响，一次性全量拉取，如果持续时间过长，如果此时数据库变更过多，会导致segment过大

增量方案

业界常用的增量方案有：

基于时间戳定时dump
oracle日志文件，比如LogMiner，OGG
oracle CDC(Change Data Capture)
oracle trigger机制，比如DataBus , SymmetricDS
oracle 物化视图(materialized view)
...

yugong在项目设计之初考虑去IOE数据迁移的灵活性，支持多种oracle版本，同时为降低DBA的运维成本，最终选择oracle物化视图作为我们的增量方案.

相比于其他，物化视图方案其优点：

原理简单，方便理解和学习，用户可以理解为一种固化的简易trigger模式
运维简单，DBA一次账户授权后，程序可按需create一张物化视图表即可完成增量订阅
相对透明，不需要像时间戳sql扫描依赖数据库表设计，也不需要关注oracle版本和服务器存储等

缺点：

性能和影响，类似于trigger机制会对源库的数据写入造成一定的性能影响.

QuickStart

See the page for quick start: QuickStart

AdminGuide

See the page for admin deploy guide: AdminGuide

Performance

See the page for yugong performance : Performance

相关资料

yugong简单介绍ppt : ppt
分布式关系型数据库服务DRDS (前身为阿里巴巴公司的Cobar/TDDL的演进版本, 基本原理为MySQL分库分表)

问题反馈

qq交流群： 537157866
邮件交流： jianghang115@gmail.com
新浪微博： agapple0002
报告issue： issues

已有 0 人发表留言，猛击->> 这里 <<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

原文 http://itindex.net/detail/55286-阿里巴巴-开源-项目

正文到此结束

所属分类：编程技术

本文标签： mail sql CTO 同步 db 人才 Apple 微博 tab 阿里巴巴时间开源服务器产品需求开发 java 数据库开源项目阿里云 trigger 云 Oracle IDE 软件 http mysql tar 数据遍历 DDL UI App src
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,992) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,259) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,059) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,963) 评论(0)
Decorators in ES7

浏览(16,581) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,551) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,997) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,912) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,055) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,209) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG