百度文件系统
百度的核心业务和数据库系统都依赖分布式文件系统作为底层存储,文件系统的可用性和性能对上层搜索业务的稳定性与效果有着至关重要的影响。现有的分布式文件系统(如HDFS等)是为离线批处理设计的,无法在保证高吞吐的情况下做到低延迟和持续可用,所以我们从搜索的业务特点出发,设计了百度文件系统。
核心特点
- 持续可用
- 数据多机房、多地域冗余,元数据通过Raft维护一致性,单个机房宕机,不影响整体可用性。
- 高吞吐
- 低延时
- 水平扩展
架构
快速试用
构建
./build.sh
单机版BFS
cd sandbox
./deploy.sh
./start_bfs.sh
如何参与开发
- 阅读RoadMap文件或者源代码,了解我们当前的开发方向
- 找到自己感兴趣开发的的功能或模块
- 进行开发,开发完成后自测功能是否正确,并运行make test及make check检查是否可以通过已有的测试case
- 发起pull request
- 在code-review通过后,你的代码便有机会运行在百度的数万台服务器上~
联系我们
邮件: opensearch@baidu.com
QQ群:188471131