转载

Fastdfs分布式文件系统的应用

我们在实际项目中常常遇到这样的应用场景,用户需要上传图片,小视频或者其它文档,这些文件的大小一般在10M以内。它们很多,而且对用户来说可能还很重要,而且可能还要经常被访问,被下载,如何妥善保存这些文件就是一个需要解决的问题。

解决这个问题需要两点:一个是文件冗余备份,保证用户的文件不会丢失,另一个是高可用性,也就是说当文件服务器出现故障的时候,可以立刻让备份服务器为用户提供服务,使用户感觉不到有什么异常。

那么我们不妨分析下有哪几种解决方案:

1.粗放型:直接作为blob字段存数据库里,利用数据库的容灾备份和HA来保障文件安全。其实这种方案是最安全的,但是显然数据库不是用来做这个的,因为太占数据库空间。不过由于其安全性最高,笔者在之前某个项目中曾经被要求这么干,因为保存的是客户的合同文件。但是类似社交网络的图片文件是没必要这么做的。

2.简约型:直接存文件系统。如果有多台应用服务器同时提供文件上传服务,那么就准备一台文件服务器,分别挂载到所有应用服务器的指定路径下,实现多台应用服务器的文件写入,同时还可以配置读取静态文件更高效的nginx或者lighttpd来负责文件的读取。这样的好处是配置简单,管理方便(要不怎么叫简约型),不过缺点也很大,就是实现不了高可用性,虽然可以定期对文件服务器进行备份,但是一旦故障,文件会有部分丢失,而且nfs协议对并发写入的支持并不好。这种方案适合低并发,可靠性要求也不高的系统。

3.专业型:就是采用专业的分布式文件系统了,方案其实蛮多的。

mongodb提供了gridfs模块做文件的分布式存储,不过对于数据库不是采用mongo的,没必要为了文件存储专门上个mongodb

其它还有很多开源的解决方案,比如阿里开源的TFS,还有本文要介绍的Fastdfs。

(呼~~终于切入正题了)关于Fastdfs我就不介绍了,请看这篇 简介 。

关于部署,网上介绍有一些,但是基本都有问题,建议以这篇为参考 如何部署 。

但是这篇同样有问题,在启动nginx和fastdfs之前需做如下修改:

  1. 编辑 /etc/init.d/fdfs_storaged/etc/init.d/fdfs_trackerd ,这两个脚本里所有的路径都多了一层local,请把里面的所有/local删掉

  2. 必须在mod_fastdfs.conf文件最后加上一行#include http.conf,好让nginx启动的时候引入这个http.conf文件。

  3. 他的nginx配置也有点小问题,用这个吧(笔者是部署在192.168.6.46和192.168.6.47两台服务器上,server_name请自行修改)

server {                  listen 80;               server_name 192.168.6.46;               root /usr/local/nginx/html;                index index.html index.htm;     location / {         if (!-e $request_filename) {           rewrite ^/(.*)$ /index.html last;           }     location /group1/M00 {             root /export/fastdfs/storage/data/;             ngx_fastdfs_module;           }     location ~ .*/.(gif|jpg|jpeg|png|bmp|swf|js)$ {      fastcgi_cache_valid 200 10m;         fastcgi_cache_valid 304 3m;         fastcgi_cache_valid 301 302 1h;         fastcgi_cache_valid any 1m;         fastcgi_cache_min_uses 1;         fastcgi_cache_use_stale error timeout invalid_header http_500;         fastcgi_cache_key $host$request_uri;         access_log off;        }         }      access_log off;  } 

好了,分别启动两台服务器的nginx和fastdfs的storage和tracker服务,部署完成。

测试一下上传文件: Fastdfs分布式文件系统的应用

好了,返回的是fileId,前面加上ip就是下载文件的url了。

还没完,接下来我们探讨下如何在java项目中使用fastdfs来帮我们保存文件。

fastdfs的作者又为我们写了一个java客户端的sdk。 github地址

但是,这个sdk没有使用连接池,效率不是很高,编码风格也倾向于C++工程师。

网上有达人写了带连接池的优化版,我在其基础上又做了一些小的改进,一方面改掉了一些不兼容fastdfs5.05版本的bug,一方面使其更便于与spring结合。 源码地址 。

我们需要在spring中如下配置:

<bean id="fastdfsFactory" class="net.mikesu.fastdfs.FastdfsClientFactory">           <constructor-arg name="configFile" value="config/props/fastdfs.properties" />     </bean> 

config/props/fastdfs.properties是与fastdfs相关配置文件。里面填这三个配置项。

connect_timeout=5   network_timeout=30   tracker_server=192.168.6.68:22122   

支持配置多个tracker_server,当然也可以像笔者这样用keepalived或者nginx为多台fastdfs服务器提供一个vip。

在我们的项目中注入fastdfs的客户端

    @Autowired     private FastdfsClientFactory fcf; 

上传文件

 FastdfsClient fastdfsClient = fcf.getFastdfsClient();  String fileId = fastdfsClient.upload(file); 

OK

原文  http://minirick.duapp.com/fastdfsfen-bu-shi-wen-jian-xi-tong-shi-zhan/
正文到此结束
Loading...