我们在实际项目中常常遇到这样的应用场景,用户需要上传图片,小视频或者其它文档,这些文件的大小一般在10M以内。它们很多,而且对用户来说可能还很重要,而且可能还要经常被访问,被下载,如何妥善保存这些文件就是一个需要解决的问题。
解决这个问题需要两点:一个是文件冗余备份,保证用户的文件不会丢失,另一个是高可用性,也就是说当文件服务器出现故障的时候,可以立刻让备份服务器为用户提供服务,使用户感觉不到有什么异常。
那么我们不妨分析下有哪几种解决方案:
1.粗放型:直接作为blob字段存数据库里,利用数据库的容灾备份和HA来保障文件安全。其实这种方案是最安全的,但是显然数据库不是用来做这个的,因为太占数据库空间。不过由于其安全性最高,笔者在之前某个项目中曾经被要求这么干,因为保存的是客户的合同文件。但是类似社交网络的图片文件是没必要这么做的。
2.简约型:直接存文件系统。如果有多台应用服务器同时提供文件上传服务,那么就准备一台文件服务器,分别挂载到所有应用服务器的指定路径下,实现多台应用服务器的文件写入,同时还可以配置读取静态文件更高效的nginx或者lighttpd来负责文件的读取。这样的好处是配置简单,管理方便(要不怎么叫简约型),不过缺点也很大,就是实现不了高可用性,虽然可以定期对文件服务器进行备份,但是一旦故障,文件会有部分丢失,而且nfs协议对并发写入的支持并不好。这种方案适合低并发,可靠性要求也不高的系统。
3.专业型:就是采用专业的分布式文件系统了,方案其实蛮多的。
mongodb提供了gridfs模块做文件的分布式存储,不过对于数据库不是采用mongo的,没必要为了文件存储专门上个mongodb
其它还有很多开源的解决方案,比如阿里开源的TFS,还有本文要介绍的Fastdfs。
(呼~~终于切入正题了)关于Fastdfs我就不介绍了,请看这篇 简介 。
关于部署,网上介绍有一些,但是基本都有问题,建议以这篇为参考 如何部署 。
但是这篇同样有问题,在启动nginx和fastdfs之前需做如下修改:
编辑 /etc/init.d/fdfs_storaged
和 /etc/init.d/fdfs_trackerd
,这两个脚本里所有的路径都多了一层local,请把里面的所有/local删掉
必须在mod_fastdfs.conf文件最后加上一行#include http.conf,好让nginx启动的时候引入这个http.conf文件。
他的nginx配置也有点小问题,用这个吧(笔者是部署在192.168.6.46和192.168.6.47两台服务器上,server_name请自行修改)
server { listen 80; server_name 192.168.6.46; root /usr/local/nginx/html; index index.html index.htm; location / { if (!-e $request_filename) { rewrite ^/(.*)$ /index.html last; } location /group1/M00 { root /export/fastdfs/storage/data/; ngx_fastdfs_module; } location ~ .*/.(gif|jpg|jpeg|png|bmp|swf|js)$ { fastcgi_cache_valid 200 10m; fastcgi_cache_valid 304 3m; fastcgi_cache_valid 301 302 1h; fastcgi_cache_valid any 1m; fastcgi_cache_min_uses 1; fastcgi_cache_use_stale error timeout invalid_header http_500; fastcgi_cache_key $host$request_uri; access_log off; } } access_log off; }
好了,分别启动两台服务器的nginx和fastdfs的storage和tracker服务,部署完成。
测试一下上传文件:
好了,返回的是fileId,前面加上ip就是下载文件的url了。
还没完,接下来我们探讨下如何在java项目中使用fastdfs来帮我们保存文件。
fastdfs的作者又为我们写了一个java客户端的sdk。 github地址
但是,这个sdk没有使用连接池,效率不是很高,编码风格也倾向于C++工程师。
网上有达人写了带连接池的优化版,我在其基础上又做了一些小的改进,一方面改掉了一些不兼容fastdfs5.05版本的bug,一方面使其更便于与spring结合。 源码地址 。
我们需要在spring中如下配置:
<bean id="fastdfsFactory" class="net.mikesu.fastdfs.FastdfsClientFactory"> <constructor-arg name="configFile" value="config/props/fastdfs.properties" /> </bean>
config/props/fastdfs.properties是与fastdfs相关配置文件。里面填这三个配置项。
connect_timeout=5 network_timeout=30 tracker_server=192.168.6.68:22122
支持配置多个tracker_server,当然也可以像笔者这样用keepalived或者nginx为多台fastdfs服务器提供一个vip。
在我们的项目中注入fastdfs的客户端
@Autowired private FastdfsClientFactory fcf;
上传文件
FastdfsClient fastdfsClient = fcf.getFastdfsClient(); String fileId = fastdfsClient.upload(file);
OK