转载

发表于 2015年12月17日
浏览 (758)
评论 (0)

ASP.NET + SqlSever 大数据解决方案 PK HADOOP

半个月前看到博客园有人说.NET不行那篇文章，我只想说你们有时间去抱怨不如多写些实在的东西。

1、 SQLSERVER 优点和缺点？

优点：支持索引、事务、安全性以及容错性高

缺点：数据量达到100万以上就需要开始优化了，一般我们会对表进行水平拆分，分表、分区和作业同步等，这样做大大提高了逻辑的复杂性，难以维护，只有群集容错，没有多库负载均衡并行计算功能。

2、 SQLSERVER 真的不能处理大数据？

答案：当然可以的，打个比方：操作单一数据库称为一维操作，如果操作相同结构，分布在多个服务器上的多个数据库这个可以称为二维操作。我们只需要对这个二维操作进行一层封装，让他支持并行运算，把服务器压力分散开，我们不需要写太多东西，SQL已经为我们封装了很多，它就好比是一个巨人，而我们只需要站在他的肩膀上，就可以轻松实现针对WEB的大数据处理。

3、 hadoop 适不适合.NET，他有哪些缺点？

（1）、数据同步慢

（2）、事务处理难

（3）、异常捕获难

（4）、很难与ASP.NET结合，无论是学习学成本，还是自身的支持方面

（5）、需要安装，适合离线大数据处理，但未必适合WEB

4、什么是 SqlSugar 框架?

SqlSugar 是一款基于 SqlSever 的轻量级高性能 ORM 框架，除了具有和ADO.NET匹敌的性能外，现在已经支持多库并行计算。

ASP.NET + SqlSever 大数据解决方案 PK HADOOP

优点：

（1）、适合海量数据的无延迟查询

（2）、支持分布式事务

（3）、让JOIN飞起来，告别大数据NOJOIN

（4）、C#.NET自家语法和大量封装函数

（5）、随机存储，也就是说可以存储在任意一个节点数据库，做到真正正的负载均衡，而不是以往主从模式的读写分离。

缺点： SqlServer授权费太贵，适合有钱的公司或者不交授权费的创业小企业

SqlSugar学习目录

1、SqlSugar基础应用

2、使用SqlSugar处理大数据

3、使用SqlSugar实现Join 待更新

4、使用SqlSugar实现分页+分组+多列排序待更新

5、节点故障如何进行主从调换

》》》》2、使用SqlSugar处理大数据《《《

1、SqlSugar的原理

Insert: 随机存储到某个节点数据库（每个节点可以配置处理的机率，如果设置为0表示该节点不会有新数据添加进来）

Update、Delete:异步请求所有数据库节点同步汇总处理结果

Search: 对分页前X页、后X页和PageCount<1000（1000这个值可以在程序中设置）的数据进行了特殊优化，其它数据进行了异步节点算法同步对结果进行汇，性能在多服务器架构中可以完美的体现出来，在单服务器架构需要注意保证足够IO，避免全表扫描，否则起不到优化效果。

1、单服务器、单硬盘、多库架构：

适合低并发，数据量在1亿以下，响应速度较高数据量最好不要超过1000W，在查询中避免全表扫描，充分利用io性能，让异步的优势体现出来。

如图：

对部署在同一台PC机上的10个同结构库进行了模糊搜索

name建了全文索引，id和num建立了复合索引

十个库加起来总共有540万条数据，普通机械硬盘只用了0.3秒的时间。

ASP.NET + SqlSever 大数据解决方案 PK HADOOP

2、单服务器、多硬盘或阵列：

可以使用LIKE等进行全表扫描，性能有明显的提升

3、多服务器、多库架构

因为把压力分摊各个节点所在服务器，所以可以轻松处亿级以上数据，节点服务器越多处理的数据量就越大，就越快，就算是T级数据，秒查也不是事儿，只需N台廉价的PC。

2、用法

1、引用SqlSugar.dll

2、配置连接字符串

其中rate是Insert时存储到某节点的机率，0表示不会有新数据添加到该节点，下面设置都为1表示我一点都不偏心

ASP.NET + SqlSever 大数据解决方案 PK HADOOP

2、添、删、改用法

ASP.NET + SqlSever 大数据解决方案 PK HADOOP

3、启用分布式事务

服务器需要开启MSDTC等服务

4、Taskable是所有分布式计算的底层核心

分页分组等复杂的运算都从这里展开，支DataTable、T:Class、值类型三种类型，能够方便的把多库的结果同步汇总到一个容器中。

使用Taskable需要注意每个节点获取的数据量都不能很大，通过少取多，内存运算，在取在运算的方式处理复杂数据的查询。

ASP.NET + SqlSever 大数据解决方案 PK HADOOP

5、使用Taskable进行分组查询

统计类报表类的查询，查询结果集不会太大，完全可使用Taskable进行处理，Merge方法能够将所有库查询的结果集合并到一个新的集合

6、使用Taskable扩展函数，让你处理多库运算更加方便。

7、分布式分页

考虑了分库机制，主键建议使用GUID来保证独一，只有主键唯一才可以使用该分页函数

至于原理我就不多讲了，一个贴子也说不完，有幸趣的朋友可以加群： 225982985 讨论

源码地址：https://github.com/sunkaixuan/SqlSugar

哈哈我已经尽力了，不管好坏为了给个赞哈

正文到此结束

所属分类：编程技术

本文标签： 服务器 UI 企业 web 负载均衡配置同步文章 update https 安装分页博客目录 git sql 分布式事务 http tab 安全时间 ask aix 压力 GitHub 统计 Hadoop 数据库大数据分组查询源码创业数据 src
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,964) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,243) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,046) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,946) 评论(0)
Decorators in ES7

浏览(16,562) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,536) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,980) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,895) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,042) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,195) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG