[转载]百万行mysql数据库优化和10G大文件上传方案 - 刀锋诚心 - 博客园

[转载]百万行mysql数据库优化和10G大文件上传方案 – 刀锋诚心 – 博客园.

最近这几天正在忙这个优化的方案,一直没时间耍,忙碌了一段时间终于还是拿下了这个项目?项目中不要每次都把程序上的问题,让mySQL数据库来承担,它只是个mySQL而已。

问题1:针对MySQL Community5.5+版本优化业务执行速度,提高整体系统效率

测试服务器硬件环境:Intel Core i5,8gb内存,7200rpm硬盘,Win7专业版

Table名称

读取频率

写入频率

最低连续读取速度

最低连续写入速度

预估数据量

C….

频繁

不频繁

30行/150ms

100行/s

百万行

D…

频繁

不频繁

30行/150ms

100行/s

百万行

De…..

频繁

不频繁

30行/150ms

10行/s

万行

St……

频繁

不频繁

30行/150ms

100行/s

百万行

S……

频繁

频繁

30行/150ms

100行/s

百万行

Pr…

很频繁

不频繁

1000行/s-5000行/s

100行/s

百万行/表

De…….

很频繁

频繁

1000行/s-5000行/s

1000行/s

百万行/表

De……

很频繁

频繁

1000行/s-5000行/s

1000行/s

百万行/表

 

看到这个想到的是拆分表,不外乎就是表的纵向拆分和横向拆分,我在项目中也遇到过类似的问题,当时也是使用mysql数据库当时大概列数有800 多,mysql数据一张表的字段是不能有800多个,最开始测试的是用String 按照JSON的格式存入的数据库,结果发现处理时加入了循环,反而使系统性能变得很慢导出一个Excel也是很吃力的,最后采用分表大概分了9张,解决了 问题,其实现在想想是不是使用对象的序列化,将序列化的对象存入数据库呢,使用在从数据库中取出来反序列化使用,当时分表后满足了需求就没再测试对象的序 列化的方法了。但是这次给的需求不需要纵向拆表,是否需要横向拆表呢?测试一次先,每次的点子都是要测试的e。

有些时候在mysql中还是要善用limit,

除开主键其余没加索引,这样上了百万条的数据查询应该是不存在问题,话不多说优化SQL吧。

但是插入还是存在问题,是否需要分表呢?如果只是上百万还是可以不用分表的,如果分表就要处理好分页查询,删除和增加的操作,我还是喜欢使用 Mysql数据的同步,使用两个mysql数据库,服务器ip分别为ip1和ip2,我们将ip1作为Master数据库,把ip2作为slave服务 器,我们可以采用单项同步的方式,就是Master的数据是主数据,然后slave主动去Master哪儿同步数据回来,太晚了,明天测试通过就可以开始 优化项目了。

在数据库中数据在100w多行时插入数据耗时2.822秒的时间,

问题2:大文件上传居然有这样的要求,

档案大小

Action

最大执行内存占用

内网最低传输速率(802.11g)

50mb

Upload

5mb

1mb/s

500mb

Upload

5mb

1mb/s

5gb

Upload

5mb

1mb/s

10gb

Upload

5mb

1mb/s

50mb

Download

5mb

1mb/s

500mb

Download

5mb

1mb/s

5gb

Download

5mb

1mb/s

10gb

Download

5mb

1mb/s

 

以前遇到过一个视频网站上传要求也是最大4G左右,这次居然要上传最大的有10G,

为提高大文件传输速率,将目标文件分成N块文件,对应启动N个线程通过TCP/IP协议来传 输,传输文件前先检查是否存在该文件的临时文件群,如果存在找出其断点位置进行续传,最后合并文 件。异步分割发送,用目前最主流的FLASH+AJAX技术。ActionScript和HTML5是支持SOCKET通讯的,呵呵。

实现流程:

1 客户端向服务端发送传递文件启动信号(发送文件名字)

2 服务器检查是否包含有该文件所对应的临时文件(eg, 传输file.txt,就检查是否存在temp[i]file.txt,(i为 第N块临时文件)),如果存在就发送所有临时文件的断点位置给客户端

3 客户端更具文件大小将文件分为N块(每块默认大小为500M,可通过参数进行配置)以加快传输速率, 然后根据服务器返回的断点位置(如果有)对每块文件进行移位,移动到断点位置进行续传,如果服务器 上没有临时文件夹,就进行普通的传送文件

4当所有线程工作完成,合并所有临时文件夹。

大文件上传的问题已经实现使用的是serverlight实现的。测试通过了大概是5-6M每秒。

赞(0) 打赏
分享到: 更多 (0)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏