MySQL同列不同行计算

本文主要是介绍MySQL同列不同行计算，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、问题

有下面这样的一张表：

date	amount
2015-12-31	3000
2016-01-22	3100
2016-01-23	3100
2016-01-24	3100
2016-01-25	3100
2016-01-26	3100
2016-01-27	3100
2016-01-28	3100
2016-01-29	3100
2016-01-30	3100
2016-01-31	3300
2016-02-01	3400
2016-02-02	3500

想要获取像下面这样的结果：

year	month	diff
2016	1	300
2016	2	200

写出SQL语句。

从结果可以猜测，就是求每一个月与上一个月的累计值之间差值，其中amount的值是已经是累计值，所以需要再sum计算了。

初一看非常简单，不就是按年和月分组统计吗？

仔细一想其实没有想像中那么容易，最要是要计算行之间的差值，在MySQL中计算列之间的差值非常容易，难点在于要计算行之间的差值，这需要一点小技巧，通过MySQL变量和子查询把列值转换为行值。

注意：对于高并发的业务，我们一般不会把这样的计算放在MySQL中，尽量在应用层处理，或者直接走统计，因为在高并发业务中保护数据库是我们重要的责任。

当然如果仅仅是一些离线的报表或者统计业务当然是没有问题，因为离线报表之类的业务可以用到，所以下面的小技巧还是可以了解一下。

二、导入数据

首先创建表：

CREATE TABLE `stat_year`  (`stat_date` date NULL DEFAULT NULL,`amount` int UNSIGNED NULL DEFAULT NULL
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

加载数据，忽略掉第一行表头：

load data local infile 'data.txt' into table amount fields terminated by '\t' ignore 1 lines;

导入后数据

三、利用变量保存前值

我们先来了解一下MySQL在SQL语句中怎样使用变量。

SELECTtmp.stat_date,tmp.current_amount,tmp.pre,( tmp.current_amount - tmp.pre ) AS diff 
FROM(SELECTstat_date,amount AS current_amount,@pre_amount AS pre,@pre_amount := sp.amount FROMstat_pay sp,( SELECT @pre_amount := 0 ) AS pre_temp ) AS tmp;

利用变量保存前值

首先，MySQL中用户变量是以@开头，系统变量@@开头，赋值使用的是:=

所以，sql中的

( SELECT @pre_amount := 0 ) AS pre_temp

相当于定义了一个用户变量@pre_amount并且初始化它的值为0。

第一个from语句的子查询部分就相当于没选择一行，先给访问@pre_amount的值做为前值并且给了一个别名pre，然后在将当前行的值赋值给@pre_amount。

现在最外层的查询就容易理解多了，就是查当前行的值，当前行前一行的值，和当前行的值与前行值的差值。

我们来看一下上面的SQL语句的explain结果：

explain

explain的输出说明：

id是每一个select的标识，id越大优先级越高，越先执行，id相同的从上向下执行
select_type：PRIMARY表示最后执行的select；DERIVED表示from语句中的子查询
table表示使用的表，表示使用id为2得到的派生表

现在我们来再来看explain的输出，就清晰多了：

首先找id最大的，id为3的最大，最先执行，我们可以看到select_type是DERIVED，表示它会生成一个派生表，其实就是相当于定义了一个变量@pre_amount放在一张表中，这个表的别名是pre_temp，这个是第2个from语句中的子查询。

id为2的有2个，select_type都是DERIVED，因为这个2个都是第一个from语句中的子查询。
从上往下，我们看到第2行的table是，表示它使用的是id为3的查询生成的派生表，也就是pre_temp这张表。type为system，表示这张表只有1行，从rows也可以看出来。

第3行table是sp表示直接使用了sp这张实际表，sp是stat_pay的别名。

最后id为1的select_type是PRIMARY表示这是最后执行的最外层查询，table是表示使用的表是id为2的查询得到的派生表。

四、最终解决方案

因为要按年、月分组，而我们只有日期，所以我们可以通过substring或者date_format来计算出年和月的值。

SELECT substring(stat_date,1,4) AS stat_year,substring(stat_date,6,2) AS mon FROM stat_pay;
SELECT date_format(stat_date,'%Y') AS stat_year,DATE_FORMAT(stat_date,'%m') AS mon FROM stat_pay;

下面我们看一下我们最终的SQL：

SELECTtmp.stat_year,tmp.mon,tmp.current_amount,tmp.pre,( tmp.current_amount - tmp.pre ) AS diff 
FROM(SELECTtotal_tmp.stat_year,total_tmp.mon,total_tmp.total_amount AS current_amount,@pre_amount AS pre,@pre_amount := total_tmp.total_amount FROM(SELECTsubstring( stat_date, 1, 4 ) AS stat_year,substring( stat_date, 6, 2 ) AS mon,max( amount ) AS total_amount FROMstat_pay GROUP BYstat_year,mon ) AS total_tmp,( SELECT @pre_amount := 0 ) AS pre_temp ) AS tmp;

result

如果你是一个完美主义者，想要结果一模一样，不想年月中有前缀0，可以通过下面的3种方式的任一一种把字符串转换为整型：

substring( stat_date, 1, 4 ) + 0 AS stat_year
convert(substring( stat_date, 6, 2 ),unsigned integer) as stat_year
cast(substring( stat_date, 6, 2 ) as unsigned integer) as stat_year