SQL开窗函数(窗口函数)详解 一、什么是开窗函数 开窗函数/分析函数:over() 开窗函数也叫分析函数,有两类:一类是聚合开窗函数,一类是排序开窗函数。 开窗函数的调用格式为: 函数名(列名) OVER(partition by 列名 order by列名) 。 如果你没听说过开窗函数,看到上面开窗函数的调用方法,你可能还会有些疑惑。但只要你了解聚合函数,那么理解开窗函数就非常容易了。 我们知道聚合函数对一组值执行计算并返回单一的值,如sum(),count(),max(),min(), avg()等,这些函数常与group by子句连用。除了 COUNT 以外,聚合函数忽略空值。 但有时候一组数据只返回一组值是不能满足需求的,如我们经常想知道各个地区的前几名、各个班或各个学科的前几名。这时候需要每一组返回多个值。用开窗函数解决这类问题非常方便。 开窗函数和聚合函数的区别: (1)SQL 标准允许将所有聚合函数用作开窗函数,用OVER 关键字区分开窗函数和聚合函数。 (2)聚合函数每组只返回一个值,开窗函数每组可返回多个值。 开窗函数与聚合函数一样,也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回一个值,开窗函数可以为每组返回多个值,因为开窗函数所执行聚合计算的行集组是窗口。 注:常见主流数据库目前都支持开窗函数,但mysql数据库目前还不支持(8.0后已支持)。 不过MySQL中可以通过变通的方式支持开窗函数。 示例: 开窗函数: MySQL实现相同功能: 其他情况只需把开窗函数转换成MySQL支持的语法即可。 转自:https://www.zhihu.com/question/ https://blog.csdn.net/sigusoft_/article/details/ 二、使用及说明 1. 分区排序:row_number () over() 有如下学生成绩表:students_grades
查询每门课程course_name前三名的学生姓名及成绩,要求输出列格式如下: course_name, number, stu_name, grades 查询语句如下:
2. 几个排序函数row_number() over()、rank() over()、dense_rank() over()、ntile() over()的区别 (1) row_number() over(): 对相等的值不进行区分,其实就是行号,相等的值对应的排名不同,序号从1到n连续。 (2) rank() over(): 相等的值排名相同,但若有相等的值,则序号从1到n不连续。如果有两个人都排在第3名,则没有第4名。 (3) dense_rank() over(): 对相等的值排名相同,但序号从1到n连续。如果有两个人都排在第一名,则排在第2名(假设仅有1个第二名)的人是第3个人。 (4) ntile( n ) over(): 可以看作是把有序的数据集合平均分配到指定的数量n的桶中,将桶号分配给每一行,排序对应的数字为桶号,序号从1到n连续。如果不能平均分配,则较小桶号的桶分配额外的行,并且各个桶中能放的数据条数最多相差1。 学生成绩表同上,查询语句如下:
查询结果如下:
3. 执行顺序 在使用 row_number() over()函数时候,over()里头的分组以及排序的执行,晚于 where 、group by、 order by 的执行。 具体可查看文章:https://blog.csdn.net/sigusoft_/article/details/ 4. 其他开窗函数 1、row_number() over(partition by … order by …) 增加一列,类似与增加伪列 2、rank() over(partition by … order by …) 3、dense_rank() over(partition by … order by …) rank(): 跳跃排序,如果有两个第一级时,接下来就是第三级。 dense_rank(): 连续排序,如果有两个第一级时,接下来仍然是第二级。 4、count() over(partition by … order by …) 5、max() over(partition by … order by …) 6、min() over(partition by … order by …) 7、sum() over(partition by … order by …) 8、avg() over(partition by … order by …) 9、first_value() over(partition by … order by …) 10、last_value() over(partition by … order by …) 与函数的功能一致,只是是开窗函数 11、lag() over(partition by … order by …) 12、lead() over(partition by … order by …) lag 和lead 可以 结果集中,按一定排序所排列的当前行的上下相邻若干offset 的某个行的某个列(不用结果集的自关联); lag ,lead 分别是向前,向后; lag 和lead 有三个参数,第一个参数是列名,第二个参数是偏移的offset,第三个参数是 超出记录窗口时的默认值)本段转自:https://www.bbsmax.com/A/q4zVkPLxJK/ over子句的复用 WINDOW r AS ( PARTITION BY std.ticket_id ORDER BY std.step_end_time ) 这句话就是将 ‘( PARTITION BY std.ticket_id ORDER BY std.step_end_time ) ’ 声明为子句,然后别名是 r ;然后就可以在 over() 中使用了。 注意:这段声明要写在where句子的后面,如下所示: 本文大部分转载自:https://www.douban.com/group/topic//
2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/83729.html