开窗函数详解_oracle开窗函数

2024年 9月 8日上午8:08 • 激活谷笔记

开窗函数详解_oracle开窗函数开窗函数详解(保姆级实操)窗口函数类似于聚合函数，但又不同于聚合函数。聚合函数是将组内多个数据聚合成一个值，而窗口函数除了可以将组内数据聚合成一个值，还可以保留原始的每条数据。本文举例场景：分组求和以及累计求和分组排序行偏移计算移动均值和移动

开窗函数详解(保姆级实操) 　　窗口函数类似于聚合函数，但又不同于聚合函数。聚合函数是将组内多个数据聚合成一个值，而窗口函数除了可以将组内数据聚合成一个值，还可以保留原始的每条数据。　　本文举例场景：分组求和以及累计求和分组排序行偏移计算移动均值和移动累计聚合函数和条件函数的组合 sum over + case when 　　小编最近开通了群，欢迎知乎的读者公号求知鸟，添加好友，加群一起讨论。　　应用场景：　　场景1：BI里自带了多种聚合方式，可以直接用聚合函数新建字段进行计算，但是都是基于维度栏的字段进行聚合，如果需要不按照维度栏字段进行分组聚合，那就需要用到窗口函数来进行计算。　　场景2：BI里直接聚合计算得到的数据不能进行筛选和二次计算，如果需要对聚合结果进行筛选和二次计算，需要用到窗口函数来进行计算。　　基本语法：　　<窗口函数> 的位置，可以放以下两种函数：　　1）专用窗口函数，包括rank, dense_rank, row_number等专用窗口函数。　　2）聚合函数，如sum, avg, count, max, min, collect_set 等。　　partition by ：分组子句，表示窗口函数的计算范围，不同的组互不相干；　　order by：排序子句，表示分组后，组内的排序方式，默认是按照升序（asc）排列；

求知鸟　　窗口函数有以下功能：　　1）同时具有分组（partition by）和排序（order by）的功能；　　2）不减少原表的行数。　　窗口函数里的partition by和 order by子句的功能是对分组后的结果进行排序，和普通SQL查询语句中的group by 和order by类似。区别在于，group by分组汇总聚合后改变了表的行数，而partition by不会减少原表中的行数。窗口函数是对where或者group by子句处理后的结果进行操作，所以窗口函数原则上只能写在select子句中。　　使用方式：　　over (partition by xxx)按照xxx分组，无分组时写法为over (partition by 1/null) ；　　over (partition by xxx order by xx)按照xxx分组，并以xx排序　　Note：以上为Spark SQL的窗口函数使用方式，其他类型数据库可能存在不同使用方式。　　案例：　　案例1：分组求和以及累计求和　　sum1: sum([Number])over(partition by [Class]) 按Class分组求和，等同于小计　　sum2: sum([Number])over(partition by [Class] order by [Date]) 按Class分组进行累计求和；　　sum3: sum([Number])over(partition by 1)/ sum([Number])over(partition by null) 不分组计算总和，等同于总计。

　　案例2：分组排序　　dense_rank() over(partition by [Class] order by [Number] desc) 　　row_number() over(partition by 1 order by [Number]desc)

　　案例3：行偏移　　lag([Number])over(partition by [Class] order by [Date] ) 按Class分组日期排序后取上一行数据，取不到值则默认为null.下图中数据相当于环比；　　first([Number])over(partition by [Class] order by [Date]) 按Class分组日期排序后取第一行数据，order by [Date]；　　last([Number])over(partition by [Class])：按Class分组日期排序后取最后一行数据；last([Number])over(partition by [Class] order by [Date])：按Class分组日期排序后取当前行数据；

　　进阶用法：　　rows/range：窗口子句，是在分组(partition by)后，组内的子分组（也称窗口）。窗口有两种，rows和range，主要用来限制行数和数据范围。窗口子句必须和order by 子句同时使用，且如果指定了order by 子句未指定窗口子句，则默认为RANGE BETWEEN unbounded preceding AND CURRENT ROW，从当前分组起点到当前行。行比较分析函数lead和lag无窗口子句。　　窗口子句常用语法：　　rows 和range区别：　　1) rows是物理窗口，即根据order by 子句排序后，取的前N行及后N行的数据计算（与当前行的值无关，只与排序后的行号相关）。　　如下例中sum_rows：sum([Number]) over (partition by 1 order by [Date] rows between 2 preceding and current row)，是按照日期排序后取前2行和当前行数据的求和。尽管很多日期对应的数据不止一行，有两个Class存在，但是默认窗口内会对Class进行升序排列再选取前2行和当前行进行累计求和计算。　　2) range是逻辑窗口，是指定当前行对应值的范围取值，包含子分组（或窗口）里的所有行，和当前行有相同order by值，如果更多的行有同个order by值，当使用range会有更多的行参与计算。　　如下例中sum_range: sum([Number]) over (partition by 1 order by [Date] range between 2 preceding and current row), 是按照日期排序后取前2天和当前日期（连续3天）数据的求和。卡片里筛除了2021-01-04的数据。当Date=2021-01-01时，没有前两天日期数据，仅读取当天2条数据，sum=1+3=4；　　当Date=2021-01-03时，取2021-01-01，2021-01-02和2021-01-03连续3天的6条数据，sum=(1+3)+(2+3)+(2+4)=15; 　　当Date=2021-01-05时，没有2021-01-04数据，只取2021-01-03和2021-01-05 两天的4条数据，sum=(2+4)+(4+6) =15; 以此类推下去，结果如下例中所示。

　　场景：计算移动均值和移动累计　　近3天平均值（包含当天）：avg([Number]) over (partition by [Class] order by [Date] rows between 2 preceding and current row) 　　近3天累计（包含当天）：sum([Number]) over (partition by [Class] order by [Date] rows between 2 preceding and current row)

　　场景：聚合函数和条件函数的组合 sum over + case when 　　当满足xx条件，才去做sum聚合；　　一般的做法需要用筛选器多拉一条分支，再拼接回原逻辑，利用下面的组合公式，减少步骤且准确。　　

　　小编最近开通了群，欢迎知乎的读者公号求知鸟，添加好友，加群一起讨论。　　相关文章：　　数据分析笔试题01 　　数据分析笔试题02 　　数据分析笔试题03 　　数据分析笔试题04 　　数据分析笔试题05 　　数据分析笔试题06 　　数据分析笔试题07

画出哈夫曼树并求出哈夫曼编码_如何构造哈夫曼树

上一篇 2024年 9月 8日上午8:06

积分电路的工作原理_积分电路的工作原理

下一篇 2024年 9月 8日

二阶低通滤波器电路图_二阶低通滤波器电路图

二阶低通滤波器电路图_二阶低通滤波器电路图一阶低通滤波是什么意思一阶低通滤波器和二阶低通滤波器区别一阶低通滤波器是一种常见的信号处理技术，用于去除信号中高频噪声或干扰。该滤波器抑制信号中高于截止频率的部分，而保留低于截止频率的部分。1.一阶低通滤波器的工作原理一阶低通滤

激活谷笔记 2024年 8月 27日
Navicat Premium 16.3.9激活(navicat premium 16 激活办法)

Navicat Premium 16.3.9激活(navicat premium 16 激活办法)

激活谷笔记 2024年 8月 10日
用html做一个登录界面_h5网页设计与制作

用html做一个登录界面_h5网页设计与制作实现手机扫描二维码页面登录，类似web转自：http://www.cnblogs.com/fengyun99/p/3541251.html接上一章，我们已经基本把业务逻辑分析清楚了下面我们第一步，实现二维码的web动态生成。页面的二维码包含的信息我在

激活谷笔记 2024年 8月 27日
激活谷笔记

Navicat Premium 16.0.11激活(Navicat Premium16安装并激活成功教程激活图文教程【亲测可行】)

Navicat Premium 16.0.11激活(Navicat Premium16安装并激活成功教程激活图文教程【亲测可行】)

2024年 8月 23日
激活谷笔记

dl250首保多少公里_保养

dl250首保多少公里_保养豪爵铃木DL250落地多少钱？DL250手续全部办完要多少钱吉姆尼参考价：未上市查看参配底价购置税优惠经销商报价车主点评随着人们生活水平的不断提高，越来越多的人开始追求“诗和远方”除了自驾，还有很多热爱赛车运动的朋友。最近有网友想买一辆豪爵铃木DL

2024年 8月 2日
轩辕剑5打开没反应怎么办

轩辕剑5打开没反应怎么办上星期的一天，很普通的一个工作日，拖泥钱老师突然问我：“您愿意写一篇《轩辕剑叁外传：天之痕》的评测吗？”我抬起眼睛看向电脑屏幕右上角，上面清晰地显示着：2019年7月15日。熟悉的配方，原来的味道“爱过。

激活谷笔记 2024年 5月 18日
Navicat Premium 16.2.7激活(Navicat10版注册码)

Navicat Premium 16.2.7激活(Navicat10版注册码)

激活谷笔记 2024年 8月 23日
激活谷笔记

产品doe是什么意思_产品dom是啥意思

产品doe是什么意思_产品dom是啥意思电子电器/LED灯具产品美国能效法规DOE认证怎么注册流程详解最近正好碰到有人在询问DOE的问题，而且还是行业内的人，我想对于DOE的相关知识，平时不是经常接触的人可能不太清楚，那正好今天有时间，就给

2024年 5月 31日
激活谷笔记

xshell连接虚拟机命令_虚拟机怎么创建shell脚本

xshell连接虚拟机命令_虚拟机怎么创建shell脚本零基础自学Linux要多久？零基础自学Linux学习周期是很难控制的，少则半年多，多则一年以上，甚至于更长，受到了很多因素的影响，比如：学习安排、是否有合适的学习资源、遇到问题是否有人解答等，都会影响学习周期的长短。而且Linux是

2024年 5月 11日
激活谷笔记

soccer英语怎么读?_soccerplayer怎么读

soccer英语怎么读?_soccerplayer怎么读soccer是什么意思中文翻译英语词汇的学习与听说读写译的实际应用密不可分，因此英语综合能力的提高也离不开单词的学习积累。接下来我们就来学习一下soccer翻译成中文是什么意思。soccer是什么意思中文翻译soccer是一个英语名词，它的意

2024年 9月 6日
激活谷笔记

分区表有问题怎么修复_分区表出了问题如何修复

分区表有问题怎么修复_分区表出了问题如何修复分区表修复的简单方法！“电脑是Win10+Ubuntu双系统，因为Ubuntu分区所剩余的空间不足，而Windows所在的分区空间还很充足，于是准备切割出一个分区给Ubuntu重新挂载。分区完成后，重启开机无法启动电脑，使用U盘进入电脑后发现硬盘变成未分配空间了

2024年 5月 27日
激活谷笔记

（翻译）禀赋效应（Endowment Effect）

（翻译）禀赋效应（Endowment Effect）

2024年 6月 20日

开窗函数详解_oracle开窗函数

相关推荐