初识 KEEPFILTERS
我们已经知道,CALCULATE 的筛选器参数的默认行为是覆盖同一列上已有的筛选器,让我们举一个简单的例子,下面这个度量值忽略 Product[Category]上的已有筛选器,只返回 Audio 的销售额。
Audio Sales := CALCULATE ( [Sales Amount], 'Product'[Category] = "Audio" )
如图所示,对于 Audio Sales 度量值,Audio 对应的 Sales Amount 值在报告的所有行上重复显示。
CALCULATE 应用新筛选器覆盖当前列上已存在的筛选器,其他列的筛选上下文保持不变。如果不想覆盖现有的筛选器,可以对筛选参数使用 KEEPFILTERS。例如,如果你只想在外部筛选上下文为 Audio 的行显示 Audio 销售额,否则显示空白值,可以定义以下度量值:
Audio Sales KeepFilters := CALCULATE ( [Sales Amount], KEEPFILTERS ( 'Product'[Category] = "Audio" ) )
KEEPFILTERS 修改 CALCULATE 将筛选器参数应用于筛选上下文的方式。它不会覆盖同一列上的现有筛选器,而是将新筛选器追加到现有筛选器中。因此,只有包含在筛选上下文中的产品类别才会显示结果。如图所示
正如它名字的含义,KEEPFILTERS 不覆盖现有筛选,而是保留现有筛选并将新筛选器追加到筛选上下文。我们可以用下图描述该行为。
KEEPFILTERS 不执行覆盖操作,它将 CALCULATE 筛选参数生成的新筛选器追加到上下文中。如果我们在 Cell Phones 行查看 Audio Sales KeepFilters 度量值,得到的筛选上下文包含两个筛选器:Cell Phones 和 Audio。由于这两个条件的交集是空集,所以结果为空。
理解 KEEPFILTERS
在 DAX 的复杂函数排行榜上,KEEPFILTERS 有一个醒目的位置。某种程度上,它的行为比较容易学习和记忆,但是你很难精确掌握何时使用它以及使用它会产生什么结果。类似于 ALLSELECTED,KEEPFILTERS 要求你准确地理解它的语义,然后才能安全地使用它。而且,正如对 ALLSELECTED 的介绍那样,我们使用 KEEPFILTERS 来揭示有关筛选上下文内部的更多细节。
KEEPFILTERS 的目的非常简单:它将新的筛选上下文与之前的筛选上下文进行逻辑上的 AND 运算。一个例子有助于更好地理解它。在下面的透视表中,公式定义如下:
Sales Amount] := SUMX ( Sales, Sales[Quantity] * Sales[Unit Price] ) [RedSalesCalc] := CALCULATE ([Sales Amount], Product[Color] = "Red") [RedSalesValues] := CALCULATE ([Sales Amount], Product[Color] = "Red",VALUES ( Product[Color] )) [RedSalesKeepFilter] := CALCULATE ([Sales Amount],KEEPFILTERS ( Product[Color] = "Red" ))
正如你所看到的,RedSalesCalc 总是计算红色产品的销售,而 RedSalesValues 和 RedSalesKeepFilter 只在红色已经存在于筛选上下文中时才计算红色产品的销售额。事实上,每个度量值的计值方式都有所不同:
- RedSalesValues 显式使用 VALUES 函数检索当前筛选上下文中活动的颜色值,CALCULATE 将其与 Product[Color]上的筛选条件取交集。
- RedSalesKeepFilter 使用 KEEPFILTERS 函数。KEEPFILTERS 在计算内部参数之后,将结果与之前的筛选上下文取交集。
虽然两个度量值看起来非常相似,在这个例子中它们也得到相同的结果,但是这是两种不同的实现技术:
- KEEPFILTERS 不是表函数:它返回的结果不是表。事实上,你只能在 CALCULATE 中使用 KEEPFILTERS,或者在迭代时用作顶层函数(我们将很快看到这个特性)。
- KEEPFILTERS 将其内部条件与之前的整个筛选上下文置于 AND 条件中,而 VALUES 只能与单个列做 AND 计算。这个事实在前面的示例中并不明显;通过下面的例子,它会变得更加清晰。
KEEPFILTERS 与上下文转换
当 KEEPFILTERS 用于迭代函数的第一参数时,发生上下文转换后,它将保留现有的筛选上下文,使用转换后的筛选上下文与其计算交集。
Average Sales Only Trendy Colors := VAR TrendyColors = TREATAS ( { "Red", "Blue", "White" }, 'Product'[Color] ) RETURN AVERAGEX ( KEEPFILTERS ( TrendyColors ), [Sales Amount] )
Average Sales Only Trendy Colors 度量值只计算 TrendyColors 中所包含颜色的平均销售额,而不考虑那些不在当前 TrendyColors 中的颜色。如果此度量值的外部上下文中有一个包含{Red, Yellow, White}的筛选器,那么结果将仅对红色和白色计值,忽略黄色和蓝色。
被还原的复杂筛选器
要理解 VALUES 和 KEEPFILTERS 之间的区别,你需要在同一个查询中混合使用上下文转换和复杂筛选器。假设你希望计算一个显示月平均销售额的度量值。此度量值将沿着年和月迭代,并为每个月计算总销售额。然后使用标准的 AVERAGEX 函数聚合各部分的结果,如下例所示:
[AvgMonthlySales] := AVERAGEX ( CROSSJOIN ( VALUES ( 'Date'[Calendar Year] ), VALUES ( 'Date'[Month] ) ), [Sales Amount] )
如果在一个简单的报告中使用这个度量值显示各年份的平均销售额,结果是正确的
为了说明 KEEPFILTERS 的用处,你需要在日历表上创建一个复杂的筛选器。这样做时,你会看到公式将不再计算正确的值。一个复杂的筛选器(也称为“固化筛选器(arbitrarily shaped filter)”,我们将在 DAX 高级原理中介绍)是一个包含相互关联筛选列的筛选器。
报告中的可见数据集显示了 2007 年和 2008 年的所有月份,你可以将其表示为:
FILTER ( CROSSJOIN ( VALUES ( 'Date'[Calendar Year] ), VALUES ( 'Date'[Month] ) ), OR ( 'Date'[Calendar Year] = 2007, 'Date'[Calendar Year] = 2008 ) )
唯一的筛选条件是日历年,所以这还不是一个复杂的筛选器。你可以通过层级结构上的筛选器选择 2007 年的最后两个月和 2008 年的前两个月来创建一个复杂的筛选器,如图所示。
这次的筛选条件不再是一个简单筛选器。实际上,你只能在同一表达式中使用同时包含年和月的条件来编写它,如下所示:
EVALUATE FILTER ( CROSSJOIN ( VALUES ( 'Date'[Calendar Year] ), VALUES ( 'Date'[Month] ) ), OR ( OR ( 'Date'[Calendar Year] = "CY 2007" && 'Date'[Month] = "November", 'Date'[Calendar Year] = "CY 2007" && 'Date'[Month] = "December" ), OR ( 'Date'[Calendar Year] = "CY 2008" && 'Date'[Month] = "January", 'Date'[Calendar Year] = "CY 2008" && 'Date'[Month] = "February" ) ) )
换句话说,固化筛选器(arbitrarily shaped filter)是一种特殊的筛选器,它还内含筛选器本身所涉及的列之间的关系。如果只处理这种筛选器,DAX 能顺利应对。但当你将它们与其他筛选器组合时,问题就出现了,如下图所示,这里我们使用上一幅图的筛选器过滤 AvgMonthlySales。
如你所见,列的总计是错误的(你可以手动计算一下平均值以验证此结论)。在解决这个问题之前,我们需要更好地理解正在发生的事情。
TOPN 筛选器的潜在风险
需要注意的是,用户可能会以许多不同的方式引入复杂筛选器,而且大多数情况下,他们并不会意识到这个问题。例如,在 Excel 的众多筛选选项中,包括一个“TOP N 筛选器”,该筛选器允许用户从值列表中选择前 N 个元素,并使用度量值对列表进行排序。
在下图中,你可以看到用户在透视表中选择了按 AvgMonthlySales 排序的前三个产品名称。
因为年份位于行上,用户期望每年看到三个产品(前三个),而透视表显示了四个产品。原因是复杂筛选被还原改变了计算 AvgMonthlySales 的筛选器。
在这种情况下,存储在条件中的关系类似于取 TOPN 的操作(MDX 函数使用 TOPCOUNT,它对应于 DAX 中的 TOPN 函数)。这种操作每年检索一定数量的产品(仅检索给定年份的前三个产品)。它存储了年与产品之间的关系,这种关系被复杂筛选还原所破坏。
对于同一个透视表,如果你使用正确的 AvgMonthlySales 公式(加入 KEEPFILTERS 的公式),得到的就是预期的结果
DAX 查询中的 KEEPFILTERS
最后值得注意的是,KEEPFILTERS 不仅在某些度量值中有用(正如我们已经演示的),而且在查询中也很有用。例如,查看以下查询:
EVALUATE FILTER ( CALCULATETABLE ( ADDCOLUMNS ( CROSSJOIN ( VALUES ( 'Date'[Calendar Year] ), VALUES ( 'Product'[Product Name] ) ), "Sales", [Sales Amount] ), GENERATE ( VALUES ( 'Date'[Calendar Year] ), TOPN ( 3, VALUES ( 'Product'[Product Name] ), [Sales Amount] ) ) ), NOT ( ISBLANK ( [Sales] ) ) ) ORDER BY 'Date'[Calendar Year], 'Product'[Product Name]
你可能不希望编写这么复杂的查询,这里还有一种更好的写法,将 GENERATE 函数作为 ADDCOLUMNS 的参数,如下面的代码所示:
EVALUATE FILTER ( CALCULATETABLE ( ADDCOLUMNS ( GENERATE ( VALUES ( 'Date'[Calendar Year] ), TOPN ( 3, VALUES ( 'Product'[Product Name] ), [Sales Amount] ) ), "Sales", [Sales Amount] ) ), NOT ( ISBLANK ( [Sales] ) ) ) ORDER BY 'Date'[Calendar Year], 'Product'[Product Name]
然而,当使用代码生成器和其他自动化工具生成查询时,像之前那种更复杂的查询是非常常见的,因为它们清楚地将投影到行和投影到列上的筛选分开。在这种情况下,你可能会遇到复杂筛选还原,因为内层的 ADDCOLUMNS 所迭代的列,被作为 CALCULATE 筛选器参数的 GENERATE 进行了筛选。因此,查询不会检索每年排名前三的产品,而是检索了更多的产品列表。
在本例中,查询的正确写法如下:
EVALUATE FILTER ( CALCULATETABLE ( ADDCOLUMNS ( KEEPFILTERS ( CROSSJOIN ( VALUES ( 'Date'[Calendar Year] ), VALUES ( 'Product'[Product Name] ) ) ), "Sales", [Sales Amount] ), GENERATE ( VALUES ( 'Date'[Calendar Year] ), TOPN ( 3, VALUES ( 'Product'[Product Name] ), [Sales Amount] ) ) ), NOT ( ISBLANK ( [Sales] ) ) ) ORDER BY 'Date'[Calendar Year], 'Product'[Product Name]
在这种情况下,KEEPFILTERS 必须在 CROSSJOIN 上操作,以便每年只检索由外层的 GENERATE 选择的前三个产品。需要注意的是,在这种特定的案例中,迭代不是在度量值中发生的,而是在 ADDCOLUMNS 中。
老师KEEPFILTERS是将现有的(or之前的)筛选追加,这个“现有的(or之前的)” 如何理解呢?
是理解为:CALCULATE中除了KEEPFILTERS之外,其余类型筛选器生效之前还是之后呢?
CALCULATE计值流貌似没有提及这一细节,原文所提及的表述为:
“如果筛选器参数使用了 KEEPFILTERS,那么该筛选器会被添加到筛选上下文中,而不会覆盖同一列的现有筛选器。”
表述里的”该筛选器”指代的含义有些笼统,不太容易理解。
老师请教一下这个公式有两个调节器,这两个调节器是怎么共同作用的,公式完整计值流是怎么样的?(图1是原始计值上下文,图2是公式,其中currentyearmonth当前筛选上下文的年月)
“你可能不希望编写这么复杂的查询,这里还有一种更好的写法,将 GENERATE 函数作为 ADDCOLUMNS 的参数,如下面的代码所示:”
1.老师这个例子的代码是避免固态筛选器被拆开的嘛,也就是不会产生 复杂筛选还原 对嘛?
2.在维度表中来自两个关系表的字段由于CROSSJOIN组合,但是同一个表中会(auto-exists)
如果例子中的:
年份:2007,2008
月份:1 月,2 月,11 月,12 月
来自同一张表,还会产生复杂筛选还原吗?
高老师,这句话 “CALCULATE 的筛选器参数的默认行为是覆盖同一列上已有的筛选器”, 我个人理解覆盖有前提条件,如果筛选器为布尔表达式或表函数的第一参数带有ALL时才可以说是覆盖,不知道我理解是否对?
高老师,需要您的帮助,我不太明白:
在”KEEPFILTERS 与上下文转换”这一节的例子,如果把Keepfilters去掉生成一个新的度量值,外部筛选上下文是product[color], 不懂为什么每一行都是RED+WHITE+BLUE的销售额之和。即使不使用KEEPFILTER, AVERAGEX内部在调用[Sales Amount]也会发生上下文转换吧,TrendyColors有筛选作用
老师好!图片里说到”发生上下文转换后“,我有点不懂上下文转换是怎么发生的,表达式里没有calculate。如果创建一个新的度量值DeKeepfilter_Average Sales Only Trendy Colors,这个度量值把keepfilters去掉了,维度拖出颜色后,每行都是红绿蓝的平均值,我不太明白为什么维度上的颜色列没有筛选作用,AVERAGEX的第一参数是受到外部筛选上下文作用的吧
最后一个TOPN的案例,CY 20007出现产品名称为4个,是严格逻辑计算下的4个,还是计算引擎随机给出的4个;
如果是前者,请教老师是否可以图解一遍计算逻辑的流程;
看了好几遍没弄懂:CY 2007筛选标签下 CROSSJOIN (VALUES ( ‘Date'[Calendar Year] ),VALUES ( ‘Date'[Month] ))
是如何破环外部TOP3复杂筛选器的,以及破坏后的结果是什么样子的。
谢谢老师~
高老师请教一下,公式,切片器,矩阵如图所示
请问公式中画框的部分两个调节器是这么操作的?
(allselected清除矩阵的年月,保留外部的年月, keepfilter在切片器年月,矩阵的年月基础上加了一个小于当前行的年月?)
高老师,文中提到的topn复杂筛选还原造成破坏的原理是什么?讲了是储存了年与产品之间的关系,具体怎么形成的能稍微扩展一下吗?
老师,案例里的DATE[CALENDAR YEAR]是文本格式(CY2007,CY2008…), 这里又怎么能直接 DATE[CALENDAR YEAR]= 2007 呢?
EVALUATE
FILTER (
CROSSJOIN (
VALUES ( ‘Date'[Calendar Year] ),
VALUES ( ‘Date'[Month] )
),
OR (
OR (
‘Date'[Calendar Year] = 2007
&& ‘Date'[Month] = “November”,
‘Date'[Calendar Year] = 2007
&& ‘Date'[Month] = “December”
),
OR (
‘Date'[Calendar Year] = 2008
&& ‘Date'[Month] = “January”,
‘Date'[Calendar Year] = 2008
&& ‘Date'[Month] = “February”
)
)
)
————————–
© 版权声明:本文为Power BI极客原创文章,著作权归作者所有
商业转载请联系作者获得授权,非商业转载请注明出处。
源地址:https://www.powerbigeek.com/understanding-keepfilters-functions/
老师,案例文件没法下载怎么处理呀
高老师,帮忙看下这个地方,我的理解对吗,在文章中没有看到类似的说明,感谢。
这里每一行计算AvgMonthlySales的时候, 取的透视表所在行的年份和产品名两个列组成的固化筛选器, 但是在计算AvgMonthlySales的过程中这个固化的初始外部筛选器被还原成两个对列的筛选组成的简单筛选器. 在
————————–
CROSSJOIN (
VALUES ( ‘Date'[Calendar Year] ),
VALUES ( ‘Date'[Month] )
)
————————–
中固化筛选器被还原成简单筛选, 又因为 ‘Date'[Month] 此时只能通过’Date'[Calendar Year] 来筛选, 故生成了对应年份的12个月作为average()的第一参数, 截至此时, 外部的固化筛选器的product name还是以和’Date'[Calendar Year] 存在关系的形式存在, 但是在之后计算average()的第二参数的时候,发生的上下文转换的时候才把product name还原成简单独立的列筛选? 还是在之前CROSSJOIN()那一步product name就已经被还原成独立的列筛选了?
另外一个有疑惑的地方是虽然发生了复杂筛选还原, 但是为何每一年显示的产品数量会不同呢?这背后的原理你在文章中并没有解释?
Sales Red :=
CALCULATE (
[Sales Amount],
KEEPFILTERS ( ‘Product'[Color] = “Red” ),
ALL ( ‘Product'[Color] )
)
————————–
针对上面的度量值,请教一下:
1、cal函数的第二参数KEEPFILTERS ( ‘Product'[Color] = “Red” )是一个显式筛选器参数,对吗?这里的KF函数应该不是在calculate计值流的都四步产生作用。
2、cal函数的第三参数ALL ( ‘Product'[Color] )是一个调节器参数,对吗?
如何去区分cal函数的一个参数是显式筛选器参数还是调节器参数呢?all类函数直接作为cal函数的非第一参数都是调节器参数吗?
老师下图中的理解您看下对吗,如果对的话,我想在power bi里面用topn去复现这个问题,好像不可以,bi里面的topn好像只能对一个字段进行计算
Sales Red :=
CALCULATE (
[Sales Amount],
KEEPFILTERS ( ‘Product'[Color] = “Red” ),
ALL ( ‘Product'[Color] )
)
老师,如果外部筛选上下文为颜色列,先是两个修改器分别发生作用,即All取消外部筛选器,keep filter保留外部筛选器,假设当时外表部筛选器为黑色,两个修改器同时作用外部筛选器,返回为空筛选器吗?空筛选器再和内部筛选器红色发生作用,返回为红色还是空集呢?all和keepfilter 修改器他们谁先和外部筛选器发生作用?谢谢
老师,能帮我看下【销售金额2】这个度量值在行标签为2016与2017时的计值流程么 。
按照我的理解,【销售金额2】这个度量值虽然发生了复杂筛选还原,但结果应该还是与【销售金额】的结果完全一致才对,而现在在年份里的结果却对不上,不知道是什么原因呢,希望老师能帮我解惑,先行拜谢!
我的模型只有两张表:日期表与订单表,关系为一对多关系,日期表为一端,订单表为多端。
PowerBI Desktop 的版本: 2.88.802.0 64-bit (2020年12月)
这个网站很好,网上摄入理解dax的文章并不多。但是问题也很突出,那就是,这个网站仅仅是“翻译”而已,而不是通过作者理解而去“复述”。
我看这篇文章就像是在看本科学生翻译的论文。
当 KEEPFILTERS 用于迭代函数的第一参数时,发生上下文转换后,它将保留现有的筛选上下文,使用转换后的筛选上下文与其计算交集。
为什么是发生转换之后,使用转换后的筛选上下文与初始筛选上下文计算交集?
先不发生转换,直接用外部筛选器筛选迭代参数的表,不行吗?干嘛还要加KF?
文章中:“RedSalesKeepFilter 使用 KEEPFILTERS 函数。KEEPFILTERS 在计算内部参数之后,将结果与之前的筛选上下文取交集。”,其中:“KEEPFILTERS 在计算内部参数之后”,计算内部参数,这里具体怎么计算?指内参=红色?还是内参覆盖外部筛选文后的红色?