从数据到信息
从信息到洞察

理解上下文转换

上下文转换是 DAX 计值过程中一个非常灵活的部分,灵活的同时意味着复杂,DAX 的大部分复杂性都蕴含于此。上下文转换需要在理解 CALCULATE 函数的基础上学习。

初识上下文转换

在理解 CALCULATE 的行为之后,你知道这个函数在计值过程中会执行一项非常重要的任务:将任何现有的行上下文转换为等效的筛选上下文。这就是我们说的上下文转换。

为了演示该行为,我们创建一个包含 CALCULATE 表达式的计算列。由于计算列总是具有行上下文,因此会触发上下文转换。例如,在产品表中定义一个包含以下 DAX 表达式的计算列:

Product[SumOfUnitPrice] = SUM ( Product[Unit Price] )

公式对所有产品的标价求和。表达式在行上下文中计算,没有筛选上下文,因此它返回表中所有产品的单价之和,而不是正在计值的当前行产品的单价。你可以在下图中看到这种行为。

SumOfUnitPrice 在计算列中计值,返回所有产品单价的总和

现在,你可以将表达式稍作修改创建一个新的计算列,加入 CALCULATE

Product[SumOfUnitPriceCalc] = CALCULATE ( SUM ( Product[UnitPrice] ) )

什么?只有一个参数的 CALCULATE? 筛选器去哪儿了?实际上,我们用的是 CALCULATE 的极简形式。我们之前说过,CALCULATE 惟一的必选参数是第一参数,因此在不使用任何筛选器的情况下调用 CALCULATE 是完全可以的。在这种情况下,CALCULATE 不会使用其他条件更改现有的筛选上下文,它仍然执行你现在正在学习的行为:接受现有的行上下文(如果有的话),并将它们转换为等效的筛选上下文。请注意,所有现有的行上下文都合并到新的筛选上下文中,稍后我们会详细阐述。

在本例中,CALCULATE 查找现有的行上下文,并在产品表上发现一个由计算列定义的正在执行的行上下文。CALCULATE 考虑这个行上下文,并用一个筛选上下文取而代之,该筛选上下文只包含行上下文正在迭代的当前行。我们将此行为称为上下文转换。一般来说,我们将以上过程简述为CALCULATE 执行上下文转换,将所有行上下文合并到一个新的等效筛选上下文中

在 CALCULATE 内部,表达式 SUM ( Product[Unit Price] )在只包含产品表当前行的筛选上下文中计值,由于 CALCULATE 执行了上下文转换。这一次的结果与产品单价(unit price)相同,如图所示。

通过使用 CALCULATE,行上下文被转换为筛选上下文,改变了结果

当你第一次观察到这种行为,会发现很难理解为何 CALCULATE 要执行上下文转换。一旦开始使用之后你就一定会喜欢上该特性,因为多亏了它你才能创建强大的公式。

此外,上下文转换还有另一个非常重要的作用。你可能还记得,筛选上下文和行上下文以不同方式在关系中运行:行上下文不会自动沿着关系方向传递,而筛选上下文从关系的“一”端传递到“多”端。因此,当发生上下文转换时,筛选上下文会自动传递到相关的表。

通过在产品表定义以下两个新的计算列公式,你可以观察到这种行为:

Product[SalesAmount] = SUM ( Sales[SalesAmount] )

Product[SalesAmountCalc] = CALCULATE ( SUM ( Sales[SalesAmount] ) )

由 CALCULATE 引发的上下文转换影响了对相关表的筛选

如你所见,SalesAmount 列包含所有销售额的总计,而 SalesAmountCalc 只包含当前产品的销售额。CALCULATE 通过转换产品表的行上下文将筛选器传递到销售表,最终显示了当前产品的销售。

请注意,当 CALCULATE 计算时,所有活动的行上下文都会发生上下文转换。实际上,在不同的表上可能有多个行上下文。例如,如果你在产品表创建计算列,使用 AVERAGEX 迭代客户表,那么有两个行上下文(产品和客户)将发生上下文转换,销售表将接收两个筛选器。考虑以下表达式:

Product[SalesWithSUMX] =
AVERAGEX (
    Customer,
    CALCULATE (
        SUM ( Sales[SalesAmount] )
    )
)

公式计算的是消费者购买该产品的平均花费(不是平均价格,而是总花费的平均值)。CALCULATE 中的 SUM 函数在筛选上下文中计值,它只显示当前客户(由 AVERAGEX 迭代)和当前产品(由计算列迭代)的销售额。记住这个规则有一个简单的方法:在 CALCULATE 中没有行上下文,只存在一个筛选上下文

理解度量值中的上下文转换

理解上下文的转换非常重要,这是因为 DAX 还有另一个隐藏知识。到目前为止,我们一直使用函数和列来编写 CALCULATE 内部的表达式。但是,你还可以编写调用度量值的表达式。如果从计算列内部调用度量值会发生什么?更一般地说法是,如果从行上下文中调用度量值会发生什么?

作为示例,你可以这样定义一个名为 SumOfSalesAmount 的度量值:

[SumOfSalesAmount] := SUM ( Sales[SalesAmount] )

然后,你可以使用以下更简单的代码定义 SalesWithSUMX 计算列:

Product[SalesWithSUMX] =
SUMX (
    Customer,
    CALCULATE (
        [SumOfSalesAmount]
    )
)

自动添加的 CALCULATE

使用 CALCULATE 表明公式发生了上下文转换,问题是,每当你从另一个表达式中调用已定义好的度量值时,DAX 都会自动将度量值封装在 CALCULATE 中。因此,前面的表达式具有与以下表达式相同的行为:

Product[SalesWithSUMX] =
SUMX (
    Customer,
    [SumOfSalesAmount]
)

这个公式没有显式调用 CALCULATE,不过上下文转换依然在发生,因为DAX 自动为度量值添加了 CALCULATE

这就是为什么编写代码时要区分列和度量值的原因,我们遵循的书写标准是避免将表名放在度量值的前面,但始终在列前面加上表名。
实际上,在前面的公式中,在 SumOfSalesAmount 之前没有表名说明 SumOfSalesAmount 是一个度量值,因此,你知道发生了上下文转换。

在嵌套中使用完整公式

上下文的自动转换使编写通过迭代执行复杂计算的公式变得容易。话虽如此,你仍然需要一些时间才能熟悉和使用这种技术。例如,如果你只想计算购买金额超过总体平均水平的客户的销售额总和,可以按如下方式编写度量值:

[SalesMoreThanAverage] :=
VAR AverageSales =
    AVERAGEX (
        Customer,
        [SumOfSalesAmount]
    )
RETURN
    SUMX (
        Customer,
        IF (
            [SumOfSalesAmount] > AverageSales,
            [SumOfSalesAmount]
        )
    )

在前面的代码中,我们使用 SumOfSalesAmount 作为在不同行上下文中计值的度量值。在定义变量时,我们使用它来计算客户销售额的平均值,而在 SUMX 的迭代中,我们使用它来检查当前客户的销售额与之前存储在变量中的平均值之间的关系。

基于 VAR 的语法更易于阅读和维护(公式的计算也可能更快)。然而,本质在于理解不同语法背后不同的公式计值流,可以不用 VAR,也无论你使用的是哪种 DAX 版本。如果没有真正理解和掌握这种上下文自动转换的机制,你可能花了大量时间阅读公式,但依然无法理解它的计算结果。

在公式内部调用度量值时,上下文转换会自动发生,无法避免。这意味着在调用度量值时避免上下文转换的唯一方法是展开它的代码。例如,假设你用另一种方法编写了前面的代码。不使用变量,而是定义一个称为 AverageSales 的度量值表示客户的平均销售额,如下面的代码所示:

[AverageSales] :=
AVERAGEX (
    Customer,
    [SumOfSalesAmount]
)
[SalesMoreThanAverage] :=
SUMX (
    Customer,
    IF (
        [SumOfSalesAmount] > [AverageSales],
        [SumOfSalesAmount]
    )
)

在突出显示的行中,使用了[AverageSales]计算客户的平均销售额。问题是此时你正在迭代(SUMX)中调用度量值,这会使上下文转换发生。因此,[AverageSales]的结果将不是所有客户的平均销售额,而是你正在迭代的客户的平均销售额。因此,测试总是会失败,度量值返回一个空值,因为 IF 的真值分支永远不会执行。如果想避免上下文转换,你需要将调用的度量值写成完整形式:

[SalesMoreThanAverage] :=
SUMX (
    Customer,
    IF (
        [SumOfSalesAmount]
            > AVERAGEX (
                Customer,
                [SumOfSalesAmount]
            ),
        [SumOfSalesAmount]
    )
)

使用完整形式后, SalesMoreThanAverage 现在返回正确的结果。此外,值得注意的是,在这种情况下整个公式有两个嵌套的行上下文, 三个度量值调用。其中两个计算由 SUMX 迭代的当前客户的销售额, 另一个 (在 AVERAGEX 内部) 计算由 AVERAGEX 迭代的当前客户的销售额。

理解这种特性之后你才能编写复杂的 DAX 代码来解决特定场景的需求。

触发上下文转换的条件

如果用一句话概况,DAX 中只有 CALCULATE 和 CALCULATETABLE 可以触发上下文转换。但在实际应用中,这句话需要你很好的理解,因为它有很多衍生形式,也就是公式中没有可见的 CALCULATE 函数,但上下文转换依然发生。比如:

  • 引用度量值,隐式调用的 CALCULATE
  • 部分时间智能函数,FIRSTDATE/LASTDATE、FIRSTNONBLANK/LASTNONBLANK 等,它们在内部使用 CALCULATE 函数。

上下文转换之后究竟有多少可见行?

上下文转换是指将行上下文转换为等效的筛选上下文。这个说法需要进一步作些澄清。 

此处为隐藏内容 VIP会员和付费用户可见

小结

  • 上下文转换性能开销比较大如果迭代具有 10 列和 100 万行的表并使用上下文转换,则 CALCULATE 需要应用 10 个筛选器,总共 100 万次。无论如何,这将是一个缓慢的操作。这并不是说应该避免依赖上下文转换。然而,它确实是 CALCULATE 的一个需要小心使用的特性。
  • 上下文转换不仅过滤一行存在于 CALCULATE 外部的原始行上下文始终标识唯一行,因为行上下文逐行迭代。当通过上下文转换将行上下文转换为筛选上下文时,新创建的筛选上下文将筛选具有相同值集的所有行。因此,您不应该假设上下文转换只创建了一个只有一行的筛选上下文,这一点非常重要,需要仔细体会。
  • 上下文转换使用公式中不存在的列尽管筛选器使用的这些列不可见,但它们仍然是表达式的一部分。这使得任何带有 CALCULATE 的公式都比最初看起来复杂得多。如果使用上下文转换,则表的所有列都是表达式的一部分,作为隐藏的筛选器参数,此行为可能会创建意外的依赖关系。
  • 上下文转换从行上下文中创建筛选上下文您可能还记得这段表述:“行上下文迭代表,而筛选上下文筛选整个模型”。一旦上下文转换将行上下文转换为筛选上下文,它将更改筛选器的性质,不再只迭代一行,而是筛选整个模型;关系成为表达式的一部分。换句话说,发生在一个表上的上下文转换可能会将其筛选效果传递到远离行上下文来源的其他表。
  • 只要是存在行上下文的环境,上下文转换就会发生例如,如果在计算列中使用 CALCULATE,会发生上下文转换。计算列中有一个自动生成的行上下文,这足以使转换发生。
  • 上下文转换所有的行上下文当对多个表执行嵌套迭代时,上下文转换会考虑所有行上下文。它会使所有这些列无效,并为当前由所有活动行上下文迭代的所有列添加筛选器参数。
  • 上下文转换使行上下文无效虽然我们已经多次重复这个概念,但它值得再次引起您的注意。CALCULATE计算的表达式中没有任何有效的外部行上下文。所有外部行上下文都被转换为等效的筛选上下文。

理解上下文转换后的计值顺序

结合目前所学,相信你已经了解下面这两个在产品表中创建的计算列之间的区别:

Product[SumOfUnitPrice] = CALCULATE ( SUM ( Product[Unit Price] ) )

Product[SumOfAllUnitPrice] = CALCULATE ( SUM ( Product[Unit Price] ), ALL ( Product ) )

它们都是计算列,并且都使用了 CALCULATE,因此,两者都发生了上下文转换。

SumOfUnitPrice 应该只包含当前行的单价。然而,SumOfAllUnitPrice 的值是多少?出于直觉,因为有 ALL (Product),所以你很可能会期望它包含所有单价的总和。结果确实如此。然而,如果你遵循我们迄今所描述的规则,会发现这其中似乎还有一些问题。

事实上,ALL (Product)返回整个产品表,有效地从筛选上下文删除了任何产品筛选器。然而,与此同时,上下文转换将筛选产品表并只显示一行。如果你把这两个条件取交集(AND),那么由于上下文转换产生的筛选器约束性更强,因此,它应该会胜出。那么,为什么结果是所有单价之和,而不是当前行的单价呢?

此处为隐藏内容 VIP会员和付费用户可见

上下文转换并不是孤立的知识,需要掌握 CALCULATE 函数的计值过程才能正确理解,这里我假定你已经有一定的基础,通过下面三个案例,你可以测试一下自己对上下文转换的理解程度。

案例一

xSUM 是 Table1 的计算列,请思考在下图中它应该返回什么结果?公式是如何计值的?

当前表为 Table1

案例二

xRANK 是 Table2 的计算列,请思考在下图中它应该返回什么结果?公式是如何计值的?

当前表为 Table2

案例文件下载(附结果)

下载链接

案例三

[Test] 度量值的第 9 行 MAX (‘销售明细'[出库日期] ) 是否被第 3 行 VALUES (‘销售明细'[出库日期] ) 影响,为什么?

Test :=
MAXX (
    VALUES ( '销售明细'[出库日期] ),
    CALCULATE (
        SUM ( '销售明细'[下单数量] ),
        FILTER (
            ALL ( '销售明细'[出库日期] ),
            '销售明细'[出库日期]
                = MAX ( '销售明细'[出库日期] )
        )
    )
)

案例解析

案例一结果

xSum 列每行都等于 20。以表的第一行为例,公式计值过程如下:

此处为隐藏内容 VIP会员和付费用户可见

案例二结果

xRANK 列从上至下是 2,2,2,1,1,1。以表的第一行为例,公式计值过程如下:

此处为隐藏内容 VIP会员和付费用户可见

案例三结果

不影响。

此处为隐藏内容 VIP会员和付费用户可见

 

下载面板

以上隐藏内容查看价格为5G 币,请先
注:加入 VIP 会员可享受全站权益,性价比更高。单独购买的内容长期有效,不受时间限制。

27
说点什么

avatar
1000
 
鼓掌微笑开心憧憬爱你色并不觉得吃瓜doge二哈喵喵思考笑哭捂脸悲伤大哭抓狂汗偷笑打脸捂眼黑线问号晕拜拜闭嘴衰咒骂ok作揖
11 评论数
19 被回复的评论
8 订阅评论的人数
 
查看最近回复
查看最热评论
  订阅本文评论  
最新 最旧 得票最多
提醒
李星棋
成员
李星棋

问一个问题,文中的product表和sales表怎么获得呢?不懂为什么calculate后的SalesAmountCalc只有部分行有值,是因为sales表中有部分产品没有吗?

李星棋
成员
李星棋

我大概知道了,高老师说的当前产品是指sales表中的产品,所以这样理解是可以的,我原来理解的当前产品是这个表文中的表里面看到的内容,所以才产生了这样的疑问。

Dot1x
成员
Dot1x

xSUM=20,
我是这样理解不知道对不对哈,请老师指点一下 作揖
1、cal中先计算第二参数
2、Filter筛选出Table1,A列中的“a2”行
3、Sum计算筛选出来的Value。

Dot1x
成员
Dot1x

请问一下,为啥值变成负数了,排名就变成这样了呢?![image.png]comment image)

muxiaomi
成员
muxiaomi

上下文和转换的概念,如果光看文字和图,可能对新人并不友好[可能我个人理解力比较差(划掉)],推荐可以先看CSG对这两节的讲解,然后再回头看书和文字,会有事半功倍的效果。

Context Transition in DAX/Power BI: A Visual Guide
https://youtu.be/XWBEHOKtgP4
Row Context vs Filter Context in DAX: a Visual Guide
https://youtu.be/qeS308beAAE

Rainman1124
成员
Rainman1124

高老师:
将步骤3得到的结果与步骤4中得到List值做比较,计算出最终排名2。

是不是应该是:将步骤3得到的结果与步骤2中得到List值做比较,计算出最终排名2。

Rainman1124
成员
Rainman1124

案例1:
1.计算列中,所以有行上下文;
2.使用Calculate,所以行上下文会转换为筛选上下文;
3.Calculate先算第2参数,再算第1参数,所以先看Filter结果;
4.Calculate中无行上下文,虽然Filter为迭代函数,第2参数处于行上下文中,但是处于Calculate中,应该转化为筛选上下文;
5.所以每行的计算列结果都为Calculat(Sum(Table1[Value]),Table1[A]=”a2″),应该为20。

136****6402
成员
136****6402

案例1的XSUM计算列的结果应该都是20,我理解的计算方式是:
①计算SUM,计算列全部为总和100
②calculate第一参数对计算列每一行转换并遍历相同行的总和,这里没有相同行,所以当前计算列的结果应该和value列结果一致
③calculate第一参数外的条件为filter的结果,filter对表’table1’的每一行进行遍历,只取列名为A,交集行内容为”a2″的值
④第三步的筛选条件应用到第二步的结果中

Rainman1124
成员
Rainman1124

高老师,我建立以下计算列,直接出错。 Product[SalesWithSUMX] = AVERAGEX ( Customer, CALCULATE ( SUM ( Sales[SalesAmount… 阅读更多 »

136****6402
成员
136****6402

因为是初学,一直苦苦理解不了,目前感觉有那么一点点理解最最最简单的上下文了,理解范围也仅限于计算列,希望老师们指点;
每一列是一个集合或一个表,一到多列组成一个表,每一列的每一个单元格与表中多列的行交集;
新增计算列,计算列本身携带行上下文特性,新增的计算列每一行都是SUM函数对单价列进行遍历,我理解的类似for each对集合高斯累加;
SUM套上calculate以后对第一参数进行重新设定筛选条件,这里只有第一参数,则代表没有筛选条件或者说筛选条件是当前自身行;

pleasureyuer
成员
pleasureyuer

看完一遍一头雾水,明天继续第2遍,第3遍。。。
如下两个公式,写出来了,理解不了,痛苦中。总是陷入自己的脑回路死循环。

值1 超过均值的 和 v-wrong =
var avg1 = AVERAGE(‘t1′[值1])
return SUMX(FILTER(‘t1’,t1[值1]>avg1),SUM(t1[值1]))

值1 超过均值的 和v-correct =
var avg1 = AVERAGE(‘t1′[值1])
return SUMX(FILTER(‘t1’,t1[值1]>avg1),CALCULATE(SUM(t1[值1])))