从数据到信息
从信息到洞察

理解 SAMPLE

如果需要对表中的数据做抽样,可以使用 SAMPLE 函数,其语法如下:

SAMPLE

SAMPLE(<n_value>, <table>, <orderBy_expression>, [<order>], [<orderBy_expression>] … )

SAMPLE 返回包含样本行数<n_value>的表,当 n 为 0 或负数时,返回空。

参数 属性 描述
Size 返回的抽样表的行数
Table 用于抽样的表或表表达式
OrderBy 可重复 每行计值的标量表达式
Order 可选
可重复
排序规则. 0/FALSE/DESC – 降序(默认); 1/TRUE/ASC – 升序.

抽样原理

本文隐藏内容查看价格为1G币,请先
单独购买的内容长期有效,不受时间限制(购买前先刷新当前页面)。加入VIP会员可享受全站权益,性价比更高。

用法示例

下面的查询每月只返回一行:

EVALUATE SAMPLE ( 12, 'Date', 'Date'[Month] )

Date 列似乎是随机分布的,其实整个表是按照 Month 列的降序排序,因为省略<order>参数默认使用降序,<column>和<order>可以重复使用。

EVALUATE
SAMPLE (
    100,
    SUMMARIZE ( 'Date', 'Date'[Date], 'Date'[Calendar Year], 'Date'[Month Number] ),
    'Date'[Month Number],,
    'Date'[Calendar Year],
)

如果你指定的列呈不规则分布,那么在提取的样本中也会看到相同的分布特征。例如,考虑以下查询,该查询从顾客表中按 Country/Region 列的分布提取 6 行。

EVALUATE
SAMPLE (
    6,
    SUMMARIZE ( Customer, Customer[City], Customer[Country/Region] ),
    Customer[Country/Region]
)

Country/Region 列的许多值都没有显示,而美国却出现了好几次。这是因为列表包含的美国的城市比其他国家/地区多得多,因此样本中美国的城市更多。

某些客户端工具使用 SAMPLE 函数来评估数据的分布,而避免检索整个数据集,并根据相应的评估结果定义坐标轴的单位。

 

说点什么

1000
 
鼓掌微笑开心憧憬爱你色并不觉得吃瓜doge二哈喵喵思考笑哭捂脸悲伤大哭抓狂汗偷笑打脸捂眼黑线问号晕拜拜闭嘴衰咒骂ok作揖
  订阅本文评论  
提醒
DAX 圣经

导读

初识 DAX

DAX 基础知识

DAX 原理

DAX 高级原理

基础函数类型

迭代函数

CALCULATE 函数

CALCULATE 调节器

基础表函数

条件判断函数

查找匹配函数

时间智能函数

统计类函数

投影函数

分组/连接函数

集合函数

其他函数