quantileTDigestWeighted
使用t-digest 算法计算数字序列近似分位数。该函数考虑了每个序列成员的权重。最大误差为1%。 内存消耗为 log(n)
,这里 n
是值的个数。
该函数的性能低于 quantile 或 quantileTiming 的性能。 从状态大小和精度的比值来看,这个函数比 quantile
更优秀。
结果取决于运行查询的顺序,并且是不确定的。
当在一个查询中使用多个不同层次的 quantile*
时,内部状态不会被组合(即查询的工作效率低于组合情况)。在这种情况下,使用 quantiles 函数。
语法
quantileTDigestWeighted(level)(expr, weight)
别名: medianTDigestWeighted
。
参数
level
— 分位数层次。可选参数。从0到1的一个float类型的常量。我们推荐level
值的范围为[0.01, 0.99]
。默认值:0.5。 当level=0.5
时,该函数计算 中位数。expr
— 求值表达式,类型为数值类型data types, Date 或 DateTime。weight
— 权重序列。 权重是一个数据出现的数值。
返回值
- 指定层次的分位数。
类型:
示例
查询:
SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)
结果:
┌─quantileTDigestWeighted(number, 1)─┐
│ 4.5 │
└────────────────────────────────────┘
参见