发布时间:2017-10-12
分类:数据蒋堂
tag:数据讲堂,有序分组,蒋步星
细心的读者可能会发现,我们在讨论有序分组时只研究了待分组集合的成员次序对分组运算可能的影响,但即然要考虑集合的有序性,那么结果集的成员次序是不是也有业务意义呢? 确实有意义,不过重要程度不如原集有序性…
发布时间:2017-10-10
分类:数据蒋堂
tag:数据蒋堂,蒋步星
我们知道,sql延用了数学上的无序集合概念,所以sql的分组并不关注过待分组集合中成员的次序。我们在前面讨论过的等值分组和非等值分组,也都没有关注过这个问题,分组规则都是建立在成员取值本身上。但如果我…
发布时间:2017-10-10
分类:数据蒋堂
tag:数据蒋堂,蒋步星
前一期 【数据蒋堂】第23期:还原分组运算的本意 我们在上一期研究了分组运算的实质,即将一个集合按某种规则拆分成若干子集。不过,上期的关注重点在于还原分组运算的步骤,而没有讨论拆分规则,例子中都是用…
发布时间:2017-09-19
分类:数据蒋堂
tag:group,sql,分组运算,数据蒋堂
分组是sql中常见的运算,但未必所有人都能深刻地理解它。 分组运算的实质是将一个集合按照某种规则拆分成若干个子集,也就是说,返回值应当是一个由集合构成的集合,但人们一般并不太关心构成这个集合的成员集合…
发布时间:2017-09-19
分类:数据蒋堂
tag:数据蒋堂,有序遍历,蒋步星
前一期 【数据蒋堂】第21期:常规遍历语法 我们继续讨论遍历运算的语法规则。 5. 序号的引用 sql延用了数学上的无序集合概念,遍历时也不关注次序。但计算机只能一步步地执行(暂先不考虑并行计算的情况…
发布时间:2017-09-05
分类:数据蒋堂
tag:数据蒋堂,蒋步星,遍历
遍历可以说是最基本的集合运算了,比如求和、计数、寻找最大最小值等聚合运算,按条件过滤集合、根据集合成员生成另一个新集合,也都是遍历运算。集合化语法要求我们能用很短的语句(经常就只有一句,而不是若干语句…
发布时间:2017-08-21
分类:数据蒋堂
tag:sql,sql语法,数据蒋堂,离散性
所谓离散性,是指集合的成员可以游离在集合之外存在并参与运算,游离成员还可以再组成新的集合。从离散性的解释上可以知道,离散性是针对集合而言的一种能力,离开集合概念单独谈离散性就没有意义了。 离散性是个很…
发布时间:2017-08-21
分类:数据蒋堂
tag:sql,数据蒋堂,集合化
sql作为最常用的结构化数据计算语言,虽然在做一些细致处理时不太方便,但用于描述基本运算还是比java等高级语言要简单许多。这是因为sql是一种集合化的语言,而java等语言不是。我们下面从sql的语…
发布时间:2017-08-08
分类:数据蒋堂
tag:sql,数据蒋堂,蒋步星
当前的大数据平台在处理结构化数据时大都仍然以提供sql语法为主流。兼容sql的好处是很明显的,sql的应用非常广泛,会sql的程序员很多,如果继续采用sql则可以避免许多学习成本。支持sql的前端软件…
发布时间:2017-07-31
分类:数据蒋堂
tag:sql,数据蒋堂,蒋步星
在结构化数据处理领域,sql无疑是应用最广泛的工作语言,不仅被所有关系数据库采用,许多新进的大数据平台也将实现sql作为目标。但现实是,面对当前纷杂的计算查询需求,sql在很多方面并不够好用。我们在前…