本书的内容即是针对不同场景和目标讲述适用的存储方案和优化算法,程序员熟悉了这些基本算法的原理及应用前提后,灵活组合运用就可以得心应手地解决业务中的高性能问题了。
创新算法,授人以渔。万亿秒查是不是大忽悠?hadoop为啥总是这么慢?大表join咋样才能快?预汇总olap行不行得通?……
本书中收集了数百个数据处理中的常见任务及对应的spl代码,涵盖了数据分析人员面对的大部分场景,掌握这些任务的实现方法并加以组合,可以很轻松地应用常规的数据分析处理。