【对比python】分组子集排序和过滤 | 润乾 -九游会登陆
任务:找出1995年每个月销售额都在前8名的销售员
python
1 | import pandas as pd |
2 | sale_file = 'e:\\txt\\salesrecord.txt' |
3 | sale_info = pd.read_csv(sale_file,sep = '\t') |
4 | sale_info['month']=pd.to_datetime(sale_info['sale_date']).dt.month |
5 | sale_group = sale_info.groupby(by=['clerk_name','month'],as_index=false).sum() |
6 | sale_group_month = sale_group.groupby(by='month') |
7 | set_name = set(sale_info['clerk_name']) |
8 | for index,sale_g_m in sale_group_month: |
9 | sale_g_m = sale_g_m.sort_values(by='sale_amt',ascending = false) |
10 | sale_g_max_8 = sale_g_m.iloc[:8] |
11 | sale_g_max_8_name = sale_g_max_8['clerk_name'] |
12 | set_name = set_name.intersection(set(sale_g_max_8_name)) |
13 | print(set_name) |
集算器
a | |
1 | e:\\txt\\salesrecord.txt |
2 | =file(a1).import@t() |
3 | =a2.groups(clerk_name:name,month(sale_date):month;sum(sale_amt):amount) |
4 | =a3.group(month) |
5 | =a4.(~.sort(-amount).to(8)) |
6 | =a5.isect(~.(name)) |
集算器保留分组子集,在循环函数中对子集进行排序和过滤非常的简单便捷。