想分组聚合各省的条数、总额,及其平均数或者占比的话,Python方便还是slq方便?

news/发布时间2024/5/18 13:33:32

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【斌】问了一个数据处理的问题。问题如下:

求教大佬:我有全国的明细5000条,其中一个字段是省(直辖市), 如果我想分组聚合各省的条数、总额,及其平均数或者占比的话,Python方便还是sql方便?

二、实现过程

这里【吴超建】提出Excel透视表就可以解决了,【DIY】和【黑科技·鼓包】也给出了自己的看法。

图片
后来粉丝自己使用数据透视表搞定了。

图片

就是占比还需要自己写个公式,不过这里【吴超建】指出其实并不需要,具体做法如下所示。

图片

后来【瑜亮老师】也给出了一个Python方法,python中用透视表也是一行代码。主要是参数aggfunc可以接受列表,以便于对某列数进行多种统计,如求和、求平均值等,同时还可以接受字典,分别对多列进行一种或多种统计。

图片

上面这个是妥妥的干货分享,确实非常不错!

顺利地解决了粉丝的问题。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Excel数据透视表需求使用Python处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【斌】提出的问题,感谢【吴超建】、【瑜亮老师】、【DIY】和【黑科技·鼓包】给出的思路,感谢【冷喵】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ulsteruni.cn/article/01510112.html

如若内容造成侵权/违法违规/事实不符,请联系编程大学网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

linux安装/切换不同版本c/c++

查看ubuntu系统上g++的版本:ls /usr/bin/g++*安装指定版本gcc和g++# 以version == 4.9为例 sudo apt-get install gcc-4.9 g++-4.9切换不同版本 当ubuntu系统上安装了不同版本的gcc和g++,可以使用update-alternatives命令设置默认使用哪个版本,典型的如在Ubuntu 16.04里安装…

P5470 [NOI2019]序列 题解

P5470:NOI2019 序列题意:给定两个长度 \(n\) 的序列 \(a,b\)。 要求各选出 \(k\) 个数,使得这 \(2k\) 个数之和最大,且两个序列选出的数至少有 \(l\) 个位置相同。 \(n\le 2\times 10^5\)。command_block 的题解 但是这个貌似有一些小问题,后文有写。 算法:模拟费用流。 …

【MySQL系列】--基础知识1:事务与隔离

1、MySQL:基础知识之事务与隔离

二极管在晶振震荡电路中作用

在含有两个电容的晶振震荡电路中,二极管需要串联进电路中,在含有电源与接地回路中,对该节点给出一个高电平,输出端输出0-1的高低电平。 两个回路中需要对输出端进行电路分析。配置好电源。晶振需要与两个并联电容串接。 对于晶振,可以使用NE555来实现相同的功能。设计相同…

个人博客用例图

管理员、用户、注册、登录、首页、写文章、查看分类、增加分类、查看回收站

解决 App 自动化测试的常见痛点

App 自动化测试中有些常见痛点问题,如果框架不能很好的处理,就可能出现元素定位超时找不到的情况,自动化也就被打断终止了。很容易打消做自动化的热情,导致从入门到放弃。比如下面的两个问题: 一是 App 启动加载时间较久(可能 App 本身加载慢,可能移动设备本身加载应用速…