数据分析技巧
我攥了很久才汇总出这篇小技巧合集,Pandas数据分析小技巧手册。
小技巧1:如何使用map对某些列做特征工程?
小技巧2: 使用 replace 和正则清洗数据
小技巧3:使用 melt 如何对数据透视分析?
小技巧4:已知 year 和 dayofyear,怎么转 datetime?
小技巧5:如何将分类中出现次数较少的值归为 others?
小技巧6:如何快速找出 DataFrame 所有列 null 值个数?
小技巧7:如何处理和填充空值?
小技巧8:如何用 Pandas 快速生成时间序列数据?
小技巧9:如何重新排序 DataFrame 的列?
小技巧10:如何完成数据下采样,调整步长由小时为天?
小技巧11:100G数据如何先随机读取1%?
小技巧12:通过标准差如何找出异常值?
小技巧13:通过分位数如何找出异常值?
小技巧14:如何修复非法值?
小技巧15:如何过滤重复值?
小技巧16:如何使用 apply 去掉特殊字符?
小技巧17:如何使用 cut 做数据分箱?
小技巧18:如何使用 rank 做排名?
小技巧19:如何使用 category列转数值?
小技巧20:如何快速拿到数据最多的3个分类?
小技巧21:如何使用 count 统计词条出现次数?
小技巧22:DataFrame转定制的json
技巧23: 筛选出满足要求的分组
技巧24: 对每个分组做聚合
技巧25: 批量随机生成时间戳
技巧26: 使用滑动窗口找出频繁刷单用户
更多小技巧陆续推送中...