发布网友 发布时间:2022-04-18 14:52
共3个回答
懂视网 时间:2022-04-18 19:13
下面就为大家分享一篇python解决pandas处理缺失值为空字符串的问题,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧踩坑记录:
用pandas来做csv的缺失值处理时候发现奇怪BUG,就是excel打开csv文件,明明有的格子没有任何东西,当然,我就想到用pandas的dropna()或者fillna()来处理缺失值。
但是pandas读取csv文件后发现那个空的地方isnull()竟然是false,就是说那个地方有东西。。。
后来经过排查发现看似什么都没有的地方有空字符串,故pandas认为那儿不是缺失值,所以就不能用dropna()或者fillna()来处理。
解决思路:先用正则将空格匹配出来,然后全部替换为NULL,再在用pandas读取csv时候指定 read_csv(na_values='NULL')就是将NULL认为是nan处理,接下来就可以用dropna()或者fillna()来处理了
以上这篇python解决pandas处理缺失值为空字符串的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
热心网友 时间:2022-04-18 16:21
df["你要填补的列名"].fillna(“填补的值”)热心网友 时间:2022-04-18 17:39
如果你要添加一千条记录,不要一条一条的concate。 可以试着每一百条组成一个小的dataframe,分十次粘上去,会快一点