问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

pandas系列之数值替换

发布网友 发布时间:2024-10-01 23:58

我来回答

1个回答

热心网友 时间:2024-10-28 23:59

本文用到的Excel截图如下:

数值替换就是将数值A替换成数值B,可以用在异常值处理、缺失值填充处理中。主要包含一对一替换、多对一替换、多对多替换这3种情形。

替换开始前先看一下原始数据结构

importpandasaspddf=pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df)

result:

姓名年龄0小明23.01小刚98.02小红876.03李华65.04小美-6.05张三34.06李四13.07王五98.5

我们可以看到,年龄这一列的876、-6、98.5都是不合理的数组,现在进行替换

1.一对一替换

一对一替换就是将某一块区域中的一个值全部替换成另一个值。

df=pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df['年龄'].replace(-6,6))

result:

023.0198.02876.0365.046.0534.0613.0798.5Name:年龄,dtype:float64

对于有规律的替换对象,可以使用replace方法实现批量替换。

eg:

importpandasaspddf=pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx',sheet_name='Sheet2')print(df)

result:

姓名年龄0小明23.01小刚NaN2小红876.03李华65.04小美NaN5张三34.06李四NaN7王五98.5

替换后:

importpandasaspdimportnumpyasnpdf=pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx',sheet_name='Sheet2')print(df.replace(np.NaN,0))

result:

姓名年龄0小明23.01小刚0.02小红876.03李华65.04小美0.05张三34.06李四0.07王五98.5

有时候需要对全表进行替换,此时replace方法相当于前面缺失值填充的fillna方法(该方法在pandas系列之缺失值的处理一文中可以看到)

注:np.NaN是python中对缺失值的一种表示方法

2.多对一替换

还是文章开头的表格数据,现在要将年龄这一列的876、-6、98.5这三个数字进行替换

df=pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.replace([876,-6,98.5],25))

result:

姓名年龄0小明23.01小刚98.02小红25.03李华65.04小美25.05张三34.06李四13.07王五25.0

这里是说将[876, -6, 98.5]的值都替换成25

3.多对多替换

多对多替换其实就是某个区域的多个一对一替换。比如将876换成整除10的结果,-6变成相反数,98.5直接保留整数部分

是先对表进行布尔选择选择行,然后通过普通索引选择列

姓名年龄0小明23.01小刚98.02小红876.03李华65.04小美-6.05张三34.06李四13.07王五98.50

result:

姓名年龄0小明23.01小刚98.02小红876.03李华65.04小美-6.05张三34.06李四13.07王五98.51
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
探歌自动启停怎么关闭不了怎么办 探歌停车自动熄火 一汽大众sagitar自动档换档位的时候震动什么原因 大众速滕挂档车身会抖动 大众速腾变速箱挡杆抖动是哪里的问题? 我的爸爸欠了一千多块,妈妈才发现因此很生气,打架怎么办?我好害怕... 我的情况是属于心理障碍吗? 我的爸爸特别喜欢强势,导致我现在非常害怕爸爸,怎么办呢? 我怕我的爸爸妈妈(亲人)死 歌唱祖国的合唱怎么排练,怎么分声部,怎么轮唱重唱领唱比较合理 柯南最后一集是什么?他有没有边会新一? pandas系列之数据类型转换和异常值的处理 pandas系列之缺失值的处理 pandas系列之数值删除 电脑文件夹字体变蓝是加密文件吗?如何恢复默认颜色? 电脑文件夹字体为何变蓝并如何恢复默认设置? 出现蓝色字体“安全模式”,按什么键进入系统? 吉象地板怎么样吉象地板官网报价 湖北吉象民安设备有限公司怎么样? 湖北吉象人造林制品有限公司企业简介 湖北吉象的湖北吉象简介 湖北吉象发展简史 cf卡是什么卡 2000年用什么聊天 民警调查后发现男子的驾照也已被吊销 男子坐副驾驶教10岁女儿开车_百度... 光雾山 桃源景区附近酒店有哪些 ...玩2个号目前我是DK,成就4千坐骑80多个了。开了CTM再玩个号,玩什么... 12号要开CTM了 目前我又两大热门职业!一个是亲儿子!还一个是DK! 真... CTM4.2PVP玩DK还是CJQ 魔兽CTM玩个QS还是DK?哪个好玩些 CTM,我该玩啥职业? 有一张搞笑图片,里面是两个人的聊天记录,很长,两个人轮流发一个表情,好... pandas系列之按列选择数据 说说手机里最搞笑的图是哪一张吧? 好玩搞笑的说说带图片大全最新版 整人靠天份被整看缘分 蓝色配什么颜色搭配起来比较好看 3.6÷25的竖式计算 3.6÷16用竖式怎么计算 3.6÷1.5的列竖式计算公式 ...前一段还一直看安徽卫视,最近却没了 搜不到了 搜N遍了,求解 谢啦... ai怎么设置多边画花ai怎么画花纹多边形 美的KFR-72LW/BP2DY-H(4)保修信息 AI做这种梅花图形怎么做求大神ai怎么做梅花形状 ...精英想收快手有500万粉丝的女网红为徒弟,首先我要玩吃鸡很厉?_百度... 如果卖家发货后又申请仅退款,会怎么样 科目一考试中容易混淆的题目之停车场停车区 科目一考试中容易混淆的题目之不能停车的路段 科目一丨理论考试中容易混淆的交规知识 【健身大挑战】十种俯卧撑,看你能够做到第几个? 这是我们的秘密专辑介绍 这是我们的秘密的专辑信息