租用问题

质量为本、客户为根、勇于拼搏、务实创新

< 返回租用问题列表

python dropna()和notnull()的用法有哪几种

发布时间:2023-08-03 08:29:16

python dropna()和notnull()的用法有哪几种

1. dropna() 函数用于删除含有缺失值的行或列。它有以下经常使用参数:
- axis:指定是删除行(axis=0)或删除列(axis=1)。
- how:指定删除行或列的条件,默许为 any,表示只要存在一个缺失值就删除,也能够设置为 all,表示全部缺失值才删除。
- subset:指定删除行或列的范围,默许为None,表示删除所有含有缺失值的行或列。
示例:
```
import pandas as pd
data = {'Name': ['Tom', 'John', 'Amy', 'Emily', 'Mike'],
'Age': [20, 25, None, 30, 35],
'Gender': ['M', 'M', 'F', None, 'M']}
df = pd.DataFrame(data)
# 删除所有含有缺失值的行
df.dropna()
# 删除所有含有缺失值的列
df.dropna(axis=1)
# 删除Age列中含有缺失值的行
df.dropna(subset=['Age'])
```
2. notnull() 函数用于判断每一个元素是否是为缺失值,返回一个布尔值的 Series。它可以用于过滤数据集中含有缺失值的行或列。
示例:
```
import pandas as pd
data = {'Name': ['Tom', 'John', 'Amy', 'Emily', 'Mike'],
'Age': [20, 25, None, 30, 35],
'Gender': ['M', 'M', 'F', None, 'M']}
df = pd.DataFrame(data)
# 过滤掉所有含有缺失值的行
df = df[df.notnull().all(axis=1)]
# 过滤掉所有含有缺失值的列
df = df[df.notnull().all(axis=0)]
```