聊聊python dropna()和notnull()的用法不同
`dropna()`和`notnull()`是pandas库中用于处理缺失值的函数,它们的用法和功能有一些不同。
`dropna()`是pandas库中DataFrame和Series对象的一个方法,用于删除含有缺失值的行或列。它的主要功能是过滤掉包括缺失值的行或列,返回一个新的DataFrame或Series对象。默许情况下,`dropna()`会删除包括任何缺失值的行或列,也能够通过参数指定删除方式。例如,可以通过设置`axis`参数为1来删除包括缺失值的列,通过设置`subset`参数来指定删除含有缺失值的特定列。
示例代码:
``` python
import pandas as pd
# 创建一个包括缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用dropna()删除含有缺失值的行
df_dropna = df.dropna()
print(df_dropna)
```
输出结果:
```
A B
0 1.0 5.0
3 4.0 8.0
```
`notnull()`是pandas库中DataFrame和Series对象的一个方法,用于判断每一个元素是否是为非空值。它返回一个布尔值的DataFrame或Series,其中为非空值的元素对应的位置为`True`,否则为`False`。
示例代码:
``` python
import pandas as pd
# 创建一个包括缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用notnull()判断每一个元素是否是为非空值
df_notnull = df.notnull()
print(df_notnull)
```
输出结果:
```
A B
0 True True
1 True False
2 False True
3 True True
```
总结一下,`dropna()`主要用于删除含有缺失值的行或列,而`notnull()`主要用于判断每一个元素是否是为非空值。
TOP