租用问题

质量为本、客户为根、勇于拼搏、务实创新

< 返回租用问题列表

python如何筛选同行相同数据,python筛选出重复数据

发布时间:2023-10-17 03:50:27

python如何挑选同行相同数据

要挑选同行相同的数据,可使用Python中的pandas库来实现。以下是一个示例代码:

import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'a', 'b', 'c']})
# 根据列B进行分组,并挑选出同行相同的数据
df_filtered = df.groupby('B').filter(lambda x: len(x) > 1)
print(df_filtered)

输出结果为:

A  B
0  1  a
2  3  a
1  2  b
3  4  b

上述代码首先创建了一个包括两列的DataFrame,然后根据列B进行分组。接着使用filter函数对分组后的数据进行挑选,lambda x: len(x) > 1表示挑选出分组后的元素个数大于1的组。最后将挑选结果打印出来。
在上述示例中,挑选出了同行相同的数据,即列B中的值为'a'和'b'的两行数据。你可以根据实际情况修改代码来挑选其他条件下的同行相同数据。