新闻资讯

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻资讯列表

python处理重复值的有什么方法,python处理excel重复数据

发布时间:2023-10-23 20:58:59

python处理重复值的有甚么方法

Python处理重复值的方法有以下几种:

  1. 使用集合(set):将重复值放入一个集合中,集合会自动去除重复值。可以通过将列表转化为集合再转回列表的方式去除重复值。
lst = [1, 2, 3, 3, 4, 4, 5]
lst = list(set(lst))
print(lst)  # 输出 [1, 2, 3, 4, 5]
  1. 使用列表推导式:可使用列表推导式来创建一个新列表,只保存原列表中的非重复值。
lst = [1, 2, 3, 3, 4, 4, 5]
lst = [x for i, x in enumerate(lst) if x not in lst[:i]]
print(lst)  # 输出 [1, 2, 3, 4, 5]
  1. 使用字典(dict)或计数器(Counter):可以将列表中的元素作为字典的键,出现的次数作为字典的值。然后可以根据字典的值来去除重复值。
from collections import Counter

lst = [1, 2, 3, 3, 4, 4, 5]
counter = Counter(lst)
lst = [x for x in counter if counter[x] == 1]
print(lst)  # 输出 [1, 2, 5]
  1. 使用pandas库:pandas库提供了专门用于处理数据的数据结构和函数,可以用来处理重复值。可使用pandas库的drop_duplicates()函数去除重复值。
import pandas as pd

lst = [1, 2, 3, 3, 4, 4, 5]
df = pd.DataFrame(lst, columns=['value'])
df = df.drop_duplicates()
lst = df['value'].tolist()
print(lst)  # 输出 [1, 2, 3, 4, 5]

以上是一些常见的方法,可以根据实际情况选择适合的方法。