新聞中心
Python 去重,統(tǒng)計,lambda函數(shù)
df.drop_duplicates('item_name')
創(chuàng)新互聯(lián)建站主要從事成都做網(wǎng)站、網(wǎng)站建設、網(wǎng)頁設計、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務。立足成都服務石獅,10年網(wǎng)站建設經(jīng)驗,價格優(yōu)惠、服務專業(yè),歡迎來電咨詢建站服務:13518219792
方法一:
df.drop_duplicates('item_name').count()
方法二:
df['item_name'].nunique()
結果:50
附:nunique()和unique()的區(qū)別:
unique()是以 數(shù)組形式(numpy.ndarray)返回列的所有唯一值(特征的所有唯一值)
nunique()即返回的是唯一值的個數(shù)
比如:df['item_name'].unique()
要求:將下表中經(jīng)驗列將按周統(tǒng)計的轉換為經(jīng)驗不限,保留學歷
df1['經(jīng)驗'] = df1['經(jīng)驗'].apply(lambda x: '經(jīng)驗不限'+ x[-2:] if '周' in x else x)
#解釋:將‘5天/周6個月’變成‘經(jīng)驗不限’,然后保留學歷‘本科’
方法二:定義函數(shù)
def dataInterval(ss):
if '周' in ss:
? ? return '經(jīng)驗不限'+ ss[-2:]
return ss
df1['經(jīng)驗'] = df1['經(jīng)驗'].apply(dataInterval)
python刪除重復數(shù)據(jù)
利用集合的不重復屬性,可以先轉換至集合,再用list()函數(shù)轉換回來即可。
比如,a是一個列表,a=list(set(a)),即可完成列表去重。
python 數(shù)組去重的方法
如:arr =['a','d','e','a']
用: arr= sorted(set(arr), key=arr.index)
同: arr = list(set(arr))
arr.sort(key=arr.index)
??直接set(arr)也可以去除重復元素,只是新數(shù)組的順序就不是原來的順序了。
如:arr=[{'text':wuyuan,'value':1},{'text':默認,'value':2},{'text':默認,'value':2},
{'text':wyy,'value':4}]
用: f = lambda x,y:x if y in x else x + [y]
arr = reduce(f, [[], ] + arr)
??這里去除的字典里面的鍵值對必須是完全一樣的。
分享標題:python去重函數(shù),Python去重函數(shù)
當前地址:http://fisionsoft.com.cn/article/dsiipds.html