close

 

#資料預處理

import pandas as pd
 

data_1 = data_1.append(pd.DataFrame([{'id':'002','name':'chi'}]))
data_1 = data_1.append(pd.DataFrame([{'id':'003','name':'david'}])).reset_index(drop=True) 
data_1 = data_1.append(pd.DataFrame([{'id':'003','name':'david'}])).reset_index(drop=True) 
data_1 = data_1.append(pd.DataFrame([{'id':'004','name':float('NaN')}])).reset_index(drop=True) 
data_1

 

output3.PNG

 

 

 

#查詢
data_1.duplicated('id')
#刪除
data_1=data_1.drop_duplicates('id')
data_1

output4.PNG

#遺失值 NaN None
#查詢
data_1['name'].isnull()
#移除遺失值(留下非遺失值)
data_1=data_1[data_1['name'].notnull()]
data_1

 output5.PNG

 
遺失值 NaN None

#查詢
data_1['name'].isnull()
#移除遺失值(留下非遺失值)
data_1=data_1[data_1['name'].notnull()]
data_1

arrow
arrow
    全站熱搜

    to52016 發表在 痞客邦 留言(0) 人氣()