百味书屋 导航

风控建模常用pandas语句

来源网站:百味书屋 2018-11-21 13:21:11
经典文章

风控建模常用pandas语句

  pandas对象是Python常用的数据分析模块,它主要包括series对象,dataframe对象和index对象。每种对象都有自己所特有的方法和属性。今天小编更新下建模中常用的pandas语句。

  导入pandas和numpy模块

  import pandas as pd

  import numpy as np

  import os
 

  查看并更改工作路径

  pwd

  os.chdir('更改的路径')
 

  读入数据集

  df = pd.read_csv(r'文件路径')
 

  查看列数、行数

  print(df1.columns.size,df.iloc[:,0].size)
 

  查看列名

  df.columns.tolist()
 

  查看每个特征的类型

  for col in fk_df.columns:

  print(col, fk_df[col].dtype)
 

  计算坏账率

  badRate = df['target'].sum()/df['target'].count()
 

  计算特征空值率

  null_rate = 1-df.count()/df.shape[0]
 

  保留空值率小于0.2的特征

  cols = null_rate[null_rate<0.2].index.tolist()
 

  查找数据集数值中型特征小于0的值并置为nan

  def rep(x):

  if type(x) !=str and x < 0:

  print(x)

  return np.nan

  return x

  df = df.applymap(rep)
 

  设置新的索引

  df = df.reindex()
 

  检查常量特征

  df1= df.loc[:,df1.apply(pd.Series.nunique) != 1]
 

  查看是否有重复特征

  len(set(list(df1.columns))) == df1.shape[1]
 

  查看特征类别数

  df1['education'].value_counts()

风控建模常用pandas语句》出自:百味书屋
链接地址:http://m.850500.com/news/185848.html 转载请保 留,谢谢!

闁绘劗鎳撻崵顔句沪閺囩偟纾婚柛蹇嬪妽閺嬶拷

濞戞挸绉撮悿渚€宕橀崨顓у晣濞戞挾鍋撴慨锟� | 闁哄倸娲﹂妴鍌滅棯閻樼粯鏅� | 闁硅埖娲濋惁鏃堝礆閻樼粯鐝� 闁挎稑鐭侀顒勬嚂閺冨倿鍏囬梺顓у枤椤斿牓鏁嶅娓�00001@163.com

相关文章

推荐文章

百味书屋 免费论文网 创业找项目 最近更新

© 百味书屋 m.850500.com 版权所有 广告合作:ainglaoda@qq.com

濞寸姵枪閸ㄥ倿宕ユ惔鈥崇ギ闁告瑯鍨伴ˇ鏌ュ礆閿燂拷
闂傚嫭鍔栧鍌炴偋闁稓骞�: 5闁稿骏鎷�/缂佲槄鎷�闁告ḿ鍠嶉悳锟�10闁稿骏鎷�
闁革负鍔庨崵搴ㄥ绩椤栨瑧甯�
闁艰鲸姊婚柈瀵糕偓骞垮灪濠€锟�
濠㈣泛绉撮崺妤呭箣閹邦剙顫犻柨娑虫嫹
濞寸姵枪閸ㄥ倿骞嬮幇顒€顫犻柛姘嚱缁辨繈鎳熼妷锔斤骏婵炲娲戞繛鍥偨閵婎煈鍤為柤杈ㄦ⒒闁鈧箍鍨哄﹢锟� 閻庡箍鍨哄﹢鍥ь嚗椤旇绻嗛柛娆欐嫹 p00852-1 闂傗偓閹稿骸鐦荤€甸偊鍠曟穱濠囧矗瀹勬澘璁插璺虹Т閸╋拷 濞撴艾銇樼花顒勫箖閵婏附鍋濈紒鎲嬫嫹 闁瑰灚鎸哥槐鎴濐嚗椤旇绻�
闁革负鍔庨崵搴ㄥ籍閸洘锛熼柨娑欒壘閹冲棙绋夐埀顒勬嚊閸愬弶鍣ù婊愭嫹 9:00-12:30 14:00-18:30 闁告稏鍔岄崣锟� 9:00-12:30
鐎甸偊鍠曟穱濠囧绩椤栨瑧甯涘☉鎿冨弿缁辨繄鎷犲畡鏉跨憦闁稿繑濞婂Λ瀵哥玻濡も偓瑜帮拷
鐎甸偊鍠曟穱濠囧绩椤栨瑧甯涘☉鎿冨弿缁辨繄鎷犲畡鏉跨憦闁稿繑濞婂Λ瀵哥玻濡も偓瑜帮拷
闁衡偓椤栨瑧甯涢柟瀛樺姇婵拷 鐎规瓕灏獮蹇擃嚗濡ゅ嫷鍤夐柡鍌氭川閻濋攱寰勫鍛厬闁哄鍟村锟�