亚洲 国产精品 日韩-亚洲 激情-亚洲 欧美 91-亚洲 欧美 成人日韩-青青青草视频在线观看-青青青草影院

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > 大數據學習教程:如何處理多類不平衡數據?

大數據學習教程:如何處理多類不平衡數據?

來源:千鋒教育
發布人:syq
時間: 2022-07-04 17:32:00 1656927120

  機器學習中的一個常見問題是處理不平衡數據,其中目標類中比例嚴重失調,存在高度不成比例的數據。如何處理多類不平衡數據呢?什么是多類不平衡數據?什么是SMOTE算法?為什么使用類別權重(Class weight)......下面將進行詳細介紹。

如何處理多類不平衡數據

  什么是多類不平衡數據?

  當分類問題的目標類(兩個或兩個以上)不均勻分布時,稱為不平衡數據。如果不能處理好這個問題,模型將會成為災難,因為使用類不平衡數據建模會偏向于大多數類。處理不平衡數據有不同的方法,最常見的是過采樣(Oversampling)和創建合成樣本。

  什么是SMOTE算法?

  SMOTE是一種從數據集生成合成算例的過采樣技術,它提高了對少數類的預測能力。雖然沒有信息損失,但它有一些限制。

  合成樣本

  限制:

  · SMOTE不適用于高維數據。

  · 可能會發生類的重疊,并給數據帶來更多干擾。

  因此,為了跳過這個問題,可以使用'class_weight '參數手動為類分配權重。

  為什么使用類別權重(Class weight)?

  類別權重通過對具有不同權重的類進行懲罰來直接修改損失函數,有目的地增加少數階級的權力,減少多數階級的權力。因此,它比SMOTE效果更好。本文將介紹一些最受歡迎的獲得數據的權重的技術,它們對不平衡學習問題十分奏效。

  · Sklearn utils

  可以使用sklearn來獲得和計算類權重。在訓練模型的同時將這些權重加入到少數類別中,可以提高類別的分類性能。

  from sklearn.utils import class_weightclass_weight =class_weight.compute_class_weight('balanced,np.unique(target_Y),target_Y)model = LogisticRegression(class_weight = class_weight)model.fit(X,target_Y)# ['balanced', 'calculated balanced', 'normalized'] arehyperpaameterswhic we can play with.

  對于幾乎所有的分類算法,從邏輯回歸到Catboost,都有一個class_weight參數。但是XGboost對二進制分類使用scale_pos_weight,對二進制和多類問題使用樣本權重。

  · 數長比

  非常簡單明了,用行數除以每個類的計數數,然后

  weights = df[target_Y].value_counts()/len(df)model = LGBMClassifier(class_weight = weights)model.fit(X,target_Y)

  · 平和權重技術(Smoothen Weights)

  這是選擇權重的最佳方法之一。labels_dict是包含每個類的計數的字典對象,對數函數對不平衡類的權重進行平和處理。

  def class_weight(labels_dict,mu=0.15): total = np.sum(labels_dict.values()) keys = labels_dict.keys() weight = dict()for i in keys: score =np.log(mu*total/float(labels_dict[i])) weight[i] = score if score > 1else 1return weight# random labels_dictlabels_dict = df[target_Y].value_counts().to_dict()weights =class_weight(labels_dict)model = RandomForestClassifier(class_weight = weights)model.fit(X,target_Y)

  · 樣本權重策略

  下面的函數不同于用于為XGboost算法獲取樣本權重的class_weight參數。它為每個訓練樣本返回不同的權重。樣本權重是一個與數據長度相同的數組,包含應用于每個樣本的模型損失的權重。

  def BalancedSampleWeights(y_train,class_weight_coef): classes = np.unique(y_train, axis =0)classes.sort()class_samples = np.bincount(y_train)total_samples = class_samples.sum()n_classes = len(class_samples) weights = total_samples / (n_classes* class_samples * 1.0)class_weight_dict = {key : value for (key, value) in zip(classes, weights)}class_weight_dict[classes[1]] = class_weight_dict[classes[1]] *class_weight_coefsample_weights = [class_weight_dict[i] for i in y_train] return sample_weights#Usageweight=BalancedSampleWeights(target_Y,class_weight_coef)model = XGBClassifier(sample_weight = weight)model.fit(X, target_Y)

  · 類權重與樣本權重:

  樣本權重用于為每個訓練樣本提供權重,這意味著應該傳遞一個一維數組,其元素數量與訓練樣本完全相同。類權重用于為每個目標類提供權重,這意味著應該為要分類的每個類傳遞一個權重。

  更多關于大數據培訓的問題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓服務經驗,采用全程面授高品質、高體驗培養模式,擁有國內一體化教學管理及學員服務,助力更多學員實現高薪夢想。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT
久久天天躁狠狠躁夜夜AV浪潮| 国产男男GayGay裸交视频| 国产精品麻豆欧美日韩WW | AV人摸人人人澡人人超碰小说| 成人爽A毛片免费网站| 国产美女视频国产视视频| 久久大香伊蕉在人线免费AV| 欧美丰满美乳XXⅩ高潮WWW| 日韩av一区二区三区| 亚洲AV网站在线观看| 永久免费AV无码国产网站| 爱丫爱丫影院在线| 国产三级精品三级在专区| 六十路七十路熟女乱码| 日韩精品无码成人专区| 亚洲白嫩学生AV无码一区| 97在线视频免费观看| 国产精品99久久久久久宅男| 久久久亚洲裙底偷窥综合| 日本极品少妇XXXXⅩOOO| 亚洲AV永久无码精品一区二区不| 400部精品国偷自产在线| 国产成人午夜精品影院| 久久久久国色AV∨免费看| 人妻精品久久久久中文字幕| 亚洲AV无码成人网站在线观看 | 免费无码一区二区三区蜜桃| 特大巨黑吊XXXX高潮| 野花高清在线观看免费官网中文版| 波多野结衣的影片| 精品少妇无码AV无码专区| 人与物VIDEOS另类XXXX| 亚洲乱亚洲乱妇无码麻豆| 不卡无码人妻一区三区| 精品人妻一区二区三区视频| 日韩AV片无码一区二区三区不卡| 亚洲精品中文字幕无码专区| 成人免费无码大片A毛片| 久久国产精品99精品国产| 色噜噜噜亚洲男人的天堂 | 久久夜色精品国产亚洲AV| 太多了太满了肚子装不下了| 中国熟妇人妻XXXXX中文| 国产乱码日产精品BD| 欧美精品色婷婷五月综合| 亚洲AV无码一区毛片AV| 边做边爱完整版免费视频播放百度 | 荷兰肥妇BBWBBWBBW| 人妻少妇精品视频aaa| 亚洲人成人无码WWW| 赤裸羔羊Ⅲ致命快感| 巨大垂乳日本熟妇挤奶| 午夜成人亚洲理论片在线观看| 777米奇第四在线观看| 黑人巨根在线观看| 色五月丁香六月欧美综合| 中国WINDOWS野外| 国内国精产品一二三区传媒| 日本中文字幕乱码免费| 诱人的老师HD中字| 国产又爽又黄又爽又刺激 | 欧美色欧美亚洲高清在线观看| 亚洲成AV人片在线观看| 丰满少妇人妻HD高清大乳在线| 免费播放AV网站的地址| 亚洲国产精品久久久久网站| 国产成人人综合亚洲欧美丁香花| 女人扒开屁股桶爽6O分钟| 亚洲乱码一区AV春药高潮图片| 国产AⅤ无码旗袍丝袜美腿| 欧美成人一区在线| 亚洲婷婷五月色香综合缴情| 国产蜜臀AV无码一区二区三区| 日本久久久久久久久久加勒比| 色老头精品午夜福利视频| 亚洲精选无码久久久| 特级西西WWW444人体聚色| 综合人妻久久一区二区精品| 精品人妻中文AV一区二区三区 | 亚洲乱码一区二区三区在线观看| 国产成人精品三级在线影院| 热99RE6久精品国产首页青柠| 用各种刑具调教吹潮的视频 | 粉嫩AV一区二区三区免费观看| 内射射满骚B含着小说| 野花AⅤ亚洲高清完整版在线观看| 国产欧美成AⅤ人高清 | 免费无码又爽又高潮视频| 亚洲日韩电影久久| 黑人xxx欧美性爱| 五十路熟妇高熟无码视频| 乖我们在办公室试试| 人妻中字视频中文乱码| 99久久精品无码专区| 麻花传媒MD0076沈芯语在线| 亚洲伊人伊成久久人综合网| 饥渴老熟妇乱子在线播放| 无码免费大香伊蕉在人线国产| 大乳丰满人妻中文字幕日本| 日本护士毛茸茸XX| Z〇Z〇ZO女人另类Z〇Z○| 内射女校花一区二区三区| 在线天堂中文最新版WWW| 久久天天躁狠狠躁夜夜躁2014| 亚洲国产欧美在线看片一国产 | 亚洲成A人片77777KKKK| 一下子挺进浓密的黑森林| 抖抈短视频APP下载| 久久国产乱子伦精品免费女人 | 欧美人和黑人牲交网站上线| 天天躁夜夜躁狠狠夜夜| 精品久久久久久亚洲精品| 无遮挡又爽又刺激的视频| 国产成人精品视频网站| 色悠久久久久综合先锋影音下载| 成人无码精品1区2区3区免费看| 全棵女性艺术写真素材| 锕锕锕锕锕锕锕锕轻点好疼视频| 欧美和日本操逼视频| AV鲁丝一区鲁丝二区鲁丝四| 欧美成人精品一区二区三区| BGMBGMBGM毛多多视频1| 秋霞鲁丝片AV无码少妇| 部长的夫人的味道中字| 三更2饺子截取一小段| 国产AV毛片1区2区3区| 我把护士日出水了视频| 国产免费破外女真实出血视频| 无码一区二区三区蜜桃| 国内精品久久久久久久COENT| 亚洲AV无码专区亚洲AV桃| 精品久久久久久久免费人妻| 亚洲性人人天天夜夜摸| 两性午夜刺激性视频2345| 337P日本欧洲亚洲大胆张筱雨| 欧美XXXX做受欧美| 被老头玩弄邻居人妻中文字幕| 日韩A片无码一区二区五区电影| 丰满乳乱亲伦小说| 无码无遮挡在线观看免费| 韩国青草自慰喷水无码直播间| 亚洲精品国产情侣AV在线| 久久天天躁狠狠躁夜夜网站| 24小时日本高清在线播放| 人妻色欲AV无码专区精油按摩 | 国产精品VIDEOS麻豆| 亚洲AV成人无码网站不卡| 精选AV种子无码专区| 中国少妇精品久久久久无码AV| 欧美性猛交XXXX免费看| 公么的大龟征服了我BD| 亚洲AⅤ精品一区二区三区| 久久精品香蕉绿巨人登场| 主人给我戴上奶牛榨乳器调教| 人妻丰满AV无码中文字幕| 国产成人精品午夜福利APP色多| 学长别揉了~流水了想要~| 久草玖玖玖爱在线资源| 2023无人区码一码二码三码| 日韩精品免费无码专区| 国产午夜福利短视频在线观看| 亚洲色欲啪啪久久WWW综合网| 男男AV纯肉无码免费播放无码| 成人网站亚洲二区乱码| 亚洲AV不卡一区二区三区| 看着领导挺进娇妻的体内电影| XXXXX18日本人HDXX| 无码AV中文一区二区三区桃花岛| 精品无码久久久久久国产| 7777精品久久久大香线蕉| 少妇被躁爽到高潮无码人狍大战| 国产人无码A在线西瓜影音 | 亚洲AV成人无码一二三| 老外免费CSGO交易网站下载| 成 人 黄 色 网站 69| 亚洲AV无码乱码精品国产| 蜜臀人妻四季AV一区二区不卡| 大象成品网站1688入口官网| 亚洲成AV人影片在线观看| 欧美交换配乱吟粗大和黄| 国产高潮抽搐翻白眼在线播放| 亚洲午夜福利AV一区二区无码 | 毛片内射久久久一区| 多毛BGMBGMBGM胖在线| 亚洲精品中文字幕乱码4区| 欧美最猛黑人xxxx黑人猛交| 国产乱子伦一区二区三区| 真实差差差无掩盖视频30分钟 | 国产ZLJZLJZLJZLJ| 野花高清在线观看免费| 色婷婷亚洲一区二区三区| 久久99精品久久久久久秒播| 把女人弄爽特黄A大片| 亚洲AV自慰白浆喷水少妇| 欧美精品VIDEOSEX极品| 国产又粗老女人又硬又爽| AV无码不卡一区二区三区| 亚洲AV秘 无码一区白峰美| 欧美性狂猛BBBBBBXXXXXX| 很嫩很紧直喷白浆在线|