[問題] 請教關於Stochastic gradient descent

時間Tue Apr 3 23:54:53 2018

請教關於stochastic gradient descent 是不是batch size設越大越好？ (只要在計算量 , 記憶體可負荷下）？我有時候mini-batch SGD train的起來有時候train不起來我在猜是不是因為我batch size設太小的原因？還是有可能是iteration (epoch) 次數不夠才會造成這種情況呢？我還是新手有google過資料但還是不太明白這種有時候train的起來(accuration有上來有時候train不起來 (acc上不來）的現象的原因先謝謝各位前輩了 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.238.128.32 ※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1522770899.A.E47.html

1^F：推 lucien0410: mini batch size 會影響acc 04/04 00:11

謝謝你的回覆請問是batch size越大越好嗎？我嘗試過把batch size加大仍會有這種有時候train得起來有時候train不起來的情況 ※ 編輯: Bondrewd (36.238.128.32), 04/04/2018 00:14:21

2^F：推 lucien0410: 我的實驗 batch size128的時候表現極差但換成64後 04/04 00:14

3^F：→ lucien0410: 表現好超多 04/04 00:14

你的例子是batch size比較小比較好？我以為batch size 越小越不容易收斂？ random的成分越大？是我誤會了嗎？

4^F：推 lucien0410: 我是新手小孬孬很可能講錯我說看看我的理解你再跟 04/04 00:20

5^F：→ lucien0410: 別人的說法交互比較 04/04 00:20

別這麼說 , 大家都是互相討論求進步我也是新手謝謝你願意分享 ※ 編輯: Bondrewd (36.238.128.32), 04/04/2018 00:24:56

6^F：推 lucien0410: batch size n 就是一口氣抓n個樣本然後根據這n個樣 04/04 00:24

7^F：→ lucien0410: 本調參數讓參數最適合這組樣本 04/04 00:24

對, 所以如果n越小那n個樣本就比較難代表整體, 我想是這樣？

8^F：推 hl4: batchsize越小隨機的成分越大，適當的隨機性質可以讓model不 04/04 00:27

9^F：→ hl4: 容易困在平緩的地區，讓整體收斂速度快一點。印象中是這樣， 04/04 00:27

10^F：→ hl4: 有錯麻煩糾正一下XD 04/04 00:27

h大的想法跟我的一樣（握手 ※ 編輯: Bondrewd (36.238.128.32), 04/04/2018 00:30:14

11^F：推 lucien0410: 感覺就像圖片的畫素一樣大batch =低畫素 04/04 00:30

12^F：推 lucien0410: 所以n越大越像母體但犧牲掉隨機性質 04/04 00:38

13^F：推 lucien0410: 但我們想要像母體又有適當的隨機性質兩個相斥的願 04/04 00:40

14^F：→ lucien0410: 望 04/04 00:40

15^F：推 lucien0410: 有一招oversample 你可以試試 04/04 00:42

16^F：推 lucien0410: 就是暴力的把所有樣本重複我的實驗oversampling 後 04/04 00:45

17^F：→ lucien0410: 模組的表現也提高很多 04/04 00:45

感謝l大的撇步分享！我試試看 ※ 編輯: Bondrewd (36.238.128.32), 04/04/2018 00:53:03

18^F：推 sean50301: batch size 設小一點可以避掉local minima trap 04/04 02:43

19^F：推 followwar: https://openreview.net/pdf?id=B1Yy1BxCZ 04/04 02:58

20^F：→ followwar: 這篇有說一下batch size 04/04 02:59

21^F：推 lucien0410: 推f大的好文分享 04/04 03:11

22^F：推 hl4: 喔喔好文好文 04/04 04:10

23^F：推 lucien0410: https://www.youtube.com/watch?v=Ilg3gGewQ5U&t=1s 04/04 11:35

24^F：→ lucien0410: 白話文圖解backpropagation 和stochastic gradient 04/04 11:37

25^F：→ lucien0410: descent 推薦給入門的版友 (可是是英文講解) 04/04 11:38

26^F：→ ssd860505da: 不同的問題適合不一樣的batch size大小 04/05 02:00

27^F：推 geminitw: 你有在每個epoch 重新隨機重排你的batch 嗎? 04/05 07:07

28^F：→ Bondrewd: 有 04/05 13:44

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

DataScience 板

[問題] 請教關於Stochastic gradient descent

熱門看板

贊助商連結