C_Sharp 板


LINE

目前的專案是需要對多個網站抓數據下來 有將httpwebrequest包成一個方法,並使用多線程去跑 方法最後有將request abort以及response close還有設定為null 方法最前有GC.Collect(); request的keep-alive設定為false ServicePointManager.DefaultConnectionLimit設定為512 十多個網站中,有兩個常會出現逾時,其他網站不會 軟體單獨對這兩個網站取數據不會出現 同時對十多個網站抓取數據才會發生 每個網站各自的抓取間隔皆為2秒 原本想說是不是網站本身問題,但是不全部一起抓就不會發生逾時 想請問板上前輩,還有什麼問題是可能造成這樣的狀況發生? 感謝 --------------------------------------------------------- 補充程式碼 public class MyRequest { string UserAgent = "Mozilla/5.0 (Windows; U; Windows NT 5.2; zh-TW; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13 ( .NET CLR 3.5.30729)"; string Accept = "image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/json, text/javascript,text/html, application/xhtml+xml, */*"; int Timeout = 60000; private bool CheckValidationResult(object sender, X509Certificate certificate, X509Chain chain, SslPolicyErrors errors) { return true; } public List<string> Get(string Url, string Referer, CookieContainer CC, bool UsingXMLHttpRequest, bool UsingProxy, ReturnType RT, string HeaderName) { List<string> ReturnList = new List<string>(); HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create(Url); if (Url.StartsWith("https", StringComparison.OrdinalIgnoreCase)) { ServicePointManager.ServerCertificateValidationCallback = new RemoteCertificateValidationCallback(CheckValidationResult); req.ProtocolVersion = HttpVersion.Version10; } req.Referer = Referer; req.CookieContainer = CC; req.UserAgent = UserAgent; req.Accept = Accept; req.Timeout = Timeout; req.Headers["Accept-Language"] = "zh-TW"; req.AutomaticDecompression = DecompressionMethods.GZip; req.KeepAlive = false; if (UsingXMLHttpRequest) { req.Headers["X-Requested-With"] = "XMLHttpRequest"; } if (UsingProxy) { req.Proxy = Proxy; } HttpWebResponse res = (HttpWebResponse)req.GetResponse(); StreamReader sr = new StreamReader(res.GetResponseStream()); if (RT == ReturnType.ResponseContent) { string str = sr.ReadToEnd(); ReturnList.Add(str); } else if (RT == ReturnType.ResponseUrl) { string str = res.ResponseUri.ToString(); ReturnList.Add(str); } else if (RT == ReturnType.ResponseHeader) { string HeaderStr = string.Empty; if (HeaderName.Contains(",")) { string[] HNarray = HeaderName.Split(','); for (int i = 0; i < HNarray.Length; i++) { HeaderStr += res.GetResponseHeader(HNarray[i]); if (i != HNarray.Length - 1) { HeaderStr += "|"; } } ReturnList.Add(HeaderStr); } else { HeaderStr = res.GetResponseHeader(HeaderName); ReturnList.Add(HeaderStr); } } else if (RT == ReturnType.All) { string str1 = sr.ReadToEnd(); string str2 = res.ResponseUri.ToString(); ReturnList.Add(str1); ReturnList.Add(str2); string HeaderStr = string.Empty; if (HeaderName.Contains(",")) { string[] HNarray = HeaderName.Split(','); for (int i = 0; i < HNarray.Length; i++) { HeaderStr += res.GetResponseHeader(HNarray[i]); if (i != HNarray.Length - 1) { HeaderStr += "|"; } } ReturnList.Add(HeaderStr); } else { HeaderStr = res.GetResponseHeader(HeaderName); ReturnList.Add(HeaderStr); } } sr.Close(); res.Close(); req.Abort(); return ReturnList; } public enum ReturnType { ResponseContent, ResponseUrl, ResponseHeader, All } } 個人將上面方法包成一個DLL 專案本身使用backgroundwork來跑 Dowork內使用Get()取資料 結束後thread.sleep(2000); 之後進到RunWorkerCompleted再重新呼叫BGW.RunWorkerAsync(); ---------------------------------------------------------- 更新進度 怎樣修改都沒有好轉 原本測試的平台是Server2003 X86 種花固I 轉移到Win7 X64 種花浮動 什麼問題都沒有了.... 在Server2008 X64上也都沒有問題 專案編輯是32位元的 也看過工作管理員是*32在執行 想請問這樣可能會是什麼問題? 對了,專案是.net 4.0 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.240.231.238
※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_Sharp/M.1440193774.A.9B5.html
1F:→ fo40225: 有完整的程式碼嗎? 這樣比較好找問題 08/22 08:24
2F:→ fo40225: 然後 不要呼叫GC.Collect() 你呼叫這個 他要把所有的線程 08/22 08:30
3F:→ fo40225: 掛起 很傷效能 08/22 08:30
4F:→ fo40225: 也不要把物件設為null 這樣會讓物件被GC的時間延後 08/22 08:31
5F:→ fo40225: .net的最佳記憶體管理方式就是有IDisposable時用using 08/22 08:33
6F:→ fo40225: 然後其他的不要管 把物件設為null在C++才是呼叫解構子 08/22 08:35
7F:→ fo40225: C#中沒有意義 08/22 08:35
8F:→ fo40225: 如果你是.net4.5以上 你可以試試用HttpClient 08/22 08:37
※ 編輯: unstoppable (111.240.231.238), 08/22/2015 15:14:21
9F:→ fatrabitree: C++設為null也沒有呼叫解構子就是... 08/22 15:24
10F:→ fo40225: 那就是我誤解了 抱歉誤導了 08/22 21:08
11F:→ fo40225: backgroundworker是設計拿來CPU-bound 別拿來IO 08/22 21:31
12F:→ fo40225: 試試 (HttpWebResponse)await req.GetResponseAsync(); 08/22 21:31
13F:→ fo40225: 有沒有可能是頻寬吃緊 導致60秒載不完? 08/22 21:32
14F:→ fo40225: 不然就是線程太多 來不及反應 08/22 21:32
感謝fo細心回應 用BGW主要是因為更新UI界面太方便了~XD(明明就是自己懶得寫thread委派) 頻寬應該不會是主要的原因,數據都是1~2X K的大小 目前看線程同時間最多7個BGW在跑 GetResponseAsyn這個我研究下,第一次看到 ※ 編輯: unstoppable (111.240.231.238), 08/22/2015 23:52:32 ※ 編輯: unstoppable (111.240.231.238), 08/23/2015 07:17:40







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP