Soft_Job 板


LINE

※ 引述《danceofdie (zong)》之銘言: : 1. 對於資料流量來源的總結,兩家公司都以隱私為由不公開資料來源,所以看完官方文件後也是不知道實際的來源是什麼。 https://www.similarweb.com/corp/ourdata/ https://www.semrush.com/kb/998 雖然很模糊,但這兩家其實有大概講一下資料來源 - 拿一堆關鍵字丟搜尋引擎的結果頁面看結果 - 跟上面類似,不過是去拉維基百科之類的大型公開資料 - 跟第三方買各種資料 - 第一方資料(不過說能拿到 GA 資料但不講怎麼拿到 GA 資料,毛毛的) 這種大規模資料搜集有時候生意不是那麼好端上檯面。 自己沒做過,但古早有聽人講過「到處下廣告,然後用廣告成效估計網站用量」之類的招 這招現在應該沒有五年十年前這麼好用,但大概還是有把戲能變? 另外 similarweb 直接在網站上提到他們會跟 ISP 買資料。 某個程度上滿嚇人的... 總之,他們的主要資料大~概~不是實際用量數據。 而是各種側面資料,加上一部分流量資料來作為估計用的基準。 這樣估計出來的資料光是能落在同一個數量級就很了不起了。 GA 直接用 JavaScript 測量網站使用狀況,品質會好得多 但也不會是百分之百準確 - Firefox 某些情況下會擋 GA,Brave 應該也會擋 - 跑在客戶端的 code 本來就不可能完全可信 - 會各種被塞(黑帽 SEO?)資料 -- 頂天立地:愛孩子就要支持蘿莉控 https://goo.gl/Zmk62o --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.15.211 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1658288600.A.606.html ※ 編輯: GALINE (114.47.15.211 臺灣), 07/20/2022 12:03:05
1F:推 Boston: 我印象中 similarweb 是透過網路封包分析(跟 ISP 買資料 07/20 17:48
2F:→ Boston: 理論上應該會比 GA 這種埋在 client side 的追蹤來得更準 07/20 17:48
3F:→ Boston: 主要是裝個 AD block or 不啟用 javascript 07/20 17:48
4F:→ Boston: GA 基本上就追蹤不到了 07/20 17:49
5F:→ Boston: 而且近幾年瀏覽器對隱私越來越嚴格,越來越多防止追蹤功能 07/20 17:49
6F:→ GALINE: 如果是 shared host 或雲端服務,分析能力還是有限 07/20 20:58
7F:→ GALINE: 現在HTTPS幾乎標配,除非環境污染 MITM,不然打穿機率不高 07/20 21:00
8F:→ GALINE: 自己的機器或固定外部IP應該就能抓很準了 07/20 21:01
9F:→ GALINE: 突然想到DNS那個方向應該還是有招... 07/20 21:02
10F:推 guanting886: 正常環境不會有MITM 07/21 01:00
11F:→ guanting886: 數據資料可以一魚多吃 當你使用平台的服務就同意他 07/21 01:02
12F:→ guanting886: 們可以怎麼使用你的資料 而且賠償是有上限的 07/21 01:02
13F:→ guanting886: 有些數據也不一定需要ISP 那邊買 07/21 01:04
14F:→ guanting886: 當你拉進那些免費的字體、JS、服務就是幫別人收集資 07/21 01:06
15F:→ guanting886: 料完善他們的服務 07/21 01:06
16F:推 guanting886: 舉例說 SEMRUSH 可以知道某網站數據狀況,上面的數 07/21 01:20
17F:→ guanting886: 據缺很意外跟 GA 上的資料接近,即使有誤差。可是那 07/21 01:20
18F:→ guanting886: 個網站呢用的AWS、Cloudfront + Cloudflare 的服務 07/21 01:20
19F:→ guanting886: 其他就是一些常見的 GA、FB PIXEL、BING 追蹤轉換、 07/21 01:22
20F:→ guanting886: 成效的東西 07/21 01:22
21F:→ guanting886: 還有 Google Font 07/21 01:23
22F:→ guanting886: 你說究竟是誰出賣了這個網站的呢 不知道 但是一開 07/21 01:25
23F:→ guanting886: 始你同意了服務條款,他們也得到你的授權,他只要 07/21 01:25
24F:→ guanting886: 適當的去掉可以識別的資料他們怎麼用你也拿他們沒 07/21 01:25
25F:→ guanting886: 什麼辦法 畢竟免費服務麻 07/21 01:25
26F:→ guanting886: 像某家賣IP Geo 資料的業者,他們怎麼可以抓到很準 07/21 01:32
27F:→ guanting886: 確的 Country/City 可以思考一下他們以前推了什麼服 07/21 01:32
28F:→ guanting886: 務給網友XD 07/21 01:32
29F:推 guanting886: 還有一些數據平台資料鎖很緊,爬蟲還不一定爬得穩, 07/21 01:37
30F:→ guanting886: 不是合作夥伴我是不相信啦XD 07/21 01:37
31F:→ GALINE: 「正常」是不應該有...(望向 superfish 案 07/21 15:04
32F:→ GALINE: CDN 業者拿到的資料品質應該也不錯 07/21 15:05
33F:→ GALINE: 這年頭資料都被賣來賣去的啊.... 07/21 15:16







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Boy-Girl站內搜尋

TOP