作者comeonbaby (来巴宝贝)
看板Python
标题[问题] spark 资料减去平均值
时间Mon Oct 1 13:34:58 2018
目前资料已分成一串tuple存在RDD里面 (ID, Data)
目前想做的是将Data值减去其ID的Data平均值
例如: (1,10) (1,20) (2,10) 跑完後会变成
(1,-5) (1,5) (2,0) 这样
因为刚接触不太清楚该怎麽实作
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 67.161.17.57
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1538372100.A.827.html
1F:→ os653: Spark 装好有内附 k-means 范例,一开始先照抄就好 10/01 21:55