作者sealoe (不买美债=人权倒退XD)
看板Cloud
标题[问题]Hadoop能干啥?
时间Wed Aug 27 16:05:48 2014
说到hadoop 以广告来说 就是大数据分析
而最着名的例子就是尿布和啤酒
我对於尿布和啤酒的例子有疑问
当然 找到两个相关的产品 互做广告有增加销售的效果
但是 首先 我有2个问题
1. 首先 我要花多少钱 建制哪些东西 才可以得到这类型结论?
2. 我在得知这结论之前 我要怎麽知道我要这个结论?
而除了搜寻引擎(基本上搞论文才有价值)
hadoop在一般应用上 能做啥 找尿布和啤酒这类型相关的题目?
而这种题目 而我得到这结论又能干啥事? 我为何要花这麽大的功夫去得到这结论?
我说个情境好了
当我得到尿布和啤酒相关的结论
"我可能在啤酒那做尿布广告吗?"
根据尿布和啤酒的结论 事实上 当然也可以得到
尿布和纸杯
尿布和花生
啤酒和花生
啤酒和小鱼乾
啤酒和纸牌
花生和烤肉
烤肉和烤肉酱
卫生纸和烤肉酱
沙茶酱和火锅料
这类型的常识性结论 问题是
我可能做相关的广告吗? 这样 我啤酒那要贴多少传单?
就算我得到这类型的结论 实务上的应用又在哪里?
这类型的销售结论 不用透过大资料应用
实际上你随便想想都有常识性的结论
以此例而言
为啥我要特别为尿布和啤酒打广告? 而不会常识性的结论打广告?
当然 这个问题和hadoop的架设以及资讯的价值 没有很大的关系
只是 实务上 到底能用来干"什麽" 又这个"什麽" 能带来哪些价值?
--
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.134.23.142
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Cloud/M.1409126751.A.5FC.html
1F:推 timfan3939: 尿布和啤酒,并不是用hadoop找到的 08/27 16:43
2F:→ timfan3939: 以往的资料分析,是要下载资料後才分析 08/27 16:44
3F:→ timfan3939: 但hadoop改变了这架构,程式上传至储存的地方分析 08/27 16:45
4F:→ timfan3939: 最後再统计结果 08/27 16:45
5F:→ timfan3939: 你举的尿布与啤酒,似乎只是特解示一个特殊的现象 08/27 16:46
6F:→ timfan3939: 就是买尿布的人,会顺带一打啤酒(因为是男人在买的) 08/27 16:47
7F:→ timfan3939: 实际应用应该是将啤酒广告或商品,放在附近 08/27 16:47
8F:→ timfan3939: 不一定是隔壁,达到方便客人的角度 08/27 16:48
9F:→ timfan3939: 或是将两者放得很远,为了取得两样商品,客人将走过 08/27 16:48
10F:→ timfan3939: 全卖场,反而有可助於提升业绩(可能会心动多买东西) 08/27 16:49
11F:推 timfan3939: 多少钱→就硬碟大小,每笔交易记录如何存下 08/27 16:55
12F:推 timfan3939: 如何知此相关→有目的找也是可以,没目的找也可。本 08/27 16:58
13F:→ timfan3939: 例子重於说用资料采矿技术,发现法奇怪的结果。而如 08/27 16:58
14F:→ timfan3939: 何正确解示此结果才是重点 08/27 16:58
15F:推 timfan3939: 至於hadoop 只是用些技术,将「发现」这个结果的过程 08/27 17:00
16F:→ timfan3939: 「加快」而已。要如何去找到你要的东西,还是依赖演 08/27 17:00
17F:→ timfan3939: 算去达成 08/27 17:00
18F:推 timfan3939: 不知以上有没解答到您的问题? 08/27 17:05
19F:→ sealoe: thx 我再想想看~ 08/28 10:20
20F:→ sealoe: 我大概理解了 事实上我该朝向资料探勘去看 08/28 14:20
21F:→ sealoe: 而不是被广告词导向 而使用实际上不见得实用的工具 08/28 14:21
22F:→ sealoe: thx 08/28 14:21
23F:推 timfan3939: 有时挖这个东西不一定是广告,行销不是只有广告一途 08/28 19:37
24F:→ timfan3939: 如何使用此结果来赚更多钱,对商人来说才是重要的 08/28 19:37
25F:→ timfan3939: 所以别被框架框住了 08/28 19:38
26F:推 felaray: 其实我觉得那就是资料探勘,Hadoop只是简化分析的工具。 08/28 22:08
27F:推 felaray: T大其实可以回篇文章了XD 08/28 22:09
29F:→ felaray: 事交易的种类 08/28 23:17
30F:推 kevingyc: 啤酒跟尿布,只是资料分析过後的观察,不是一开始的假设 08/29 07:46
31F:→ sealoe: 事实上 我稍微看了一下 这类的系统 都要非常大才有价值 08/29 15:14
32F:→ sealoe: 举个例子 对沃尔玛的商品销售资料做资料探勘 举例奶粉尿布 08/29 15:15
33F:→ sealoe: 或许可能利用到 但是对於传统的店家 甚至於大润发 08/29 15:15
34F:→ sealoe: 似乎不太需要.(以找出最相关的两件商品这种事上为例) 08/29 15:17
35F:→ sealoe: 不过 我大概有点了解 要搞懂这方面的知识 似乎不是一天两 08/29 15:18
36F:→ sealoe: 天可以搞定. 且销售资料也得累积. 举例来说 我如果要用 08/29 15:19
37F:→ sealoe: 就是要 1.先找人设计或是找到工具 2.根据工具特性输入资料 08/29 15:20
38F:→ sealoe: 做成资料仓储的东西 3.经过一年後, 开始可以做些相关产品 08/29 15:20
39F:→ sealoe: 的销售调查(资料探勘) 这样 真的合成本吗? 之前的系统是 08/29 15:21
40F:→ sealoe: 得全部换掉? 假设以10间超商就好了, 换掉POS换掉销售资料 08/29 15:22
41F:→ sealoe: 库, 不用太多, 上百万还是要的. 这样要做啥才能真正让 08/29 15:22
42F:→ sealoe: 引入类似技术有价值呢? 还是说 这类技术是设计给沃尔玛 08/29 15:22
43F:→ sealoe: 类型的大公司使用, 如果规模不够 实际上不该使用呢? 08/29 15:23
44F:→ felaray: 样本数要够大 价值比较能显现出来 因为在巨量资料的情况 08/29 19:36
45F:→ felaray: 下用传统人力已经无力去分析.. 08/29 19:37
46F:推 timfan3939: 样本数不够大还是可以分析。只是分析出来的结果会有些 08/30 14:25
47F:→ timfan3939: 杂讯,会导致误判之类的。至於pos之类的,大多都有 08/30 14:26
48F:→ timfan3939: 收据系统,就是买完後就给张收据,这也是未来公司对帐 08/30 14:26
49F:→ timfan3939: 的资讯。若旧有pos好用的话,不如只增加存资料的功能 08/30 14:27
50F:→ timfan3939: 也就是收据记录功能就好了。 08/30 14:27
51F:→ timfan3939: 资料方面,不是有需要才记录,而是平时就在记录,需要 08/30 14:28
52F:→ timfan3939: 时才能快速取得,快速送去运算,得到结果 08/30 14:28
53F:→ timfan3939: 说真的,如果公司没计画去记录下所有可能的数据,那就 08/30 14:30
54F:→ timfan3939: 用普通的市场调查就可以解决了。而大数据也算是市场调 08/30 14:31
55F:→ timfan3939: 查的一部份,准确度比去一个一个问还准(资料多,且全 08/30 14:32
56F:→ timfan3939: 部的资料都算),且较方便(用几台电脑就跑出来了,不 08/30 14:32
57F:→ timfan3939: 用花心思设计问卷、吸引别人来填之类的) 08/30 14:32