作者ggirls (哥)
看板Programming
标题[问题] 如何分析(新闻)资讯?
时间Fri Jul 5 09:48:19 2013
我知道这是个大问题,但我没有相关知识,上学时google都还没这样红,想知道有没有这种专门学科?或论着?关键字是什麽。
所谓分析资讯就例如随便抓过资料,想要将之分类为高兴的或难过的或被批评的被称赞的。
我只想到关键字的方法,若是,有这种免费中英文字典可抓吗?
--
Sent from my Android
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 116.59.246.185
1F:→ MOONRAKER:阿看到「高兴」就是高兴 118.163.12.174 07/05 11:26
2F:→ MOONRAKER:「难过」就是难过 这样不就结了 118.163.12.174 07/05 11:26
3F:→ MOONRAKER:还要什麽中英文字典 118.163.12.174 07/05 11:27
4F:推 purpose:为什麽最後会突然冒出字典,很突兀 124.8.133.247 07/05 12:16
5F:→ ggirls:字典的英文是dictionary 116.59.251.194 07/05 13:35
6F:→ azureblaze:英文的字典是牛津 118.168.88.88 07/05 13:41
7F:→ ggirls:牛津不是一部字典喔,sorry 116.59.251.194 07/05 14:04
8F:→ Foremanytz:data mining 163.15.40.184 07/05 15:53
9F:→ EShensh:可以利用重覆出现的词来抓为关键字。 114.41.75.91 07/05 16:48
10F:→ EShensh:然後多比较几篇,得出真正的关键字。 114.41.75.91 07/05 16:48
11F:→ yauhh:有很多零碎的技术.像文件分类,资料探勘等等 36.226.99.148 07/05 20:15
12F:→ lulala453:Information Retrieval 1.163.22.251 07/05 21:13
13F:→ MOONRAKER:到底是跟字典有什麽ㄆ关系 1.34.60.15 07/05 21:56
14F:→ MOONRAKER:看清楚 是免费可抓的字典喔 1.34.60.15 07/05 21:57
15F:→ n3oanderson:machine learning, classifier 61.230.78.214 07/05 22:02
16F:→ yauhh:怕什麽,怕他带着错误的想法却做出来了吗? 36.226.99.148 07/05 22:13
17F:推 purpose:谢谢原PO,让我多学到一个英文单字 124.8.133.247 07/05 23:07
18F:→ yauhh:是说要技术关键字的字典吗?电脑科技专门字典 118.167.55.68 07/06 11:39
19F:推 coolcomm:原po指的应该是字典的library吧 123.110.151.94 07/06 12:20
20F:→ yauhh:说word-net吗? 118.167.55.68 07/06 12:43
21F:→ gargoyle005:是 网路蜘蛛 有很多资讯查一下 123.194.173.80 07/07 10:25
22F:→ gargoyle005:或是 web robot 相关的东西 123.194.173.80 07/07 10:26
23F:→ gargoyle005:还有 robots.txt 123.194.173.80 07/07 10:27
24F:→ yauhh:应该不是蜘蛛crawler,肢蛛没办法分析资讯 36.226.98.239 07/07 10:32
25F:→ gargoyle005:嗯 python 的 scikit也不错 123.194.173.80 07/07 10:59
26F:嘘 kingstong:某楼的GIRL,牛津字典没听说过吗?!我们用 114.38.67.201 07/07 18:18
27F:→ kingstong:的是常见的单字,但很多不常用的单字就得 114.38.67.201 07/07 18:18
28F:→ kingstong:查牛津,GOOGLE一下好吗?还有专业字典还 114.38.67.201 07/07 18:20
29F:→ kingstong:得买,本鲁蛇乃出身文组,理组大都读原文 114.38.67.201 07/07 18:23
30F:→ kingstong:还有原文书贵到爆,拍泄推文离题了 114.38.67.201 07/07 18:25
31F:→ ggirls:楼上,牛津不等同牛津字典喔,sorry。 116.59.238.49 07/08 15:16
32F:→ ggirls:感谢楼上上…认真回答的朋友 116.59.238.49 07/08 15:21
33F:推 starengine:Information Retrieval+1 114.44.221.8 07/08 19:24
34F:→ yauhh:突然来个白马非马,真是丈二金刚 36.226.99.49 07/08 19:32
35F:推 kingstong:有没有直接写BINARY CODE的人?! 36.233.229.90 07/08 22:29
36F:→ suhorng:古早时候应该很多? 118.166.47.118 07/08 22:40