作者OSDBNetwork (路人甲)
看板Ajax
标题[问题] 如何抓出脸书所有的"动态消息"?
时间Mon Apr 7 09:15:15 2014
---------------------------------------------------------------------
脸书的"动态消息"很多,
一直往下看,都看不完,
所以想抓出脸书所有的"动态消息".
检视网页原始码,
想了很久,
却不知道怎麽分析.
请问大家一下,
脸书所有的"动态消息"要分析哪一段原始码呢?
(又或者要分析哪个档案?)
PS: "赞" "留言" "分享" 不用
http://i.imgur.com/YLLagRQ.jpg
---------------------------------------------------------------------
像脸书的"地标",
如果想找出所有地标的名称,
可以藉由网页原始码,
将所有地标的名称全部列出来.
例如:
https://www.facebook.com/profile.php?id=100002267748233&sk=map
将网页原始码最底下的<script>...</script>复制出来
beautify 一下 script
(
http://www.jspretty.com/ )
http://paste.plurk.com/show/1847524/
取一段网页原始码可以得知
http://i.imgur.com/vNpLrMM.jpg
"id": 182179281823672,
代表
http://wwww.facebook.com/182179281823672
"name": "\u7def\u4f86\u96fb\u8996\u7db2",
代表 地标的名称
\u7def ,
http://www.scarfboy.com/coding/unicode-tool?s=7def ,
代表中文的 纬 , 也就是 HTML 的 緯
\u4f86 ,
http://www.scarfboy.com/coding/unicode-tool?s=4f86 ,
代表中文的 来 , 也就是 HTML 的 來
\u96fb ,
http://www.scarfboy.com/coding/unicode-tool?s=96fb ,
代表中文的 电 , 也就是 HTML 的 電
\u8996 ,
http://www.scarfboy.com/coding/unicode-tool?s=8996 ,
代表中文的 视 , 也就是 HTML 的 視
\u7db2 ,
http://www.scarfboy.com/coding/unicode-tool?s=7db2 ,
代表中文的 网 , 也就是 HTML 的 網
"latitude": 25.078403186215,
代表 纬度
"longitude": 121.56900884754,
代表 经度
"city": 2350688,
这个 city code 对照表不知道在哪?
如果有人知道, 请提供一下. 谢谢.
"country": "TW"
代表 台湾
知道以上规则後,
写个小程式分析网页原始码,
就可以快速浏览脸书所有地标的名称了.
(不用一个一个地标点进去看名称)
有图有真相
http://i.imgur.com/TM7UoQl.jpg
---------------------------------------------------------------------
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.255.132.30
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Ajax/M.1396833334.A.0FE.html
1F:→ ckvir:fb不是有提供sdk api吗? 04/26 20:07
2F:→ ckvir:干嘛那麽辛苦去parse htnl 04/26 20:07