作者PsMonkey (痞子军团团长)
看板Ajax
标题Re: [翻译] 「让 AJAX 网页可以被网路爬虫读取」建 …
时间Tue Oct 13 08:49:50 2009
: 推 SMUGEN:糟糕 需要这个东西但这篇却看不太懂 只好先给推~~~ 10/13 00:18
: 推 tomin:看不懂 是同一页要能处理三类URLs 且输出都要相同? 10/13 00:29
: → TonyQ:简单来说 , 原本的ajax 操作时要加锚点标示目前状态. 10/13 07:58
: → TonyQ:这是identify , 用来识别当前页面的究竟是哪一页 , 10/13 07:58
: → TonyQ:其次是要有可以只用这个锚点资讯 , 就产出完整html的page 10/13 07:59
: → TonyQ:简单来讲只是变成两道工 , 跟之前摆a / 里面放可连至完整页 10/13 07:59
: → TonyQ:但是onclick return false 做 ajax处理的方案有异曲同工之妙 10/13 08:00
: 推 tomin:唔 就是要做成picasa web那样? #xxxx可以连到某照片? 10/13 08:02
有写 GWT 的可能懂起来比较快
(是说,我没写过传统的 AJAX,所以这样讲好像也不太可靠 XD)
TonyQ 讲的有点对又有点不太对
现在 #xxxx 就可以连到指定的 resource
(或着说,产生指定的 resource)
picasa 我没用不知道,但是 gmail 是这样子处理的
这篇要以 search engine 的角度去看,会比较快
GWT 上头的 Hyperlink(ㄜ... 是个物件,功能上跟 <a> 等意)
按下去之後会改变 URL 里头 # (锚点)
於是这篇建议,要被 search engine 处理的 URL,就改成「!#=AJAX」
更正确讲,是 web server 里头的 headless browser 产生的 HTML 中
要被 search engine 处理的 URL 要改成「?_escaped_fragment_=AJAX」
大概是这样
======
反正只是建议书啦,还不用太认真看待 XD
--
侃侃长论鲜窒碍 首页:
http://www.psmonkey.idv.tw
众目睽睽无心颤 Blog:
http://ps-think.blogspot.com
茕居少聊常人事
杀头容易告白难 欢迎参观 Java 版(@ptt.cc) \囧/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.20.136.131