Re: [翻译] 「让 AJAX 网页可以被网路爬虫读取」建 …

时间Tue Oct 13 12:27:30 2009

※ 引述《TonyQ (^^)》之铭言： : ※ 引述《PsMonkey (痞子军团团长)》之铭言： : : 现在 #xxxx 就可以连到指定的 resource : : （或着说，产生指定的 resource） : : picasa 我没用不知道，但是 gmail 是这样子处理的两个例子： http://picasaweb.google.com.tw/lh/view?q=cat&psc=G#5318136144069597426 http://mail.google.com/mail/#inbox/1244ba38306fd756 看起来是相同的处理方式不过Google自己的服务都没有用!#了　怎麽blog还建议用"!" : : 於是这篇建议，要被 search engine 处理的 URL，就改成「!#=AJAX」 : : 更正确讲，是 web server 里头的 headless browser 产生的 HTML 中 : : 要被 search engine 处理的 URL 要改成「?_escaped_fragment_=AJAX」 : : 大概是这样 : 至於这份规格书所建议的撰写方式则是在这样的流程下额外增加一些东西. : 这边通常需要一些额外的辅助才做得到啦, : 像我以前写 jsp 时用的 decorator 就很适合这样做. : 我们刚刚总共有的步骤如下 : 浏览主要页面(页1,user.html) -> 发request -> 收response -> : 处理後出现新的页面(页2) : 然後新的处理步骤是这样 : 浏览主要页面(页1,user.html) -> 发request : -> (透过 a ) 将页面标示锚点且用!开头 (像是 #!page2 ) : -> 收response -> 处理後产生新的页面 2 (此时url: user.html#!page2) : 如果使用者直接连 user.html#!page2 , : 这个页面要能够直接显示页面2的内容 ,这边是基本的 . : 再来就是 : user.html?_escaped_fragment_=page2 : 应该要是产出静态（无js辅助）只有内容的 html . 纯html 不用js 无法动态产生内容吧不用js 怎麽parse url　得到page2这个值　再去捞资料? 除非 1) *.html被controler　mapping到*.php *.pl等等server side语言 2) 事先(批次)将所有可能用到的*.html output成一个一个档案 user.html?_escaped_fragment_=page2 被视为要读取user_page2.html 另外[_escaped_fragment_]这17个字元是可替换的? 例如可换成user.html?very_polite=page2 简单讲　连结要有不同的网址　对应到不同的内容实际上　request/response收发的　通常都只是一整个网页的小小地方/区块例如index.php/html/... 一直跟counter.php要上站人数统计那些(AJAX暗地去捞的)小区块资料　例如counter.php　就不需去做!#这类SEO的动作吧因为我们不希望search engine找到counter.php 而是希望它去解析index.php 因为那些片段资料　是没有足够意义的　一定要整体看(index.php)才有意义如此一来　search engine可能永远不知道counter.php的存在解析index.php时　counter.php的资料不会被放在index.php里面除非你去递交counter.php的网址或是要有一页连结　专门就是呈现静态资料（已捞完counter.php的index.php） : 我的理解大概是这样 , : 原则上这还是不脱之前所看到对search engine友善的讨论... : 觉得有误的地方再提出来讨论吧 XD --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 140.122.30.140 ※ 编辑: tomin 来自: 140.122.30.140 (10/13 12:35)

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Ajax 板

Re: [翻译] 「让 AJAX 网页可以被网路爬虫读取」建 …

热门看板

赞助商连结