作者washqwe (阿蹦)
看板Ajax
标题[node] cheerio 原理
时间Thu Dec 31 19:31:40 2015
请问jsdom or cheerio是如何写成的,大概原理是?
取到mongodb的资料及fs.readfile到html档後如何只用原生module将html里的值根据collec
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.217.136.107
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Ajax/M.1451561502.A.426.html
1F:推 mmis1000: 这两个都是开放原始码专案,问这个问题前google过了吗? 01/01 23:55
2F:→ mmis1000: 他们基本上都是实作DOM,jsdom是以binary的方式实作 01/02 00:05
3F:→ mmis1000: cheerio则是用另一个js写的html parser当底层 01/02 00:06
4F:→ mmis1000: 他们都用了自己或是其他人写的parser 01/02 00:06
5F:→ mmis1000: 因为node.js的环境里根本没dom这回事,他又不是浏览器, 01/02 00:07
6F:→ mmis1000: 因此要用就得自己写,或是找其他人写的01/02 00:07
7F:→ washqwe: 如何不用module传值给dom? 01/02 06:43
8F:→ washqwe: 下什麽关键字有教如何readfile後读mongodb传值给dom? 01/02 06:55
9F:→ mmis1000: 就说node.js里根本没dom,请直接用module01/02 12:38
10F:→ washqwe: 不用module无法做到?01/02 17:26
11F:→ washqwe: 当然知没dom 指的是html file01/02 17:51
※ 编辑: washqwe (180.217.148.188), 01/02/2016 18:20:11
12F:→ mmis1000: 对,半不到,没有就是没有,要不然你就自己做 01/02 19:23
13F:→ mmis1000: 或是用regex暴力解字串,但是html并不是很适合用regex直 01/02 19:23
14F:→ mmis1000: 接操作的格式 01/02 19:24
15F:→ washqwe: 自己做有关键字吗 01/03 11:36
16F:→ mmis1000: 你可以参考cheerio原始码看他们是怎麽做的 01/03 18:41
17F:→ mmis1000: 但我不推荐这麽做,有现成的不用要自干实在不是很好的选 01/03 18:42
18F:→ mmis1000: 项 01/03 18:42