看板Oversea_Job
标 题Re: 请教一些面试问题
发信站批踢踢参 (Sat Aug 25 18:07:55 2007)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!ptt3
※ 引述《LINC (Go cubs!)》之铭言:
: ※ 引述《michaelz (michaelz)》之铭言:
: : 用开头字母的话大概会看到一堆http, www之类的东西..然後所有的东西都要放在同一个
: : partition, 用整个url算hash code可能会好一点
: 不知道有没有人想过用tree
: 以www.upenn.edu, www.cis.upenn.edu, www.ese.upenn.edu来说
: 看起来应该会像这样:
: edu - upenn - www
: - cis - www
: - ese - www
: 考虑到DNS的distribution, root node 如com, edu, org应该可省下不少空间
这个叫作trie, 是满有趣的data structure, 但是问题在於这并不能减少空间
如果把整个internet做成trie的话, 每一个网页还是要占去一个node,这样子整体
node的的数量不会减少, 还可能会增加. 比如说没有一个网址是叫作edu的,但是
你还是需要用一个node去存edu...
如果每一个upenn.edu的前面都是www的话...那些是leaf的www可以去掉..或许能
减少一点空间..但是整体上效用应该不会很大
--
※ 发信站: 批踢踢参(ptt3.cc)
◆ From: 64.236.139.77
1F:推 Baudelaire:trie的作法很有意思,跟tree发音一样 :P 08/26 00:46