看板Oversea_Job
标 题Re: 请教一些面试问题
发信站批踢踢参 (Sat Aug 25 12:35:44 2007)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!ptt3
※ 引述《michaelz (michaelz)》之铭言:
: ※ 引述《[email protected] (遗憾太常。)》之铭言:
: : 我会设计的方法:
: : URL的有效字元 A-Z a-z 加上一些符号,大概总共算是60个symbol,
: : n0*60^0+n1*60^1+n2*60^2+n3*60^3+n4*60^4+...+ni*60^i
: : 不过这个数字大的一塌糊涂,所以不是什麽好方法;
: : 如果不想要collision的话,资料量可能就是那麽大。
: : 至於partition的话,用开头字母就可以作uniform dist.了。
: 用开头字母的话大概会看到一堆http, www之类的东西..然後所有的东西都要放在同一个
: partition, 用整个url算hash code可能会好一点
不知道有没有人想过用tree
以www.upenn.edu, www.cis.upenn.edu, www.ese.upenn.edu来说
看起来应该会像这样:
edu - upenn - www
- cis - www
- ese - www
考虑到DNS的distribution, root node 如com, edu, org应该可省下不少空间
--
※ 发信站: 批踢踢参(ptt3.cc)
◆ From: 141.158.245.93