作者shoshumai (筋斗云速度变快了)
看板Programming
标题[讨论] 新型态的Protocol兼FileSystem
时间Mon Feb 1 23:05:54 2016
大家好,工程师职历近2年的7年级最末段生想和各位前辈讨论一下protocol
最近因为工作关系,一会是研究unix,一会是研究blockchain的,非理工出身的我真的是
脑袋一片混乱…不过因为完全没有理工背景,能在工作上有机会去查这些东西也是觉得满
特别的,跟同业聊天可以装个mania
(但终究是装的,希望可以赶快装满)
然後最近在关注一个叫做「ipfs」的Open Source专案(
https://github.com/ipfs/ipfs)
他既是一个protocol,又是一个FileSystem,还可以是P2P,CDN等等
野望是取代http@@
(引用: If built right, it could complement or replace HTTP. )
其中,特别想知道的是hash collision问题
http://silverwingedseraph.net/ipfs.html
脱离数学很久,而且不太看得懂英文写的数学,有点难想像怎样的条件下可以自由的产生
hash而不重复。(天文数字&???)
要是真的可行,网站不需要ip的世界,乍看是满理想的。但类同比特币,这种无法地带能
成为主流?
但telnet的ptt也没有消失,说真的,网路的历史要说也不算长
(例如说:对应IoT跟行动机器而)重建一个protocol的理想,也是有那麽些说服力
另外一个想讨论的是,standard uri
https://github.com/ipfs/go-ipfs/issues/1678
文中引用了RFC 2718
2.1.2 Improper use of "//" following "<scheme>:"
我微弱的科技英语的解读是,「scheme名 : slash slash 网址」
这个表现其实不符合美学
理由可能是其它回文讨论提到的在「bridge unix and the web」上的问题
(上面这句收回。重读一次觉得这边没有关联...)
我没写过C, 没经历过UNIX-based OS林立的时代(最近有在读跟我出生年份差不多的书)
ARPA更是不懂
这篇希望可以看看同年代的考古学生或考古上班族 and 那年代的前辈们的见解
「新时代的main protocol的可能性」
如果是肯定的话,「它该有的模样?」
否定的话,「人为因素或技术因素?」
以上,感谢阅读,敬请指教
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 106.161.166.95
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Programming/M.1454339161.A.F36.html
※ 编辑: shoshumai (106.161.166.95), 02/01/2016 23:08:35
※ 编辑: shoshumai (106.161.166.95), 02/01/2016 23:12:35
※ 编辑: shoshumai (106.161.166.95), 02/01/2016 23:50:40
1F:推 longlongint: hash 不需要真的不会重复 只需要这220.137.158.216 02/02 02:00
2F:→ longlongint: 辈子没遇过重复就够了220.137.158.216 02/02 02:00
3F:推 capita: 我做过几乎一样的研究 但你是想讨论什麽? 1.171.176.23 02/02 11:00
4F:推 penut85420: double hash不够就用triple hash啊XDD 1.167.156.26 02/02 12:24
RE: capita前辈
sorry, 夹杂了个人的烦恼,随手用自己微薄的知识写了这篇,文章流畅度有点差
主要想问:
(1)HTTP未来被取代的可能性?
因为我不想focus在我个人的烦恼, 所以说是与其要求一个结果, 我比较倾向於不同年代的
工程师的开放式讨论
然後
(2)进一步假设, 要是想打造一个全新的, 近未来的理想的protocol,
他会是个怎样的protocol?
当然,
(3)技术上或者人为因素ooxx的关系, http是无法取代的论点也想听听看
RE:longlongint前辈, penut85420前辈
hash那部分, 我的脑袋的想像是, 假设全世界用着类似的机器,(假设是有连线功能的
电灯好了, 无视使用hash的理由, 只是假设庞大数量且条件相近的机器), 在同一时间内
做类似的事情, 不会发生hash collision吗??
P.S.我本来只是个Java工程师, 一言难尽的原因, 现在在研究这些资讯知识用词有误之类
的话请鞭小力一点...
※ 编辑: shoshumai (106.161.158.143), 02/02/2016 20:01:50
5F:推 penut85420: 其实我对hash实作也是感到不可思议, 61.231.61.84 02/02 22:19
6F:→ penut85420: 用过js跟ruby之类的总觉得很神奇,好 61.231.61.84 02/02 22:19
7F:→ penut85420: 像hash一辈子用不完一样 61.231.61.84 02/02 22:19
8F:→ shoshumai: 我连高中都不是理组,怕乱用词会有点丢106.161.166.112 02/03 00:32
9F:→ shoshumai: 脸. 我的空想是,性质极度相似的机械,106.161.166.112 02/03 00:33
10F:→ shoshumai: ,时间也相近时,产生hash时就算是random106.161.166.112 02/03 00:34
11F:→ shoshumai: 也不会重复或有所偏向吗?why?106.161.166.112 02/03 00:34
※ 编辑: shoshumai (106.161.166.112), 02/03/2016 00:36:58
12F:推 penut85420: 即使极相似的机械,他们还是会有一个 1.167.156.26 02/03 11:46
13F:→ penut85420: 独一无二的代码,就像mac位址一样 1.167.156.26 02/03 11:46
14F:推 Killercat: hash重复只有一个原因,样本过大 59.124.251.135 02/05 10:34
15F:→ Killercat: 但是这要大到什麽程度 你可以研究一下 59.124.251.135 02/05 10:34
16F:→ Killercat: hash collision rate 59.124.251.135 02/05 10:34
18F:→ Killercat: 不重复是绝无可能的 只是看样本多大 59.124.251.135 02/05 10:37
19F:→ Killercat: 造成的rate是「可接受的」 59.124.251.135 02/05 10:37
20F:→ Killercat: 表中的160bit就是现行的20bytes MD5 59.124.251.135 02/05 10:39
感谢各位的分享。
我不解的是,机率是一个单纯的计算结果
但hash的产生的背景真的是算式那样单纯的东西吗?
(上面这句有点难懂,但我也不知怎麽说,就是上面所说极度相似的机械)
还有一点就是,如果我们谈某件事机率是0.1
但发生时也有可能是,1/10, 1/12, 1/8
会有偏差
实际上可能没有实验室测过天文数字级样本
那这样用来作为世界级分散protocol真的不会发生大问题吗?
特别是如果ipfs可以用hash取代ip的话
某政府机关是某hash,但某hacker想出了奇招,做出一样的hash,仿制该网页?
但最近想想,就跟前几例所说的相同,弄得超复杂的,也许就够了
※ 编辑: shoshumai (106.161.162.186), 02/05/2016 22:59:33
21F:推 Killercat: 你这问题就简单了,地球上沙子约有101.139.180.153 02/08 12:29
22F:→ Killercat: 7x10^21, 也就是说,就算数量到那麽大101.139.180.153 02/08 12:29
23F:→ Killercat: 现有160bit碰撞机率仅略大於百万分之一101.139.180.153 02/08 12:30
24F:→ Killercat: 而160bit不够多 可以网上加到240bit101.139.180.153 02/08 12:31
25F:→ Killercat: 反正不过30bytes,以现在网路科技来讲101.139.180.153 02/08 12:31
26F:→ Killercat: 实在只是个微不足道的大小101.139.180.153 02/08 12:31