作者I0O1 (罗 sir)
看板CSSE
标题Re: [讨论] 6G (影音档) → 压缩 → 5K
时间Fri May 13 01:07:47 2005
※ 引述《obov (哈特利废藏)》之铭言:
: 其实我比较希望能听听大家讨论原po相关的议题
我正经讨论 6G 影像档是不是能压缩成 5K 吧
(哈哈, 真正正经只有几句话,其他都是废话)
先要定义什麽是 6G 影像档 (image file or arbitrary file),
如果 6G 的 content 只有 0 或只有 1,一定能压到 5K (废话 1)
还要定义压缩,若是失真压缩,当然能压到 5K (废话 2)
而 shannon 的 entropy 限制压缩的最小大小 (有一点小废话.. )
问题是, entropy 要以什麽估算?
以本文? 以 user profile? 或是更大范围的 statistic?
这边就此打住
有兴趣大家大家再讨论
废话说完,说几个(或许可笑的) ideas, 让任何 6G 无失真压成 5K 以下的方法
1. 有人提到用除法。例如 'A' = 65, 'B' = '66', 'z' = 122
要储存 ABzzzBB 可以很简单的用
0.065066122122122066066 存
嗯.. 这个方法我没有细想,但是
如何找到 p, q 使得 p/q = 文件转化为小数, 且 encoding (p, q) < 5K
可能是个问题。还有待勤劳的人解解看
2. snapshot of network states (又名,不可能的任务)
若我们能知道
a. "过去的任何时间点" (至少 1990 开始)
b. "任何网路" (小至一张网路卡, 大至 Internet;
近从自己身边的 bluetooth, 远到 FBI 内部网路)
c. 的 states (例如 packet flow)
基本上等於拥有一个近乎无限大的字典
要储存 6G 档案就很容易,只要给定 "时间" "范围" "states参考依据"
例如, 压缩档案内容像是
2004年4月7号 22:04.047 ~ 22:04.221, 台大文学院 1F, packet bits
3. hyperlink
只要文件在网路上,要用的时候在网路上找就得了
(范例请见注 2)
注: 2 看起来很异想天开,但其实 3 只是 2 的特例,常靠 google, yahoo
帮我们蒐集资料
注2: 3 还是压缩吗?
有人说,这根本就是把资料放在资料库中,要的时候下载嘛。的确 "类似" !
不过这边强调的 idea 不是如何储存,而是如何把原文拆解为 fragment
并且有 fast algorithm 在网路上 search fragment,
并将 search 结果建立为 index (例如 URI 就是很好的 index)
最後将 index 储存为压缩档
e.g., 原文: Hello world, 早安,大家好
可能的 fragments: "Hello world, "
"早安,"
"大家好"
压缩结果: <fragment>
http://....../....</fragment>
<fragment>
http://.......</fragment>
<fragment>ftp://....../..</fragment>
好像压缩档变大了,哈哈哈 It's just an idea!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.184.163.27
1F:→ I0O1:对不起 写的很乱 因为爱困 Zzz 218.184.163.27 05/13
2F:→ I0O1:不过这篇重点是,未来很多应用可以藉着 internet完成 218.184.163.27 05/13
3F:→ I0O1:例如电子字典, 未来可能要翻译的时候才到网路上搜寻 218.184.163.27 05/13
4F:→ I0O1:资料也类似,网路上够多资讯了,总会兜出你的文章 218.184.163.27 05/13
5F:→ I0O1:还有,看错了,影音档 (要用 bits 观点看) 218.184.163.27 05/13