作者welkins (和平真好)
看板C_and_CPP
標題[問題] 用Huffman來壓縮非文字檔
時間Fri Apr 13 22:36:06 2018
想請問一下
如果我想要實作一個用Huffman來壓縮非文字檔的壓縮程式,
我的做法是先用一個陣列存每個ASCII各別的頻率再依照頻率去建Huffman Tree,
然而這種做法做出來的在解壓縮txt的時候還能正常執行,
但是我試著壓縮mp3之類時卻無法成功解壓縮。
原因是出在ASCII上面嗎?
有點不知道這種情況要怎麼解
希望各位可以指點一下,十分感謝
===========================
手邊沒code剛剛重寫了一部分
開檔部分是
ifstream fin;
fin.open("input.txt", ios::binary);
讀進來的部分大概是這樣
https://pastebin.com/tSAVHTTt
把ch讀進來後存成ASCII頻率的陣列
在用這個陣列去建Huffman
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.246.71.241
※ 文章網址: https://webptt.com/m.aspx?n=bbs/C_and_CPP/M.1523630168.A.843.html
※ 編輯: welkins (27.246.71.241), 04/13/2018 22:53:00
1F:→ uranusjr: 非文字檔哪來的 ASCII?你到底做了什麼?04/13 22:53
我用binary方式開了之後
再把他視作文字處理
2F:→ james732: 比對看看解壓縮後的內容是什麼地方出錯了?04/13 22:54
3F:→ james732: 直覺跟換行字元有關(?04/13 22:54
解壓縮完後就變亂碼了…
4F:→ Schottky: 你怎麼開檔的04/13 23:13
5F:→ Schottky: 是不是壓縮只做了一半就斷了04/13 23:14
我用fstream binary模式開檔
再把它當文字讀char
6F:→ wtchen: 你的程式碼呢?跟C的關聯性呢?不補資訊就砍文04/13 23:25
寫這程式的電腦不在手邊程式碼可能暫時沒辦法補
關連…大概就我是用c++寫的
我想說有沒有可能是他讀檔的時候
我這種用fstream binary的讀法會產生什麼問題
又或者非文字檔根本不能這樣處理
請問這樣的話不能發在這板嗎?
抱歉,剛來這邊對規定不是很清楚
7F:→ school4303: 就是要你貼code04/14 00:10
8F:→ Schottky: 沒貼 code 只能擲筊04/14 00:20
10F:推 nightnawk: 你陣列存的是一個char所以寫出去應該也是0x00~0xff04/14 00:37
11F:→ jerryh001: sign/unsign的問題?04/14 00:45
sign/unsign的問題是指?
在這邊sign/unsign可能會有什麼問題嗎?
12F:→ Lipraxde: 當成文字處理是什麼意思啊?不是直接用0~255的值去算喔04/14 03:21
13F:→ Lipraxde: ?04/14 03:21
我是直接用0-255去算沒錯!
請問如果直接用0-255的值去算是不可行的嗎?
14F:→ wtchen: 我給你12小時把code補上,不然砍文04/14 03:47
code 已附上
15F:→ Schottky: 那應該就是程式寫錯而已,多找找 bug,加油 (拍肩)04/14 08:06
16F:→ Schottky: code 不完整。然後這邊就標準的 signed/unsigned 錯誤04/14 12:41
17F:→ Schottky: 想想如果 ch 的內容是 -100 (你以為是156) 會發生什麼事04/14 12:43
喔喔 了解了
所以記的時候要用unsigned
18F:→ Lipraxde: 字數數錯也不會變亂碼吧,應該還有其他地方錯04/14 13:05
※ 編輯: welkins (39.10.106.19), 04/14/2018 13:45:13
19F:推 Schottky: 應該還有其他地方錯+1 04/15 08:12