kivi1021 wrote:
w7 & office 2007
W7 X64 約 8 mb
我解壓了半小時才一點點所以就取消不玩了
壓縮玩不知道要多久
所以也不知道裡面到底是真是假...(恕刪)
假的....
複雜的壓縮演算法需要較多時間解壓縮回來,基本上不能說錯,但是壓縮倍率的極限,取決於被壓縮資料本身的entropy、或稱"熵",或是白話點說就是有用的資訊量。
完整原版W7 x64或Office 2007整套軟體的資訊量,絕對不只8MB。
回到樓主問題,以演算法速度/壓縮率的平衡度來說,RAR或7-Zip都可算是非減損式壓縮法中的佼佼者了,再壓榨個幾趴出來不能說沒機會,但就得看到底樓主用途為何、值不值得用那個時間跟犧牲檔案互通性去換。但是如果希望壓縮率比RAR/7-ZIP好上幾倍,是不可能的。
熱心助人的小弟弟 wrote:
的確如此
壓縮比會跟不同檔案的資料結構而有差異
沒有那種好幾GB壓縮成幾KB的事情
我猜樓主要找的是以前一個騙人的玩意兒~
就是把要壓縮的資料全部搬到某個隱藏的目錄去,留下一些資訊跟假資料變成一個數KB的壓縮檔.
這個壓縮檔可以可以解得開, 但是copy到別台機器去就解不開了(因為真正的資料沒有在裏面).
感覺很神奇, 事實上是騙人的....
至於64k demo(如樓上提到的慧星撞地球), 那又是另一回事了. 那是把資料都用程式/公式來表現,
例如天空的雲彩, 地面的貼圖, 慧星噴發的粒子, 大多是用一種叫procedural texture的技術來產生的.
像樹什麼的,也只是一個演算法把參數套進去產生出樹的模型, 種種方法很多, 目的就是為了在64KB
大小的程式中塞進愈多東西愈好. 但是這個限制很多, 主要是以顯示自己的程式技巧為主要目的的,
一般並不實用, 那個不是資料壓縮的領域.
與失敗為伍者,天天靠盃都是別人的錯。
與成功為伍者,天天跟失敗切磋直到不再出錯。
你給我一堆data,透過定理公式,就可以算出壓縮的極限。
比方說111222333,可以壓成:
[111->a, 222->b, 333->c ; abc]
這樣有沒有比較小?好像沒有耶.....
但是重複出現次數一多111222333111222333111222333就會變成
[111->a, 222->b, 333->c abc->d; d]
這樣就比較小了。
這時候只要記住,符號出現的機率越高,就可以把該符號壓的越小。
所當一個資料,全部都是0的時候,容量就可以壓很小,因為出現機率很高。
壓縮後的資料,符號機率分佈會變得更平均。
越平均,就越沒有辦法壓縮。
這也就是為什麼,壓縮過的東西,再次壓縮效果不好。
關閉廣告