7BIT壓縮編碼長度計算方法(C編程實現(xiàn)) |
發(fā)布時間: 2012/8/8 17:28:40 |
大家都知道,ASCII(不包括擴展ASCII)的最高位是0,所以,我們可以利用這一空位來存儲數(shù)據(jù),“7BIT壓縮編碼”就是這么做的。關于7BIT壓縮編碼的詳細算法,可以在網(wǎng)上找到(Simple)。這里,我說一下自己的一種關于計算7BIT編碼長度的C語言實現(xiàn)方法。(應該有更好的方法啦~)
1。如果給出已經(jīng)7BIT編碼的字符串,在不解碼的情況下,計算出解碼后的長度,也就是源碼(ASCII)的長度。
pSrc -- 已經(jīng)編碼的字符串地址
nSrc -- 通過函數(shù)strlen(pSrc)計算出來的長度 nLength -- 原編碼的長度(就是我們想知道的結果) if (nSrc%7 == 0) { if (*(pSrc+nSrc-1) >> 1) nLength = (nSrc/7)*8; else nLength = (nSrc/7)*8 - 1; } else { if (*(pSrc+nSrc-1) >> (8-nSrc%7)) nLength = (nSrc/7)*8 + nSrc%7 + 1; else nLength = (nSrc/7)*8 + nSrc%7; } 解釋:
第一個判斷編碼后的長度是不是7的倍數(shù),我們都知道,7BIT壓縮編碼可以將8字節(jié)ASCII壓縮成7字節(jié)。如果編碼后的長度恰好是7的倍數(shù),那么就“很可能"源碼是8的倍數(shù)長度。這里只能說是“很可能”,因為 8*n-1 個ASCII編碼后也會占用 7*n 個字節(jié)(也有可能是 7*n-1 字節(jié))。也就是說,160個ASCII編碼后為140字節(jié),159個ASCII編碼后也為140字節(jié)(或者139字節(jié)),那么現(xiàn)在我們知道編碼后是140字節(jié),原編碼ASCII到底是160個,還是159個呢? if (*(pSrc+nSrc-1) >> 1) 做出了判斷,如果結果為真,那么就是 8*n 個原編碼,如果為假,那么就是 8*n-1 個原編碼。這里,相信大家稍微思考一下就明白了;)嘻嘻,有不明白的,email問我啦~ 如果編碼后的長度,不是7的倍數(shù),那么對最后一位的移位判斷稍微復雜一些,道理是和上面一樣的,只是移位的位數(shù)不一樣而已。計算長度的時候,先取出8位ASCII的整數(shù)倍(nSrc/7)*8,然后再取余數(shù)nSrc%7,然后根據(jù)對最后一位的移位判斷結果,判斷到底是否還得加一位。(這是為什么呢?為什么不是和上面7的整數(shù)被時的減一位呢?哈哈~思考一下就知道了) 2。如果給出原ASCII字符串,在不編碼的情況下,計算出7BIT編碼后的長度。
pSrc -- 源ASCII字符串地址
nSrc -- 通過函數(shù)strlen(pSrc)計算出來的長度 nLength -- 7BIT編碼后的長度(就是我們想知道的結果) if (nSrc%8 == 0)
{ nLength = (nSrc/8)*7; } else { if (*(pSrc+nSrc-1) >> nSrc%8-1) nLength = (nSrc/8)*7 + ((nSrc%8)*7)/8 + 1; else nLength = (nSrc/8)*7 + ((nSrc%8)*7)/8; } 本文出自:億恩科技【www.riomediacenter.com】 |