FMUSER更輕鬆地傳輸視頻和音頻!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org ->荷蘭語
sq.fmuser.org ->阿爾巴尼亞人
ar.fmuser.org ->阿拉伯語
hy.fmuser.org - >亞美尼亞
az.fmuser.org ->阿塞拜疆
eu.fmuser.org ->巴斯克
be.fmuser.org ->白俄羅斯語
bg.fmuser.org - >保加利亞
ca.fmuser.org ->加泰羅尼亞語
zh-CN.fmuser.org ->中文(簡體)
zh-TW.fmuser.org - >中國(繁體)
hr.fmuser.org ->克羅地亞語
cs.fmuser.org ->捷克
da.fmuser.org ->丹麥語
nl.fmuser.org - >荷蘭
et.fmuser.org ->愛沙尼亞語
tl.fmuser.org ->菲律賓
fi.fmuser.org ->芬蘭語
fr.fmuser.org - >法國
gl.fmuser.org ->加利西亞語
ka.fmuser.org ->喬治亞
de.fmuser.org ->德語
el.fmuser.org - >希臘
ht.fmuser.org ->海地克里奧爾語
iw.fmuser.org ->希伯來語
hi.fmuser.org ->印地語
hu.fmuser.org - >匈牙利
is.fmuser.org ->冰島語
id.fmuser.org ->印尼語
ga.fmuser.org ->愛爾蘭
it.fmuser.org - >意大利
ja.fmuser.org ->日語
ko.fmuser.org ->韓文
lv.fmuser.org ->拉脫維亞
lt.fmuser.org - >立陶宛
mk.fmuser.org ->馬其頓語
ms.fmuser.org ->馬來語
mt.fmuser.org ->馬耳他語
no.fmuser.org - >挪威
fa.fmuser.org ->波斯語
pl.fmuser.org ->波蘭語
pt.fmuser.org ->葡萄牙語
ro.fmuser.org - >羅馬尼亞
ru.fmuser.org ->俄語
sr.fmuser.org ->塞爾維亞語
sk.fmuser.org ->斯洛伐克
sl.fmuser.org - >斯洛文尼亞
es.fmuser.org ->西班牙語
sw.fmuser.org ->斯瓦希里語
sv.fmuser.org ->瑞典語
th.fmuser.org - >泰國
tr.fmuser.org ->土耳其語
uk.fmuser.org ->烏克蘭語
ur.fmuser.org ->烏爾都語
vi.fmuser.org - >越南
cy.fmuser.org ->威爾士語
yi.fmuser.org - >意第緒語
(1)視頻信號冗餘信息
以記錄數字視頻的YUV分量格式為例,YUV分別表示亮度和兩個色差信號。 例如,對於現有的pal TV系統,亮度信號的採樣頻率為13.5MHz。 色度信號的頻帶通常是亮度信號的一半或更少,即6.75mhz或3.375mhz。 以4:2:2的採樣頻率為例,Y信號採用13.5mhz,色度信號U和V以6.75mhz採樣,採樣信號以8bit量化,則可以計算出數字視頻的編碼率。如下:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216兆位/秒
如果直接存儲或傳輸如此大量的數據,將很難使用壓縮技術來降低比特率。 可以根據兩個基本條件壓縮數字視頻信號:
L.數據冗餘。 例如,空間冗餘,時間冗餘,結構冗餘,信息熵冗餘等,即,圖像的像素之間存在很強的相關性。 消除這些冗餘不會導致信息丟失,而是無損壓縮。
L.視覺冗餘。 人眼的某些特徵(例如亮度辨別閾值,視覺閾值)對亮度和色度的敏感度不同,這使得不可能在編碼中引入適當的錯誤並且將不會被檢測到。 人眼的視覺特性可用於交換具有某些客觀失真的數據壓縮。 這種壓縮是有損的。
基於上述兩個條件的數字視頻信號的壓縮,使得視頻數據大大壓縮,有利於傳輸和存儲。 數字視頻壓縮的常用方法是混合編碼,即將變換編碼,運動估計和運動補償以及熵編碼相結合以進行壓縮編碼。 通常,使用變換編碼來消除圖像的幀內冗餘,並且使用運動估計和運動補償來消除圖像的幀間冗餘,並且使用熵編碼來進一步提高壓縮效率。 簡要介紹以下三種壓縮編碼方法。
(a) 壓縮編碼方式
(b) 變換編碼
變換編碼的功能是將在空間域中描述的圖像信號變換到頻域,然後對變換後的係數進行編碼。 一般而言,圖像在空間上具有很強的相關性,並且向頻域的變換可以實現去相關和能量集中。 常見的正交變換包括離散傅里葉變換,離散餘弦變換等。 離散餘弦變換被廣泛用於數字視頻壓縮中。
離散餘弦變換稱為DCT變換。 它可以將L * l的圖像塊從空域轉換到頻域。 因此,在基於DCT的圖像壓縮和編碼過程中,需要將圖像劃分為非重疊的圖像塊。 假設圖像的大小為1280 * 720,則將其分為160 * 90個圖像塊,其大小為8 * 8,而不會以網格形式重疊。 然後,可以對每個圖像塊執行DCT變換。
在分割塊之後,將每個8 * 8點圖像塊發送到DCT編碼器,並將8 * 8圖像塊從空間域轉換到頻域。 下圖顯示了一個8 * 8圖像塊的示例,其中數字代表每個像素的亮度值。 從圖中可以看出,該圖像塊中每個像素的亮度值比較均勻,尤其是相鄰像素的亮度值不是很大,說明圖像信號具有很強的相關性。
實際的8 * 8圖像塊
下圖顯示了上圖中圖像塊的DCT轉換結果。 從圖中可以看出,經過DCT變換後,左上角的低頻係數集中了很多能量,而右下角的高頻係數上的能量很小。
DCT變換後的圖像塊係數
DCT轉換後需要對信號進行量化。 由於人眼對圖像的低頻特性(例如對象的整體亮度)敏感,而對圖像中的高頻細節不敏感,因此在傳輸過程中,高頻信息只能或少或少地傳輸低頻部分。 量化過程通過量化低頻區域的係數和對高頻區域的係數進行粗量化來減少信息傳輸,從而去除了對人眼不敏感的高頻信息。 因此,量化是有損壓縮過程,並且是視頻壓縮編碼中質量受損的主要原因。
量化過程可以用以下公式表示:
其中,FQ(U,V)表示量化後的DCT係數; f(U,V)表示量化前的DCT係數; Q(U,V)代表量化權重矩陣; q是量化步長; round是指合併,將要輸出的值作為最接近的整數值。
合理選擇量化係數,對變換後的圖像塊進行量化後的結果如圖所示。
量化後的DCT係數
量化後,大多數DCT係數都更改為0,而只有少數係數是非零值。 此時,僅需要壓縮和編碼這些非零值。
(b)熵編碼
熵編碼之所以被命名是因為編碼後的平均編碼長度接近於源的熵值。 熵編碼是通過VLC(可變長度編碼)實現的。 基本原理是在源中將高概率的符號賦予短碼,而在發生概率較小的符號中賦予長碼,從而從統計上獲得較短的平均碼長。 可變長度編碼通常包括霍夫曼碼,算術代碼,運行代碼等。運行長度編碼是一種非常簡單的壓縮方法,其壓縮效率不高,但編解碼速度較快,仍然得到廣泛應用,尤其編碼轉換後,使用遊程編碼,效果很好。
首先,緊隨量化器輸出直流係數之後的交流係數應以Z型掃描(如箭頭線所示)。 Z掃描將二維量化係數轉換為一維序列,然後進行遊程編碼。 最後,在運行編碼(例如霍夫曼編碼)之後,使用另一個可變長度代碼對數據進行編碼。 通過這種可變長度編碼,編碼效率進一步提高。
(c)運動估計和運動補償
運動估計和運動補償是消除圖像序列時間方向相關性的有效方法。 上述的DCT變換,量化和熵編碼方法是基於一幀圖像的。 通過這些方法,可以消除圖像中像素之間的空間相關性。 實際上,除了空間相關性之外,圖像信號還具有時間相關性。 例如,對於具有新聞聯播等背景靜態的數字視頻,以及圖片主體的微小移動,每張圖片之間的差異很小,圖像之間的相關性也很大。 在這種情況下,我們不需要分別對每個幀圖像進行編碼,而只能對相鄰視頻幀的變化部分進行編碼,以進一步減少數據量。 這項工作是通過運動估計和運動補償來實現的。
運動估計技術通常將當前輸入圖像分為幾個彼此不重疊的小圖像子塊,例如,幀圖像的大小為1280 *720。首先,將其分為40 * 45個圖像塊,其中16 *不以網格形式相互重疊的16個大小,然後在前一個圖像或後一個圖像的搜索窗口範圍內,為每個圖像塊找到一個塊,以在一個圖像範圍內找到一個圖像塊搜索窗口最相似的圖像塊。 搜索過程稱為運動估計。 通過計算最相似圖像塊和圖像塊之間的位置信息,可以獲得運動矢量。 以此方式,可以從參考圖像運動向量所指向的最相似圖像塊中減去當前圖像塊,並且可以獲得殘留圖像塊。 因為殘留圖像塊中的每個像素值非常小,所以在壓縮編碼中可以獲得更高的壓縮率。 該減法過程稱為運動補償。
由於在編碼過程中需要將參考圖像用於運動估計和運動補償,因此選擇參考圖像非常重要。 通常,編碼器根據不同的參考圖像將輸入的每個幀圖像劃分為三種不同的類型:I(內部)幀,B(引導預測)幀和P(預測)幀。 如圖所示。
典型的I,B,P幀結構順序
如圖所示,I幀僅使用該幀中的數據進行編碼,在編碼過程中不需要運動估計和運動補償。 顯然,由於I幀沒有消除時間方向的相關性,因此壓縮率相對較低。 在編碼過程中,P幀使用前I幀或P幀作為運動補償的參考圖像,實際上,它對當前圖像和參考圖像之間的差異進行編碼。 B幀的編碼方式類似於P幀,唯一的區別是在編碼過程中需要使用前I幀或P幀以及後I幀或P幀進行預測。 因此,每個P幀編碼需要使用一個幀圖像作為參考圖像,而幀B需要兩個幀作為參考。 相反,B幀具有比P幀更高的壓縮率。
(d)混合編碼
本文介紹了視頻壓縮和編碼中的幾種重要方法。 在實際應用中,這些方法不是分開的,通常將它們組合在一起以獲得最佳的壓縮效果。 下圖顯示了混合編碼的模型(即,變換編碼+運動估計和運動補償+熵編碼)。 該模型在MPEG1,MPEG2,H.264等標準中得到了廣泛的應用,從圖中可以看出,當前的輸入圖像必須先劃分為塊,再從該塊中減去該塊獲得的圖像的塊。運動補償後的預測圖像以獲得差分圖像x,然後對差分圖像塊進行DCT變換和量化。 量化的輸出數據有兩個不同的位置:一個是將其發送到熵編碼器進行編碼,而編碼後的代碼流則輸出到設備中的緩存Save並等待傳輸。 另一個應用是對信號x'進行反量化和逆變化,它對具有運動補償的圖像塊輸出進行相加以獲得新的預測圖像信號,並將新的預測圖像塊發送到幀存儲器。
|
輸入電子郵件以獲取驚喜
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org ->荷蘭語
sq.fmuser.org ->阿爾巴尼亞人
ar.fmuser.org ->阿拉伯語
hy.fmuser.org - >亞美尼亞
az.fmuser.org ->阿塞拜疆
eu.fmuser.org ->巴斯克
be.fmuser.org ->白俄羅斯語
bg.fmuser.org - >保加利亞
ca.fmuser.org ->加泰羅尼亞語
zh-CN.fmuser.org ->中文(簡體)
zh-TW.fmuser.org - >中國(繁體)
hr.fmuser.org ->克羅地亞語
cs.fmuser.org ->捷克
da.fmuser.org ->丹麥語
nl.fmuser.org - >荷蘭
et.fmuser.org ->愛沙尼亞語
tl.fmuser.org ->菲律賓
fi.fmuser.org ->芬蘭語
fr.fmuser.org - >法國
gl.fmuser.org ->加利西亞語
ka.fmuser.org ->喬治亞
de.fmuser.org ->德語
el.fmuser.org - >希臘
ht.fmuser.org ->海地克里奧爾語
iw.fmuser.org ->希伯來語
hi.fmuser.org ->印地語
hu.fmuser.org - >匈牙利
is.fmuser.org ->冰島語
id.fmuser.org ->印尼語
ga.fmuser.org ->愛爾蘭
it.fmuser.org - >意大利
ja.fmuser.org ->日語
ko.fmuser.org ->韓文
lv.fmuser.org ->拉脫維亞
lt.fmuser.org - >立陶宛
mk.fmuser.org ->馬其頓語
ms.fmuser.org ->馬來語
mt.fmuser.org ->馬耳他語
no.fmuser.org - >挪威
fa.fmuser.org ->波斯語
pl.fmuser.org ->波蘭語
pt.fmuser.org ->葡萄牙語
ro.fmuser.org - >羅馬尼亞
ru.fmuser.org ->俄語
sr.fmuser.org ->塞爾維亞語
sk.fmuser.org ->斯洛伐克
sl.fmuser.org - >斯洛文尼亞
es.fmuser.org ->西班牙語
sw.fmuser.org ->斯瓦希里語
sv.fmuser.org ->瑞典語
th.fmuser.org - >泰國
tr.fmuser.org ->土耳其語
uk.fmuser.org ->烏克蘭語
ur.fmuser.org ->烏爾都語
vi.fmuser.org - >越南
cy.fmuser.org ->威爾士語
yi.fmuser.org - >意第緒語
FMUSER更輕鬆地傳輸視頻和音頻!
聯絡我們
分類
電子通訊