第5章 信源编码
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
第4章 信息率失真函数
信源无失真传输所需的最小信息率为RH(X);
允许信源有失真时,输出的最小速率可降低为R< H(X);
失真D越大,R可以越小,因此R是D的函数,且为单调递减函数。
R(D)就叫做信息率失真函数。
问题
信源熵H(X)的物理含义是什么?
为什么要研究信源熵?
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1 信息率失真函数的概念和性质
4.1.1 失真函数和平均失真
4.1.2 信息率失真函数R(D)
4.1.3 信息率失真函数的性质
4.1.4 R(D)与C
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1 信息率失真函数的概念和性质
在实际问题中,信号有一定的失真是可以容忍的。但是当失真大于某一限度后,信息质量将被严重损伤,甚至丧失其实用价值。要规定失真限度,必须先有一个定量的失真测度。为此可引入失真函数。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1.1 失真函数和平均失真
X={xi},xi{a1,…an}
信源编码器
Y={yj},yj{b1,…bm}
失真函数d(xi,yj)
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
失真矩阵
单个符号的失真度的全体构成的矩阵 ,称为失真矩阵
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
均方失真:
相对失真:
误码失真:
绝对失真:
前三种失真函数适用于连续信源,后一种适用于离散信源。
最常用的失真函数
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
序列编码情况失真函数定义为:
其中d(xil,yjl)是信源输出L长符号样值xi中的第l个符号xil时,编码输出L长符号样值yj中的第l个符号yjl的失真函数。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
失真函数的数学期望称为平均失真,记为
已知p(xi)和d(xi,yj),平均失真只是符号转移概率p(yj/xi)的函数。 p(yj/xi )在此实质上代表编码方式。
信源编码器
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
如:
x1y1
x2 y2
x1y1
x2 y1
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
对于连续随机变量同样可以定义平均失真
对于L长序列编码情况,平均失真为
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1.2 信息率失真函数R(D)
信源编码器的目的是使编码后所需的信息传输率R尽量小,
R
给定失真的限制值D,使 D,找最小R,
R(D),定义为信息率失真函数。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1.3 信息率失真函数R(D)
X
Y
假想信道
将信源编码器看作信道,信源编码器输出的信息率R对应到信道,即为接收端Y需要获得的有关X的信息量,也就是互信息I(X;Y)。
p(yj/xi) 信源符号编码概率 信道转移概率
信源编码器
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
D允许试验信道
若p(xi)和d(xi,yj)已定,则可给出满足
条件的所有转移概率分布pij,它们构成了一个信道集合PD
称为D允许试验信道。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
信息率失真函数R(D)
当p(xi)一定时,互信息I是关于p(yj/xi) 的U型凸函数,存在极小值(2.2节)。
在上述允许信道PD中,可以寻找一种信道pij,使给定的信源p(xi)经过此信道传输后,互信息I(X;Y)达到最小。
D=? p(yj/xi)=pij? R(D)=?
I [p(xi), p(yj/xi)]
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
对于离散无记忆信源,R(D)函数可写成
p(ai),i=1,2,…,n 是信源符号概率分布;
p(bj/ai),i=1,2,…,n,j=1,2,…,m 是转移概率分布;
p(bj),j=1,2,…,m 是接收端收到符号概率分布。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
R(D)的物理意义
无失真时:R=H(X)
有失真时:R=R(D)=H(X)-H(X/Y)H(X)
H(X/Y):由于压缩编码损失的信息
对于给定信源,在平均失真不超过失真限度D的条件下,信息率容许压缩的最小值R(D)
H(X)
R
信源编码器
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
例 4-2
设信源的符号表为A={a1,a2,…,a2n},概率分布为p(ai)=1/2n,i=1,2,…,2n,失真函数规定为
即符号不发生差错时失真为0,一旦出错,失真为1,试研究在一定编码条件下信息压缩的程度。
H(X)
H(X/Y)
可压缩的信息量
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1.3 信息率失真函数的性质
R(D)函数的定义域
⑴ Dmin和R(Dmin)
Dmin=0
对于连续信源
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
讨论
何时Dmin=0?
只有当失真矩阵中每行至少有一个零元素。
何时R(0)=H(X)?
只有当失真矩阵中每行至少有一个零,并每一列最多只有一个零。
否则R(0)可以小于H(X),表示这时信源符号集中有些符号可以压缩、合并而不带来任何失真。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
(2) Dmax和R(Dmax)
R(Dmax)=0
选择所有满足R(D)=0中D的最小值,定义为R(D)定义域的上限Dmax,即
因此可以得到R(D)的定义域为
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
Dmax=?
R(D)=0就是I(X;Y)=0,这时试验信道输入与输出是互相独立的,所以条件概率p(yj/xi)与xi无关。即
需满足条件
从上式观察可得:在j=1,…,m中,可找到 值最小的j,当该j对应的pj=1,而其余pj为零时,上式右边达到最小,这时上式可简化成
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
例4-3
设输入输出符号表为X=Y{0,1},输入概率分布p(x)={1/3,2/3},失真矩阵为
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
解:
当Dmin=0时,R(Dmin)=H(X)=H(1/3,2/3)=0.91比特/符号,这时信源编码器无失真,所以该编码器的转移概率为
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
当R(Dmax)=0时
此时输出符号概率p(b1)=0,p(b2)=1,
所以这时的编码器的转移概率为
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
2. R(D)的下凸性
证明思路:
设 D= D1+(1- )D2, (0 1)
再证: R(D1+(1- )D2) R(D1)+(1- )R(D2)
3. R(D)的单调递减性和连续性
若D>D’,PD PD’
(选择pji的范围大)
(连续性证明从略)
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
综上所述,可以得出如下结论:
R(D)是非负的实数,即R(D) 0。其定义域为0~Dmax,其值为0~H(X)。当D>Dmax时, R(D) 0。
R(D)是关于D的下凸函数,因而也是关于D的连续函数。
R(D)是关于D的严格递减函数。容许的D越大,所要求的R越小。反之亦然。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
由以上三点结论,对一般信息率失真R(D)曲线的形态可以画出来:
离散系统
连续系统
R(D)
H(X)
R(D)
0 D Dmax D
R(D)
0 Dmax D
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.1.4 R(D)与C
研究对象
信道
信源
给定条件
信道转移概率p(yj/xi)
信源分布p(xi)
选择参数
信源分布p(xi)
信源编码器编码方法p(yj/xi)
限制条件
结论
H(X/Y)
=H(X)-I(X;Y)
噪声干扰丢失的信息量
编码压缩损失的信息量
信道容量C 率失真函数R(D)
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
4.2 离散信源和连续信源的R(D)计算
某些特殊情况下R(D)的表示式为:
(1)当d(x,y)=(x-y)2, 时,
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
(2)当d(x,y)=|x-y|, 时,
(3)当d(x,y)=(x,y),p(x=0)=p,p(x=1)=1-p时,
R(D)=H(p)-H(D)
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
*
这些R(D)可画成三条曲线
图4-5 信息率失真函数R(D)
0 Dmax D
R(D)
H
(3)
(1)
(2)
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
R(D)的参量求法
已知信源概率分布pi和给定失真矩阵[dij ],求R(D)。
• I(pij)是pij的下凸函数,但通过求条件极值难以得到R(D)
显式,通常先求参量表示式。
(1)
(2)
用拉格朗日乘子法有
令
(4)式两边对j求和得
(5)
(3)
(4)
可解得:
(4)式两边乘以pi再对i求和得
(6)
解(6)式得i,解(5)式得qj。
将(4)式代入(2)式得到以s为参量的D(s)
(7)
(8)
将(4)式代入(1)式得到以s为参量的R(s)
将i和qj代入(7)式得到S(D),再代入(8)式消去参量S,就可得到R(D)。
注意: qj应确保为非负,否则计算失效。
例4-5 二元信源的R(D)函数
已知: P(a1)=p, P(a2)=1-p, p1/2,
求: R(D)
解:(1) Dmin=0,R(0)=H(X)=H(p),
(2)
R(Dmax)=0,
(3) 当0
R(D)是下凸的、连续的、严格递减的函数。
ï
î
ï
í
ì
¹
>
=
=
j
i
j
i
j
i
y
x
α
α
y
x
)
,y
d(x
0
0
[
]
)
,
(
j
i
y
x
d
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ë
é
=
)
,
(
)
,
(
)
,
(
)
,
(
)
,
(
)
,
(
)
,
(
)
,
(
)
,
(
2
1
2
2
2
1
2
1
2
1
1
1
m
n
n
n
m
m
b
a
d
b
a
d
b
a
d
b
a
d
b
a
d
b
a
d
b
a
d
b
a
d
b
a
d
L
M
M
M
L
L
d
i
j
i
j
i
x
y
x
y
x
d
/
)
,
(
–
=
(
)
2
)
,
(
j
i
j
i
y
x
y
x
d
–
=
j
i
j
i
y
x
y
x
d
–
=
)
,
(
î
í
ì
=
=
=
其它
,
1
,
0
)
,
(
)
,
(
j
i
j
i
j
i
y
x
y
x
y
x
d
d
å
=
=
L
l
jl
il
j
i
L
y
x
d
L
d
1
)
,
(
1
)
,
(
y
x
(
)
,,
(,)(,)()/(,)
ijijijiij
ijij
Dpxydxypxpyxdxy
==
åå
i
x
j
y
)
(
i
j
x
y
p
10
01
éù
=
êú
ëû
P
10
10
éù
=
êú
ëû
P
ò
ò
¥
¥
–
¥
¥
–
=
dxdy
y
x
d
y
x
p
D
xy
)
,
(
)
,
(
å
å
=
=
=
=
L
l
l
L
l
jl
il
L
D
L
y
x
d
E
L
D
1
1
1
)]
,
(
[
1
D
{
}
n
a
a
a
x
L
,
,
2
1
Î
{
}
n
b
b
b
y
L
,
,
2
1
Î
Þ
(
)
,
()/(,)
ijiij
ij
Dpxpyxdxy
=
å
{
}
(/):
Dji
PpyxDD
=£
DD
£
)
;
(
min
)
(
Y
X
I
D
R
D
P
=
å
å
=
=
Î
=
n
i
m
j
j
i
j
i
j
i
P
P
b
p
a
b
p
a
b
p
a
p
D
R
D
ij
1
1
)
(
)
/
(
log
)
/
(
)
(
min
)
(
î
í
ì
=
¹
=
j
i
j
i
a
a
d
j
i
0
1
)
,
(
1
1111
(1/2)()(,,,)log2log(1)
2222
n
nn
RHYHnn
nnnn
–
++
===-+
L
14243
)
(
)
0
(
)
(
min
X
H
R
D
R
=
=
¥
=
=
=
)
(
)
0
(
)
(
min
x
H
R
D
R
c
D
D
D
R
0
)
(
max
min
=
=
[
]
max
,
0
D
D
Î
j
j
i
j
ij
p
y
p
x
y
p
p
=
=
=
)
(
)
/
(
max
11
1111
minmin
minmin
ijij
jj
nm
iijij
pp
ij
nmmn
ijijjiij
pp
ijji
DDppd
ppdppd
==
====
==
åå
==
åååå
1
1
=
å
=
m
j
j
p
å
=
n
i
ij
i
d
p
1
å
=
=
=
n
i
ij
i
m
j
d
p
D
1
,
,
2
,
1
max
min
L
max
11
min
j
mn
jiij
p
ji
Dppd
==
=
åå
ú
û
ù
ê
ë
é
=
ú
û
ù
ê
ë
é
=
0
1
1
0
)
,
(
)
,
(
)
,
(
)
,
(
2
2
1
2
2
1
1
1
b
a
d
b
a
d
b
a
d
b
a
d
d
ú
û
ù
ê
ë
é
=
1
0
0
1
P
{
}
3
1
3
1
,
3
2
min
0
3
2
1
3
1
,
1
3
2
0
3
1
min
,
min
min
2
,
1
2
,
1
22
2
12
1
21
2
11
1
2
,
1
2
1
2
,
1
max
=
þ
ý
ü
î
í
ì
=
þ
ý
ü
î
í
ì
´
+
´
´
+
´
=
+
+
=
=
=
=
=
=
=
å
j
j
j
i
ij
i
j
d
p
d
p
d
p
d
p
d
p
D
2
2
2
1
,
b
a
b
a
®
®
ú
û
ù
ê
ë
é
=
1
0
1
0
P
)
R(D’
Y)
I(X;
min
Y)
I(X;
min
R(D)
D’
ji
D
ji
P
p
P
p
=
£
=
Î
Î
()
max(;)
i
px
CIXY
=
()1
i
i
px
=
å
{
}
(/):
Dji
PpyxDD
=£
2
2
2
2
1
)
(
s
p
s
x
e
x
p
–
=
D
D
R
s
log
)
(
=
x
e
x
p
l
l
–
=
2
)
(
D
D
R
l
1
log
)
(
=
ï
î
ï
í
ì
=
=
=
=
å
å
å
=
m
1
j
ij
ij
ij
ij
i
ij
j
ij
ij
i
n)
,
1,2,
(i
1,
p
d
p
p
D
q
p
log
p
p
Y)
I(X;
L
)
p
p
(q
i
ij
i
j
å
=
¶
–==
¶
å
L
iij
j
ij
[IsD
μ
p]0,(i1,2,,n)
p
1
)]
exp(
[
–
å
=
il
l
l
i
sd
q
l
=
i
i
i
μ
log
λ
p
===
LL
ijjiij
pq
λ
exp(sd),(i1,,n;j1,,m)
å
=
i
ij
i
i
1
)
exp(sd
p
λ
=
å
ijijiij
ij
D(s)dpq
λ
exp[sd]
=+
å
ii
i
R(s)sD(s)plog
λ
[
]
ú
û
ù
ê
ë
é
=
0
1
1
0
d
ij
éù
=
êú
ëû
P
10
01
[
]
max
minmin(1),
iij
jj
i
Dpdppp
==-=
å
éù
=
êú
ëû
P
01
01
11
12
(1),(1)(1)
ss
epep
ll
—
éùéù
=+=+-
ëûëû
12
(1)(1)
,
11
ss
ss
ppeppe
qq
ee
—
==
—
(),()log(1)()
11
ss
s
ss
ee
DsRseHp
ee
==-++
++
()()()
RDHpHD
=-
1
1
DD
DD
–
éù
=
êú
–
ëû
P
()min(;)
ijD
pP
RDIXY
Î
=
max
()0
RD
=
D