'프로그래밍/Multimedia'에 해당되는 글 2건

  1. 2009.04.28 DCT(Discrete Cosine Transform)
  2. 2009.04.27 디지털 오디오의 기초
프로그래밍/Multimedia2009. 4. 28. 18:07

1. DCT(이산여현변환)란?

- DCT를 이용하면 영상을 공간영역(Spatial Domain)으로부터 주파수 영역(Frequency Domain)으로 변환할 수 있으며 영상 데이터는 변화가 적으므로 낮은 주파수, 특히 0 주파수(DC) 성분이 큰 값을 갖게 되고 높은 주파수 성분은 상대적으로 매우 작은 값을 갖게 된다. 즉, 대부분의 정보가 낮은 주파수 쪽으로 몰리게 되므로 다음에 설명할 양자화 과정을 적절히 거치면 높은 압축률로 우수한 화질을 얻을 수 있다.

- 정보량이 많아 값이 낮은 주파수 성분만을 충실히 취하고 높은 주파수 성분은 값이 아주 작으므로 거의 무시해 버림으로써 전체 데이터양을 줄이는 원리인데, 높은 주파수 성분은 영상의 세밀한 해상도에 기여하기 때문에 이런 방법을 사용해 심하게 압축하면 해상도 저하라는 불이익을 감수해야 한다. DCT는 많은 곱하기와 더하기가 사용되므로 계산량이 상당히 많으나, 고속 알고리즘으로 인해 영상을 8*8 블럭으로 나눠 계산함으로써 계산 효율을 높일 수 있다.이 DCT를 용한 영상압축 방법은 성능과 실제 구현성이 좋아 정지 영상 뿐 아니라 동영상 압축에서도 폭 넓게 사용되고 있다.

 

1.1 DCT의 정의

- 두 개의 정수 값 i, j에 의해 표현된 함수(한 정지 영상)가 주어졌을 때 2D DCT 변환은 이 함수를 i와 j와 동일한 범위를 가지는 정수 u, v로 표현되는 새로운 함수로 변환된다.

i, u = 0,1,...,M-1 j, v = 0,1,...,N-1

- JPEG 영상 압축 표준에서 영상 블록은 차원 M = N = 8을 갖는 것으로 정의된다.

 

2. 2D DCT(2차원 이산 여현 변환)

i, j, u, v = 0,1,...,7

2.1 2D IDCT(2차원 역이산 여현 변환)

i, j, u, v = 0,1,...,7

3. 1D DCT

- f(i)가 시간 i에 따라 변화하는 신호를 표현.

- 시공간의 신호 f(i)를 주파수 공간의 신호 F(u)로 변환.

3.1 1D DCT의 예

 

예) f(i)가 (a)와 같이 주어졌을 경우에 F(u)를 구하시오

예) (d)는 임의의 입력 신호 f(i)에 대한 그 DCT 출력 F(u)를 나타내고 있다.

f(i)(i=0...7) : 85 -65 15 30 -56 35 90 60

F(u)(u=0...7) : 69 -49 74 11 16 117 44 -5

임을 보이시오.

 

3.2 1D IDCT

예) F(u)(u=0...7) : 69 -49 74 11 16 117 44 -5 값이 다음과 같을 때 f(i)를 구하시오

'프로그래밍 > Multimedia' 카테고리의 다른 글

디지털 오디오의 기초  (0) 2009.04.27
Posted by 마블(이환문)
프로그래밍/Multimedia2009. 4. 27. 13:55

1. 사운드의 디지털화

1.1 사운드란 무엇인가?

- 불빛과 같은 파동 현상을 말하기도 하고, 어떤 물리적인 장치의 동작에 의해 공기가 압축되고 팽창하는 분자 운동과 관련된다.

 

1.2 디지털화

- 아날로그 신호를 디지털화하기 위해서 sampling을 수행하여야 함.

- sampling : 균일한 시간 간격으로 값을 측정하는 방법.

- sampling frequency : sampling이 취해지는 비율.

- quantization : 진폭이나 전압의 sampling을 의미.

그림 1. 아날로그 신호의 예

1.3 Nyquist 이론

- 정확한 sampling을 위해서는 적어도 신호의 최대 주파수 성분의 두 배로 sampling이 이루어져야 한다.

- Nyquist 율과 동일한 주파수를 의미.

그림 4. 구형파 신호의 중첩

1.4 Aliasing

- 분석하고자 하는 신호를 sampling 주파수로 sampling하여 주파수 분석을 하였을 때 sampling 주파수의 절반 이상에 해당하는 주파수성분이 Nyquist 주파수 이하의 성분으로 겹쳐 나타나게 되는 현상

 

그림 7. 주파수의 1.5배 sampling

 

1.5 신호 대 잡음 비(SNR)

- 신호 대 잡음 비(SNR) : 정확한 신호와 잡음의 비율을 의미.

- SNR값은 dB을 단위로 하고 전압의 제곱에 대한 상용로그 값으로 정의됨.

 

P is average power, A is RMS amplitude

 

예제) 신호의 전압 이 잡음의 10배라면, SNR은 이다.

 

 

 

 

1.6 신호 대 잡음 비(SQNR)

- 양자화 잡음 : 원신호에 비교하여 양자화된 아날로그 신호의 오차분

- 샘플당 N 비트에 대한 디지털 신호의 범위는 에서

- 실제 아날로그 신호가 에서 범위에서 존재한다면, 각 양자화 단계는 이걸로 표시한다.

- SQNR은 단지 신호의 최대값으로 표현되고, 이것은 약 의 단계 로 대응.

- SQNR은 분모로 최대값 = 를 가진다

6.02N(dB)는 피크 신호 대 잡음비(PSQNR)을 나타내고 있다.

최악의 경우로 입력파가 구형파라면 아래와 같은 수식을 가진다

'프로그래밍 > Multimedia' 카테고리의 다른 글

DCT(Discrete Cosine Transform)  (0) 2009.04.28
Posted by 마블(이환문)