주어진 매개변수에 대한 오디오 파일의 크기를 계산합니다. 오디오 인코딩

오디오 정보 인코딩 문제 해결.

  1. 이론적 부분

문제를 풀 때 학생들은 다음 개념에 의존합니다.

시간 이산화- 연속 오디오 신호를 인코딩하는 동안 음파가 별도의 작은 시간 섹션으로 나뉘고 각 섹션에 대해 특정 진폭 값이 설정되는 프로세스입니다. 신호 진폭이 클수록 소리가 커집니다.

소리의 깊이 (코딩 깊이) - 오디오 인코딩당 비트 수.

다양한 볼륨 레벨의 수는 공식 N= 2로 계산됩니다.나 , 여기서 I는 사운드 깊이입니다.

샘플링 주파수- 시간 단위당(1초당) 입력 신호 레벨의 측정 횟수. 샘플링 속도가 높을수록 이진 인코딩 절차가 더 정확합니다. 주파수는 헤르츠(Hz) 단위로 측정됩니다.

바이너리 코딩의 품질은 코딩 심도와 샘플링 비율에 의해 결정되는 값입니다.

레지스터 비트 심도- 오디오 어댑터 레지스터의 비트 수. 비트 심도가 클수록 전류 크기를 숫자로 또는 그 반대로 개별 변환할 때마다 발생하는 오류가 작아집니다. 비트 폭이 I이면 입력 신호를 측정할 때 2=N 다른 값.

  1. 실용적인 부분. 문제의 분석 및 해결.

작업 1 . 16비트의 코딩 심도와 10,000Hz의 샘플링 속도에서 지속 시간이 20초인 디지털 스테레오 사운드 파일의 정보량을 추정해 보십시오. 결과는 100분의 1 단위로 반올림하여 Kbytes로 표시됩니다.

이러한 문제를 해결할 때 다음 사항을 잊지 말아야 합니다.

모노 - 1채널, 스테레오 - 2채널이란?

작업 2 . 재생 시간이 10초이고 샘플링 속도가 22.05kHz이고 해상도가 8비트인 디지털 오디오 파일의 크기(바이트)를 결정하십시오.

주어진:

I = 8비트 = 1바이트

t = 10초

η = 22.05kHz = 22.05 * 1000Hz = 22050Hz

I - 사운드 카드의 비트 심도,

t - 오디오 파일 재생 시간,

η - 샘플 속도

해결책:

V(알림.) = I η t

V(정보) = 22050 *10 *1 = 220500바이트

답변: V(정보) = 220500바이트

찾다: V(정보량) -?

소리의 시간 샘플링.

소리는 진폭과 주파수가 지속적으로 변화하는 음파입니다. 신호의 진폭이 클수록 사람의 소리가 커지고 신호의 주파수가 클수록 톤이 높아집니다. 컴퓨터가 소리를 처리하려면 연속적인 소리 신호를 일련의 전기 충격(이진수 0과 1)으로 변환해야 합니다.

연속 오디오 신호를 인코딩하는 과정에서 시간 샘플링이 수행됩니다. 연속적인 음파는 별도의 작은 시간 섹션으로 나뉘며 각 섹션에 대해 특정 진폭 값이 설정됩니다.
이산화는 연속 신호를 일련의 이산 값으로 변환하는 것으로, 각 값에는 특정 이진 코드가 할당됩니다.


따라서, 시간 A(t)에 대한 신호 진폭의 연속적인 의존성은 라우드니스 레벨의 이산 시퀀스로 대체됩니다. 그래프에서 이것은 부드러운 곡선을 일련의 "단계"로 대체하는 것처럼 보입니다.

각 "단계"에는 사운드 볼륨 레벨 값, 해당 코드(1, 2, 3 등)가 지정됩니다. 사운드 볼륨 레벨은 각각 가능한 상태의 집합으로 간주할 수 있습니다. 코딩 프로세스에서 더 많은 볼륨 레벨이 할당될수록 각 레벨의 값에 의해 더 많은 정보가 전달되고 사운드가 더 좋아집니다. 최신 사운드 카드는 16비트 오디오 인코딩 깊이를 제공합니다. 서로 다른 신호 수준(주어진 인코딩에 대한 상태)의 수는 다음 공식을 사용하여 계산할 수 있습니다.
N=2 16 =65356[사운드 레벨],
여기서 I는 인코딩 깊이입니다.

따라서 최신 사운드 카드는 65536개의 신호 레벨을 인코딩할 수 있습니다. 오디오 신호 진폭의 각 값에는 16비트 코드가 할당됩니다.

연속 오디오 신호의 이진 코딩을 사용하면 일련의 이산 신호 레벨로 대체됩니다. 코딩 품질은 단위 시간당 신호 레벨 측정 횟수, 즉 샘플링 속도에 따라 달라집니다. 1초에 더 많은 측정이 이루어질수록(샘플링 속도가 높을수록) 이진 인코딩 절차가 더 정확해집니다.

이진 오디오 인코딩의 품질은 인코딩 깊이와 샘플링 속도에 의해 결정됩니다.

초당 측정 횟수는 8000에서 96000까지 가능합니다. 즉, 아날로그 오디오 신호의 샘플링 속도는 8에서 96[kHz]까지의 값을 가질 수 있습니다. 8[kHz]의 주파수에서 샘플링된 오디오 신호의 품질은 라디오 방송의 품질에 해당하고 96[kHz]의 주파수에서 오디오 CD의 음질에 해당합니다. 또한 모노 및 스테레오 모드가 모두 가능하다는 점에 유의해야 합니다.

사운드 파일의 정보량

오디오 파일 V sf의 볼륨을 결정하려면 측정 수 K meas에 인코딩 깊이(레벨당 비트 수) V 1meas를 곱해야 합니다.

V zf \u003d K 측정 * V 1측정

여기서 측정 횟수 K meas는 다음에 따라 달라집니다.

작업 1


숙제

1 (mm)비트 코딩을 위한 샘플링 주파수(dd)[kHz], 사운드 시간(dd)[s]을 사용하여 스테레오 사운드 파일의 볼륨을 결정합니다.

2 인코딩 깊이(mm)[BIT]와 샘플링 주파수(dd)[kHz]에서 크기가 (yy)[KB]인 모노 오디오 파일의 재생 시간을 [s] 단위로 결정합니다.
여기서 (dd)는 생년월일, (mm)은 생년월, (yy)는 생년월일입니다.

진폭과 주파수가 다양합니다. 신호의 진폭이 높을수록 사람이 더 크게 인지합니다. 신호의 주파수가 높을수록 톤이 높아집니다.

그림 1. 음파의 진동 진폭

음파 주파수초당 진동 수에 의해 결정됩니다. 이 값은 헤르츠(Hz, Hz) 단위로 측정됩니다.

인간의 귀는 $20$ Hz에서 $20$ kHz 범위의 소리를 감지하며, 이 범위를 소리. 하나의 소리 신호에 할당된 비트 수를 호출합니다. 오디오 코딩 깊이. 최신 사운드 카드는 $16-$, $32-$ 또는 $64비트 오디오 인코딩 깊이를 제공합니다. 오디오 정보를 인코딩하는 과정에서 연속 신호가 대체됩니다. 이산즉, 이진수 0과 1로 구성된 일련의 전기 충격으로 변환됩니다.

오디오 샘플링 속도

오디오 인코딩 프로세스의 중요한 특성 중 하나는 $1$초당 신호 레벨 측정 횟수인 샘플링 속도입니다.

  • 초당 한 번의 측정은 $1$ 기가헤르츠(GHz)의 주파수에 해당합니다.
  • 초당 $1000$ 측정은 $1$ 킬로헤르츠(kHz)의 주파수에 해당합니다.

정의 2

오디오 샘플링 속도 1초 동안 음량을 측정한 횟수입니다.

측정 횟수는 $8$ kHz ~ $48$ kHz 범위에 있을 수 있으며 첫 번째 값은 라디오 방송 주파수에 해당하고 두 번째 값은 음악 미디어의 음질에 해당합니다.

비고 1

사운드의 주파수와 샘플링 깊이가 높을수록 디지털화된 사운드가 더 잘 들립니다. 전화 연결 품질에 해당하는 가장 낮은 디지털 오디오 품질은 샘플링 속도가 초당 8000회이고 샘플링 깊이가 $8$ 비트일 때 얻어지며 이는 오디오 트랙 하나의 녹음("모노" 방법). 오디오 CD의 품질에 해당하는 최고 품질의 디지털 사운드는 샘플링 속도가 초당 $48,000$회이고 샘플링 깊이가 $16$비트일 때 달성되며 이는 두 개의 오디오 트랙을 녹음하는 것과 같습니다(스테레오 모드).

사운드 파일의 정보량

디지털 사운드의 품질이 높을수록 사운드 파일의 정보량이 커진다는 점에 유의해야 합니다.

모노 오디오 파일($V$)의 정보량을 추정해 보겠습니다. 이는 다음 공식을 사용하여 수행할 수 있습니다.

$V = N \cdot f \cdot k$,

여기서 $N$은 소리의 총 길이이며 초 단위로 표시됩니다.

$f$ - 샘플링 주파수(Hz),

$k$ - 인코딩 깊이(비트).

예 1

예를 들어 소리의 지속 시간이 $1$ 분이고 샘플링 속도가 $24$ kHz이고 인코딩 깊이가 $16$ 비트인 평균 음질이 있는 경우:

$V=60 \cdot 24000 \cdot 16 \ 비트=23040000 \ 비트=2880000 \ 바이트=2812.5 \ KB=2.75 \ MB.$

스테레오 사운드를 인코딩할 때 샘플링 프로세스는 왼쪽과 오른쪽 채널에 대해 개별적으로 독립적으로 수행되므로 모노 사운드에 비해 사운드 파일의 볼륨이 두 배가 됩니다.

예 2

예를 들어 평균 음질($16$ 비트, 초당 $24000$ 측정값)로 사운드 지속 시간이 $1$초인 디지털 스테레오 사운드 파일의 정보량을 추정해 보겠습니다. 이렇게 하려면 인코딩 깊이에 $1$초당 측정 수를 곱하고 $2$(스테레오 사운드)를 곱합니다.

$V=16 \ 비트 \cdot 24000 \cdot 2 = 768000 \ 비트 = 96000 \ 바이트 = 93.75 \ kb.$

오디오 정보를 인코딩하는 기본 방법

이진 코드로 오디오 정보를 인코딩하는 다양한 방법이 있으며 그 중 두 가지 주요 방향이 있습니다. FM방식그리고 웨이브 테이블 방식.

FM방식 (주파수 변조)는 이론적으로 모든 복잡한 소리가 서로 다른 주파수의 일련의 단순한 고조파 신호로 분해될 수 있다는 사실에 기반하며, 각 신호는 규칙적인 정현파가 되며, 이는 코드로 설명할 수 있음을 의미합니다. 오디오 신호를 고조파 계열로 분해하고 이산 디지털 신호 형태로 표현하는 과정은 "아날로그-디지털 변환기"(ADC)라는 특수 장치에서 발생합니다.

그림 2. 오디오 신호를 개별 신호로 변환

그림 2a는 ADC 입력의 오디오 신호를 보여주고 그림 2b는 ADC 출력의 이미 변환된 이산 신호를 보여줍니다.

숫자 코드 형태로 표시되는 사운드 재생 시 역변환을 위해 DAC(디지털-아날로그 변환기)가 사용됩니다. 사운드 변환 프로세스는 그림 1에 나와 있습니다. 3. 이 코딩 방식은 좋은 음질을 제공하지는 않지만 컴팩트한 코드를 제공합니다.

그림 3. 개별 신호를 오디오 신호로 변환

그림 3a는 DAC 입력에 있는 이산 신호를 보여주고 그림 3b는 DAC 출력에 있는 오디오 신호를 보여줍니다.

테이블 웨이브 방식 (웨이브 테이블)는 주변 세계의 소리 샘플, 악기 등이 미리 준비된 테이블에 저장되어 있다는 사실에 근거합니다.숫자 코드는 소리의 피치, 지속 시간 및 강도 및 기타 특성을 특징 짓는 매개 변수를 나타냅니다. 소리. "실제" 사운드를 샘플로 사용하기 때문에 합성 결과로 얻은 사운드의 품질이 매우 높고 실제 악기의 음질에 근접합니다.

사운드 파일 형식의 예

사운드 파일은 여러 형식으로 제공됩니다. 가장 인기있는 것은 MIDI, WAV, MP3입니다.

미디 형식(Musical Instrument Digital Interface)는 원래 악기를 제어하도록 설계되었습니다. 현재 전자악기 및 컴퓨터 합성 모듈 분야에서 사용되고 있다.

WAV 오디오 파일 형식(파형)은 임의의 소리를 원래 음파 또는 음파의 디지털 표현으로 나타냅니다. 모든 표준 Windows 사운드에는 .wav 확장자가 있습니다.

MP3 형식(MPEG-1 Audio Layer 3)는 사운드 정보를 저장하는 디지털 형식 중 하나입니다. 더 높은 품질의 인코딩을 제공합니다.

문제를 풀 때 학생들은 다음 개념에 의존합니다.

시간 이산화 - 연속 오디오 신호를 인코딩하는 동안 음파가 별도의 작은 시간 섹션으로 나뉘고 각 섹션에 대해 특정 진폭 값이 설정되는 프로세스입니다. 신호 진폭이 클수록 소리가 커집니다.

오디오 깊이(코딩 깊이) - 오디오 인코딩당 비트 수.

볼륨 수준 (신호 수준)- 사운드의 볼륨 레벨이 다를 수 있습니다. 다양한 볼륨 레벨의 수는 다음 공식으로 계산됩니다. N = 2 어디 - 소리의 깊이.

샘플링 주파수 시간 단위(1초당)당 입력 신호 레벨의 측정 횟수. 샘플링 속도가 높을수록 이진 인코딩 절차가 더 정확합니다. 주파수는 헤르츠(Hz) 단위로 측정됩니다. 1초에 1회 측정 -1Hz.

1초 1kHz에서 1000회 측정. 문자로 샘플링 빈도를 나타냅니다. . 인코딩을 위해 다음 세 가지 주파수 중 하나를 선택합니다. 44.1kHz, 22.05kHz, 11.025kHz.

사람이 듣는 주파수 범위는20Hz ~ 20kHz .

바이너리 인코딩 품질 - 인코딩 깊이 및 샘플링 속도에 의해 결정되는 값입니다.

오디오 어댑터(사운드 카드) - 소리가 입력되면 소리 주파수의 전기적 진동을 숫자 이진 코드로 변환하고 소리를 재생할 때 그 반대로(숫자 코드에서 전기적 진동으로) 변환하는 장치.

오디오 어댑터 사양: 샘플링 속도 및 레지스터 비트 심도.).

등록 용량 - 오디오 어댑터 레지스터의 비트 수. 비트 심도가 클수록 전류 크기를 숫자로 또는 그 반대로 개별 변환할 때마다 발생하는 오류가 작아집니다. 비트 심도가 , 그런 다음 입력 신호를 측정할 때 2 = N 다른 값.

디지털 모노 오디오 파일 크기( )는 다음 공식으로 측정됩니다.

= * * /8 , 어디 샘플 속도(Hz), – 소리나 소리가 녹음된 시간, 레지스터의 비트 심도(해상도). 이 수식은 크기를 바이트 단위로 측정합니다.

디지털 스테레오 오디오 파일 크기( )는 다음 공식으로 측정됩니다.

=2* * * /8 , 왼쪽 및 오른쪽 사운드 채널이 별도로 인코딩되기 때문에 신호는 두 개의 스피커에 대해 녹음됩니다.

수험생에게 유용합니다. 1 번 테이블, 인코딩된 오디오 정보의 1분 분량이 다른 샘플링 속도에서 얼마나 많은 MB를 차지하는지 보여줍니다.

샘플링 주파수, kHz

44,1

22,05

11,025

16비트 스테레오

10.1MB

5.05MB

2.52MB

16비트 모노

5.05MB

2.52MB

1.26MB

8비트 모노

2.52MB

1.26MB

630kb

1. 디지털 파일 크기

레벨 "3"

1. 샘플링 속도 22.05kHz, 해상도 8비트에서 재생 시간이 10초인 디지털 오디오 파일의 크기(바이트)를 결정합니다. 파일이 압축되지 않았습니다. (, 156페이지, 예 1)

해결책:

크기 계산 공식(바이트 단위) 디지털 오디오 파일: = * * /8.

바이트로 변환하려면 결과 값을 8비트로 나누어야 합니다.

22.05kHz = 22.05 * 1000Hz = 22050Hz

= * * /8 = 22050 x 10 x 8 / 8 = 220500바이트.

답변: 파일 크기는 220500바이트입니다.

2. 44.1kHz의 샘플링 속도와 16비트의 해상도에서 재생 시간이 2분인 디지털 오디오 파일의 저장 공간을 결정합니다. (, p. 157, No. 88)

해결책:

= * * /8. – 디지털 오디오 파일을 저장할 메모리 양.

44100(Hz) x 120(s) x 16(비트) / 8(비트) = 10584000바이트 = 10335.9375KB = 10.094MB.

답변: ≈ 10Mb

레벨 "4"

3. 사용자의 메모리는 2.6MB입니다. 1분 길이의 디지털 오디오 파일을 녹음해야 합니다. 샘플링 속도와 비트 심도는 어떻게 됩니까? (, p. 157, No. 89)

해결책:

샘플 속도 및 비트 심도 계산 공식:* =A/T

(바이트 단위 메모리) : (초 단위 재생 시간):

2.6MB = 2726297.6바이트

디* =A/T= 2726297.6바이트: 60 = 45438.3바이트

D= 45438.3바이트 : 나

어댑터의 비트 심도는 8비트 또는 16비트일 수 있습니다. (1바이트 또는 2바이트). 따라서 샘플링 속도는또는 45438.3Hz = 45.4kHz ≈ 44.1kHz– 표준 특성 샘플링 속도 또는 22719.15Hz = 22.7kHz ≈ 22.05kHz- 표준 특성 샘플링 속도

답변:

4. 여유 디스크 공간은 5.25MB이고 사운드 카드의 비트 심도는 16입니다. 샘플링 속도 22.05kHz로 녹음된 디지털 오디오 파일의 사운드 길이는 얼마입니까? (, p. 157, No. 90)

해결책:

사운드 지속 시간 계산 공식 : T \u003d A / D / I

(바이트 단위 메모리 크기) : (Hz 단위 샘플링 속도) : (바이트 단위 사운드 카드 비트 심도):

5.25MB = 5505024바이트

5505024바이트: 22050Hz: 2바이트 = 124.8초
답: 124.8초

5. 디지털 오디오 파일을 녹음하는 1분은 디스크에서 1.3MB를 차지하며 사운드 카드의 비트 심도는 8입니다. 사운드의 샘플링 속도는 얼마입니까? (, p. 157, No. 91)

해결책:

샘플 속도를 계산하는 공식은 다음과 같습니다. =A/T/

(메모리 크기(바이트)) : (녹음 시간(초)) : (사운드 카드 비트 심도(바이트))

1.3MB = 1363148.8바이트

1363148.8바이트: 60:1 = 22719.1Hz

답변: 22.05kHz

6. 2분간의 디지털 오디오 녹음은 5.1MB의 디스크 공간을 차지합니다. 샘플링 주파수 - 22050Hz. 오디오 어댑터의 비트는 무엇입니까? (, p. 157, No. 94)

해결책:

비트 심도를 계산하는 공식은 다음과 같습니다. (메모리 바이트) : (초 단위 재생 시간): (샘플링 주파수):

5, 1MB = 5347737.6바이트

5347737.6바이트: 120초: 22050Hz = 2.02바이트 = 16비트

답: 16비트

7. 디스크의 여유 메모리 양은 0.01GB이고 사운드 카드의 비트 심도는 16입니다. 샘플링 주파수 44100Hz로 녹음된 디지털 오디오 파일의 사운드 길이는 얼마입니까? (, p. 157, No. 95)

해결책:

소리의 지속 시간을 계산하는 공식 T \u003d A / D / I

(메모리 크기(바이트)) : (샘플링 속도(Hz)) : (사운드 카드 비트 심도(바이트))

0.01GB = 10737418.24바이트

10737418.24바이트: 44100: 2 = 121.74초 = 2.03분
답: 20.3분

8. 길이가 1분인 모노 오디오 파일의 정보량을 추정합니다. 인코딩의 "깊이"와 오디오 신호의 샘플링 속도가 각각 동일한 경우:
a) 16비트 및 8kHz
b) 16비트 및 24kHz.

(, p. 76, No. 2.82)

해결책:

ㅏ).
16비트 x 8,000 = 128,000비트 = 16,000바이트 = 15.625KB/s
15.625KB/초 x 60초 = 937.5KB

비).
1) 1초 길이의 사운드 파일 정보량은 다음과 같습니다.
16비트 x 24,000 = 384,000비트 = 48,000바이트 = 46.875KB/s
2) 1분 길이의 사운드 파일 정보량은 다음과 같습니다.
46.875KB/초 x 60초 = 2812.5KB = 2.8MB

답변: a) 937.5KB; b) 2.8MB

레벨 "5"

표 1이 사용됨

9. 재생 시간이 3분인 고품질 디지털 오디오 파일을 저장하려면 얼마나 많은 저장 공간이 필요합니까? (, p. 157, No. 92)

해결책:

44.1kHz의 샘플링 속도와 16의 오디오 어댑터 비트 깊이로 높은 음질을 구현합니다.
메모리 양을 계산하는 공식은 다음과 같습니다. (녹음 시간(초)) x (사운드 카드의 비트 심도(바이트)) x (샘플링 주파수):
180초 x 2 x 44100Hz = 15876000바이트 = 15.1MB
답변: 15.1MB

10. 디지털 오디오 파일에 낮은 품질의 오디오 녹음이 포함되어 있습니다(사운드가 어둡고 약함). 볼륨이 650KB인 경우 파일 소리의 길이는 얼마입니까? (, p. 157, No. 93)

해결책:

어둡고 음소거된 사운드의 경우 샘플링 속도 - 11.025kHz, 오디오 어댑터 비트 깊이 - 8비트(표 1 참조)와 같은 매개 변수가 특징적입니다. 그러면 T =A /D /I . 볼륨을 바이트로 변환해 보겠습니다. 650KB = 665600바이트

T=665600바이트/11025Hz/1바이트 ≈60.4초

답: 소리의 길이는 60.5초입니다.

해결책:

1초 길이의 사운드 파일 정보량은 다음과 같습니다.
16비트 x 48,000 x 2 = 1,536,000비트 = 187.5KB(스테레오이므로 2를 곱함).

1분 길이의 사운드 파일 정보량은 다음과 같습니다.
187.5KB/s x 60s ≈ 11MB

답변: 11MB

답변: a) 940KB; b) 2.8MB.

12. 16비트 인코딩 및 32kHz 샘플링 속도를 사용하여 볼륨이 다음과 같은 경우 모노 오디오 파일의 재생 시간을 계산합니다.
a) 700KB
b) 6300KB

(, p. 76, No. 2.84)

해결책:

ㅏ).
1) 1초 길이의 사운드 파일 정보량은 다음과 같습니다.

700KB: 62.5KB/초 = 11.2초

비).
1) 1초 길이의 사운드 파일 정보량은 다음과 같습니다.
16비트 x 32,000 = 512,000비트 = 64,000바이트 = 62.5KB/s
2) 700KB 모노 오디오 파일의 재생 시간은 다음과 같습니다.
6300KB: 62.5KB/초 = 100.8초 = 1.68분

답변: a) 10초; b) 1.5분

13. 스테레오 녹음의 1초가 CD에서 차지하는 정보의 바이트 수를 계산합니다(주파수 44032Hz, 값당 16비트). 1분은 얼마나 걸립니까? 최대 디스크 용량은 얼마입니까(최대 길이를 80분으로 가정)? (, p. 34, 운동 번호 34)

해결책:

메모리 양 계산 공식 = * * :
(녹음 시간(초)) * (사운드카드 비트 심도(바이트)) * (샘플링 속도). 16비트 - 2바이트.
1) 1s x 2 x 44032Hz = 88064바이트(1초 스테레오 CD)
2) 60s x 2 x 44032Hz = 5283840바이트(1분 스테레오 CD)
3) 4800s x 2 x 44032Hz = 422707200바이트 = 412800KB = 403.125MB(80분)

응답: 88064바이트(1초), 5283840바이트(1분), 403.125MB(80분)

2. 음질의 정의.

음질을 결정하려면 샘플링 주파수를 찾고 표 1을 사용해야 합니다.

256(2 8) 신호 강도 레벨 - 라디오 방송 음질, 65536(2 16) 신호 강도 레벨 사용 - 오디오 CD 음질. 최고 품질의 주파수는 CD에 녹음된 음악에 해당합니다. 이 경우 아날로그 신호의 크기는 초당 44,100회 측정됩니다.

레벨 "5"

13. 사운드 지속 시간이 10초인 모노 오디오 파일의 볼륨을 알고 있는 경우 음질(방송 품질, 중간 품질, 오디오 CD 품질)을 결정합니다. 같음:
a) 940KB
b) 157KB.

(, p. 76, No. 2.83)

해결책:

ㅏ).
1) 940KB = 962560바이트 = 7700480비트
2) 7700480bps: 10초 = 770048bps
3) 770048bps: 16비트 = 48128Hz - 샘플 속도 - 가장 높은 44.1kHz에 근접
답변: 오디오 CD 품질

비).
1) 157KB = 160768바이트 = 1286144비트
2) 1286144비트: 10초 = 128614.4bps
3) 128614.4bps: 16비트 = 8038.4Hz
답변: 방송 품질

답변: a) CD 품질; b) 방송의 품질.

14. 3.5인치 플로피 디스크에 맞는 사운드 파일의 길이를 결정합니다. 이러한 디스켓의 데이터 저장을 위해 512바이트의 2847개 섹터가 할당됩니다.
a) 낮은 음질: 모노, 8비트, 8kHz
b) 고음질: 스테레오, 16비트, 48kHz.

(, p. 77, No. 2.85)

해결책:

ㅏ).

8비트 x 8,000 = 64,000비트 = 8,000바이트 = 7.8KB/s
3) 1423.5KB 모노 오디오 파일의 재생 시간은 다음과 같습니다.
1423.5KB: 7.8KB/초 = 182.5초 ≈ 3분

비).
1) 디스켓의 정보량은 다음과 같습니다.
2847 섹터 x 512바이트 = 1457664바이트 = 1423.5KB
2) 1초 길이의 사운드 파일 정보량은 다음과 같습니다.
16비트 x 48,000 x 2 = 1,536,000비트 = 192,000바이트 = 187.5KB/s
3) 1423.5KB 스테레오 오디오 파일의 재생 시간은 다음과 같습니다.
1423.5KB: 187.5KB/초 = 7.6초

답변: a) 3분; b) 7.6초.

3. 이진 오디오 코딩.

문제를 풀 때 그는 다음과 같은 이론적 자료를 사용합니다.

오디오를 인코딩하기 위해 그림에 표시된 아날로그 신호는


비행기는 수직선과 수평선으로 나뉩니다. 수직 분할은 아날로그 신호(신호 측정 주파수)의 샘플링이고, 수평 분할은양자화 수준별. 저것들. 그리드가 미세할수록 숫자의 도움을 받아 아날로그 사운드가 더 잘 근사됩니다. 8비트 양자화는 일반 음성(전화 대화) 및 단파 무선 전송을 디지털화하는 데 사용됩니다. 16비트 - 음악 및 VHF(초단파) 라디오 방송을 디지털화합니다.

레벨 "3"

15. 아날로그 오디오 신호는 먼저 256 신호 강도 레벨(방송 음질)을 사용하여 샘플링한 다음 65536 신호 강도 레벨(오디오 CD 음질)을 사용하여 샘플링했습니다. 디지털화된 소리의 정보량은 몇 번이나 다를까요? (, p. 77, No. 2.86)

해결책:

256 신호 강도 레벨을 사용하는 아날로그 신호 코드 길이는 다음을 사용하여 8비트입니다. 65536 신호 강도 레벨은 16비트와 같습니다. 한 신호의 코드 길이가 두 배가 되었기 때문에 디지털화된 소리의 정보량은 2배 차이가 납니다.

답: 2번.

수준 " 4 »

16. Nyquist-Kotelnikov 정리에 따르면 아날로그 신호가 이산 표현(샘플에서)에서 정확하게 재구성되려면 샘플링 주파수가 이 신호의 최대 오디오 주파수의 최소 2배여야 합니다.

    인간 오디오의 샘플링 주파수는 얼마여야 합니까?

    음성의 샘플링 속도와 심포니 오케스트라 사운드의 샘플링 속도 중 어느 것이 더 높아야 합니까?

목적: 사운드 작업을 위한 하드웨어 및 소프트웨어의 특성을 학생들에게 소개합니다. 활동: 물리학 과정에서 지식 얻기(또는 참고 서적으로 작업하기)). (, p. ??, 작업 2)

해결책:

사람이 듣는 주파수 범위는 20Hz에서 20kHz로 알려져 있습니다. 따라서 Nyquist-Kotelnikov 정리에 따르면 아날로그 신호가 이산 표현(샘플에서)에서 정확하게 복원되기 위해서는샘플링 주파수는 이 신호의 최대 오디오 주파수의 두 배 이상이어야 합니다. 사람이 들을 수 있는 최대 사운드 주파수는 -20kHz이며 이는 장치가 ra 및 소프트웨어는 최소 40kHz, 보다 정확하게는 44.1kHz의 샘플링 속도를 제공해야 합니다. 심포니 오케스트라 사운드의 컴퓨터 처리는 음성 처리보다 샘플링 속도가 더 높은데, 이는 심포니 오케스트라의 경우 주파수 범위가 훨씬 더 크기 때문입니다.

대답: 40kHz 이상, 심포니 오케스트라의 샘플링 속도가 더 높습니다.

레벨 "5"

17. 그림은 녹음기에 의해 녹음된 1초간의 말소리를 보여줍니다. 주파수가 10Hz이고 코드 길이가 3비트인 이진 디지털 코드로 인코딩합니다. (, p. ??, 작업 1)

해결책:

10Hz 인코딩은 피치를 초당 10번 측정해야 함을 의미합니다. 등거리 순간을 선택합시다.

3비트의 코드 길이는 2를 의미합니다. 3 = 8 양자화 레벨. 즉, 선택한 각 순간의 피치에 대한 숫자 코드로 다음 조합 중 하나를 설정할 수 있습니다. 000, 001, 010, 011, 100, 101, 110, 111. 따라서 8개만 있습니다. , 피치는 8 "레벨"로 측정할 수 있습니다.

피치 값을 가장 가까운 낮은 수준으로 "반올림"합니다.

이 인코딩 방법을 사용하면 100 100 000 011 111 010 011 100 010 110과 같은 결과를 얻을 수 있습니다.

메모.코드가 진폭의 변화를 얼마나 부정확하게 전달하는지 학생들의 주의를 끄는 것이 좋습니다. 즉, 10Hz의 샘플링 속도와 2의 양자화 레벨 3 (3비트)가 너무 작습니다. 일반적으로 사운드(음성)의 경우 샘플링 속도 8kHz, 즉 초당 8000회, 양자화 수준 2를 선택합니다. 8 (코드 8비트 길이).

답: 100 100 000 011 111 010 011 100 010 110.

18. 샘플링 속도와 함께 양자화 수준이 컴퓨터에서 소리를 표현하는 주요 특징 중 하나인 이유를 설명하십시오.목표: "데이터 표현 정확도", "측정 오류", "표현 오류"의 개념에 대한 학생들의 이해를 강화합니다. 학생들과 함께 바이너리 코딩 및 코드 길이를 검토합니다. 활동 유형: 개념 정의 작업. (, p. ??, 작업 3)

해결책:

기하학, 물리학, 기술에는 "측정 오류"의 개념과 밀접한 관련이 있는 "측정 정확도"의 개념이 있습니다. 하지만 이런 개념도 있다"표현 정확도". 예를 들어 사람의 키에 대해 다음과 같이 말할 수 있습니다. 2m, b) 1.7m보다 약간, c) 1m 72cm, d) 1m 71cm 8mm. 즉, 1, 2, 3 또는 4자리 숫자를 사용하여 측정된 성장을 나타낼 수 있습니다.
바이너리 인코딩도 마찬가지입니다. 특정 시점에서 피치를 녹음하는 데 2비트만 사용하면 측정이 정확하더라도 낮음(00), 평균 미만(01), 평균 이상(10), 높음(11). 1바이트를 사용하면 256레벨을 전송할 수 있습니다. 어떻게
더 높은 양자화 수준 , 또는, 이는 다음과 같습니다.측정된 값을 기록하기 위해 더 많은 비트가 할당될수록 값이 더 정확하게 전송됩니다.

메모.측정 도구는 선택된 양자화 수준도 지원해야 한다는 점에 유의해야 합니다(밀리미터 정확도로 데시미터 눈금이 있는 눈금자로 측정된 길이를 나타내는 것은 의미가 없습니다).

답변: 양자화 수준이 높을수록 사운드가 더 정확하게 전송됩니다.

문학:

[ 1] 컴퓨터 과학. 2권으로 구성된 Taskbook-workshop / Ed. I.G. 세마키나, E.K. Henner: Volume 1. - Basic Knowledge Laboratory, 1999 - 304 p.: 병.

정보학 및 정보 기술에 대한 워크샵. 교육 기관용 교과서 / N.D. Ugrinovich, L.L. Bosova, N.I. Mikhailov. – M.: 비놈. 지식의 실험실, 2002. 400 p.: 병.

학교 정보학: 저널 "컴퓨터 과학 및 교육" 보충 자료. 4 - 2003. - M.: 교육 및 정보학, 2003. - 96p.: 아픈.

Kushnirenko A.G., Leonov A.G., Epictetov M.G. 외 정보 문화: 정보 코딩. 정보 모델. 9-10학년: 일반 교육 기관용 교과서. - 2판. - M.: Bustard, 1996. - 208 p.: 아프다.

Gein A.G., Senokosov A.I. 학생을 위한 정보학 핸드북. - 예카테린부르크: "U-Factoria", 2003. - 346. p54-56.


지식은 작은 것으로 구성된다
매일의 경험의 알갱이.
디. 피사레프

목표: 실제로 이론적 지식의 적용.
수업 목표:
소리를 디지털화할 때 이진 코딩의 원리를 가르치기 위해
사운드의 시간적 샘플링 개념을 소개합니다.
오디오 코딩의 품질, 코딩 깊이 및 샘플링 속도 간의 관계를 설정합니다.
오디오 파일의 정보량을 평가하는 방법을 가르치기 위해;
컴퓨터를 사용하여 오디오를 녹음하고 WAV 형식의 오디오 파일로 저장하고 재생합니다.

수업 중:

I. 조직적 순간 1. 음악 소리
2. 선생님 말씀:

우리 수업의 주제는 "오디오 정보의 이진 코딩"입니다. 오늘 우리는 사운드 시간 샘플링의 개념에 대해 알아보고 사운드 인코딩 품질, 인코딩 깊이 및 샘플링 속도 간의 관계를 실험적으로 설정하고 오디오 파일의 볼륨을 추정하는 방법을 배우고 컴퓨터를 사용하여 사운드를 녹음하고 사운드 파일에 저장합니다. WAV 형식 및 재생.

II. 학생들의 지식 업데이트. 질문: (양식 1번에 답변 작성)

1. 정보의 존재 유형을 나열하시오? (숫자, 텍스트, 그래픽, 소리).
2. 비디오 시퀀스에 대해 어떤 키워드를 선택할 수 있습니까? (인코딩 정보).
3. 소리의 깊이는 무엇입니까? (오디오 깊이 또는 인코딩 깊이 - 오디오 인코딩당 정보 비트 수).
4. 소리의 볼륨 레벨은 어떻게 됩니까? (사운드는 볼륨 레벨이 다를 수 있습니다.

5. 샘플링 속도는 무엇입니까? (샘플링 주파수 - 단위 시간당(1초당) 입력 신호 레벨의 측정 횟수.
6. 디지털 모노 오디오 파일의 크기를 계산하는 공식은 무엇입니까?
(A=D*T*I).
D - 샘플링 주파수;
T는 소리를 내거나 녹음한 시간입니다.
I는 레지스터의 비트 심도입니다.
7. 디지털 스테레오 오디오 파일의 크기를 계산하는 공식은 무엇입니까?
A=2*D*T*I

III. 문제 해결. 작업 번호 1 (Semakin. No. 88 p. 157, 문제집 번호 1). 양식 번호 1.

44.1kHz 샘플 속도 및 16비트 확장자에서 재생 시간이 2분인 디지털 오디오 파일을 저장할 메모리 양을 지정합니다.


IV. 새로운 자료 학습.

90년대 초부터 개인용 컴퓨터는 소리 정보로 작업할 수 있었습니다. 사운드 카드, 마이크 및 스피커가 있는 모든 컴퓨터는 사운드 정보를 녹음, 저장 및 재생할 수 있습니다.
특수 소프트웨어 도구(사운드 녹음 편집기)의 도움으로 사운드 파일을 생성, 편집 및 청취할 수 있는 다양한 기회가 열립니다. 음성인식 프로그램이 만들어지고 그 결과 음성으로 컴퓨터를 제어할 수 있게 된다.
물리학 과정에서 소리는 진폭과 주파수가 지속적으로 변화하는 기계적 파동이라는 것을 알고 있습니다(그림 1). 진폭이 높을수록 소리가 커지고 주파수가 낮을수록 톤이 낮아집니다. 컴퓨터는 디지털 장치이므로 연속적인 소리 신호를 일련의 전기 충격(0과 1)으로 변환해야 합니다. 이를 위해 음파가 그래픽으로 표현되는 평면을 가로선과 세로선으로 구분한다(Fig. 2, Fig. 3). 수평선은 볼륨 레벨이고 수직선은 1초 동안의 측정 횟수(초당 1회 측정은 1Hz) 또는 샘플링 주파수(Hz)입니다. 이 방법을 사용하면 각각 이진 코드로 값이 할당된 불연속 볼륨 레벨 시퀀스로 연속 종속성을 대체할 수 있습니다(그림 4).

그림 1그림 2 그림 3그림 4
볼륨 레벨의 수는 사운드의 깊이(한 레벨을 인코딩하는 데 사용되는 바이트 수)에 따라 다릅니다. 일반적으로 8kHz 및 양자화 레벨(코드 8비트 길이).
, 여기서 N은 볼륨 레벨 수이고 I는 사운드 깊이(비트)입니다.

예: 양식 번호 3
해결책:
1) 5Hz의 주파수로 인코딩 - 이것은 피치가 1초 안에 측정됨을 의미합니다. 4비트 깊이 - 16개의 볼륨 레벨이 사용됨을 의미합니다.
피치 값을 가장 가까운 낮은 수준으로 "반올림"합니다. (인코딩 결과: 1000 1000 1001 O11O 0111)

2) 인코딩된 사운드(A)의 정보량을 계산하기 위해 간단한 공식이 사용됩니다. A = D * i * T, 여기서 D - 샘플링 주파수(Hz); i - 사운드 깊이(비트); T - 울리는 시간(초).
A = 5Hz * 4비트 * 1초 = 20비트.

V. 독립적인 작업 교육. 5번 양식


VI. 연구 과제. 양식 6

그룹 #1-5. 다양한 콘텐츠(독백, 대화, 시, 노래)의 음성 정보에 대한 이진 음성 코딩의 품질과 오디오 파일의 정보량 간의 관계를 설정합니다. 파일의 정보량과 녹음 모드(모노, 스테레오) 간의 관계.


연구 진행:

1) 2번 ​​양식을 작성합니다.
2) 실험 중 얻은 결과를 표로 기록한다.
3) 결론을 내립니다.

VII. 그룹 작업 요약
VIII. 미니 프로젝트 뮤지컬 및 사운드 가능성.
명칭: 프로그램: "숲에서 태어난 크리스마스 트리"
SCRN 7
라인(20,0)-(300,180),2,BF
FOR I=1 ~ 2000
X=280*RND+20 Y=180*RND
C=16*RND
PSET(X,Y),C
다음 나
수면 1
라인 (150,140)-(170,160),6,BF
PSET(110,140)
라인-(210,140), 10
라인-(160,110),10
라인-(110,140),10
페인트(160,120), 10,10
24.10 찾기
PRINT "숲에서 태어난 크리스마스 트리"
플레이 "ms+80 02 18 caajafcc"
PSET (120,110)
라인-(200,110),10
라인-(160,85),10
라인-(120,110),10
페인트(160.90),10.10
24.10 찾기
PRINT "그녀는 숲에서 자랐습니다",
"caab->dc4" 재생
PSET(130.85)
라인-(190,85),10
라인-(160,65),10
라인-(130,85), 10
페인트(160.70),10.10
24.10 찾기
"겨울과 여름에 슬림" 인쇄
플레이 "C PSET (140.65)
라인-(180,65), 10
라인 -(160,50), 10
라인 - 페인트(160.60), 10.10
24.10 찾기
인쇄 "그린 워스"
PLAY “카조후”

멈추다
IX 수업 요약

1). 프로그램 자료의 동화 수준 제어
1. 8kHz의 샘플링 속도에서 샘플링된 오디오 신호의 품질은 다음에 해당합니다.

    a) 오디오 CD의 음질
    비) 방송품질;
    c) 평균 품질.
2. 오디오 파일은 어떤 형식으로 저장되나요?
    a) DOC;
    b) WAV;
    다) BMP.
3. 연속 오디오 신호의 인코딩 품질은 다음에 따라 달라집니다.
    ㅏ) 샘플링 주파수 및 인코딩 깊이;
    b) 모니터의 색심도 및 해상도;
    c) 국제 코딩 표준에서.
4. 두 개의 오디오 파일이 동일한 샘플링 속도와 인코딩 깊이로 녹음됩니다. 스테레오 모드로 녹음된 파일의 정보량이 모노 모드로 녹음된 파일의 정보량보다 큽니다.
    a) 4회;
    b) 볼륨이 동일합니다.
    다) 2회.
2). 학생들의 지식과 기술 평가.
삼). 선생님 말씀.

물론 음질에 대한 평가는 대체로 주관적이며 우리의 인식에 달려 있습니다. 사람과 마찬가지로 컴퓨터는 저장 및 후속 재생을 위해 사운드 정보를 인코딩합니다. PC의 메모리와 사람의 메모리에 저장된 소리 정보의 차이점은 무엇입니까? (답변: 인간의 소리 코딩 과정은 감정과 밀접한 관련이 있습니다.)
따라서 컴퓨터는 소리를 저장하고 사람은 음악을 저장합니다!!!음악은 영혼이 영혼에게 말하는 유일한 언어이다(Berthold Averbach). 그녀는 하늘로 들어올릴 수 있고, 감각을 일깨우고, 마음을 묶고, 두려움을 심어줄 수 있습니다. 음악은 사람마다 다릅니다. "월광연가"는 당신에게 어떤 감정이나 연상을 불러일으킵니까?... 사랑하는 사람의 따뜻한 시선, 어머니의 부드러운 손길, 그리고 이 황홀한 소리가 정보학 수업을 떠올리게 할 수도 있습니다. . 이 모든 것은 디지털 이진 코드에 액세스할 수 없습니다.

X. 숙제작업 번호 89,91,92 페이지 157.