Audio
audio는 공기나 물 같은 매질의 진동을 통해 전달되는 파형이다.
주파수 (f)
1초에 몇 번 반복되는가
주기 (T)
몇 초에 한 번 반복되는가
T = 1/f
진폭(Amplitude)
최고점의 높이, 골의 깊이
Pitch & Loudness
High frequency 일수록 High pitch (높은 소리)
대체로 Amplitude가 크면 Loudness(소리의 크기)가 크다.
Analog Digital Conversion (ADC)
소리는 연속적인 아날로그 신호인데, 음성 신호 처리를 위해서는 이를 디지털 신호로 바꿔야한다. (discrete한 vector로 만드는것)
이 과정은 Sampling(표본화)과 Quantization(양자화)로 이루어진다.
Sampling
일정한 간격의 주기로 신호의 강도를 수집하는 것
전체 데이터를 전부 사용하면 시간과 비용이 많이 소모되기 때문에 적당한 개수의 데이터만 뽑아서 전체의 패턴을 추정한다.
Sampling rate
초당 sample 갯수
ex) sample rage = 44100Hz 인 경우, 1초에 44100개의 sample을 뽑은 것
Nyquist law
모든 신호가 그 신호에 포함된 최고 주파수의 2배에 해당하는 빈도를 가지고 일정한 간격으로 샘플링하면 원래의 신호를 완벽하게 기록할 수 있다는 법칙
44100Hz
사람의 가청 주파수 : (20Hz~20KHz)
최고 가청 주파수인 20KHz의 2배인 40KHz에 오차 허용 범위 10%, 그리고 업계 표준과의 동기화 문제 등으로 인해 대부분의 오디오 sample rate는 44100Hz이다.
Quantization
sampling한 아날로그 신호를 digitizing 하는 작업
sampling된 samples는 엄청난 양이므로, 효율적으로 저장하는 것이 중요하다.
이를 위해 해당 data를 정수(또는 의미 있는수)로 변환하는 작업이 quantization이다.
Bit depth
quantization을 얼마나 세밀하게 할지에 대한 정도
ex) Bit depth = 16bits 이면, 16비트(약 65536levels)의 값으로 discrete하게 양자화 된 소리
양자화를 마친 데이터는 encoding을 거쳐 '0'과 '1'의 이진 비트로 표현된다.
참고 링크
https://hyunlee103.tistory.com/54
'프로젝트 > AI ANC' 카테고리의 다른 글
[LSTM] 삼성전자 주식, 이더리움 시세 예측 (Python 딥러닝) (0) | 2021.08.09 |
---|---|
[Keras] KeyError : 'acc' 해결하기 (0) | 2021.08.04 |