Sóng âm thanh là gì?
Sóng âm thanh là gì?
Sóng âm thanh là gì?
Phân tích sóng âm thanh (tiếng Anh: Audio signal analysis hoặc Sound wave analysis) là quá quá trình nghiên cứu, đo đạc và trích xuất thông tin từ sóng âm thanh nhằm hiểu bản chất, đặc tính và ý nghĩa của nó.
Sóng âm thanh bản chất là dao động áp suất lan truyền trong không khí (hoặc môi trường khác), nên phân tích sóng âm thanh chính là phân tích dao động cơ học này theo nhiều khía cạnh khác nhau.
Các hướng phân tích sóng âm thanh chính:
1. Phân tích trong miền thời gian (Time domain analysis)
- Quan sát trực tiếp dạng sóng (waveform): biên độ theo thời gian.
- Các thông số đo được:
- Biên độ cực đại (peak amplitude)
- Biên độ hiệu dụng (RMS – Root Mean Square)
- Tần số lặp (nếu là âm tuần hoàn)
- Thời gian vang (reverberation time)
- Độ trễ, pha giữa các kênh (trong âm thanh nổi/multichannel)
2. Phân tích trong miền tần số (Frequency domain analysis)
- Dùng biến đổi Fourier (FFT – Fast Fourier Transform) để chuyển từ miền thời gian sang miền tần số.
- Kết quả: Phổ tần số (frequency spectrum)
- Cho biết:
- Những tần số nào có trong âm thanh
- Mức năng lượng (cường độ) của từng tần số
- Tần số cơ bản (fundamental frequency) và các hài âm (harmonics) → giúp nhận diện cao độ của nốt nhạc hoặc giọng nói
3. Phân tích thời gian – tần số (Time-Frequency analysis)
- Vì âm thanh thực tế không đứng yên (như giọng nói, nhạc cụ), phổ tần số thay đổi theo thời gian.
- Các công cụ phổ biến:
- Spectrogram (phổ đồ): biểu diễn tần số theo thời gian, màu sắc thể hiện cường độ
- Short-Time Fourier Transform (STFT)
- Wavelet Transform
- Constant-Q Transform (dùng nhiều trong âm nhạc)
4. Phân tích đặc trưng âm thanh (Audio feature extraction)
Trích xuất các đặc trưng số để máy tính hiểu được âm thanh:
- Tần số cơ bản (pitch)
- Độ sáng âm sắc (brightness)
- Độ nhọn (sharpness)
- MFCC (Mel-Frequency Cepstral Coefficients) – rất phổ biến trong nhận diện giọng nói
- Chroma features (dùng trong phân tích nhạc)
- Zero-crossing rate, spectral centroid, spectral flux, v.v.
5. Các ứng dụng thực tế của phân tích sóng âm thanh
- Nhận diện giọng nói (speech recognition)
- Nhận dạng nhạc, phân tích giai điệu (Shazam, SoundHound)
- Phân loại âm thanh (tiếng chó sủa, tiếng súng, tiếng vỡ kính…)
- Xử lý âm thanh: khử tiếng ồn, tách giọng hát khỏi nhạc nền
- Chẩn đoán y khoa (phân tích tiếng tim, tiếng phổi)
- Đo đạc âm học kiến trúc (thời gian vang phòng hòa nhạc)
- Phát hiện lỗi máy móc qua tiếng động
Tóm lại đơn giản nhất
Phân tích sóng âm thanh = “mổ xẻ” âm thanh ra để xem:
- Nó to nhỏ thế nào (biên độ)
- Cao thấp ra sao (tần số, cao độ)
- Thay đổi thế nào theo thời gian
- Chứa những thành phần gì → Từ đó máy tính hoặc con người hiểu được ý nghĩa của âm thanh đó.