logo
新迪泰电子
热线电话:0755-89891702
行业新闻

常用语音模块录音模块参数

发布时间:2017-09-13 13:56:14

  语音信号的量化
采样率(f)、位数(n)、波特率(T
采样:将语音模拟信号转化成数字信号
采样率:每秒采样的个数(byte
波特率:每秒钟采样的位数(bit)

波特率直接决定音质。Bps: bit per second采样位数指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H


1)采样率


   奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。

 

嗓音的频带宽度为2020K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K16bit,如果碰到某些特别的声音,如乐器,音质也有用48K24bit的情况,但不是主流。


   一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。
    在应用单片机的过程中,采样越高,定时器中断速度越快,会影响到其他信号的监控和检测,所以要综合考虑。


3)语音压缩技术。
由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式:


   语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。


   语音采样:一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。


   数学压缩:主要是针对采样位数进行压缩,这种方式也是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。
通常,以上几种压缩方式都是综合起来使用的。


4)常用语音格式
PCM格式: Pulse Code Modulation 脉冲编码调制,它将声音模拟信号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。

一、
WAV格式:Wave Audio Files 是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。


    ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自

动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90%以上,已广泛地应用于电话通信领域。


   MP3格式: Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用 MPEG Audio Layer 3 的技术,采取了名为感官编码技术的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。

 

它的实质是vbrVariant Bitrate 可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小。
mp3压缩率10倍甚至12倍。是最初出现的一种高压缩率的语音格式。
Linear Scale格式:根据声音的变化率大小,把声音分成若干段,对每段用线性比例进行压缩,但是它的比例是可变的。


Logpcm格式:基本上对整个声音进行线性压缩,将最后若干位去掉。这种压缩方式在硬件上很容易实现,但音质比Linear Scale差一些,特别是音量较小声音比较细腻的情况下效果较差。主要用于pure speech方面。


3、语音ROM空间的表述
语音芯片为表述的形象化,由语音长度来表示
a)普通语音芯片以6K采样率为语音长度计算标准。
b)录音IC4K采样率为语音长度计算标准。
即:以6k4k)采样率芯片可以播放的长度。


4、语音芯片的要素
相同品种的芯片成本与芯片的大小成正比。
a)I/O口的分配和ROM的大小(语音秒数)决定芯片成本。低秒数语音芯片其I/O口较少
b)音质提高,采样提高,语音秒数缩短
音质降低,采样降低,语音秒数变长
c) 语音秒数的计算方法:M/(n*f)
M---ROM大小(bitn*f---波特率
5、声音处理软件介绍
1SoundForge
2Cooledit
3goldwave
4Calewalk

录音模板参数

1.录音模块支持MICLINE录音;

2.最大可支持外挂64M bit SPI-FLASH,录音时间可达1600秒;

3.支持通过USB进行上传和下载语音;

4.支持播放电脑下载的高音质语音的播放;

5.最多可录制252段语音(包含固定语音);

6.支持掉电保存数据功能;

7.支持10KHz采样率录音戒14K采样率录音;

8.采用独立的文件管理系统,录音无碎片产生,更合理的分配SPI-FLASH空间;

9.支持按键及MCU控制;

10.10级可控音量;

11.工作电压DC3.3V

12.采用8 DSP 内核录音芯片,16 ADC 输入,16 DAC 输出;

13.支持外挂SPI-FLASH 容量范围为4M Bit 64M Bit

14.支持标准按键、按键一对一模式和三线串口控制模式;

15.支持LINE 线路录音和MIC 现场录音;

16.可自行设定采样率,支持6K 16K 采样;

17.电压范围为DC2.7V 3.6V,自带低电压侦测电路;

18.省电模式仅耗电150uA 以下;

19.可以广泛应用在电话录音、工控、消费、玩具等领域。

上一篇:录音模块录音芯片应用领域及参数

下一篇:15/20/30/60秒录音模块产品开发应用

版权所有 Copyright © 新迪泰电子备案号:粤ICP备14055744号