一、產品市場
隨著混合辦公新常態的深化,企業對高效協作工具的需求激增,直接帶動了智能會議設備的革新浪潮。當前,智能會議系統的全球市場已跨越百億美元門檻,其發展焦點正從基礎的音視頻通信,轉向集高保真錄音、實時云端同步與智能數據管理于一體的融合性解決方案。

在實際會議場景中,挑戰尤為具體:如何在開放式辦公室或嘈雜環境中清晰剝離人聲與背景噪聲?怎樣確保數小時的會議內容被完整、清晰地記錄?以及如何讓錄音資料既能安全存儲于設備本地,又能即時上傳至云端供團隊調取與分析?這些已成為提升會議效率的關鍵。
針對這些核心訴求,WT2605A芯片方案提供了專業級的應答。其出色的音頻處理能力、長效的低功耗運行以及靈活的存儲與連接擴展性,使其成為構建現代會議錄音設備(如全向麥克風、會議音箱、錄音筆)的理想核心。無論是企業日常例會、培訓機構的教學留存,還是對可靠性要求極高的司法庭審記錄,該方案都能提供穩定、清晰且易于管理的完整錄音解決方案。
二、產品應用框圖
基于外部MCU與WT2605A的UART協議交互架構,系統框圖重構如下:

1)音頻采集與處理鏈
輸入級:支持麥克風輸入,WT2605A-24SS通過ADC對麥克風信號進行采樣、量化,并編碼為數字音頻數據。
處理單元:WT2605A獨立完成ADC采樣(16bit/44.1kHz)、環境噪聲消除、MP3實時編碼(CBR
128kbps),編碼后數據流直接寫入TF卡。
2)控制與通信鏈
指令交互:外部MCU通過UART發送標準指令控制WT2605A,包括錄音啟停、文件查詢、數據塊讀取等操作。
數據傳輸:WT2605A響應MCU請求時,將TF卡中的音頻文件以512字節/包的形式通過UART回傳,數據流格式為[包頭][長度][命令碼][數據][CRC16]。
網絡層:MCU接收數據包后,通過SPI接口連接網絡模塊(如ESP32-C3),封裝為TCP/IP協議包上傳至服務器,支持Base64編碼或二進制直傳。
3)電源與狀態管理
供電設計:WT2605A與MCU采用獨立LDO供電(3.3V/500mA),避免數字噪聲干擾音頻電路。
狀態同步:MCU通過解析WT2605A的狀態碼(如0x01: 空閑、0x02: 錄音中),驅動LED指示燈顯示設備工作狀態。
4)數據流詳解
下行控制流:
MCU --UART指令 --> WT2605A(控制錄音、讀取操作)
上行控制流:
WT2605A --UART數據包 --> MCU --TCP/IP -->
云服務器
該架構實現硬件級解耦:WT2605A專注高精度音頻處理,MCU負責協議轉換與網絡通信,二者通過標準化UART指令協同,降低系統耦合度與開發復雜度。
三、芯片介紹
WT2605Ax是一系列功能強大的高品質錄音芯片,采用了高性能32位處理器、最高頻率可達192MHz。具有低成本、低功耗、高可靠性、通用性強等特點,現有WT2605A8-24SS的封裝芯片。帶有地址播放、插播、單曲循環、所有曲目循環、隨機播放、錄音等功能,。32級音量可調、最大可以支持外掛128Mbit的Flash。
3.1產品特點
1)核心性能:
高性能32位處理器、最高頻率可達192MHz。實時處理多路音頻流。
WT2605A集成MP3/WAV編碼器,支持8-48kHz采樣率,比特率8-320kbps,錄音音質達CD級。
音頻輸出方式默認為DAC輸出,不可修改,硬件支持16bit DAC輸出。
2)存儲擴展:
WT2605A支持SPI-FLASH、TF卡、U盤三種存儲介質,最大支持32GB容量,錄音時長可達數百小時。
3)接口豐富:
WT2605A標準UART通信接口,默認波特率115200,支持通過串口命令設置波特率,便于與外部MCU通信。
4)低功耗優化:
WT2605A內置動態功耗調節機制,工作電流≤30mA,休眠模式下功耗低至uA級。
3.2芯片引腳描述

PIN-NO. | 名稱 | 功能說明 |
1 | RX | UART_RX通信端口 |
2 | TX | UART_TX通信端口 |
3 | DAT/DM | 燒錄腳/USB D- |
4 | CLK/DP | 燒錄腳/USB D+ |
5 | P04 | BUSY輸出腳 |
6 | P03 | IO口 |
7 | MICLDO | 麥克風電源,麥克風供電端 |
8 | MIC+ | 麥克風輸入腳(+) |
9 | P00 | IO口 |
10 | DACVSS | DAC地 |
11 | VCM | 接一個105外部電容到地 |
12 | DAC | DAC音頻輸出 |
13 | P23/SDCLK/SPI_SO | SD卡時鐘腳/Flash數據輸出腳 |
14 | P22/SDCMD/SPI_CLK | SD卡片選腳/Flash時鐘腳 |
15 | P20/SDDAT/SPI_CS | SD卡數據腳/Flash片選腳 |
16 | P21/SPI_SI | Flash數據輸入腳 |
17 | VCC | 電源輸入 |
18 | VOUT | 接106電容到地 |
19 | P17 | ADKEY |
20 | GND | GND |
21 | NG | NG |
22 | ANT | 藍牙天線腳 |
23 | OSCI | 晶振OSCI |
24 | OSCO | 晶振OSCO |
四、功能介紹
1)指令化錄音控制
精準操控:MCU通過UART指令直接控制錄音啟停,支持調節采樣率、增益等級。
狀態反饋:WT2605A實時返回硬件狀態(如存儲異常、低電量)。
2)文件存儲與讀取
無文件系統存儲:錄音文件按日期_時間.wav格式直接寫入TF卡,規避FAT表風險。
指令驅動操作:MCU通過指令查詢文件列表、分塊讀取數據(512字節/包),支持斷點續傳與安全擦除。
3)裸數據上傳
協議精簡:MCU將音頻數據封裝為自定義TCP幀(同步頭+時間戳+數據+CRC),直傳服務器。
自適應分片:根據網絡質量動態切換數據塊大小(512字節),確保傳輸穩定性。
4)低功耗與可靠性
二級休眠:工作模式(50mA)→深度休眠(2μA),按鍵喚醒。
核心優勢:純UART指令驅動,實現硬件級高可靠控制,適配低成本MCU開發,無軟件依賴。
五、指令介紹
5.1協議命令格式
標準UART異步串口接口,屬于3.3V
TTL電平接口。通訊數據格式是:起始位:1位;數據位:8位;奇偶位:無;停止位:1位。使用電腦串口調試助手,需要正確設置串口的參數,設置如圖:
起始碼 | 長度 | 命令碼 | 參數 | 累加和校驗 | 結束碼 |
0X7E | 見下文 | 見下文 | 見下文 | 見下文 | 0XEF |
注意:“長度”是指長度+命令碼+參數+校驗和的長度,“累加和校驗”是指長度+命令碼+參數的累加和的低字節。
5.2協議指令
低功耗
參數為“00”時功耗小于2uA,指令喚醒時間為50ms以內。
注:芯片在RXD腳下降沿行喚醒,建議發送 0x00 0x00 進行喚醒。使用外掛Flash方案時,休眠功耗與外掛flash有關。
示例:發→◇7E 04 B8 00 BC EF □ (進入深度休眠)
設備剩余容量
查詢當前設備剩余容量。
示例:發→◇7E 03 CE D1 EF □
收←◆7E 06 CE 01 E2 0E C5 EF (當前設備剩余容量123406kB)
錄音品質
碼率(BR)/采樣率(SR)對應關系
采樣率(SR) | 16000 | 32000 | 44100 | 48000 |
碼率(BR) | 16kbps | / | / | / |
32kbps | 32kbps | 32kbps | 32kbps |
64kbps | 64kbps | 64kbps | 64kbps |
/ | 128kbps | 128kbps | 128kbps |
/ | / | 192kbps | 192kbps |
/ | / | 256kbps | 256kbps |
/ | / | 320kbps | 320kbps |
/ | / | 384kbps | 384kbps |
示例:發→◇7E 05 D4 01 01 DB EF □
表示錄音采樣率為32kHz,碼率為32kbps
錄音控制
示例:發→◇7E 05 D5 00 0A E4 EF □
收←◆7E 04 D5 00 D9 EF
文件管理
1)查詢當前外設連接狀態:
示例:發→◇7E 03 CA CD EF □
收←◆7E 04 CA 07 D5 EF (當前掛載盤符有U盤、TF卡、Flash)
0X07:無PC連接(BIT3=0),有U盤(BIT2=1),有TF卡(BIT1=1),有SPI-FLASH(BIT0=1)。
2)查詢TF卡內音樂文件總數:
示例:發→◇7E 03 C5 C8 EF □
收←◆7E 05 C5 00 02 CC EF (TF卡內文件總數為2)
4)讀取錄音文件:
通過文件名讀取文件數據,首先發送F4指令獲取文件大小(3字節),再發送F3指令自動上傳512 bytes數據,上傳數據包含在7E 00 F3
...... XX EF中,其中......
為上傳的一包數據,XX為累加和校驗,是指0x00+0xF3+上傳數據的累加和的低字節;上傳數據期間需要每隔一段時間發送7E 03 F3 F6
EF,以保持上傳數據的完整性,直至文件讀取完畢。
示例:發→◇7E 0B F4 32 35 33 31 33 31 30 30 8E EF □(獲取文件大小)
收←◆7E 06 F4 05 D8 40 17 EF(文件大小為383040 bytes)
發→◇7E 03 F3 F6 EF □(開始上傳數據)
收←◆7E 00 F3 XX ...... XX EF(上傳512 bytes數據)
發→◇7E 03 F3 F6 EF □(上傳期間發送)
收←◆7E 00 F3 XX ...... XX EF (上傳512 bytes數據)
收←◆..........................................
收←◆7E 04 F3 00 F7 EF(讀取完畢時返碼)
表示讀取文件名為25313100的音頻文件
5)刪除指定文件:
可以指定根目錄下的文件索引及文件名來刪除指定的音頻文件。
示例:發→◇7E 05 E2 00 01 E8 EF □ (刪除索引值為1的文件)
發→◇7E 0B E3 32 35 33 31 33 31 30 30 7D EF □ (刪除文件名為“25313100.MP3”的文件)
發→◇7E 03 E6 E9 EF □ (刪除全部文件并格式化)
網絡傳輸
波特率設置(921600,N,8,1),音頻錄制格式為MP3,外部單片機讀取音頻文件并上傳服務器。
六、方案展示
6.1硬件架構設計
系統由外部單片機(MCU)與WT2605A芯片協同工作,硬件架構如下:

主控鏈路:
WT2605A負責音頻采集、編碼、存儲至TF卡,僅通過UART協議與外部MCU通信。
外部MCU(如STM32F4系列)作為系統控制核心,通過UART發送指令讀取錄音文件,并通過Wi-Fi/以太網模塊上傳至服務器。
接口定義:
WT2605A與MCU之間采用UART(波特率921600bps,8N1格式),僅需連接TX、RX、GND三線。
MCU與網絡模塊(如ESP8266)通過SPI或UART通信,實現HTTP/MQTT協議封裝。
6.2控制與上傳流程
1)文件文件名獲取:
獲取根目錄下的文件文件名。
2)文件內容讀取:
可以指定根目錄下的文件名來讀取指定的音頻文件。
3)數據上傳服務器:
MCU接收數據塊后,通過網絡模塊封裝為HTTP POST請求,按分片上傳至服務器。
6.3典型應用案例
司法錄音筆方案:
硬件配置:WT2605A + STM32F405 + 4G模組(移遠EC200T),TF卡加密分區存儲。
工作流程:
庭審結束后,法警通過按鍵觸發MCU讀取指定錄音文件。
MCU逐包獲取數據并加密(AES-256),通過4G網絡上傳至法院私有云。
上傳完成后,MCU發送指令刪除本地文件,確保數據唯一性。
6.4方案優勢總結
通過UART協議實現外部MCU對WT2605A的精細化控制,系統具備以下特性:
高可靠性:純硬件協議交互,避免API接口的軟件層兼容性問題。
靈活組網:MCU可適配多種網絡環境(Wi-Fi/4G/有線),滿足不同場景部署需求。
強安全性:敏感操作(如文件刪除)需MCU二次校驗,防止誤觸發。
如果您的項目對音質有極致要求,可以考慮性能更強大的音頻編解碼芯片。需要達到專業錄音或高保真回放級別,可以參考WT2000A芯片:
顯著提升的信噪比(SNR):WT2000A芯片的DAC信噪比(SNR)為104dB,ADC信噪比(SNR)為95dB,優于WT2605A的96dB和90dB。更高的SNR意味著背景噪音更小,聲音更純凈。
更高的分辨率與采樣率:WT2000A芯片支持24-bit ADC,優于WT2605A的16-bit
ADC,能夠記錄和還原更豐富的音頻細節和更寬廣的動態范圍。