崗位職責:
1、負責公司音頻模型的訓練與優(yōu)化,對音頻數(shù)據(jù)進行特征提取、標注預處理,并進行數(shù)據(jù)增強與數(shù)據(jù)集構建;
2、基于 PyTorch / TensorFlow 等深度學習框架,進行音頻時頻域建模、空間重建等神經(jīng)網(wǎng)絡算法開發(fā);
3、參與模型壓縮(如INT8量化)、推理加速及異構部署(GPU/NPU)適配;
4、跟進模型在車載、PC、移動端等不同場景的部署需求,配合工程團隊進行模型聯(lián)調測試;
5、跟蹤行業(yè)前沿研究(音頻分離、空間定位、HRTF重建等),轉化為可落地能力。
任職要求:
1、碩士及以上學歷,信號處理、人工智能、聲學、計算機等相關專業(yè);
2、具備 2 年以上音頻/語音方向深度學習模型訓練經(jīng)驗;
3、熟悉深度學習常見網(wǎng)絡結構(如UNet、ResNet、Transformer),有音頻建模(如源分離、聲源定位、空間音頻)經(jīng)驗優(yōu)先;
4、熟練使用 Python、PyTorch/TensorFlow、librosa、ffmpeg 等工具;
5、了解音樂結構、聲學特征,具備實際音頻處理項目經(jīng)驗者優(yōu)先;
6、具備獨立完成音頻模型開發(fā)與部署的能力,包括數(shù)據(jù)處理、模型設計、訓練優(yōu)化及推理落地。
7、有良好的溝通協(xié)作能力與工程化思維,熱愛音頻與創(chuàng)新技術;
加分項:
1、有環(huán)繞聲、空間音頻、虛擬現(xiàn)實音頻等模型或產(chǎn)品經(jīng)驗;
2、有比賽、開源項目或論文成果優(yōu)先;
3、熟悉 Onnx、Triton、CUDA、TensorRT 等推理優(yōu)化工具優(yōu)先。