1、負(fù)責(zé)AI大模型的適配與開優(yōu)化工作,包括模型性能分析與調(diào)優(yōu)、識別和解決瓶頸問題;
2、負(fù)責(zé)AI大模型算子的優(yōu)化和性能調(diào)優(yōu),確保模型在公司硬件平臺上的高效穩(wěn)定運(yùn)行;
3、負(fù)責(zé)終端大模型部署和解決方案開發(fā)及適配,確保AI設(shè)備能夠滿足客戶性能和功能需求
4、深入了解硬件架構(gòu)及底層邏輯,與硬件團(tuán)隊緊密合作,實現(xiàn)軟硬件協(xié)同優(yōu)化;
5、跟蹤最新的研究進(jìn)展和技術(shù)趨勢,提出改進(jìn)和創(chuàng)新的想法。
任職要求:
1、計算機(jī)/通信/數(shù)學(xué) 本科、碩士,3年以上工作經(jīng)驗(本)/2年以上工作經(jīng)驗(碩士);
2、熟悉計算機(jī)系統(tǒng)體系架構(gòu),對軟件性能優(yōu)化加速有深入理解和實踐經(jīng)驗。
3、了解并熟悉AI推理框架(如Onnx runtime\TensorRT等),成功部署過RNN、DNN、CNN、LTSM等模型且有實際使用經(jīng)驗者優(yōu)先;
4、熟練使用至少一種主流AI框架(如TensorFlow、PyTorch、Mindspore等),并能高效進(jìn)行模型開發(fā)與調(diào)試;
5、熟練掌握C/C++、Python編程語言,以及svn/git版本控制、CMake、Makefile等構(gòu)建工具;
6、熟悉國產(chǎn)GPGPU/NPU及操作系統(tǒng),有國產(chǎn)平臺部署大模型應(yīng)用開發(fā)經(jīng)驗者優(yōu)先;
7、能獨立完成售前解決方案,研制方案、研制總結(jié)及用戶使用說明書的編寫
8、工作扎實認(rèn)真,善于與人溝通,具有團(tuán)隊合作精神。