一. 崗位職責
1. 基于大模型,構建智能體架構,實現(xiàn)復雜問題的 理解–規(guī)劃–工具調用–執(zhí)行–感知–反思(必要條件) 全流程能力;
2. 前沿技術探索,設計 算法迭代飛輪(必要條件),優(yōu)化基礎模型,有效提升模型性能指標與穩(wěn)定性;
3. 規(guī)劃與實施 多智能體系統(tǒng)(必要條件),并在實際場景中落地;
4. 負責大模型在具體產(chǎn)品中的預訓練、微調、封裝與模型部署服務化全鏈路;
5. 與產(chǎn)品、工程團隊協(xié)作,針對業(yè)務進行模型適配、性能優(yōu)化與迭代升級。
二. 任職要求
● 碩士及以上學歷,人工智能、計算機科學、自動化、數(shù)學等相關專業(yè)優(yōu)先;
● 扎實的數(shù)據(jù)結構和算法功底,精通 Python/C++ 中至少一種,有 PyTorch、
TensorFlow 等深度學習框架使用經(jīng)驗,并熟悉 分布式訓練;
● 有大型預訓練模型開發(fā)經(jīng)驗,包括高效訓練、微調、模型壓縮、推理優(yōu)化/部署等;
● 在頂級學術會議(如 NeurIPS、ICLR、CVPR、ACL 等)發(fā)表一作論文,或在多模態(tài)、CV、NLP、強化學習等競賽中取得優(yōu)異成績者優(yōu)先;
● 責任心強、積極主動,良好的溝通與團隊協(xié)作能力,能夠快速推進項目進展
工作時間10點——21點