崗位職責
1.大語言模型性能優(yōu)化:開展大語言模型增量預訓練與微調技術研究,提升模型在特定領域和任務上的性能表現(xiàn),任務場景包含但不限于代碼生成、知識問答、文本生成等;
2.基于大模型的智能體開發(fā):構建能夠自主學習和決策的智能體,以解決復雜問題,如實時任務規(guī)劃、動態(tài)事件響應等;
3.面向垂直領域的檢索增強生成:基于文本、圖片、網(wǎng)頁、數(shù)據(jù)庫、知識庫等多源異構領域數(shù)據(jù),開展嵌入模型構建、向量數(shù)據(jù)庫優(yōu)化、召回重排序等技術研究,提升大模型在互聯(lián)網(wǎng)信息挖掘、領域知識問答等的時效性和專業(yè)性;
4.基于垂直領域業(yè)務場景、MCP協(xié)議框架、大模型開展Agent研發(fā);
5.參與團隊協(xié)作和項目管理,與跨部門成員合作,共同推進大模型項目的研發(fā)、實施和優(yōu)化,確保項目目標的實現(xiàn)。
任職要求:
1.碩士及以上,計算機科學與技術、軟件工程、人工智能、數(shù)學等相關專業(yè);
2.熟悉大模型預訓練、微調、應用主流算法和常用工具,具備較強的算法實現(xiàn)和軟件開發(fā)能力;
3.熟悉Python編程,熟悉TensorFlow、PyTorch等主流深度學習框架;
4.深入理解自然語言處理(NLP)、強化學習、計算機視覺、大語言模型(如GPT,GLM)等相關算法原理及應用;
5.具備跨領域學習能力,有較強的邏輯思維、交流溝通能力;能夠自我驅動,有強烈的責任感和團隊協(xié)作意識。
加分項:
1.有在頂級會議或期刊發(fā)表論文者優(yōu)先;
2.熟悉langchain、llamaIndex等開源框架者優(yōu)先;
3.有模型微調、知識圖譜、智能體開發(fā)處理經驗者優(yōu)先。