崗位職責(zé):
1.負(fù)責(zé)基于開源大模型進(jìn)行領(lǐng)域適配和指令微調(diào)。設(shè)計(jì)和實(shí)施高效的微調(diào)策略(如LoRA, QLoRA, P-Tuning等),以提升模型在特定任務(wù)(如智能客服、內(nèi)容生成、代碼輔助、數(shù)據(jù)分析、圖文理解等)上的表現(xiàn)。探索和實(shí)踐大模型的預(yù)訓(xùn)練、繼續(xù)預(yù)訓(xùn)練技術(shù)。
2.設(shè)計(jì)并開發(fā)基于大模型的應(yīng)用程序架構(gòu),包括但不限于RAG系統(tǒng)、智能代理、多模態(tài)應(yīng)用等。集成大模型API到公司產(chǎn)品中,并確保系統(tǒng)的穩(wěn)定性、可擴(kuò)展性和安全性。構(gòu)建高效的數(shù)據(jù)處理管道,用于模型的訓(xùn)練、評(píng)估和部署。
3.對(duì)模型進(jìn)行量化、剪枝、蒸餾等優(yōu)化,以提升推理速度并降低計(jì)算成本。負(fù)責(zé)將模型部署到生產(chǎn)環(huán)境(云端或邊緣),并持續(xù)監(jiān)控其性能和資源消耗。解決模型在部署和推理過程中遇到的技術(shù)難題。
4.建立科學(xué)的模型評(píng)估體系,設(shè)計(jì)和執(zhí)行全面的評(píng)測(cè)方案,包括人工評(píng)估和自動(dòng)化評(píng)估。持續(xù)跟蹤模型在生產(chǎn)環(huán)境中的表現(xiàn),基于業(yè)務(wù)數(shù)據(jù)和用戶反饋進(jìn)行模型的迭代優(yōu)化。
5.跟蹤大模型領(lǐng)域的最新學(xué)術(shù)進(jìn)展和技術(shù)動(dòng)態(tài),并探索其在公司業(yè)務(wù)中的應(yīng)用可能性。
任職要求:
1、計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)或相關(guān)專業(yè)的本科及以上學(xué)歷。具有1年以上的大模型開發(fā)和應(yīng)用經(jīng)驗(yàn)。
2、 精通Python,具備扎實(shí)的編程能力和良好的代碼風(fēng)格。熟練掌握PyTorch或TensorFlow之一,并了解其分布式訓(xùn)練機(jī)制。
3、具有使用Hugging Face Transformers、Accelerate、PEFT等庫的實(shí)際經(jīng)驗(yàn)(加分項(xiàng))。深入理解Transformer架構(gòu),并掌握至少一種主流大模型(如GPT系列、LLaMA系列等)的原理和使用。掌握2種以上的大模型微調(diào)及RAG工具,具備工作流開發(fā)與智能體搭建的經(jīng)驗(yàn)。
4、具備大模型微調(diào)的實(shí)戰(zhàn)經(jīng)驗(yàn),熟悉Prompt Engineering、LoRA等參數(shù)高效微調(diào)方法。
5、熟悉Linux開發(fā)環(huán)境,掌握Git、Docker等開發(fā)工具,具備良好的軟件工程素養(yǎng)。
6、對(duì)自然語言處理(NLP)基礎(chǔ)任務(wù)(如文本分類、NER、語義理解等)有深刻理解。
7、熟悉大模型的評(píng)測(cè)方法、常見問題(如幻覺、偏見)及其緩解方案。