工作職責(zé)??:
1.負(fù)責(zé)大模型測評數(shù)據(jù)的整理、分類、結(jié)構(gòu)化標(biāo)注。
2.根據(jù)測評和測試方案,執(zhí)行模型效果測評和系統(tǒng)端對端測試。
3.記錄測試異常并復(fù)現(xiàn)用戶問題場景,分析定位問題。
4.統(tǒng)計分析用戶真實數(shù)據(jù),不斷完善用例庫。
5.??測評系統(tǒng)建設(shè)支持??。
任職要求:
1.計算機(jī)相關(guān)專業(yè)本科及以上學(xué)歷,經(jīng)驗?zāi)晗薏幌蕖?
2.能快速理解NLP任務(wù)需求,有AI輔助編程工具或類似產(chǎn)品的使用或測試經(jīng)驗。
3.務(wù)必熟練使用Excel/Python進(jìn)行基礎(chǔ)數(shù)據(jù)處理,具備一定的編寫測試腳本能力。
4.熟悉常用的測試開發(fā)工具,如Git、Postman、Jmeter等。
5.具備良好的溝通能力、執(zhí)行力強(qiáng)、具備跨團(tuán)隊協(xié)作意識和問題解決能力。
6.加分項:NLP基本知識和原理,模型測評經(jīng)驗,prompt工程能力。