搜索職位:
-
職位描述
-
語言模型算法專家1. 負責大型語言模型的訓練與推理效果優化,包括但不限于數據處理、預訓練、指令精調、RLHF、推理優化等
2. 對現有算法、數據進行分析和評估,優化模型生成效果,減少有害、敏感或偏見相關回復
3. 調研并探索LLM方向相關前沿算法,如位置編碼、模型結構等,持續提升現有算法的效率與效果
4. 探索張量并行,數據并行,流水并行等3D訓練加速方法
5. 跟蹤行業內前沿技術,語言模型技術方案設計和相關技術的落地驗證。1. 計算機、人工智能等相關專業碩士及以上學歷,5年以上工作經驗
2. 精通TensorFlow/PyTorch/Megatron等深度學習訓練或推理框架底層原理,熟悉3D并行訓練技術原理
3. 對大模型有技術熱情,熟悉GPT/BERT/llama/GLM等模型的結構和原理
4. 熟悉語言大模型基本原理及應用,具備千億級別參數大模型設計、研發或調優經驗
5. 主導過自然語言算法或語言大模型(大于300億參數)方向研發工作,或發表過相關頂會、期刊論文
6. 參與過主流榜單評測,有多個語言大模型主流評測榜單上進入前五的記錄優先
-
企業介紹
-
工作地址
-
杭州