搜索職位:
-
職位描述
-
工作職責
1. 領軍開展大模型算法研究,包括但不限于:單模態、多模態大模型的百卡、千卡訓練集群模型預訓練,全參、LoRA、P-Tuning等模型微調,模型量化、分布式部署算法,實現Aoto-GPT等最新大模型算法研究與應用;
2. 帶領團隊解決大模型在垂直領域落地問題;
3. 帶領團隊解決大模型的可控可信度不足、推理效率低的問題,解決大模型業務落地的技術障礙;
4. 協同跨團隊技術和業務同學共同達成技術和業務目標;
5. 領銜研究和創新,負責跟蹤最新的技術發展和研究成果,提出新的技術創新和改進方案,以提高模型的性能和效率。
6. 提供獨立思考和創新能力,解決不同領域的技術難題。
工作要求
1. 大學本科及以上學歷,并取得相應學位,計算機及相關專業優先,擁有扎實的大模型理論研究基礎, 八年及以上相關工作經驗;
2. 對主流大模型(例如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等)的原理、性能、差異有深入理解;
3.掌握大模型生產全鏈路技術,擁有大模型訓練、微調、產品應用經驗;
4. 熟悉常見的模型小型化技術,如量化/剪枝/蒸餾等,熟悉onnx/tensorRT;
5.對大模型的技術和行業發展有深刻認知,能夠把握大模型發展方向;
6. 具備較強的溝通能力,有較強的主動性及團隊合作精神,具有帶隊經驗。思路清晰,思維敏捷,語言和文字表達能力優秀,責任心強。
7.誠實守信、作風踏實嚴謹、責任心強,具備良好團隊協作能力精神,學習能力強,善于解決復雜問題。
-
企業介紹
-
工作地址
-
北京,上海