搜索職位:
-
職位描述
-
崗位職責:
1.熟悉python,C++等編程語言中的一種或多種;
2.熟悉主流LLM結構,GPT,llama等,了解結構特點;
3.熟悉主流的深度學習以及NLP框架,包括:pytorch,huggingface等;
4.熟悉常見的LLM訓練框架:deepspeed,megatron;
5.了解常見的LLM推理加速框架:VLLM,tensorRT等;
6.有分布式LLM訓練經驗;
7.理解長文本外推,cache壓縮等技術;
8.對LLM訓練數據生成與處理有一定的認識。
任職要求:
1.高校畢業的數學系、計算機、人工智能方向,及能力優秀的研究生;
2.具有良好的算法設計的能力,機器學習基礎扎實,編程能力優秀;
3.具有較強的Coding能力,熟練掌握Python開發;熟悉MongoDB,InfluxDB等,能夠實現以上數據庫的查詢、讀寫;
4. 踏實認真,自驅力強;機器學習、數據挖掘方向CCFA、B類論文經驗者優先。
-
企業介紹
-
工作地址
-
上海