公司主要业务:
行业AI大模型及行业AI应用的研发。
岗位职责:
利用现有的人工智能技术,结合自身平台的大数据,实现AI咨询问答,行业数据的智能内容推荐、结果预测分析等。
负责人工智能模型的开发和优化,包括深度学习、机器学习模型等。
根据业务需求,设计和实施高效的AI算法。
负责大规模数据集的处理、模型训练和调优。
参与人工智能项目的整体架构设计和优化。
致力于行业人工智能机器学习算法的研发,如推荐算法,用户行为预测,大数据分析,自然语言处理,深度学习,机器学习等。
研究和使用开源大模型技术,提供解决方案并进行应用实现。
负责研发和优化大模型的训练和部署技术,提升模型效率和性能。
参与开源大模型的开发和维护工作,提高模型的普遍性和适用性。
能够及时跟进和了解AI相关技术在学术界和工业界的最前沿技术发展,持续引入和应用创新的技术和算法赋能业务。
任职要求:
具备良好的英文读写能力,能阅读英文文献。
本科及以上学历,计算机科学、数学、统计或相关领域。
有实际项目经验者优先,如计算机视觉、自然语言处理、推荐系统等领域。
熟悉目前比较主流的大模型(例如 OpenAI)的定制化使用、训练微调等技术
2年以上大模型相关经验优先,具有大模型的开发、训练、调优经验,熟悉模型压缩、知识蒸馏等技术。
对深度学习、机器学习、自然语言处理等有深入理解,熟悉常用的AI模型及其优缺点。
具备扎实的编程技能,熟悉Python等常用编程语言,掌握Pytorch、tensorflow,Paddlepaddle,Caffe等相关深度学习框架。
掌握训练大模型的训练流程(SFT/RW/RLHF)。
有较深厚的机器学习和深度学习基础,了解各种学习算法及应用场景(如逻辑回归、SVM、神经网络、决策树、贝叶斯、CNN、DNN、RNN、LSTM等)。
了解数据并行,张量平行等相关分布式训练方法,熟悉常用大模型分布式训练框架例如deepspeed,Megatron-LM。
有NLP或大模型相关项目经验,熟悉Transformer模型架构,ChatGLM、LLaMA等相关模型原理。