一面: 了解过哪些大模型?它们在结构上的差异? 大模型常用的位置编码有哪些?优缺点分别是什么? 介绍预训练—后训练—推理的流程 详细问了 RLHF(包括 PPO 算法原理) DPO 和 PPO 的区别 超长上下文是怎么实现的(例如 Kimi) 大模型智能体(Agent)的工作原理和组成部分 场景题:如何训练一个大模型,让它能更好地精确提取摘要 码题:经典股票四连问(121、122、123、188) 二面: CV 和 NLP 的区别与联系 在Transformer 框架下,CV、NLP、语音是否可能“大一统” 大模型训练:数据清洗、处理、配比的方法 大模型训练:如何更容易提升模型性能 什么是大模型的幻觉,如何缓解 为什么会有复读问题,业内有哪些解决办法 工具与 Agent:大模型工具调用的实现方式 工具与 Agent:Agent 的组成部分及实现方法 开放题:你在大模型训练中遇到过的困难,如何解决? 代码题:实现一个Tokenizer(只能用 PyTorch 基础语法) 三面: 项目深挖:尤其是 Agent 项目,从背景、动机、做法和结果等方面都问得非常细,聊了半个小时 开放题:你觉得当前大模型还存在哪些问题?有什么解决办法? 开放题:如果让你自己设计一个 Agent,你会怎么做?为什么? 职业相关:找工作除了薪资,还看重哪些因素? 对文心一言的了解:优点&可以改进的地方 如果拿到 Offer,你能为团队做出什么贡献? #算法 #大模型 #Agent #面经 #互联网大厂 #机器学习 #人工智能发展 #人工智能就业 #LLM#AI