面试真题

简介: 多套AI与Java技术面试题,涵盖RAG、智能体、大模型部署、分布式系统、JVM调优、数据库设计等核心内容,深入考察项目经验、架构能力与技术深度,适用于中高级工程师岗位选拔。

多套AI与Java技术面试题汇总,涵盖RAG、智能体、大模型部署、分布式系统、JVM调优、数据库设计等核心内容,深入考察候选人项目经验、架构设计及技术深度,适用于中高级工程师岗位选拔。
第1套
第一轮1.自我介绍2.MySql里面如何查询慢sql3.你是怎么理解RAG的知识增强4.传统知识库和RAG知识库有什么区别5.智能体里面的路由是怎么去理解的6.多轮会话的意图转换是怎么去分发的7.会话上下文满了是怎么处理的8.这个AI模块是有多少人在做9.MCP服务端10.用户信息查询里面,如何获取到用户id的11.有没有了解到上下文的缓存,既要保证聊天上下文,还要保证会话的成本足够的低第二轮1.还是自我介绍2.你觉得难度最大的项目3.你的这个路由意图分析是怎么做的4.项目做了多久5.项目的难点在哪里6.你是怎么去学习相关的技术的7.有没有使用到AI编程工具去辅助开发8.AI工具用到了什么模型9.有没有处理一些并发问题10.有没有参与过数据分析11.什么时候毕业,为什么离职,现在工作不好找吧,找工作你会考虑哪些方面12.团队组成是什么样的,工作节奏是怎么样的,小版本发布是固定时间吗13.发布中遇到问题,你们是怎么处理的14.还有什么需要了解吗第三轮没录音,也没问什么问题,只记得问了说笔试题难不难,说是笔试题是根据简历AI生成的
第2套
1、先做个自我介绍2、项目上线了嘛?3、有多少个用户?是对外的嘛?4、里面集成了一些AI的能力是吗?5、AI是你自己搭建的嘛?6、都用了哪些模型?是做了量化的对吧?7、是什么样的一个配置?能达到怎么样的一个并发?8、大模型的并发达到多少?100token?9、大模型的算力?10、大模型的并发量是怎么去计算的呢?11、ToolCalling工具这一块调用的是什么?12、服务是怎么提供工具给到大模型的?(ToolCalling)13、实时数据是怎么给到大模型调用的?(ToolCalling)14、图片模型,文生图,图生文你了解过多少?15、有没有设想过你的文生图是能够做到怎样的?(之前有没有设计过、用在什么场景上)16、你有用过哪些AI工具17、有用Cursor去写代码嘛?18、向量知识库这一块你有深入了解过嘛?用的是哪个向量知识库19、Agent这一块你有了解嘛?20、能不呢说一个具体的你负责的比较核心的,然后有一定的技术栈复杂度的?21、有没有去做Agent的编排?22、有没有了解过define?23、用户在实际使用时,在响应上,在体验上怎么样?响应是实时流的是吗?24、假设100个并发翻10倍呢100倍呢?25、压测的时候怎么知道服务器的瓶颈呢?或者暴露出来的问题呢?26、有做过链路的性能分析这一块嘛?27、现在住在哪里?28、上家公司什么原因离职?29、如果让你接触通讯、石油类的项目,你会有什么想法?30、工作上可以要你紧急配合,你会怎样?(问加班)31、你有什么想问的嘛?32、你之前有带过团队嘛?33、你未来的发展方向呢?要成为技术的leader?走管理方向?带带团队?
第3套
1、自我介绍2、Javajdk1.8jvm组成3.平时有遇到jvm调优吗4.CPU飙增,k8s该怎么解决5、你对于这个方面解决的思路是怎么样的6、你觉得这个CPU陡增是因为什么原因导致的呢7、除了你前面说的这些,还有什么情况吗8、流量激增该怎么解决9、如果是用户量上来了,你怎么解决10、Java你有用到反射的应用吗11、你平时有用反射来做一些自定义的东西吗12、多线程的参数,以及你在项目中用到的解决多线程的问题13、你有用到线程池解决什么问题呢14、为什么不追加消费者15.多线程你了解16.线程和进程的区别17.http握手的过程18.在线聊天wobsecket,通道断了,降级策略19、有理解什么是长轮询和短轮询20、你有没有哪个项目数据量是比较大的,是多少21、假设你的订单表每天都是上千万的,你会怎么处理22、那你怎么解决条件查询这个问题23、你是根据ID分表的,假设我要查询某个人的订单,你是怎么查询的24、你说es存储每天上千万数据,那你为什么还要分表呢25、你说一下数据库索引失效的场景26、假设索引匹配了,最左匹配原则也遵守了,但数据库依旧没走索引,是为什么呢27、有没有了解过区分度的概念28、你这有做到ai智能问答,你是怎么多到自然语言识别的29、你能讲一下你最近这个项目的整体架构吗30、你的知识来源是怎么来的31、你是怎么切割那些文档的32、你的es向量知识库是自己搭的吗33、你怎么解决数据量大要存入向量知识库的问题的34、你搭了es向量知识库之后是怎么测评的,怎么定义回答的是满意的35、匹配度怎么计算,可以量化吗36、你的意图识别层是怎么做的37、你的意图识别层从软件架构方面来讲是怎么设计的38、那你们意图识别的准确率怎么评测39、你有没有听过aicoding的模式40、你有没有试过输入一个需求文档,后面的编写,测试,到落地都让ai来做41、如果要做这个事情,你有什么思路42、你有什么想要问的吗
第4套
(非外包,想招个能带团队做AI的) (没有问八股和业务)1、自我介绍2、详细了解一下项目3、这个模块是你负责的还是只完成了一部分?4、中间有搭载其它中间模块吗?5、有建立自己的知识库吗?6、那你们现阶段是直接调用commit那个ollama大模型吗?7、智能商品推荐这块,没太听清。8、怎么拆解让AI知道推荐哪个商品给你9、之前公司在重庆10、前端开发有接触吗11、项目周期半年左右,是做外包还是自研?12、之前有带过团队吗? 团队组成怎么样的13、如果让你带团队能负责吗?14、假设你本身是一个管理者的话,开发进度滞后了,甲方又频繁变更需求,怎么处理?15、怎么看待加班呢?是自愿加班吗?16、如果项目你作为负责人,你自身要开发,还要带领团队开发,怎么协调?17、之前的团队怎么样?18、这边你还有什么想了解的吗?
第5套
1.自我介绍2.springai在你的项目怎么用的3.大模型准确率,并发率是多少4.说说你对langchain4j的了解5.面试官介绍langchain的好处,自己家在用langchain6.springai很多bug你怎么解决7.大文件导出到Excel具体怎么做8.你3年做了那么多项目吗?9.说说你项目的难点、亮点,技术栈用了什么来解决什么问题
第6套
1.自我介绍2.比较有亮点的模块?讲ai了3.怎么去验证或者标准去达到商用?4.知识库的来源?5.你刚刚说的命中率,怎么构建向量的?讲一个具体的例子6.关于用户的存储没有高频问题?上下文?7.文本量可控吗?是怎么样的?项目上线了,8.有其他项目9.线上故障排查10.你刚刚说大文件导入导出导致oom怎么解决的?11.多久会版本迭代?12.平常的开发的流程是怎么样的?13.java场景题:投放广告,传入广告素材:图片,视频加一些H5素材,在抖音也会看到,点击进去可以看到广告商落地页,此时用户提交资料,购买,锁单;对于用户我们也会做风控判定(手机号),手机号黑名单库我们有1000w级别,用户请求量是100w级别,这时候想快速得到用户是否是黑名单,在200ms,怎么实现14.你刚刚的那个误判是怎么解决的15.离职原因?16.你有什么想问的?
第7套

  1. 自我介绍2. rag的原理是怎样的3. 说下为什么用混合检索4. ai的片段不对时,你是怎么去调优的5. 还有其他的ai使用案例呢6. 说一下java中的并发7. 公平锁怎么实现8. 说一下java代码里怎么实现乐观锁9. spring里怎么解决循环依赖的10. 事物在spring中怎么使用,还有事务失效的场景11. mysql怎么实现主从架构12. 说一下你对redis的高可用的理解13. redis分片时,键是怎么设计的14. 你有主导过功能到上线吗15. 说一下之前做的功能(从开头到上线)16. 预约挂号redis怎么同步到数据库的17. 消息幂等性你是怎么解决的18. 数据库里的字段不能做唯一标识,你怎么优化19. 后台管理系统,一个用户有很多角色,你怎么设计这个系统20. 你有什么问题
    第8套
    1.自我介绍2.你觉得微服务项目和单体项目的区别3.你在使用微服务的时候为什么选择spring cloud alibaba4.你还使用了什么其他的阿里的组件5.你可以自己实现一个分布式锁吗6.redission锁的主要目的是什么?7.你在哪些业务上用了redission分布式锁,做了哪些事情8.这个优惠券超领问题除了使用redission分布式锁来解决,还有其他方式吗?9.悲观锁和乐观锁的区别和原理10.你在哪个业务中有用到sync呢11.你这个购物车的数据存在哪12你能讲一下你这个购物车的前后端执行流程吗13.你对cookie了解吗14.你会前端吗15.你对js,css了解吗16.你对jvm,进程这些熟吗17,jvm的内存模型18.一个方法的运行,它会分配到哪些区,开辟了哪些空间,做了哪些操作19.你处理过一些生产故障吗20.如果浏览器白屏了,你会怎么判断和处理21.前端发请求,到后端没响应,怎么办22.事务这块了解吗23.我看你对ai好像有经验,你是这么做的,自己学的吗24.用的它的apikey是吧,那你们做了什么封装呢,25.你们这个除了对接大模型,自己还做了什么事情?26.你这个项目上线了吗,有多少用户27.你还有什么要问我的吗
    第9套
    1.自我介绍2.从前端来一个请求到后端,你中间会经历哪些环节,以及中间件,包括网关,包括因为你是微服务架构,讲一下里面的细节3.微服务架构里面,一个服务一个机器,他是有多个节点,你是怎么知道他是在哪一个节点,哪一个环节。4.怎么做服务发现呢?5.接口安全有没有一些思考和使用呢?怎么保证接口安全,比如说防刷、防篡改、防重放(不知道这个词对不对)?6.没接触过线屏(线程屏蔽?)吗?7.你觉得你做的成就感最高的一个项目是哪一个?8.你的输入和输出是什么?(AI智能体对话)9.有没有一些实际的案例,我想知道你一个真实的用户,他在你们这个AI里面会输入什么问题。最后返回给用户10.中间的环节,就是怎么从文本到最后返回用户想要的结果。11.这个系统搭建下来你遇到了哪些困难?12.为什么选择用ollama直接搭建呢,你直接搭建肯定没有开源模型强啊13.为什么ollama会更好一点,你会对模型做精调吗?14.那你最后部署的是什么模型呢?15.你的知识库怎么连接的呢,你的知识库的外挂的,它是怎么做分片呢?你的知识库的数据是什么样的,是纯文本的吗?还是怎么样的呢?16.那你里面有图片的,那它的图片是怎么做的呢?它是怎么交给大模型的呢?17.你怎么评价你这个大模型的效果,用户输入了我想要。。。的文本,你怎么评判这样的效果呢?评价的指标是什么呢?18.如果你是端到端的评价,那是很难去迭代的,那你们是怎么去进行处理的?19.你刚刚有提到关键词,那关键词有没有命中率啊?20.那你觉得你从中学到了什么?(任何角度)21.整个SpringAI这个,你主要负责哪个模块?22.RAG外挂知识库,整个实现的流程?
    第10套
    1.自我介绍2.工作项目哪个比较有挑战性,除了ai智能体,因为之做了几个月3.签到要做补签怎么做4.怎么去检查redis跟MySQL是否同步,有没有用到事务追踪5.联合索引a,b,c,单独查找a或b或c会不会命中索引6.缓存三剑客7.有没有做限流,如果不用中间件怎么做限流的策略,编码层面来解决8.nginx怎么做限流策略9.springcloud怎么做配置,哪些参数需要做配置10.mcp服务用在哪里,服务有几个mcp,mcp调用写的是客户端还是服务端11.rag知识库增强的原理,es有算置信度吗12.物联网连接除了用到mqtt协议,还有了解其他的协议了吗13.之前公司加班严重吗,这边项目蛮赶的14.有带过团队,主导项目吗15.有攻克过什么关键技术吗(提了嘴ai项目被说其实也没有做的很深),是怎么去了解这些技术的16.讲一下线程安全,除了加锁还有什么方法线程安全,threadlocal有了解吗17.hashmap和hashtable的区别18.hashmap初始容量是多少,为什么是16个19.MySQL有几种锁,事务隔离级别20.不靠修改事务隔离级别,在代码层面上怎么解决脏读21讲一下jvm22.平常说的gc有哪两种23.创建一个方法,创建实例化一个对象,对象存在堆还是栈,什么时候会释放掉这个内存24.用最多的排序是哪几个,冒泡的原理,排序了几遍,快排有用过吗25.seata有什么模式,tcc用过吗26.解释下CAP,你们是cp还是ap,知道nacos可以设置ap和cp吗。27.你怎么理解现在的互联网,有了解我们岗位是做什么的吗28.上一家公司工作环境怎么样,随便谈谈29.给你offer最想从我们公司得到的是什么,除了物质上的,技术上的30.未来职业发展规划31.有什么想问的,离职原因
    第11套
    1.自我介绍2.你在上个项目主要是一个怎么样的角色3.你的团队都有些什么人4.你们有用到网上开源的商城来做的吗5.你有做过一些前端项目6.你用过什么ai工具7.cursor怎么个厉害法8.你用的时候有觉得不好用的时候吗9.你有没有写着写着就失控了10.你是用的agent的吗,会不会写着写着会失控,11. 你之前有做过前端的工作吗12. 你们团队有测试吗13.那你自己学习的时候有学过前端框架吗14.数据库除了MySQL还有接触一些其他的吗15.有用过mongoDB吗16.MySQL和Oracle这些有时候不一样,你有做过了解吗17.你平时关注it的哪一方面的信息18.说一下你的智能体模块19.rag用的哪个产品,是用的哪个开源的还是怎么样?20.你们部署的时候使用什么样的硬件部署啊?21.你这个基于rag的编程有了解吗22.你知道结合ai编程工具和rag怎么用吗23.你们公司沟通平时是怎么沟通的,有和客户沟通的机会吗24.你们做项目之前,需求是怎么理解的25.你们的开发周期是怎么样的,有没有周会、日会这样的。
    第12套
    1、自我介绍2、用了什么SpringAI组件3、讲一下智能体模块4、用的什么平台5、搭在自己的服务上吗6、hashmap底层结构7、hashmap扩容机制8、链表什么情况转红黑树9、什么情况下用linkedlist和arraylist10、上边两个有什么区别11、索引失效12、数据库事务四大特性13、Mysql默认隔离级别14、线程池的作用15、介绍一个你熟悉的项目16、开发团队人员构成17、讲一下优惠券18、还有什么比较大的技术挑战19、AI智能体主要解决什么问题20、搭建平台是你主要负责吗21、用过deepseek吗22、用千问需要token计费吗23、服务器什么配置24、docker用过吗25、日常开发中的开发规范26、日常开发接口性能优化27、项目最大的数据量是多少28、订单表数据越来越多,用到分库分表吗
    第13套
    1、自我介绍2、这个项目是做个自己用的还是企业运营的?3、AI做的是那一块?4、RAG用的框架是哪一个?5、这个项目大概多少人做?6、你参与AI模块,你自己做了哪些功能?7、Toolcalling和API这一块你是怎么来搭建的?8、你们做私有化部署时候你们的配置是怎样的?(我部署的是通义千问)9、(继上一个问题)那你这边是参与了调用而已?10、你们知识库里面的知识是通过什么途径引入进去的?怎么去维护的?11、那你A客服模块这一块是怎么做的?12、AI是如何来跟踪与患者的对话的?(下一次对话,如何记忆上一次的内容呢?)(这里的程序是怎么设计编写的?)13、这个系统有没有上线在用?14、目前用户量有多少?15、简历上后面那两个项目也是在上一家公司的?16、你在做这个项目,比较有技术挑战性的是哪一方面?17、为什么要用Lua脚本来保持你并发的原子性呢?目的是啥?直接用java代码去调用lua脚本?18、你高并发可以用程序锁来解决抢号的问题啊,为什么要用lua脚本?19、你对我们公司的业务有么有做过了解?20、你们的知识库是自己推进去的吗?没有去做UI端维护之类的?21、你们有没有做个那种大一点的,企业级别的知识库?22、你介绍下SpringAI?目前我们公司还没有这个23、你们是怎么来应用SpringAI的?24、其他的你还想有什么要了解的吗?
    第14套
    分布式系统与并发 你对分布式锁熟悉吗?除了Redis锁,还了解哪些? 在什么场景下会选择使用哪种锁? 在一个大数据量异步复制的场景下,你会选择什么锁? 如果使用Redis锁,在主从切换时发生丢锁问题怎么办? 在需要保证强一致性(如复制银行账户或身份信息)的大数据量复制场景下,你会选择什么锁? 之前有用过Zookeeper锁吗? 如何保证后端接口的幂等性? 如何保证你用来实现幂等性的ID是唯一的?跨系统时如何保证? 有用过分布式事务吗?在这个场景里要如何保证数据一致性?数据库 你对数据库锁(DB锁)熟悉吗? 在之前提到的大数据量复制场景中,如果用数据库锁(DB锁)应如何实现? 使用数据库行锁进行大数据量复制时,如何解决可能出现的死锁和性能下降问题? 当系统并发数超过1000导致性能问题时,你会如何优化你的设计? 如果因为资源和复杂度限制,不能采用分库分表的方案,还有其他方法吗? 如果引入Redis作为缓存,如何保证它和数据库的数据一致性?特别是如何保证强一致性? 如果通过数据库设计幂等表,这个表该如何设计? 使用版本号的方案如何保证唯一性约束? 在使用数据库做幂等处理时,如何处理业务执行超时的情况?AI大模型 项目中提到的AI模型是如何部署的?硬件配置是怎样的? 你是如何量化评估一个模型效果不好的?你们的评估体系是怎样的? 为什么选择使用Ollama而不是VLLM来部署模型? 你是否了解Ollama和VLLM在部署模型时的性能差距? 在多轮对话中,如何保证模型能够准确识别用户的意图? “预约挂号”、“病症分析”和“化验单分析”这三个场景为什么不设计成不同的入口,而是要合并在一起?请分析拆开与合并各自的优劣势。 你们的算力设备(A100显卡)在运行时,负载和显存占用大概是多少? 线上环境一共运行了几个模型? 模型是跑在一张卡还是两张卡上?如何配置Ollama在两张卡上运行模型? AI这部分工作是你主要负责的吗?项目架构与流程 请画一下“小精灵宠物医院”这个项目的架构图。 这个智慧医疗平台是SaaS服务吗?是给一家医院使用吗? 平台的整体数据量有多大? 为什么要进行分库分表? 请介绍一下你们项目的工作流程(从需求接收到发布)。 项目一共有几套环境?分别是怎样部署的? 你们使用什么软件进行项目管理?个人背景与职业规划 你毕业的院校(烟台南山学院)是什么性质的学校? 你目前是在职还是已经离职?离职原因是什么? “小精灵宠物医院”这个项目开发了很久,是你入职后一直在做吗? 这个项目团队有多少人? 你上一家公司(旭和科技)是做什么性质的?团队规模多大? 从上上一家公司(四项联创)跳槽的原因是什么? 你在旭和科技的薪资待遇是怎样的?公积金如何缴纳?
相关文章
|
13天前
|
数据采集 人工智能 安全
|
8天前
|
编解码 人工智能 自然语言处理
⚽阿里云百炼通义万相 2.6 视频生成玩法手册
通义万相Wan 2.6是全球首个支持角色扮演的AI视频生成模型,可基于参考视频形象与音色生成多角色合拍、多镜头叙事的15秒长视频,实现声画同步、智能分镜,适用于影视创作、营销展示等场景。
644 4
|
8天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
348 164
|
7天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
359 155