- 博客(1436)
- 收藏
- 关注
原创 国内首个「混合推理模型」Qwen3深夜开源,盘点它的N种对接方式!
今日凌晨,通义千问团队正式开源了 Qwen3 大模型,并且一口气发布了 8 个型号,其中包括 0.6B、1.7B、4B、8B、14B、32B 以及 30B-A3B 和 235B-A22B,使用者可以根据自己的业务情况,选择合适的版本进行使用。更让人惊喜的是,最新的 Qwen3 系列模型具备,全面满足复杂问题处理与全球化应用需求。PS:Qwen3 也是国内首个「混合推理模型」,「快思考」与「慢思考」集成进同一个模型,对简单需求可低算力「秒回」答案,对复杂问题可多步骤「深度思考」,大大节省算力消耗。
2025-04-29 16:42:52
1191
原创 最火向量数据库Milvus安装使用一条龙!
Milvus 设计之初就是为 AI 而生的一个高效的向量数据库系统,在大多数情况下,Milvus 的性能是其他向量数据库的 2-5 倍,它能实现万亿级向量的毫秒级相似性搜索,而且 Milvus 还是开源的向量数据库。PS:也就说 Milvus 既开源(可以免费使用+支持二次开发)又具备高性能,这样的数据库谁不爱呢?
2025-04-25 16:27:38
581
原创 大模型向量数据库去重的N种实现方案!
Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。定义:向量是用于表示具有大小和方向的量。向量可以在不同的维度空间中定义,最常见的是二维和三维空间中的向量,但理论上也可以有更高维的向量。例如,在二维平面上的一个向量可以写作 (x,y),这里 x 和 y 分别表示该向量沿两个坐标轴方向上的分量;而在三维空间里,则会有一个额外的 z 坐标,即 (x,y,z)。
2025-04-24 11:29:25
405
原创 聊聊SpringAI流式输出的底层实现?
SSE(Server-Sent Events)是一种允许服务器向浏览器或其他客户端推送实时更新的技术。它是一种单向通信机制,服务器可以主动向客户端发送数据,而客户端无需频繁轮询服务器请求数据。SSE 是基于 HTTP 协议的,使用标准的MIME 类型来传输数据。Spring WebFlux 是 Spring Framework 5 引入的响应式 Web 框架,旨在解决高并发场景下传统同步阻塞模型(如 Spring MVC)的性能瓶颈。
2025-04-23 17:04:03
893
原创 被LangChain4j坑惨了!
最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。
2025-04-21 16:01:58
441
原创 超实用!用FunctionCall实现快递AI助手
定义: Function Call(也称为 Tool Call)它允许大模型与一组 API 或工具进行交互,从而增强其功能。也就是说 Function Call 和 RAG、MCP 等类似都是用于增强 AI 能力边界的。
2025-04-17 16:14:26
830
原创 SpringAI版本更新:向量数据库不可用的解决方案!
Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,,Spring AI 将其全部源码删除了。此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。
2025-04-16 16:05:47
653
原创 干货分享!MCP 实现原理,小白也能看懂
不知道大家有没有发现?对于添加到 MCP 服务市场的成千上万个 MCP 服务(而且这个数字每天还在增加),我们可以不写一行代码,轻松实现调用,但背后的原因究竟是啥呢?MCP 虽然用起来很方便,但搞不懂背后的实现原理,总感觉这个知识点还没完全掌握,所以接下来,我们一起来看它的实现原理。
2025-04-11 16:34:27
636
原创 超实用!Prompt程序员使用指南,大模型各角色代码实战案例分享
提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。
2025-04-02 16:50:46
833
原创 SpringAI用嵌入模型操作向量数据库!
嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation,检索增强生成)等应用的技术基础。
2025-04-01 16:36:25
790
原创 必看!SpringAI轻松构建MCP Client-Server架构
MCP 是 Model Context Protocol,模型上下文协议,它是由 Anthropic(Claude 大模型母公司)提出的开放协议,用于大模型连接外部“数据源”的一种协议。是通过 Spring Boot 集成扩展了 MCP 的 Java SDK(开发工具),它同时提供了 Spring Boot 客户端和服务器的启动器,方便使用 Spring AI MCP 快速开发 AI 应用程序。
2025-03-27 12:02:10
4483
5
原创 面试官:工作中优化MySQL的手段有哪些?
MySQL 是面试中必问的模块,而 MySQL 中的优化内容又是常见的面试题,所以本文来看“工作中优化MySQL的手段有哪些?
2025-03-24 15:11:38
646
原创 面试官:谈谈你对Reactor模型的理解?
Reactor 模型是一种,主要用于处理高并发的网络 I/O 请求。其核心思想是通过一个或多个线程监听事件,并将事件分发给相应的处理程序,从而实现高效的并发处理。
2025-03-21 14:54:34
1023
原创 拿下美团实习~
线程编排定义:多线程任务编排指的是对多个线程任务按照一定的逻辑顺序或条件进行组织和安排,以实现协同工作、顺序执行或并行执行的一种机制。
2025-03-18 17:17:51
1009
原创 面试官:你项目是如何保证高可用的?
项目的高可用、高并发和高扩展是当前开发中必须追求的三大目标,因此也是面试中经常被问到的内容,所以我们今天就来看看,如何才能保证项目的高可用性呢?
2025-03-10 11:52:00
748
原创 华为一面:谈谈你对JWT的理解?
JWT(JSON Web Token) 是一种开放标准(RFC 7519),用于在网络应用间安全传输信息,通常用于身份验证和信息交换。其核心特点是通过紧凑且自包含的 JSON 对象传递数据,无需服务端存储会话状态。
2025-03-06 16:48:04
738
原创 面试官:谈谈你对线程池拒绝策略的理解?
Override// 自定义逻辑(如记录日志、持久化任务、重试等)// 保存任务信息// 通知相关负责人// 使用自定义策略。
2025-03-05 10:45:57
855
原创 别再混淆了!JVM内存模型和Java内存模型的本质区别
JVM 内存模型(JVM Memory Model)和 Java 内存模型(Java Memory Model, JMM)是 Java 开发中两个非常重要的概念,但这两个概念很容易被搞混,所以本文就来通俗易懂的讲讲二者的区别。首先,我们先来看看各自的概念,以及其解决的问题。
2025-03-04 10:51:48
309
原创 快收藏!一个技巧从此不再搞混缓存穿透和缓存击穿
在 Redis 中有两个定义:一个缓存击穿、一个缓存穿透,因为二者的名字比较像,因此很容易就搞混了。但本文会给你提供一个记忆的小技巧,帮你彻底区分二者的定义。在讲这个技巧之前,我们先来了解一下二者的区别。1.定义与区别。
2025-02-28 11:45:59
601
原创 面试官:你项目是如何实现读写分离的?
读写分离(Read-Write Splitting)是一种常见的数据库架构优化策略,通过将数据库的读操作(查询)和写操作(插入、更新、删除)分离到不同的数据库实例上,从而。在项目中实现读写分离目前主流的实现技术是通过 Apache ShardingSphere 来实现数据库的读写分离的。
2025-02-26 14:31:48
954
原创 华为薪资和评级对照表!建议收藏
华为每次的招聘都很晚,但同时又是最让人惊喜和期待的 Offer,但很多同学对于华为的评级和薪资颇为不解,所以今天在这里简单的和大家聊聊这个话题。接下来的这个评级和薪资是往年校招的统计数据,非官方信息,大家可以做一个参考。
2025-02-24 15:28:39
1964
原创 面试被问“你的缺点是什么?”该怎么答?
面试时经常被问到“你的缺点是什么?”,这个问题看似很简单,但每次回答都感觉差点意思。如果你也有这样的困惑,那么本篇文章一定要认真看完。
2025-02-20 16:36:30
383
原创 面试官:说说你项目中JWT的执行流程?
JWT(JSON Web Token) 是一种开放标准(RFC 7519),用于在网络应用间安全传输信息,通常用于身份验证和信息交换。其核心特点是通过紧凑且自包含的 JSON 对象传递数据,无需服务端存储会话状态。
2025-02-19 12:37:47
991
原创 面试官:谈谈RabbitMQ的队头阻塞问题?
RabbitMQ 延迟消息的队头阻塞问题是指,在使用死信队列(DLX)和 TTL(消息过期时间)实现延迟消息时,。
2025-02-18 17:13:55
627
原创 干货:DeepSeek+SpringAI实现流式对话!
前面一篇文章我们实现了《炸裂:SpringAI内置DeepSeek啦!》,但是大模型的响应速度通常是很慢的,为了避免用户用户能够耐心等待输出的结果,我们通常会使用流式输出一点点将结果输出给用户。那么问题来了,想要实现流式结果输出,后端和前端要如何配合?后端要使用什么技术实现流式输出呢?
2025-02-13 08:53:34
2613
原创 炸裂:SpringAI内置DeepSeek啦!
Spring AI 是 Spring 生态系统中的一个重要项目,旨在将人工智能集成到 Spring 应用程序中,它为 Java 开发者提供了一种便捷的方式来构建、管理和部署 AI 模型。Spring AI 的核心是解决了 Spring 生态和 AI 的快速集成:将您的企业数据和****API与AI 模型连接起来。Spring AI 几乎支持所有主流的 AI 模型提供商,例如 Anthropic、OpenAI、Microsoft、Amazon、Google 和 Ollama。聊天嵌入附件文本转图片。
2025-02-12 16:08:36
1330
原创 普通人也能轻松掌握的20个DeepSeek高频提示词(2025版)
其中包含的内容有:DeepSeek、场景题、并发编程、MySQL、Redis、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、JVM、设计模式、消息队列等模块。“把本周完成的[具体工作]转化为周报,按[成果数据]-[突破点]-[行业对标]结构,每部分用emoji标注重点,最后用三句话提炼部门价值”。“给25岁女生推荐防晒霜,结合海岛旅游场景,用闺蜜安利语气,带🧴🌊⛱️表情,突出防水性能和补涂技巧,最后埋个价格悬念”。本文已收录到我的面试小站。
2025-02-11 16:56:05
698
原创 1分钟学会DeepSeek本地部署,小白也能搞定!
模型参数规模典型用途CPU 建议GPU 建议内存建议 (RAM)磁盘空间建议适用场景1.5b (15亿)小型推理、轻量级任务4核以上 (Intel i5 / AMD Ryzen 5)可选,入门级 GPU (如 NVIDIA GTX 1650, 4GB 显存)8GB10GB 以上 SSD小型 NLP 任务、文本生成、简单分类7b (70亿)中等推理、通用任务6核以上 (Intel i7 / AMD Ryzen 7)
2025-02-08 19:45:30
1026
转载 面试官:说说OpenFeign的实现原理?
面试题大全:www.javacn.site大家好,我是磊哥。今天来看一下,OpenFeign的实现原理~一、理解远程调用远程调用怎么理解呢?远程调用和本地调用是相对的,那我们先说本地调用更好理解些,本地调用就是同一个 Service 里面的方法 A 调用方法 B。那远程调用就是不同 Service 之间的方法调用。Service 级的方法调用,就是我们自己构造请求 URL和请求参数,就可以发起远程...
2024-06-16 11:08:28
575
转载 面试官:说说Spring事务传播机制?
面试题大全:www.javacn.siteSpring 事务传播机制是指,包含多个事务的方法在相互调用时,事务是如何在这些方法间传播的。既然是“事务传播”,所以事务的数量应该在两个或两个以上,Spring 事务传播机制的诞生是为了规定多个事务在传播过程中的行为的。比如方法 A 开启了事务,而在执行过程中又调用了开启事务的 B 方法,那么 B 方法的事务是应该加入到 A 事务当中呢?还是两个事务相互...
2024-06-15 11:32:05
194
原创 字节面试:MySQL自增ID用完会怎样?
面试题大全:www.javacn.site在一些中小型项目开发中,我们通常会使用自增 ID 来作为主键的生成策略,但随着时间的推移,数据库的信息也会越来越多,尤其是使用自增 ID 作为日志表的主键生成策略时,可能很快就会遇到 ID 被用完的情况,那么如果发生了这种情况,MySQL 又会怎样执行呢?“PS:当然,在分库分表的场景中,我们通常会使用雪花算法来替代自增 ID,但中小型项目开发中,使用自增...
2024-06-14 08:30:15
1064
原创 面试官:谈谈对SpringAI的理解?
面试题大全:www.javacn.siteSpring AI 已经发布了好长时间了,目前已经更新到 1.0 版本了,所以身为 Java 程序员的你,如果还对 Spring AI 一点都不了解的话,那就有点太落伍了。言归正传,那什么是 Spring AI?如何快速进行 Spring AI 开发呢?1.什么是Spring AI?Spring AI 是 Spring 官方社区项目,旨在简化 Java A...
2024-06-13 08:00:12
1049
原创 网易面试:SpringBoot如何开启虚拟线程?
面试题大全:www.javacn.site虚拟线程(Virtual Thread)也称协程或纤程,是一种轻量级的线程实现,与传统的线程以及操作系统级别的线程(也称为平台线程)相比,它的创建开销更小、资源利用率更高,是 Java 并发编程领域的一项重要创新。“PS:虚拟线程正式发布于 Java 长期支持版(Long Term Suort,LTS)Java 21(也就是 JDK 21)。虚拟线程是一种...
2024-06-12 08:08:30
506
原创 百度面试:如何用Redis实现限流?
面试题大全:www.javacn.site高并发系统有三大特征:限流、缓存和熔断,所以限流已经成为当下系统开发中必备的功能了。那么,什么是限流?如何实现限流?使用 Redis 能不能实现限流?接下来我们一起来看。1.什么是限流?“限流是指在各种应用场景中,通过技术和策略手段对数据流量、请求频率或资源消耗进行有计划的限制,以避免系统负载过高、性能下降甚至崩溃的情况发生。限流的目标在于维护系统的稳定性...
2024-06-11 10:01:57
1352
原创 腾讯音乐:什么锁比读写锁性能更高?
面试题大全:www.javacn.site在并发编程中,读写锁 ReentrantReadWriteLock 的性能已经算是比较高的了,因为它将悲观锁的粒度分的更细,在它里面有读锁和写锁,当所有操作为读操作时,并发线程是可以共享读锁同时运行的,这样就无需排队执行了,所以执行效率也就更高。那么问题来了,有没有比读写锁 ReentrantReadWriteLock 性能更高的锁呢?答案是有的,在 Ja...
2024-06-10 15:29:36
812
原创 美团面试:说说Netty的零拷贝技术?
面试题大全:www.javacn.site零拷贝技术(Zero-Copy)是一个大家耳熟能详的技术名词了,它主要用于提升 IO(Input & Output)的传输性能。那么问题来了,为什么零拷贝技术能提升 IO 性能?1.零拷贝技术和性能在传统的 IO 操作中,当我们需要读取并传输数据时,我们需要在用户态(用户空间)和内核态(内核空间)中进行数据拷贝,它的执行流程如下:从上述流程我们可以...
2024-06-07 08:08:52
647
原创 高德面试:为什么Map不能插入null?
面试题大全:www.javacn.site在 Java 中,Map 是属于 java.util 包下的一个接口(interface),所以说“为什么 Map 不能插入 null?”这个问题本身问的不严谨。Map 部分类关系图如下:所以,这里面试官其实想问的是:为什么 ConcurrentHashMap 不能插入 null?1.HashMap和ConcurrentHashMap的区别HashMap ...
2024-06-06 08:08:52
822
原创 面试官:说说延迟任务的时间轮调度算法?
面试题大全:www.javacn.site本文继续讨论 Netty 相关的面试题,今天咱们来看一道 Netty 中的高频面试题:说说 Netty 延迟任务的时间轮调度算法?Netty 框架是以性能著称的框架,因此在它的框架中使用了大量提升性能的机制,例如 Netty 用于实现延迟队列的时间轮调度算法就是一个典型的例子。使用时间轮算法可以实现海量任务新增和取消任务的时间度为 O(1),那么什么是时间...
2024-06-05 08:08:49
732
原创 面试官:说说Netty对象池的实现原理?
面试题大全:www.javacn.siteNetty 作为一个高性能的网络通讯框架,它内置了很多恰夺天工的设计,目的都是为了将网络通讯的性能做到极致,其中「对象池技术」也是实现这一目标的重要技术。1.什么是对象池技术?对象池技术是一种重用对象以减少对象创建和销毁带来的开销的方法。在对象池中,只有第一次访问时会创建对象,并将其维护在内存中,当再次需要使用对象时,会直接从对象池中获取对象,并在使用完毕...
2024-06-04 09:00:31
780
原创 拼多多面试:Netty如何解决粘包问题?
面试题大全:www.javacn.site粘包和拆包问题也叫做粘包和半包问题,它是指在数据传输时,接收方未能正常读取到一条完整数据的情况(只读取了部分数据,或多读取到了另一条数据的情况)就叫做粘包或拆包问题。从严格意义上来说,粘包问题和拆包问题属于两个不同的问题,接下来我们分别来看。1.粘包问题粘包问题是指在网络通信中,发送方连续发送的多个小数据包被接收方一次性接收的现象。这可能是因为底层传输层协...
2024-06-03 08:08:49
861
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人