logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型面试必考点:PPO/DPO/GRPO/DAPO算法演进全解析!

最近看大模型方向的秋招面经,发现一个很有意思的现象:面试官们对 PPO、DPO、GRPO、DAPO 简直是“爱不释手”,几乎成了大模型岗的必考题。我去知乎或者翻博客想搞懂这几个“O”的演进关系时,往往一头扎进复杂的数学公式里,看得头皮发麻。为什么我们先有了 PPO,又去卷 DPO,现在怎么又冒出来个 GRPO 和 DAPO?它们到底在解决什么问题?今天我们就来扒一扒大模型偏好对齐(Alignmen

文章图片
#面试#算法#人工智能 +3
一文详尽之SFT(监督微调)!

结语在大模型浪潮初期,我和我的前辈曾经有过一段对话。我:这工作(某个方向的 sft)交给我合适吗,我能胜任吗?前辈:这工作谁都能做。我:那你为啥选我来做?前辈:这不是因为我认识你,跟你熟悉嘛。我:……前辈:你做不做,不做有的是人想做,不行我招个实习生来做。我:我做我做,我当然做。

#人工智能
【干货收藏】AI智能体(Agent)开发全景指南:8大核心技术

AI智能体的自主能力,源于一套严谨的核心工作流。Prompt指令层:作为Agent的“任务导航图”,不仅包含用户的核心需求,还需明确Agent的角色定位(如“专业财务分析师”)、行为边界(如“禁止生成不实数据”)、可调用工具列表(如“Excel数据处理工具”)。一份精准的Prompt能大幅降低Agent的决策偏差,例如为“市场调研Agent”设计Prompt时,需明确调研范围(“2024年中国新能

文章图片
#人工智能#transformer#RAG
COZE应用:3分钟用字节“扣子”打造股票AI分析工作流

今天,我将为大家介绍如何利用字节跳动旗下的AI智能体开发平台“扣子Coze”来打造一个股票分析工作流(workflow),并基于此工作流发布一个股票分析器机器人。首先,让我们明确什么是工作流。Coze扣子的工作流功能允许用户通过直观的可视化界面,将大语言模型、代码块、插件等元素灵活组合,编织成复杂且高效的工作流程,从而扩展大模型的应用场景。在这个特定的股票分析工作流中,我们的目标是让用户输入股票名

文章图片
#人工智能#AI
小白都能看懂,deepseek本地部署教程

日志查看端口冲突OLLAMA_HOST=0.0.0.0:11435 ollama serve # 指定新端口。

文章图片
#人工智能#RAG#AI
DeepSeek+dify知识库,查询数据库的两种方式(api+直连)

一直有小伙伴介绍在问我,怎么让在个ai应用客户端直接连接数据库查询。dify官方没有现成的组件可以直接用。当时我想的是两种方式,一种是基于代码执行模块直接查询数据库,一种是基于Http请求,调用自己封装接口来查询数据库。想干这事之前先梳理下流程让kimi给我生成一个文章表,并且插入10条数据,我们可以告诉kimi,文章长度多大,这样内容可以丰富些。直接让kimi生成一个暴露接口查数据库的服务,有简

文章图片
#知识图谱#人工智能
手把手教会你搭建属于自己的智能体

本期为大家介绍如何搭建自己的智能体,本期用到的工具是扣子(Coze),Coze 是一个由字节跳动推出的 AI 开发平台,主要用于快速构建、调试和部署基于人工智能的对话机器人(Bot)和智能体(Agent)。它类似于其他低代码/无代码 AI 平台,但更注重灵活性和扩展性,支持用户通过可视化工具或代码深度定制 AI 应用。

文章图片
#人工智能
分步指南:在VSCode中本地部署DeepSeek,打造强大私密的AI编程助手

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效

文章图片
#vscode#ide#DeepSeek +1
    共 635 条
  • 1
  • 2
  • 3
  • 64
  • 请选择