来源 | 十字路口
题图由Siliconcloud平台生成
AI 正在以前所未有的速度重塑各行各业,而站在这场变革最前沿的莫过于 AI 工程师们。
在「十字路口」的最近一期播客中,主播Koji(新世相创始人)与Ronghui(科技VC)两位邀请了两位 AI 领域的杰出人物硅基流动创始人&CEO 袁进辉与独立开发者 idoubi 分享他们对 AI 工程师这个职业的独到见解。从底层技术到应用开发,从大公司到独立创业,他们全方位解析了 AI 工程师的现状与未来、机遇与挑战,以及如何在这个快速变化的领域保持竞争力。
此外,两位嘉宾还分享了他们对 AI 未来发展趋势的预测。他们认为,尽管短期内 AI 工具类应用将迎来爆发,但从长远来看,AI Native 应用才是未来的主流。无论你是已经身在 AI 行业,还是正考虑转型成为 AI 工程师,相信这期内容都会给你带来启发。
1
袁进辉的「过山车」和「十字路口」
Koji:袁老师的职业经历颇具传奇色彩,特别是他在过去一年的经历堪称过山车。很多朋友也非常了解袁老师在国内大模型市场的地位。恐怕没有谁的 2023 年比袁老师更富戏剧性,正如他自己所总结的,这是「一段坐在过山车上的岁月」。2023 年初时,袁老师的上一家公司 OneFlow 估值 1 亿美元,被「光年之外」并购后,新公司一个月估值飙升至 10 亿美元以上。而两个月之后,这个数字又骤降为 0。再过了一个月,袁老师创立了硅基流动,重新开始,天使轮即估值数亿人民币。
袁进辉:回顾过去,最高光的时刻还是在技术上的。虽然从常规意义上来说,OneFlow 被并购时因为社会关注度高可能会被视为高光时刻。
但对我个人而言,最兴奋的时刻是我们做出 OneFlow 并在技术社群产生影响力的时候。特别是当时我们在整个行业最早预见到大模型的发展趋势,并为此做了一些技术准备。尽管很长一段时间内行业内并未形成共识,但当模型规模变大、国内外广泛关注大模型系统架构时,人们发现中国有一家初创企业 OneFlow 已经在这方面做出了成果,甚至 PyTorch 做类似设计时也参考了 OneFlow 的工作。当我们的技术得到认可时,那种感觉确实让人心情舒畅。
至于最彷徨的时刻,可能是去年从光年出来的时候。我们仍然坚信大模型是当今时代最好的机会,但原本手中有非常好的条件,突然间就失去了。那时我们确实感到迷茫,不知该何去何从。不过这种彷徨的状态并没有持续太久。
Koji:彷徨大概持续了多久?
袁进辉:彷徨的时刻持续了一个月。大约在7月,社会上开始知道我们公司面临着是否加入美团的选择。那时许多同事已经收到了其他公司的 offer,我们必须在有限的时间内做出决策,是否要重新创业。我们无法拖延太久,因为每个人手中的 offer 都有期限,其他选择也可能会失效。我们必须在很短的时间内做出一个大多数人都认同的方向。
说得夸张一点,当时我们大多数工程师都拿到了所谓的 3 倍、5 倍, 甚至有人拿到 10 倍薪资的 offer。在那种情况下,对我们每个人来说都是一个巨大的考验和抉择。
Koji:所以在那一个月之内,你就决定要做硅基流动?
袁进辉:在一个月之内,最主要的决定是:我们要继续创业。虽然在光年之外的半年时间里,许多其他公司已经积累了大量资源,而我们又回到了起点,但我们认识到整个行业仍处于非常早期的阶段。
更重要的是,我们这个团队在推理 (inference) 方向的战斗力和能力仍然是整个行业最拔尖的。我们拥有所谓的「杀手锏」或「绝活」,在这个刚刚兴起的巨大浪潮面前,我们仍然有很大的机会。这是我们的基本判断。我们需要思考的重点是如何利用手中的这个「金刚钻」,找到合适的切入点,确保我们能在这个浪潮中坐在牌桌上,并且在未来有更大的发挥空间,这是大前提。在确定了这个方向后,剩下的问题就是找到具体的切入点,完成融资,成立公司等一系列实际问题。
Koji:在我的朋友圈子中,硅基流动的大模型云服务SiliconCloud(http://siliconflow.cn/zh-cn/siliconcloud)自上线以来获得了很高的好感度和口碑。如果今天袁老师要用一句话向所有的 AI 应用开发者来介绍硅基流动,你会用一句什么样的话来安利大家?
袁进辉:我们的目标是让不懂 AI 的开发者也能开发 AI 应用。我们希望能把应用中 AI 相关的部分都帮大家搞定。
Koji:最近新世相用硅基流动的 API 开发了一个名为「AI 遗嘱」的应用。
这个应用旨在鼓励年轻人在 AI 的引导和陪伴下思考死亡,写一份模拟遗嘱。我们希望通过这种方式让大家思考生命中最重要的事物,从而做出更好的选择,过好每一天。
这个程序的开发者是晨然,他过去主要是做产品经理的工作。这是他第一个从零到上线的程序。他表示使用硅基流动的开发速度非常快,甚至说用硅基流动去接 DeepSeek 的 API 速度过快。有趣的是,为了营造一个慢一些、冷静一些、严肃一些的思考氛围,我们还特意降低了 AI 的响应速度,没有让回复和 token 的展示像 API 那么快。他当时感慨道,没想到硅基流动可以把 DeepSeek 已经很快的响应再提升一倍。
2
独立开发者 idoubi 的 AI 之路
Koji:接下来我们来和 idoubi 聊聊。idoubi 是独立开发者圈子里被视为神一样的存在。先简单介绍一下自己作为独立开发者做过哪些项目,以及你自己最喜欢、最引以为豪的项目是哪一个?
idoubi:去年 10 月我从腾讯辞职后,就一直在独立开发的圈子里。最早做的是 GPTs 的应用导航,即第三方应用商店。去年快过年的前三天做了一个 AI 红包封面,这个项目在星巴克花了 1 小时就写好了,却意外地火了一段时间。之后又陆续开发了 其他项目:1 月份做了 AI 壁纸网站,2 月份开发了 AI 音乐播放器,3 月份开源并推出了 AI 搜索引擎,4 月份做了 AI 试衣。
从去年 10 月到今年 5 月,我基本保持每月发布一个新作品的节奏。5 月到 7 月暂停了新项目的发布,主要是因为 AI 搜索项目需要投入大量精力。8 月我又开始做一个新项目AI landing page generator:一键生成网页的落地页,预计不久后会发布。
在我所有的项目中,最印象深刻的有三个:
-
GPTs 导航站:这是我第一次用全栈开发方式做的独立产品。之前在腾讯我主要做后台开发,负责 Go 语言开发、KYS、集群架构等。
-
AI 红包封面:这是一个意外成功的项目。在星巴克仅用一小时就完成了开发,却获得了很高的热度,给了我很大信心。从这个项目开始,我在即刻圈、Twitter 等平台上的知名度慢慢积累起来。
-
AI 搜索引擎 ThinkAny:这可能是大家最熟知的项目。很多人惊讶于一个人就做出了 AI 搜索引擎。这个项目也为我带来了许多以前没有的体验。
Koji:所以就是在你做独立开发之后,做的项目又快又多,而且看上去是完全不可能完成的任务?一个人做了一个AI搜索引擎,那在你的这个开发过程当中,AI帮上了多大的忙呢?
idoubi:我发现 AI 确实在开发过程中提供了很大帮助。以实现音乐播放器为例,之前如果要开发类似网易云音乐的播放器组件,没有 AI 辅助可能需要花费很长时间。但是借助 AI,只需告诉它我需要实现一个具有三种切换模式的播放组件,不到 1 小时就能完成开发。
我认为 AI 最大的优势在于它有一些标准化的东西,像音乐播放器这样的组件是有标准答案的,通过 AI 辅助可以极大提高编码和实现速度。
Koji:我的背景是计算机专业,在北航读完本科和研究生后,一直从事产品经理工作,已经有十年没写代码了。最近 Claude 这个工具的出现给了我一个需求。我一直在为十字路口公众号排版的问题困扰——交给他人排版后总是不满意,需要花大量时间调整,但不调整又觉得无法发布。
有一天我突发奇想,决定用 Claude 帮我写一个排版器。令人惊喜的是,只用了不到 10 分钟就完成了。现在十字路口公众号每篇文章的排版非常统一,而且效率极高——只要我在 Notion 里把格式写好,5 秒钟就能完成一篇公众号的排版。
那一天,就那一刻,我感觉自己插上了代码的翅膀,过去学习的计算机专业知识仿佛复活了。虽然之前因为缺乏细节技巧而不会写代码,但程序思维一直存在于我的脑海中。作为产品经理,我最擅长的就是下指令写需求文档。现在我可以直接将这些需求文档交给 AI。
当我第一次尝试时,代码如行云流水般在屏幕上呈现,即使在配置 Python 开发环境时遇到困难,AI 也能给出详尽到令人惊叹的指导。
3
AI 工程师的分类
Koji:我们开始来聊一聊当我们在聊 AI 工程师的时候,我们究竟在聊些什么。AI 工程师好像并不是一个有明确定义的职业,我们说到 AI 工程师的时候,往往是一个非常宽泛的一个含义和指向。请袁老师来给我们讲一讲,现在的 AI 公司里面有哪几类典型的 AI 工程师?
袁进辉:我的理解是,我们可以说和 AI 相关的工程师都叫 AI 工程师。其中,我较为熟悉的是专注于产出 AI 技术的这一类工程师。关于如何使用 AI 的工程师,idoubi 更有发言权。接下来,我将主要讨论如何产出 AI 技术的工程师。
在 AI 能力的生产过程中,主要有两类工程师: 算法工程师和系统工程师。
-
算法工程师专注于提升 AI 的效果。例如提高语音识别的准确度、改进图像识别的精确性、生成更清晰且符合需求的图片等。他们的目标是提高模型的智能水平和准确率。
-
系统工程师 ( infrastructure 工程师) 则致力于提升 AI 的效率。即使模型效果已经不错,如果计算过程过慢,可能会导致成本过高或用户体验欠佳。他们的工作是在保证模型准确率不受影响的前提下,让 AI 在底层算力或芯片上运行得更快、规模更大。
系统工程师的工作还包括优化模型的训练过程,使其更快、更稳定、规模更大。比如,他们需要解决如何将模型扩展到数百甚至上万张 GPU 上的问题。此外,他们还负责模型的线上部署,确保在高负载 (如每日活跃用户数达到几千万) 的情况下,推理速度仍然很快。
总的来说,算法工程师负责 AI 能力的质量,而系统工程师则负责 AI 能力的效率和规模。在算法工程师这个大类下,还有许多细分的专业方向,一会儿可以补充一下。
在 AI 能力生产出来并应用到端上或云端后,又衍生出一些新的工种。
比如 Prompt 工程师,我们在研究如何设计更优质的提示词,让大模型更好地理解并满足我们的需求。为了解决模型的「幻觉」问题,我们开始使用检索增强生成(RAG)技术,这也催生了新的工作岗位。以及还有 Agent 和 Workflow 的概念,需要专门的工程师来搭建这些应用开发框架。像 Dify 和 Coze 这样的项目,其开发者我们通常称为 Infra 工程师。
Infra 工程师的工作范畴正在不断扩大。最初,他们可能专注于如何在 GPU 上高效实现 Transformer 等深度学习模型。现在,他们的工作已经延伸到开发各种应用框架,让模型能力更易于使用。比如,他们开发了各种 Workflow,涵盖了文生图领域,还有 ComfyUI、SD Web UI 等工具的开发。这些都属于系统工程师或 Infra 工程师的工作范畴。
再往上一层,就是如何应用这些 AI 能力来开发具体的应用和产品了。这方面 idoubi 最为熟悉,也许我们可以请他来详细讲解一下。
4
AI 工程师的职业发展
idoubi:在 AI 应用开发领域,我主要专注于上层应用这一块。让我用一个实际例子来说明如何开发一个 AI 应用。
最简单的 AI 应用,比如像 「哄哄模拟器」这种,可以被称为零代码 AI 应用。它们通常基于 Coze 或Dify 等平台,或者之前使用的一些智能体,通过嵌入一段提示词来实现功能。这些应用会在接收用户输入后,与模型进行多轮交互,最终产生结果。这是最基础的一层应用。
要开发一个 AI 应用,首要任务是设计一套优质的提示词。在过去一年多里,提示词工程已经发展成为一个专门的领域,甚至形成了类似方法论的体系。这些方法告诉我们如何写出更好的提示词,比如使用 「总-分-总」结构