强化学习曾小健-CSDN博客

原创北大麻将源码 /mahjong-rl/model_pool.py 用 FIFO 策略管理模型，利用共享内存实现跨进程通信和数据共享，适用于分布式或并行环境下的模型参数管理。

服务端 (：管理模型的存储和共享内存的分配。客户端 (：通过共享内存获取模型的元信息或加载模型参数。模型池采用FIFO策略管理模型，利用共享内存实现跨进程通信和数据共享，适用于分布式或并行环境下的模型参数管理。

2024-12-31 23:37:37 1131

原创 RICAI -A Review of Mahjong AI Research 论文麻将AI论文

由Mizukami N（2015）提出，使用逻辑回归构建对手预测模型，预测对手是否快赢、胜利牌和支付点数。该模型的基础是为后续研究奠定了基础，并且在防守方面表现良好。然而，该模型在攻击性方面存在不足，因为它没有考虑玩家得分对选择动作的影响。

2024-12-30 14:43:15 918

原创我叫曾小健，开发第一线：新Windows与开发环境：大模型LLM/量化 Win-Mac统一快捷键体验 win强制关机：shutdown /s /f /t 0

对于开发者用Windows来说，最大的建议就是不要用Windows，既然必须要用，那就来吧！！！

2023-07-24 10:45:24 394

原创 Ubuntu Linux AI大模型开发常用命令 - 更新中包括NVIDIA状态，和安装相关常用软件包，没事就背背 - 背诵创造美好生活

Ubuntu AI大模型开发常用命令 - 更新中包括NVIDIA状态，NVIDIA状态，实时更新：和安装相关常用软件包没事就背背，增加开发效率。

2023-06-21 11:28:05 612

原创用上$20/月的Claude Code，你会觉得Cursor是傻子

再举一个我自己的例子。我最近在研发课程，我一直在尝试，怎么让毫无编程基础的新人，无痛接入海外收单平台creem的订阅支付?同时订阅$20/月的Cursor和$20/月的Claude Code，两者结合。朋友们，这是一个喜大普奔的好消息：Claude 突然偷偷更新，$20/月的Pro套餐，也可以使用Claude Code了。之前没有大范围给人安利，是因为以前必须$100/月和$200/月的套餐才能使用Claude Code，很多朋友舍不得。- 功能全部写完后，它还自己写了单元测试，自己测试通过，才交付给你。

2025-06-05 17:20:21 113

原创纳瓦尔：人生其实只有3个关键选择，你最终会活成什么样，取决于你如何决策

所以不是命运安排你“普通”“平庸”或“痛苦”，是你自己能接受——“也就这样吧”。一段感情走下去，不是因为“非他不可”，而是因为“已经这么久了，也挺合适”。一份工作干了几年，不是因为“我很热爱”，而是因为“也不讨厌，能忍”。住在一个城市十年，不是因为“我很喜欢这里”，而是因为“朋友都在、搬家太麻烦”。Naval没有批评这些选择，而是提醒我们：这些，不是世界强加给你的，是你默认接受的“最低标准”。

2025-06-05 16:12:43 532

原创成长最快的方式是研究赚钱，而不是坚持学习

反观普通家庭的孩子，就像背着房贷学画画的年轻人，你必须先掌握能变现的「生存技能」。但现在是“算法即资本”的时代，还在还困“学习神圣化”的人，注定被时代边缘化。真正的成熟，是让理想扎根在现实的土壤里。著名作家刘墉曾建议年轻人："二十岁时找能学东西的工作，三十岁时找能赚钱的工作，四十岁时找喜欢的工作。生存法则：当每一次失败的交易、每一个客户的拒绝，都是对你的淬炼，让你更懂得如何在现实中立足。在信息的洪流中，唯有把学习视为有设计的“认知投资”，才能真正驾驭时间这匹烈马，驶向财富与价值创造的辽阔天地。

2025-06-05 11:37:39 286

原创重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

由于推理模型的输出长短差异极大，在同样的批大小（batch size）下，RL 训练必须等待批次中最长的输出生成完才能继续进行训练，以及进行下一个批次的数据收集，造成极大 GPU 资源浪费。staleness 表示当采用一个批次的数据进行模型训练时，生成最旧的一条数据的模型版本和当前更新的模型版本之间的版本差（比如，一个批次中最旧的一条数据由 step 1 产生的模型输出，当前模型由 step 5 产生，则该批次 staleness=4）。带有奖励值的轨迹数据会被存入回放缓冲区，等待训练器进行训练。

2025-06-05 11:19:08 749

原创 AI漫画神器！Komiko：草稿秒变漫画，人人都是漫画家！

Komiko 提供免费计划（50 次图像生成，需每日任务赚取“zaps”积分）和付费计划（无水印、商业用途），支持 Web、iOS 和 Android 平台。上传黑白线稿，AI 自动填充色彩，支持参考图像或提示（如“红色头发，漫画风格”）引导颜色和风格选择，生成时间约 5-10 秒。用户上传 2-5 张关键帧图像（如角色不同姿势），AI 自动生成过渡帧，创建流畅动画（最长 10 秒，720p/1080p）。支持多种艺术风格（漫画、动漫、Ghibli 等），保留原始线条质量，减少 80% 手动上色时间。

2025-06-05 11:01:12 674

原创刚刚，图灵奖得主Yoshua Bengio官宣LawZero：保护人类的快乐和努力

他将目前的 AI agent 描述为试图模仿人类和取悦用户的“演员”，并表示 Scientist AI 系统更像是一个“心理学家”，能够理解和预测不良行为。“如果我们拥有一个能治愈癌症的 AI，但另一个版本的 AI 也可能失控，制造出一波又一波的生物武器，杀死数十亿人，那么我认为这是不值得的。“因为我是一名研究人员，所以我的答案是，‘好吧，我要研究这个科学问题，也许我能有所作为’，但其他人可能有不同的答案。的方法，开发一种“设计安全”的人工智能（AI），以发现试图欺骗人类的“流氓”系统。

2025-06-05 10:08:21 652

原创 Github万星开源项目！CAMEL-AI 联合港大推出的通用智能体OWL技术报告公布

对于Infinity-MM数据集，最终文本余弦相似度分数超过SFT阶段相同阈值（0.7）的轨迹标记为“chosen”，低于阈值的标记为“rejected”，最后，共收集1009个过滤后的轨迹对。在此背景下，多智能体系统。在网页浏览、多模态、多种文件类型阅读、推理、编程任务上的性能比较上，Workforce方法始终优于角色扮演和单智能体方法，并且经过OWL训练后，智能体在不同任务上的性能均得到提升。，因为这一阶段能够提升分解策略的质量，超越简单的模仿示范，使得规划智能体能够发展出更复杂的决策能力。

2025-06-04 17:22:02 749

原创娱乐性赌博属于正常文娱活动，不构成犯罪

最高人民法院、最高人民检察院、公安部关于开展集中打击赌博违法犯罪活动专项行动有关工作的通知》：“要严格区分赌博违法犯罪活动与群众正常文娱活动的界限，对不以营利为目的，进行带有少量财物输赢的娱乐活动，以及提供棋牌室等娱乐场所并只收取固定的场所和服务费用的经营行为等，不得以赌博论处。在司法实践中，存在有将小额赌博、麻将馆当作犯罪打击的，在一些线上棋牌中此类案例非常多，此类打击严重混淆了赌博违法犯罪活动与群众正常文娱活动的界限，属于以禁赌为名干扰群众的正常文娱活动。2025年06月03日 12:03。

2025-06-04 17:04:45 509

原创 90年代靠“小霸王”成名，身边有四大门徒，段永平这人有多厉害？

所以凭借着青少年这个群体，小霸王在90年代就做到了年产值几个亿的辉煌战绩，但是这个时候小霸王之父老段不干了，大家要知道老段当时只是一个厂长，他上面还有集团，也就是说老段不是老板，只是一个高级的打工人而已，并且小霸王赚的钱也并不是全归厂子的，厂子只拿20%，有80%他是要拿出来给上边集团的，这时候老段就有点憋屈了，用他自己的话说，那时候的他不快乐不快乐，是因为钱吗？那时候还没有拿银行卡，你就看那一摞子的钱摆了一地，分钱的时候，也是一摞子一摞子的给拿不下的就用报纸裹起来给据说光那天裹钱的报纸就用了十几摞。

2025-06-04 16:34:01 228

原创段永平投资网易全过程

以下文章来源于价值的创造，作者创造价值价值的创造.巴菲特，段永平投资思想的搬运者。学习投资理念，只需要看巴菲特和段永平的东西就行了。关于投资，难道有比他们说得更好的？声明：本文信息来源于网络公开资料，包括但不限于网易招股书，历年财报，段永平网易博客，雪球发言及其公开采访。本文的目标是让读者了解段永平投资网易的全过程并从中学到正确的投资理念。本文作者力求理性客观地还原全过程，尽量只做事实陈述，如无必要不做个人主观分析与推测。1997年丁磊以注册资金50万元人民币创立了网易。一开始靠BBS论坛和免费的个人主页

2025-06-04 16:16:01 722

原创突发！Anthropic闪电断供Windsurf，Claude API五日内全面切断

但可以预见的是，失去了 Claude 核心模型支持的 Windsurf，其对 OpenAI 的战略价值和整合路径，或许都需要重新评估。就在不久前，多家媒体报道称 OpenAI 已同意斥资约 30 亿美元收购 Windsurf，这笔交易若最终敲定，将成为 OpenAI 历史上规模最大的并购案之一，旨在迅速扩大其在 AI 编程应用层的影响力，并获取宝贵的模型交互数据。Anthropic 方面对此给出的官方解释是，公司正在“优先保障与更具可持续性的合作伙伴之间的容量调配，以更好地服务广泛的开发者社群。

2025-06-04 16:06:39 425

原创 Flowith完全开放Neo:重新定义AI创作生产力的革命性突破

原创未来智能与人类2025年05月30日 22:48湖北文章介绍了Neo和Flowith平台的革命性AI技术及其在多个领域的实际应用，详细探讨了这些工具的核心功能、技术突破、应用场景以及未来发展趋势。这些工具通过“无限步骤”、“无限上下文”和“无限工具”等能力重新定义了AI生产力，并展现出在教育、创意产业、企业运营等领域的深远影响。关键点Neo实现了“无限步骤”能力，能够持续执行复杂任务，应用场景包括长篇小说创作、复杂软件开发、市场分析报告等。Neo具备“无限上下文”能力，

2025-06-04 09:25:30 676

原创 Web 开发 AI 就选它？V0复合架构无错误率 93.87% 远超 Claude 4 Opus 单体！

比如，v0-1.0-md 现在用的是 Anthropic 的 Sonnet 3.7，而 v0-1.5-md 用的是 Sonnet 4。开源模型微调倒是灵活点，但目前来看，在 v0 关心的任务上 (尤其是带多模态输入的代码生成)，闭源大模型还是吊打开源模型。新内容生成或者大改动，就靠基础模型了。v0-1.5-lg 虽然比 v0-1.5-md 模型更大，但有时候犯错会更多点，这是 AI 模型规模化常见的取舍。现在市面上的 AI 模型，基本就两种：要么是头部厂商的闭源大模型，要么是第三方托管的开源模型。

2025-06-03 11:09:41 1118

原创深度｜Google首席科学家Jeff Dean最新分享：AI核心壁垒不是参数量，而是系统、算法与部署全链能力，关键在于能否嵌入真实任务流与硬件终端

ZF编辑部2025年06月02日 15:03北京从BERT到Gemini，AI大模型的进化之路像极了一场技术与认知的双螺旋竞速：一边是工程层面对规模、效率和通用性的极限挑战，另一边则是我们对“智能”本质理解的不断刷新。今天，我们正站在这样一个拐点：Transformer 已不再只是一个“架构名词”，而是演化为整个AI生态系统的技术基石；而Gemini，则是Google试图打造“通用操作系统”的最新答卷。它不仅代表了AI能力的集成与重构，更是一次对模型形态、推理硬件、开发体验乃至。

2025-06-03 10:37:17 1326

原创统一视角看待RL从LLM到MLLM再到Agentic AI空间探索中的演进与挑战

在Agent RL领域，也有诸多RL框架、奖励建模、优化策略的创新研究，如近期提出的两级分层优势估计策略GiGPO，以Optimal Tool Calls为目标的OTC-POs等...这里不再赘述，感兴趣的大伙可以关注更多这方面领域的最新研究进展，与VLM一样，相信不同领域下的A(Agentic)LM也有着更多样化、差异化的「CoT」Patterns。这种评估范式隐含着一个值得商榷的前提假设：视觉推理应与文本推理共享相同的认知模式，那么，有没有一种可能，视觉推理的思考模式就应该是不同于文本推理的呢？

2025-06-03 10:21:00 1106

原创 Suno AI API 项目主页github

Suno.ai v3 是一个令人惊叹的 AI 音乐服务，虽然官方还没有开放 API，但我们已经迫不及待的想在某些地方集成它的能力。我们发现有些用户也有类似的需求，所以我们将这个项目开源了，希望你们喜欢。当做一个工具/插件/操作时，你可以把 suno ai 集成到你的 AI Agent 中。suno-api 是一个非官方的开源项目，供初学者学习和研究使用。使用API调用suno.ai的音乐生成AI，并且可以轻松。: 合并音乐，将扩展后的音乐和原始音乐合并。: 在一首音乐的基础上，扩展音乐长度。

2025-06-03 00:17:13 677

原创 Suno.ai v3 Suno API

在 Vercel 仪表板中添加一个环境变量，其中包含第一步中获得的 cookie 的值。虽然官方 API 尚未开放，但我们迫不及待地想将其功能集成到某个地方。我们发现一些用户有类似的需求，所以我们决定开源这个项目，希望你会喜欢它。1.获取你的app.suno.ai账户的cookie。如果您在本地运行此程序，请确保将以下内容添加到您的。如果部署到 Vercel，请。4. 运行 suno-api。5. 使用 Suno API。查看详细的 API 文档。3.配置suno-api。部署到 Vercel。

2025-06-03 00:14:43 365

原创刚刚，AI科学家Zochi在ACL「博士毕业」，Beta测试今日上线

在没有任何任务特定优化的情况下，Zochi 达到了最先进水平，在 80% 的任务上超过了人类表现中位数，并在 50% 的任务中获得奖牌。这使得 Llama-2-7B 仅用 0.0098% 的参数就实现了 93.94% 的 AlpacaEval 胜率，超越了 GPT-3.5-Turbo，并获得了同行的高度评价。在使用基于 NeurIPS 会议指南的自动审稿人进行评估时，Zochi 的论文获得了 8、8 和 7 的高分，均远高于顶级机器学习会议平均录用论文 6 分的接收门槛。

2025-06-01 00:54:36 637

原创在大公司卡在中层？你可能缺了这个能力

他前期调研充分，主动同步信息，解决各方顾虑，逐步获得多方信任，项目最后还被评为总部的协作范例。在最近一次为管理者设计领导力课程的访谈中，几位高管指出：在复杂的矩阵型组织里，中层面临的最大挑战，不是专业能力，也不是业务能力，而是——👉 提醒：不要想当然别人知道自己的境遇，理解自己，而是要转化视角，对齐认知，用对方听得懂到语言说到点上、说出价值、说出对方的痛点。但越是复杂的组织，越需要中层成为“连接上下的中枢”，而不是“命令的搬运工”。从中层到高层，只有专业能力和服务年限，远远不够，想要破圈，就需要——。

2025-05-30 15:58:46 802

原创天工AI杀疯了！一键搞定小说设定/PPT/表格，打工人狂喜！

讲多了担心大家觉得烦，简单讲，就是天工针对我们的日常打工场景，干了一票大的，在文档、ppt、表格、网页、播客、通用模式方面都做了Agent，全都可以一键生成，并且效果很不错，其中文档、ppt、表格这三个Agent更是加入了Deep Research的专家级Agent。帮我生成一个中国不同城市的毛绒绒效果vlog，内容分别是毛绒绒的蓝色领结的小柴犬到北京、上海、成都、深圳、广州等地旅游，并与这些地方的著名景点自拍合照，景点也是毛绒绒的质感，小柴犬表情开心，背景地标建筑明显，配乐轻松欢快有趣。

2025-05-30 12:02:55 807

原创请详细说名大模型并行训练为什么选机器都是2的次方级别？

请详细说名大模型并行训练为什么选机器都是2的次方级别？

2025-05-30 11:58:05 950

原创 10台八块机器具体怎么分块，allreduce过程

项目描述总 GPU10 台 × 8 卡 = 80并行方式切分矩阵乘法、attention 等重型层划分模型层级，流水调度多份数据、多份模型副本，通过 AllReduce 同步梯度通信方式TP/PP 使用 send/recv，DP 使用 AllReduce（NCCL）通信优化建议使用 NCCL + InfiniBand 或 RoCEv2 + NVLink（intra-node）

2025-05-30 11:48:24 644

原创币圈战神：比特币持续震荡，保持震荡思路布局；

1、特朗普总统明天将与埃隆·马斯克举行新闻发布会。“这将是他的最后一天，但并非如此……埃隆太棒了！2、Coinbase即将在美国旧金山重新开设办公室；3、英国改革党领袖奈杰尔·法拉奇 (Nigel Farage)将提出战略比特币储备法案。4、华尔街巨头Cantor Fitzgerald 将推出黄金支持的比特币基金；5、摩根大通：美国现货加密货币 ETF周三资金流入强劲；

2025-05-30 11:25:02 493

原创 AI Agent报告深度：2025Agent元年，AI从L2向L3发展（附下载）

比如，微软的Windows Copilot、谷歌的Vertex AI Agent Builder、百度的文心智能体平台等，都旨在构建强大的生态系统，巩固其在AI Agent领域的地位。比如，法律领域的Harvey AI，金融领域的同花顺、新致软件，医疗领域的润达医疗、卫宁健康等，都在各自的领域内建立了深厚的壁垒。强化学习训练方法的成熟，更是激发了AI与环境交互的潜力，O1、O3等模型在纯文本领域的成功，为多模态Agent的训练提供了范式。技术的进步，如同春风化雨，为Agent的普及创造了条件。

2025-05-30 11:19:57 700

原创一年前市值超越阿里的拼多多，现在只有阿里的一半了

要知道，2024 年四季度，该业务的收入还有 535.99 亿元，较 2023 年同期的人民币 402.054 亿元增长 33%。总的来说，就是在状态不好的情况下，拼多多选择继续补贴商家和顾客，继续维护自己生态的竞争力，一直等到未来情况明朗。，一来拼多多的自营占比非常少，二来拼多多上面的店铺大部分是经销商开的，并不是品牌直营店。拼多多从未对 TEMU 的经营数据做过明确的披露，但市场普遍认为拼多多的出海业务。来讲是无法忽视的。不过，短期影响也是影响，拼多多接下来几个季度的利润表现，搞不好还会很难看。

2025-05-30 11:08:54 674

原创 68岁王东升又干出一个IPO！北京AI芯片独角兽，冲刺“RISC-V第一股”

作为AI时代的重要载体，智能终端正成为赋能便捷生活的核心手段，通过智能感知、人机交互与高效计算，重新定义人与物理世界的交互方式。近年来，RISC-V生态步入快速扩张阶段，谷歌、高通、英伟达等科技公司纷纷支持RISC-V国际基金会统一标准并增强开发工具。这一势头因行业投入力度不断加大，还在进一步增强。奕斯伟计算的系统化研发能力、RISAA开放平台与RDI、「三重复用」商业模式以及创新人才培育体系，使其从竞争中脱颖而出，成为颇具影响力的智能终端及具身智能解决方案提供商。

2025-05-30 10:47:56 965 1

原创 Lovart一手体验，人人都是设计师？

Tammy AI商业科技 2025年05月29日 20:32 广东产品名称：Lovart官网：www.lovart.ai产品定位：世界上第一个专业设计类Agent今天终于有时间体验了Lovart,前段时间被刷屏好久。刚开始写的提示词有点随意，生成的logo几乎没有满意的。然后上传了一些自己喜欢的logo，作为参考，也稍微调整了提示词，最后生成的logo还不错，可以直接拿来用了。对于普通人来说，使用专业Agent，只要能准确地描述出自己的需求就可以了。输入设计需求，Agent将自动完成灵感收集、设计计划、设计

2025-05-30 10:43:14 427

原创 Anthropic CEO 的一个惊人判断

8、为了让大众更好的看到 AI 对就业市场的影响，Anthropic 现在做的一件重要的事情就是发布 AI 经济指数报告，每个月发布一份，来具体详细的追踪企业对 AI 的采用情况，以及哪些岗位受到了影响。6、今年，我曾经写过几篇企业采用 AI 的文章，令人印象深刻的是，很多 CEO 都明确表达了这样的观点：在招人之前，请回答为什么 AI 不能胜任这份工作。2、AI 技术肯定会带来一系列的好处，比如癌症被治愈，经济每年增长 10%，但也有 20% 的人可能还失去工作。在采访里说了一些惊人的判断。

2025-05-30 10:07:34 259

原创什么叫因果语言模型中的下三角注意力矩阵，还有上三角注意力矩阵，这在矩阵乘法和最终的语言模型中有什么具体意义，请详细说明

下三角矩阵用于因果语言模型，确保每个词只能依赖于其之前的词，从而避免未来的信息泄露。上三角矩阵则允许模型在某些应用中访问未来的信息，通常用于非因果模型或双向模型。矩阵乘法中的这些遮蔽矩阵通过控制注意力权重的计算范围，确保模型在训练和推理过程中能够正确地建模输入数据的关系。

2025-05-29 10:51:05 539

原创被贵人追着喂饭的人，都有一个共性：因为你在他的“估值体系”里被严重低估。

这场“投资”看似赌命，实则早有算计：异人血统纯正却处境艰难，吕不韦看中的正是他“低估值高潜力”的特质。但某天你正巧想炖汤，突然发现角落里有个摊主在整理一堆带泥的萝卜，蔫叶子还没摘干净，但根部饱满水灵。他说，自己明明勤奋踏实，甚至主动给领导跑腿打杂，但升职加薪的好事永远轮不上他。后来穆彰阿失势，门生纷纷避嫌，唯独曾国藩照常拜访，还替他在咸丰帝面前周旋。就像上面讲的那件事，实习生不主动，就没人发现他的能力。“贵人运”的玄学，但往深了想，其实是个体差异的必然。“一条鞭法”，顾璘的门生故旧成了他最坚定的支持者。

2025-05-29 10:34:59 416

原创如何发现身边极度聪明的人

聪明人在沟通中一般不会急着表达，而是先听别人怎么说，若是别人说的有道理，他们一般只是点头默许，若是别人说的不够全面，他们只做适当的补充，他们不会急于表现自己。作为普通人，我们想逆天改命，或者让自己过的更好，一定要践行终身学习，终身成长的理念，只有大量的阅读，读的书多了，遇到问题解决的方法自然就有了。就拿减肥来说，若是想减肥，一旦计划制定，就严格按照计划执行，在执行的过程中慢慢调整，使自己的身体适应变化，只要坚持执行，都能达到目的。不读书，眼前就是世界，读书，眼前就是世界，读书和不读书，认知是不一样的。

2025-05-29 10:23:45 262

原创如何判断一个人的认知在你之上？

在舒适区做事，你会有更多的掌控感和安全感，但未必快乐，也有可能无聊。总认为，体面的工作，就应该是，西装革履，写字楼，带咖啡机的办公室。你知道前方艰难，但你愿意尝试不内耗自己，按照自己的节奏来执行。你明知道自己不够强，但你愿意接纳自己的不完美，仍然持续投入；词汇即语言，语言即逻辑。语言的边界，就是你思考的边界。你不是怕失败，而是怕别人看到你失败的样子，尤其是。

2025-05-29 10:19:57 926

原创《教父》：判断一个人的层次高低，不要看他的穿衣打扮，也不要看他的职位高低，而是要看他是否具备这3种“暗能力”

层次的高低，从来不是由西装价格或职位头衔决定。教父维多穿着旧西装，却用冷静、博弈与规则构建了一个帝国。普通人在混乱中发泄情绪，高手在沉默中布局未来；普通人被利益冲昏头脑，智者用利益编织网络；普通人践踏规则求快钱，强者敬畏规则谋长远。正如书中的那句箴言：“一个人只有一种命运。而命运的答案，早在你选择修炼何种“暗能力”时便已写下。

2025-05-29 10:13:29 654

原创对标Claude 4的野心！DeepSeek R1-0528重磅升级 | 长文本+超强编程，中国AI再掀风暴！

DeepSeek的“深夜放大招”风格已成为行业常态，但每次更新都在夯实其技术护城河。从长文本到编程，从开源到性价比，R1-0528的升级不仅是参数堆砌，更是对实际需求的精准回应。中国AI的这场“静悄悄的革命”，正在改写全球大模型竞争格局。

2025-05-29 09:20:17 795

原创蚂蚁开源新RAG框架KAG，可达91%准确率

KAG 可以有效克服传统RAG 向量相似度计算的歧义性和OpenIE 引入的 GraphRAG的噪声问题，支持逻辑推理、多跳事实问答等。OpenIE: 神经开放域信息抽取(Open Information Extraction)，也被称为开放信息抽取，是一种从非结构化文本中提取信息的强大技术。不同于传统的信息抽取方法，OpenIE 不依赖于预定义的领域知识或本体模式，使其具有更广泛的适用性和灵活性。KAG 的核心功能包括：知识与 Chunk 互索引结构，以整合更丰富的上下文文本信息。

2025-05-29 09:14:30 712

原创 0528这一夜，中国AI彻底翻身了：DeepSeek R1让全世界刮目相看 | 深度评测

哎，这个世界变化真的太快了！再保守就要错过更多机会了。后面黄叔会继续深度测评DeepSeek R1，看看什么时候可以用国产大模型把AI编程蓝皮书重写一遍。

2025-05-29 09:11:59 803

【长江证券】水下听风，智领深蓝【发现报告 fxbaogao.com】.pdf

【长江证券】水下听风，智领深蓝【发现报告 fxbaogao.com】

2025-06-04

搜索引擎概览 searchengine

2024-11-19

11个代码生成相关的论文，20241022更新版本-持续更新，包含代码搜索、代码搜索、代码模型survey、代码评论评估、代码评

find . -mindepth 2 -maxdepth 2 -type f -name "*.pdf" | awk -F/ '{print $(NF-1)}' | sort | uniq -c 2 代码或bug分类 1 代码搜索 1 代码生成 1 代码模型survey 1 代码评论评估 5 代码评估与提示

2024-10-22

10篇代码生成的论文，包括代码评估、代码搜索、代码生成、survey、代码或bug分类

题目类型分区摘要精读链接 Comparing large language models and humanprogrammers for generating programming code 代码评估 arxiv 评估七种LLMs在生成编程代码方面的性能，探讨不同提示策略对LLMs编码性能的影响，直接比较LLMs与人类程序员的编程能力，评估LLMs在不同编程语言之间生成和翻译代码的能力，以及考察LLMs的计算效率和从过去错误中学习的能力。 A Comparison of the Effectiveness of ChatGPT andCo-Pilot for Generating Quality Python Code 代码评估会议包括评估ChatGPT和Copilot在解决LeetCode编程问题上的有效性，探讨ChatGPT在接收到反馈后纠正代码的能力，以及其在提高代码质量和性能方面的潜力。 Program Code Generation with Generative AIs 代码评估 MDPI水刊-Algorithms非SCI 比较了人类生成的代码

2024-10-21

Multimodal Representation for Neural Code Search

—Semantic code search is about finding semantically relevant code snippets for a given natural language query. In the state-of-the-art approaches, the semantic similarity between code and query is quantified as the distance of their representation in the shared vector space. In this paper, to improve the vector space, we introduce tree-serialization methods on a simplified form of AST and build the multimodal representation for the code data. We conduct extensive experiments using a single corpu

2024-10-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人