步子哥-CSDN博客

原创探索代码的魔法：从一行指令到智能世界的构建

在数字时代的浪潮中，代码如同魔法咒语，驱动着从手机屏幕到星际探测器的万物互联。一行简单的指令，如何演变为改变世界的智能系统？让我们跟随 OpenHands 的脚步，走进代码的奇幻世界，揭开它如何以开源之力点燃创新的火花。

2025-05-03 21:32:30 562

原创数学的魔法阶梯：DeepSeek-Prover-V2如何点亮定理证明的星空

DeepSeek-Prover-V2不仅是一款模型，更是一场数学与人工智能的交响乐。它通过递归子目标分解、冷启动数据合成、强化学习、课程学习和双模态证明设计，将自然语言的直觉与形式化证明的严谨性融为一体。无论是MiniF2F的88.9%通过率，还是PutnamBench的49个解决题目，亦或是ProverBench的6个AIME问题，这款模型都在向我们展示：AI不仅能“计算”，还能“思考”。就像伽利略用望远镜发现了木星的卫星，DeepSeek-Prover-V2为我们打开了一扇通往数学新世界的大门。

2025-05-02 04:18:25 447 1

原创 AI 数学家的诞生：DeepSeek-Prover-V2 的证明之旅

在人工智能（AI）的浪潮席卷全球之际，大型语言模型（LLMs）展现出的推理能力，尤其是在数学问题解决方面，已经彻底改变了许多领域 (DeepSeek-AI, 2025)。想象一下，AI 不仅能理解复杂的数学题目，还能像人类数学家一样，一步步推导出严谨的证明过程。这听起来像是科幻小说，但 DeepSeek-AI 团队带来的 DeepSeek-Prover-V2，正让这一梦想逼近现实。然而，从 LLM 擅长的、充满启发式和直觉的自然语言推理，跨越到形式化定理证明那如同精密仪器的逻辑世界，并非易事。

2025-05-02 04:04:56 684

原创令牌之舞：自回归模型编织超高分辨率图像的简洁之道

自回归（AR）模型在语言生成领域成就斐然，但其在图像合成上的应用常受限于高昂的计算成本和分辨率瓶颈，与扩散模型相比竞争力不足。核心挑战在于处理海量图像令牌。我们提出。

2025-05-01 23:29:54 940

原创 WebThinker：让大模型成为深度研究大师的魔法引擎

想象一下，你是一位科学家，面前堆满了需要查阅的文献、网页和数据，但时间紧迫，任务繁重。突然，一个智能助手跳出来，它不仅能帮你搜索信息，还能像人类研究员一样，边思考、边搜索、边撰写报告，甚至能深入网页的“兔子洞”挖掘隐藏的宝藏。这不是科幻小说，而是的真实能力——一个让大型推理模型（Large Reasoning Models, LRMs）化身深度研究大师的开源框架。今天，我们将带你走进这个令人兴奋的科技冒险，探索 WebThinker 如何颠覆传统研究方式，让复杂问题迎刃而解。

2025-05-01 13:47:44 890

原创思想的盾牌：当语言模型学会防御

在信息时代的战场上，参考污染就像隐藏在数据中的“特洛伊木马”。链式防御思维以其简单而优雅的设计，为语言模型披上了一层思想的铠甲。它不仅让我们看到大型语言模型的潜力，也提醒我们：真正的智慧，不在于记住多少知识，而在于如何在纷繁复杂的信息中找到真相。通过模仿人类的结构化推理，链式防御思维为语言模型的可靠性开辟-

2025-04-30 20:30:25 1361

原创探索论文到代码的魔法之旅：从文字到程序的跨界对话

Paper2Code 为我们展示了一种全新的科研实践模式，将传统的论文阅读、代码重构流程彻底颠覆。通过规划、分析、编码三个阶段的层层递进，系统实现了从学术论文到可执行代码仓库的自动化转化。与此同时，多Agent 协同工作机制、严谨的公式化表征以及详尽的实验评测，都为这一系统奠定了扎实的理论和实践基础。这种将逻辑与艺术相结合的自动代码生成方式，无疑将在未来激发更多跨领域、跨学科的合作创新，为科研人员节省更多时间、摆脱繁杂的代码实现烦恼，更专注于科学问题本身的探索。

2025-04-30 00:00:00 10

原创探索论文到代码的魔法之旅：从文字到程序的跨界对话

2025-04-30 00:00:00 751

原创引擎之心：Godot 的魔法工厂与幕后故事

Godot Engine 以其模块化、跨平台、可扩展的架构，成为开源游戏开发领域的璀璨明星。它的每一块“魔法积木”都经过精心打磨，既能独立闪耀，又能拼接成无数可能。无论你是引擎贡献者，还是游戏开发者，理解 Godot 的内部机制，都是走向高阶魔法师的必经之路。

2025-04-30 00:00:00 752

原创物理的智慧之舞：当AI学会用哈密顿的语言推理

DHN的出现标志着物理推理的新时代。它将哈密顿力学的优雅与神经网络的灵活性相结合，让AI不仅能预测物理系统的未来，还能从碎片化的观测中推理系统的本质。就像一位舞者通过零星的旋律重现整支舞，DHN在物理推理的舞台上展现了惊艳的表演。未来，随着计算能力的提升和架构的优化，DHN有望带领AI在更广阔的科学领域翩翩起舞。

2025-04-29 00:00:00 774

原创记忆的魔法师：OpenHands Agent的记忆保存奇遇记

OpenHands中的Agent记忆系统，像极了一位魔法师的多层次魔法书——既有底层的保险箱（存储层），又有灵活的记忆管理（Memory/State），还有会话与对话的智慧归档。无论是短暂的对话，还是跨越时空的任务，Agent都能凭借这套记忆魔法，做到“前事不忘，后事之师”。未来，随着AI Agent的能力不断进化，这套记忆魔法也将变得更加智能、灵活，成为AI世界里不可或缺的“灵魂之书”。

2025-04-29 00:00:00 877

原创物理推理的魔法师：去噪哈密顿网络的奇幻冒险

在科学的浩瀚星空下，物理推理如同一场永无止境的探险。科学机器学习的使命，就是让AI不仅会“算”，更要懂“理”——让它们在神经网络的黑盒中，嵌入物理的铁律。现有的物理神经网络，尤其是哈密顿神经网络（HNN），虽然能守住能量守恒的底线，却常常只盯着“下一步”，忽略了时间长河中更深远的联系。这样，DHN就能在同一个网络中，泛化建模多种物理系统，既保持物理归纳偏置，又能灵活适应异质系统。受去噪扩散模型启发，DHN在训练时会随机遮蔽或加噪部分状态，让网络学会从“残缺”或“污染”的观测中，逐步还原出物理合理的轨迹。

2025-04-28 03:34:34 407

原创模型的自我进化：当AI学会用自己的智慧“举一反三”

TTRL的出现标志着AI从“被动接受知识”向“主动探索世界”的转变。通过多数投票和强化学习，TTRL让模型在没有标签的情况下，依然能通过自我反思和优化实现性能飞跃。这不仅为数学推理任务带来了突破，也为更广泛的AI应用指明了方向。未来的AI或许不再需要人类的“手把手”指导，而是像一个聪明的学生，凭借自己的智慧，在未知的领域中不断成长。

2025-04-28 03:18:07 715

原创模型的自我进化：测试时强化学习的奇幻冒险

TTRL的出现，仿佛给AI模型装上了“自我修炼”的外挂。在没有标准答案的世界里，模型依然能靠“集体智慧”不断进化。这不仅让AI更聪明，也让我们看到了人工智能自我成长的无限可能。未来的AI，或许真的能像人类一样，在未知中自我突破，成为真正的“智慧生命体”。

2025-04-28 03:15:09 1107

原创记忆的炼金术：OpenHands如何让AI变得更聪明

每次AI要做决策，都要把便签纸上的内容重新“读一遍”，这不仅浪费算力，还让AI容易“忘记”重要的细节。未来，随着AI代理变得越来越复杂，如何让它们“有选择地记忆”，甚至“主动遗忘”，将成为AI发展的新方向。OpenHands团队发现，许多AI代理（Agent）在执行复杂任务时，90%的上下文其实是“废话”——比如过时的状态、无关的对话、重复的信息。OpenHands团队也在探索更智能的记忆管理机制，比如引入“情境感知”，让AI根据不同场景动态调整记忆策略，甚至模拟人类的“直觉”与“灵感”。

2025-04-28 00:00:00 189

原创智能摘要的魔法师：自我检索与切片，如何让大模型“只说重点”？

在AI界，“摘要”就像给一部小说写书评。方面型摘要（Aspect-Based Summarization, ABS），则是只针对你关心的“方面”写书评，比如只谈主角的成长、只说故事的悬疑部分。定制化需求：比如电商评论，有人只关心“价格”，有人只在意“质量”。专业领域：金融、法律、医疗等领域，用户常常只关注某一细分主题。就是在输入里加一个“示例”，让模型“照猫画虎”生成摘要。更聚焦：只保留最相关内容，摘要更“贴题”。更高效：节省token空间，支持更长文档和更多ICL示例。更可靠。

2025-04-28 00:00:00 818

原创代码的交响曲：用人工智能编织软件仓库的未来

CodePlan 就像一位数字时代的指挥家，将大型语言模型的生成能力与规划算法的逻辑严谨性相结合，为仓库级编码任务带来了一场革命。它不仅提高了开发者的生产力，还为软件工程的自动化开辟了新路径。从包迁移到时间编辑，CodePlan 展示了人工智能在复杂软件开发中的巨大潜力。未来，随着对动态依赖、非代码 artifacts 和更智能提示策略的支持，CodePlan 有望成为软件开发的“全能指挥家”，协调从代码到配置的每一部分，奏响更宏伟的数字交响乐。

2025-04-27 20:46:40 930

原创因果的隐秘跃迁：从混沌到秩序的数学探秘

对于马尔可夫链 (

2025-04-27 07:17:06 484

原创解锁潜能：变分自编码器与扩散模型的协同进化之旅

在人工智能生成图像的领域，变分自编码器（VAE）和潜扩散模型（LDM）曾像一对默契不足的舞伴，各自在舞台上独舞。传统方法中，VAE负责将图像压缩为紧凑的“潜空间”表示，而LDM则在这一空间中学习生成逼真的图像，两者却鲜有交集。然而，一项名为REPA-E（Representation-Aligned End-to-End Training）的新技术打破了这一隔阂，让这两者开始了一场协同进化的华丽舞蹈。

2025-04-27 06:36:33 656

原创 AI的心灵剧场：CAMEL与大模型社会的奇幻冒险

CAMEL让我们第一次有机会“窥探”AI社会的心智世界。它不仅是AI协作的实验场，更是未来智能社会的缩影。正如舞台上的演员各司其职，AI社会中的每个智能体也在各自的角色中闪耀。未来，或许我们每个人都将成为这场“AI心灵剧场”的观众、导演，甚至演员。

2025-04-27 00:00:00 695

原创穿越十万代码迷宫：RAG在超大规模代码仓库的精密工艺

Qodo团队的RAG系统，凭借智能切片、上下文维护、文件类型适配、嵌入增强、两阶段检索、仓库级降噪和多维评测，成功攻克了超大规模代码仓库的检索难题。未来，随着AI模型和工程体系的不断进化，RAG有望成为每个开发团队的“代码大脑”，让开发者在十万级代码迷宫中，始终能找到回家的路。

2025-04-27 00:00:00 833

原创思想的交响曲：人类与AI共舞的协作推理新时代

在数字时代，信息如洪流般奔涌，短视频和AI生成内容的浪潮席卷全球。然而，这股潮流是否正在悄然侵蚀我们的深思能力？当我们沉迷于TikTok的95分钟快闪，或是对AI的输出不假思索地全盘接受时，批判性思维的火花似乎在渐渐熄灭。Seunghyun Yoo在《Co-CoT: A Prompt-Based Framework for Collaborative Chain-of-Thought Reasoning》中提出了一种革命性的解决方案——协作链式推理框架（Co-CoT）。

2025-04-26 19:13:51 419

原创代码星海的寻宝者：RAG在万仓代码帝国的冒险

在万仓代码帝国，RAG不只是AI的“寻宝地图”，更是开发者的“智慧伙伴”。智能切片、语义嵌入、两步检索、仓库降噪……这些创新让AI真正读懂了代码的“家谱”，也让开发者在浩瀚代码星海中，能更快找到属于自己的“宝藏”。未来，RAG将继续进化，成为每个开发团队不可或缺的“代码探险家”。而Qodo的故事，也许才刚刚开始。

2025-04-26 17:24:21 488

原创快如闪电的对话：FastMCP与智能世界的快速通道

FastMCP就像一条高速公路，把AI的能力、安全性和可扩展性推向新高度。无论你是AI开发者、数据科学家，还是对智能世界充满好奇的探索者，FastMCP都能帮你用最简单的方式，打开AI与世界对话的大门。未来已来，快来体验这场“快如闪电”的智能革命吧！

2025-04-26 17:10:12 1069

原创模型上下文的奇幻之旅：MCP的崛起与AI新秩序

主机是整个MCP生态的“大脑”。虽然协议对主机的实现细节“语焉不详”，但核心思想是：主机要有自己的“路由逻辑”，像交通指挥员一样，合理分配任务。无论如何，MCP的出现，预示着AI应用从“单打独斗”走向“协同作战”的新时代。未来的AI助手，将不再只是“会聊天”，而是能像“万能管家”一样，帮你调度一切数字资源，真正成为你的“数字分身”。未来，随着HTTP传输的完善，MCP有望成为AI客户端（如Glama、Claude Desktop）插件市场的“基石”，让用户像装APP一样，随时为AI加装新能力。

2025-04-26 16:52:57 675

原创代码的魔法：从需求到程序的智慧旅程

在软件开发的广袤世界中，编写代码就像是在数字森林中开辟一条新路。大型语言模型（LLMs）如 GPT-4o 和 Gemini-Pro 已经展现出在简单代码生成中的非凡能力，但当面对真实世界的复杂代码仓库时，它们往往像迷失在迷雾中的旅人，难以应对错综复杂的依赖关系和领域知识的挑战。2025 年 4 月，一项名为的创新框架横空出世，它以双图结构和智能推理为核心，为 LLMs 赋予了在真实世界代码生成中的“魔法”能力。

2025-04-26 16:13:42 137

原创代码的魔法使：从Cline原理揭秘AI Agent的智慧设计

人工智能（AI）Agent正在改变我们与技术的交互方式，从自动编码到智能助手，它们如魔法般提升效率，点燃创造力。在这股浪潮中，Cline脱颖而出，作为一款免费、开源的AI编码插件，它不仅在开发者社区中声名鹊起，还通过其精巧的Prompt设计，为我们揭示了AI Agent设计的一般范式。这篇文章将带你走进Cline的幕后，探索如何通过角色设定、工具调用、动态扩展等机制，打造一个高效、可靠的AI Agent。准备好，我们将用通俗的语言和生动的比喻，解锁AI Agent的“魔法书”！

2025-04-26 07:12:28 84

原创无反向传播之道：神经网络训练的新纪元

传统深度学习强调层级表示的学习，认为越深层越抽象。

2025-04-26 05:37:11 15

原创梦想家DreamerV3：让AI像人一样“做梦”学本领

DreamerV3让AI学会了“做梦”，靠脑补和自我模拟，能在各种环境下快速成长，成为真正的“全能选手”！

2025-04-26 00:00:00 846

原创探索 Transformer 长序列中的稀疏注意力权衡之美

对于短序列，密集注意力与低级稀疏方法之间的性能差距不大，但当序列扩展到极长（如 128K token）时，只有大模型配合高稀疏率才能在固定 FLOPS 预算下达到最佳表现。在保证性能稳定的前提下，解码阶段普遍比预填充阶段能接受更高的稀疏率，但平均性能指标往往掩盖了存在少数任务对于稀疏极为敏感的风险。通过建立扩展定律，我们可以将模型规模、序列长度与稀疏参数之间的关系形式化，并利用这些定律对未来配置进行预测，为设计者与工程人员提供实用参考。

2025-04-26 00:00:00 932

原创追踪者的秘密花园：多目标跟踪算法的奇妙旅程

想象一下，你是一位侦探，面对一群在街头穿梭的人群，你需要准确地识别并追踪每一个目标的轨迹。

2025-04-25 22:11:23 53

原创梦境启示录：穿越多领域的世界模型之旅

DreamerV3 代表了强化学习领域迈向通用智能的一大步。通过借助世界模型——这种内部模拟机制，结合 symlog 预测、行为者-评论家架构及一系列巧妙的正则化与归一化策略，该算法不仅能够在众多任务中展现出色表现，还能在不经过特殊调参的情况下统一应对多样化环境。无论是面对具有挑战性的 Atari 游戏、需要复杂连续控制的机器人任务，还是面对极具开放性和探索性的 Minecraft 中的钻石采集，DreamerV3 都表现出极高的数据效率和跨领域的鲁棒性，充分展示了统一架构的强大潜力。

2025-04-25 21:00:00 883

原创数据流转的魔法书：PocketFlow中共享存储与参数的奇幻之旅

在数字世界的迷宫中，数据如溪流般在节点与流程之间奔涌，编织出计算的交响乐。PocketFlow 是一个轻量而强大的框架，它以优雅的方式管理数据的流动，通过（Shared Store）和（Params）两种机制实现节点间的通信。本文将深入剖析 PocketFlow 的通信机制，结合其源代码，探索共享存储与参数如何协作，驱动数据流转的魔法。我们将以通俗易懂的语言、生动的比喻和贴近生活的例子，带你走进这个奇幻的编程世界，揭示 PocketFlow 的核心奥秘。

2025-04-25 20:56:28 109

原创探索自主协作的智慧之旅：AgentRxiv引领的科学新纪元

从历史的长河中汲取智慧，我们始终深知，科学的进步离不开集体智慧的累积。无论是古时的学者论辩，还是今日AI与人类的协同探索，知识的传承与创新始终是推动社会不断前行的根本动力。AgentRxiv正是这种理念的现代演绎，它以开放、共享、协同的方式，构建起一个全新的科研生态系统，让每一个自主代理的微小进步都不再孤单，而是成为整个知识大厦中不可或缺的一砖一瓦。当我们回望这段探索之旅，会发现技术的突破从来不是终点，而是一段更为辉煌旅程的序章。未来的科学，必将在人机共舞中，披荆斩棘、不断绽放新的智慧火花。

2025-04-25 20:00:00 18

原创探索未知优化迷宫：自然语言中的数学魔法

优化技术始终在人类智慧的历史长河中熠熠生辉。从古代的最短路径问题，到现代机器学习中的大规模非凸优化，每一次突破都意味着人类对世界认知的进一步提升。然而，在现实中，大多数优化问题并不会直接呈现在数学课本上，而是以口语与自然语言的形式出现，如“如何在最短时间内运送货物”或者“在有限资源下最大化收益”。这时候，传统的数学表述与复杂的编码实现，往往让许多非专业人士望而却步。

2025-04-25 00:00:00 10

原创星际对话：探秘极致低精度的BitNet b1.58 2B4T传奇

BitNet b1.58 2B4T不仅仅是一款高效的1-bit语言模型，它更像是一位勇敢的先行者，阐释了在极端量化条件下依然可以达到与全精度模型相媲美甚至超越的性能。通过架构重构——从Transformer到定制的BitLinear层；通过系统训练——从高学习率到低温冷却、从监督微调到直接偏好优化；以及通过专门的推理实现——针对GPU与CPU均开发优化内核，这一系列创新之举为众多研究者和开发者指明了一条全新的高效模型设计道路。探索更大规模（例如7B或13B参数量）1-bit模型的训练规律和性能极限；

2025-04-24 07:09:19 1144

原创智慧的跃迁：从知识堆叠到认知工程的奇幻旅程

在人工智能的舞台上，第一幕已经落幕，大型语言模型（LLMs）如GPT-4和Llama 3通过海量数据和参数的堆砌，完成了知识的初步整合。然而，这一幕的辉煌背后，隐藏着知识延迟、浅层推理和思维深度的局限。如今，第二幕正在徐徐展开——以为核心，人工智能正从知识的仓库转型为思想的熔炉，通过测试时扩展（test-time scaling）技术，探索从“知道”到“理解”的智慧飞跃。本文将带你走进这场奇幻的旅程，揭开认知工程如何通过深层推理和创造性思维，重新定义人工智能的未来。

2025-04-24 00:00:00 84

原创代码的交响乐：用人工智能谱写存储库级编程新篇章

CodePlan 的出现标志着软件工程进入了一个新阶段：从局部代码补全到全局存储库编辑，人工智能正在从“独奏”走向“交响”。它不仅提升了开发者的生产力，还为自动化复杂编码任务开辟了新的可能性。就像一位指挥家将杂乱无章的音符编织成动人的乐章，CodePlan 通过规划和分析，将复杂的代码修改变成了一场优雅的表演。未来，随着 CodePlan 的不断完善，我们或许能看到它应用于更广泛的场景：从迁移遗留系统到自动重构代码，甚至为跨语言项目提供统一的编辑框架。

2025-04-24 00:00:00 975

原创【已解决】ModuleNotFoundError: No module named ‘_tkinter‘

如果你在用macOS，且用homebrew安装了（路径是），它。

2025-04-23 23:00:00 599

原创逆风而上：从自然智慧中悟出的 Agent 框架设计之道

综观当前 Agent 框架的发展现状与挑战，我们不难发现，很多现有系统在追求短期效果的同时，忽略了长远的智能潜力和系统韧性。过分暴露复杂性、限制多样性，或是将涌现智慧寄托于未来版本的修补，既违背了自然自组织的原理，也限制了系统本身的成长。真正的智能系统设计，应当回归自然，借鉴生物神经网络、生态群落的自适应与协作机制，实现智能的自然而然涌现。在工程化和科学探索的双重指引下，未来的 Agent 框架将不断融合模块化设计、开放接口机制以及多 Agent 协作模式。

2025-04-23 21:00:00 139

FOUNDATION AGENTS的进展与挑战从脑启发智能到进化、协作和安全的系统 ### 人工智能大型语言模型驱动的智能体模块化架构及其安全性和进化机制综述

内容概要：本文是一篇关于智能体（agents）的综述，探讨了从脑启发智能到进化、协作和安全系统的进展与挑战。文章首先介绍了智能体的模块化设计，涵盖认知、感知、行动、记忆、世界建模、情感、目标和奖励等核心组件，强调了这些模块与人类大脑功能的相似性。接下来，文章探讨了智能体的自我增强机制，包括自适应学习、反馈驱动的改进和持续知识集成，以适应动态环境。随后，文章讨论了多智能体系统的协作与进化，强调了集体智慧和适应性决策的重要性。最后，文章详细分析了构建安全和有益的AI系统的必要性，提出了内在和外在安全威胁的缓解策略。文章还探讨了未来的研究方向，包括多模态感知、长上下文建模、幻觉缓解策略等。适用人群：本文适合研究人员、学生、政策制定者和行业从业者，尤其是对AI智能体、大型语言模型（LLMs）及其应用感兴趣的读者，以及对未来社会中人类与AI共存感兴趣的群体。使用场景及目标：①理解智能体的模块化设计和其与人类认知的相似性；②学习智能体的自我增强机制和持续学习策略；③探讨多智能体系统的协作模式和集体智慧；④掌握构建安全、有保障和有益的AI系统的策略和技术。其他说明：本文不仅提供了关于智能体的全面概述，还鼓励读者提出新问题并探索这一领域的研究空白。文章强调了智能体设计不仅要追求强大和高效，还要具备适应性、伦理性和与人类社会的深度一致性。通过综合不同学科的见解，本文为智能体的发展提供了一个前瞻性的路线图。

2025-04-09

Qwen2.5-Omni 论文Word格式

2025-03-27

不要再过度思考了：一项关于对大型语言模型的有效推理

2025-03-23

《从塔楼到尖顶：一次语音魔法的奇幻旅程》

当科技与语言交相辉映，当文本与语音在大语言模型中共舞，我们便迎来了一个全新的时代。本文带您走进SPIRE的世界——一个从纯文本LLM（大语言模型）进化而来的多模态奇迹，通过引入离散语音单元（DSU），使得模型不仅精通翻译，更能准确识别和转换语音。下面，让我们用轻松幽默的笔触来细诉这一激动人心的旅程，探索这座由TOWER到SPIRE的高塔构筑，如何在语音与文本间架起一座坚实的桥梁。

2025-03-14

TokenButler- Token Importance is Predictable.docx

大型语言模型（LLMs）依赖于键值（KV）缓存来存储标记历史，从而实现标记的有效解码。随着KV缓存的增长，它成为主要的内存和计算瓶颈。然而，有机会缓解这一瓶颈，特别是因为先前的研究表明，只有很小一部分标记在每个解码步骤中都有意义地贡献。寻找这些关键标记的主要挑战在于它们是动态的，并且严重依赖于输入查询。现有的方法要么冒着质量风险永久驱逐标记，要么保留完整的KV缓存，但在生成时依赖于检索标记块（页面），在密集、内容丰富的任务中失败。此外，许多现有的KV缓存稀疏方法依赖于对标记重要性的不准确代理。为了解决这些限制，我们引入了TokenButler，这是一个高粒度、查询感知的预测器，它学会了识别这些关键标记。通过训练一个轻量级预测器，其参数开销不到1.2%，TokenButler根据标记的上下文预测重要性进行优先排序。这提高了困惑度和下游准确性，相对于估计标记重要性的最新方法提高了超过8%。我们在一个新颖的合成小上下文共指检索任务上评估了TokenButler，展示了接近或达到神谕准确度的性能。

2025-03-11

现有的长文本生成方法主要集中在从短输入生成长文本上，忽略了长输入和长输出任务这类任务有许多实际应用，但缺乏可用的基准此外，随着输入长度的增加，现有方法不可避免地会遇到“中间丢失”现象

现有的长文本生成方法主要集中在从短输入生成长文本上，忽略了长输入和长输出任务。这类任务有许多实际应用，但缺乏可用的基准。此外，随着输入长度的增加，现有方法不可避免地会遇到“中间丢失”现象。在本文中，我们首先介绍了一个长输入和长输出基准（LONGINOUTBENCH），包括一个合成数据集和一个全面的评估框架，解决了缺失基准的挑战。然后我们开发了检索增强型长文本写手（RALWRITER），它检索并重述了重要但被忽视的内容，通过构建明确的提示来缓解“中间丢失”问题。最后我们使用提出的LONGINOUTBENCH来评估我们的RALWRITER与可比基线，结果证明了我们方法的有效性。我们的代码已在 https://github.com/OnlyAR/RAL-Writer 发布。

2025-03-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

FOUNDATION AGENTS的进展与挑战 从脑启发智能到进化、协作和安全的系统 ### 人工智能大型语言模型驱动的智能体模块化架构及其安全性和进化机制综述

Qwen2.5-Omni 论文Word格式

不要再过度思考了：一项关于 对大型语言模型的有效推理

《从塔楼到尖顶：一次语音魔法的奇幻旅程》

TokenButler- Token Importance is Predictable.docx

现有的长文本生成方法主要集中在从短输入生成长文本上，忽略了长输入和长输出任务 这类任务有许多实际应用，但缺乏可用的基准 此外，随着输入长度的增加，现有方法不可避免地会遇到“中间丢失”现象

论文译文：LLM Maybe LongLM: SelfExtend LLM Context Window Without Tun

巨型语言模型的 8 位量化：LLM.int8() 中文版论文

LLM+Mamba具有选择性状态空间的线性时间序列建模

Meta的Pearl强化学习库入门（中文版）.pdf

空空如也

FOUNDATION AGENTS的进展与挑战从脑启发智能到进化、协作和安全的系统 ### 人工智能大型语言模型驱动的智能体模块化架构及其安全性和进化机制综述

不要再过度思考了：一项关于对大型语言模型的有效推理

现有的长文本生成方法主要集中在从短输入生成长文本上，忽略了长输入和长输出任务这类任务有许多实际应用，但缺乏可用的基准此外，随着输入长度的增加，现有方法不可避免地会遇到“中间丢失”现象