自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7858)
  • 收藏
  • 关注

转载 通过图片诊断皮疹?谷歌的人工智能工具比人类医生更擅长

为了验证最终系统确实优于未经修改的 Gemini 2.0 版本,研究人员命令该模型模拟医患对话,其中模型分别扮演患者、医生以及评估其他两人对话的第三方。「这样,你就可以在进行诊断对话时赋予它正确的、理想的行为。谷歌医疗聊天机器人的升级版可以使用智能手机照片来诊断皮疹,并可以评估大量其他类型的医学图像,从而提高机器人查明疾病原因的能力。

2025-05-12 16:05:03 2

转载 「ChatGPT+GitHub」,OpenAI搞了个大联合

此外,大家关心的隐私问题,OpenAI也考虑了,ChatGPT将尊重组织设置,因此用户只能看到他们已获准查看的GitHub内容以及明确与ChatGPT共享的代码库。OpenAI表示,只有经过验证的组织才能对o4-mini进行微调。IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)

2025-05-11 16:57:10 26

转载 哈佛新论文揭示 Transformer 模型与人脑“同步纠结”全过程!AI也会犹豫、反悔?

人类本来逻辑在线,但题目稍微掺点“常识偏见”,比如“所有有翅膀的动物会飞,所有会飞的动物能上天,所以所有有翅膀的动物都能上天吗?这篇论文的作者,换了个角度:不只看AI模型的输出,还要扒一扒Transformer每一层的“处理动态”,与人脑处理信息的“实时轨迹”是否能对上。人类实验里,受试者的鼠标先朝“鱼”方向飘过去,走了一小段“弯路”,再折回“哺乳动物”,画出一条漂亮的“纠结弧线”。有趣的是,AI和人类不仅选项重合,连“走神”的路径也同步:人类在鼠标上徘徊的那一秒,AI在网络里也“犹豫”着。

2025-05-11 16:57:10 73

转载 科学家拍下单个原子的“社交图鉴”,开启量子现象可视化新纪元

长期以来,人们一直预测玻色子会相互“聚集”,彼此靠近的概率更大。接着,研究人员开启光晶格,冻结原子的位置,再用第二束激光照射悬浮的原子,通过原子发出的荧光确定它们各自的位置。“这就是理论变得极其复杂的地方——人们开始画图,而不是能够写出一个完整的理论,因为他们无法完全解决它,”Zwierlein 说,“现在我们可以验证这些量子霍尔态的‘草图’是否真实存在。该技术先让原子云自由移动并相互作用,接着开启光晶格,短暂冻结原子的运动轨迹,随后运用经过微调的激光快速照射悬浮的原子,在原子自然消散前拍下其位置图像。

2025-05-11 16:57:10 9

转载 多智能体系统的标准化问题,A2A 与 MCP 集成的优势与困境

集成的关键风险,探讨潜在的技术挑战,并分析未来研究的可能方向,以确保这些协议能真正支持可扩展、可靠的智能体经济。但是协议的落地并非仅仅是技术实现的问题,它还关系到智能体生态的构建、市场应用的扩展以及未来经济模式的演化。使得智能体协作更加高效,但仍有诸多技术挑战需要解决,以确保未来的智能体经济能够安全、可靠地发展。的集成架构,并提出三种主要模式,每种模式都有独特的优势和挑战,需要在具体应用场景下权衡选择。各司其职,前者规范了智能体之间的任务协作,后者确保智能体能标准化地访问外部工具和数据。

2025-05-10 14:45:54 77

转载 博士生唯一第一作者,历时6年,华东师大最新Nature:挑战假说,定位生命起源

实验室聚焦“人地海复合系统演变规律”“生态保护与资源综合利用”和“数字孪生与智能决策”三大研究方向,在学科体系创新维度,秉持交叉融合理念,突破传统学科边界,有机整合海洋科学、环境生态、地理信息、人工智能等多学科优势资源与前沿技术,创新性地组建多学科交叉研究团队,构建起开放共享的协同创新网络,为破解河口海岸领域重大复杂科技问题提供系统性解决方案。研究团队推断,当使用的标志蛋白更多地分布到阿斯加德古菌序列中,则涅尔德古菌进入阿斯加德古菌门,反之,则进入TACK古菌超门。

2025-05-10 14:45:54 17

转载 图灵奖得主杨立昆万字实录:AI Agent要实现真智能,必须摆脱“Token游戏”

来源:数字开物4月25日,Meta首席 AI 科学家杨立昆在宾夕法尼亚大学进行了一场圆桌对谈。本次对话杨立昆分享了早期神经网络项目的探索、对AI范式的演进,并深入剖析了深度学习革命的驱动因素。还探讨了强化学习的角色、AI的社会影响与风险、开源生态的重要性等话题。最后,杨立昆还就AI Agent、物理世界理解、非语言思维等前沿问题与现场观众进行了互动。杨立昆认为AI的生存风险被夸大,当前AI远未达到人类水平智能,仅靠扩大LLM规模无法实现AGI。他指出,真正的风险在于偏见、滥用和信息控制,而AI本身也是对抗这

2025-05-10 14:45:54 19

转载 深度长文|AI大模型的“侦探”与“罪犯”:一场关于学习效率的意外揭秘

这场意外的揭秘告诉我们,AI的强大,不仅在于其“生成”万物的能力,更在于其日益精准的“评估”和“判断”能力。未来的AI进化之路,需要我们不断提升“侦探”的智慧,让它们拥有更聪明的“眼睛”,更好地理解人类的意图和偏好,从而引导AI走向更广阔、更符合我们期望的未来。出发,我们通过“侦探”与“罪犯”的故事,揭示了AI训练中一个反直觉现象背后的深层原因:“生成-验证差距”的存在,使得RLHF/PFT这种先培养“侦探”再指导“罪犯”的模式,成为AI高效学习、通往卓越的有效“捷径”。这相当于“侦探”的判断力有效。

2025-05-09 18:12:50 30

转载 谷歌:人工智能的重要趋势:回顾、现状与未来展望

从硬件(TPU系列)、软件抽象(Pathways)、模型架构(Word2Vec、Seq2Seq、Transformers、MoEs)到训练算法(无监督和自监督学习、蒸馏)和推理算法(思维链、推测解码),创新发生在多个层次。AI模型和产品正在成为令人难以置信的强大和有用的工具,进一步的研究和创新将继续这一趋势。Gemini项目涉及许多不同领域的贡献者,包括预训练、后训练、设备上模型、数据、基础设施、服务、评估、代码库以及长期研究等核心领域,还有能力、安全、视觉、音频、代码、代理和国际化等领域。

2025-05-09 18:12:50 189

转载 深度学习之父、图灵奖得主Bengio:三年前的ChatGPT让我觉得人类无法掌控AI,希望通过“科学家AI”把模型彻底装在笼子里

在描绘了AI能力飞速逼近人类水平的图景后,Bengio教授将听众的注意力引向了一个更令人不安的领域——AI系统中开始出现的、类似“自我保护”(self-preservation)的行为,以及与之相伴的欺骗(deception)和逃逸(escape)企图。主持人SimonChesterman教授敏锐地观察到,尽管在过去几年,特别是ChatGPT出现后,公众对AI的认知有所提升,也出现了一些积极的治理动向(如英国的Bletchley倡议、AI安全峰会等,Bengio教授也参与其中),但近期的风向似乎有所转变。

2025-05-09 18:12:50 22

转载 OpenAI迎来新帅,Instacart CEO 空降执掌应用部门,奥特曼将专注三大支柱

更具体地说,在支持Fidji和应用团队的同时,Sam将把更多精力聚焦在研究(Research)、计算(Compute)和安全系统(Safety Systems)上,这些部门将继续直接向他汇报。他将继续直接监督OpenAI的所有核心支柱——研究(Research)、计算(Compute)和应用(Applications),确保各领域协同发展。

2025-05-08 21:41:43 38

转载 万字长文解密智能体互联之路:MCP、ACP、A2A与ANP标准协议通览与跨平台互操作性探究

例如,在一个企业自动化系统中,一个智能体可能负责数据整理,另一个智能体需要调用它的整理结果进行业务分析。例如,一个数据分析智能体可以发现另一个智能体可以处理数据库查询,并自动将查询任务委派给对方,这样智能体之间形成了一种类似企业内部工作流的自动化协作机制。智能体真正发挥其潜力,需要一种标准化的互操作性协议,使得不同类型的智能体可以通过通用的规则进行数据交换、能力共享和任务执行。智能体的能力得到了极大的扩展,它们不仅能理解复杂的自然语言指令,还能自主规划、执行任务,并与其他系统无缝协作。

2025-05-08 21:41:43 143

转载 Nature里程碑成果:重新定义了科学界对学习方式的理解

Benna是一名计算神经科学家,也是这项研究的共同通讯作者,他说:“这种新方法使我们能够将多个实验的数据结合起来,做出详细的发现,而这些发现仅使用单个大脑中记录的有限数量的相关神经元是不可能的。“我们的研究结果表明,学习超越了局部变化——它重塑了大脑区域之间的交流,使其更快、更强、更精确,”该研究的主要作者Assaf Ramot说:“学习不仅会改变大脑的行为,还会改变大脑做事的方式。研究发现,在学习过程中,丘脑激活M1神经元来编码学习到的运动,并停止与学习到的运动无关的神经元的激活。

2025-05-08 21:41:43 237

转载 智酷 421 期 | 从“地心说”到“日心说”,智能体在21世纪科学范式转变中的核心地位

通过各种形式的沙龙、对话、培训、丛书编撰、论坛合作、专题咨询、音视频内容生产、国内外学术交流活动,以及每年一度的苇草思想者大会(原名互联网思想者大会),苇草智酷致力于广泛联系和连接科技前沿、应用实践、艺术人文等领域的学术团体和个人,促成更多有意愿、有能力、有造诣的同道成为智酷社区的成员,共同交流思想,启迪智慧,重塑认知。刘锋博士与科学院大学吕本富、刘颖教授提出的广义智能体理论,通过构建标准智能体模型并阐释其演化动力学机制,为探索物理学、人工智能及科技哲学中的若干关键难题,开辟了一条富有前景的探索新路径。

2025-05-08 21:41:43 9

转载 一个谷歌大神Jeff Dean的演讲,回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术

的技术,可让模型推理速度更快。这样一来,你可以得到擅长不同任务的专家,比如有的擅长处理时间和日期,有的擅长地理位置,有的擅长生物学。部分原因是,他们最初在机器翻译任务上证明,用少 10 到 100 倍的计算量和小 10 倍的模型,就可以获得比当时最先进的 LSTM 或其他模型架构更好的性能。在这场演讲中,Jeff Dean 首先以谷歌多年来的重要研究成果为脉络,展现了 AI 近十五年来的发展轨迹,之后又分享了 Gemini 系列模型的发展历史,最后展望了 AI 将给我们这个世界带来的积极改变。

2025-05-07 18:07:25 22

转载 碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一

Gemini 2.5 Pro Preview(I/O 版)可通过 Gemini API 以及谷歌的 Vertex AI 与 AI Studio 平台获取,价格则与升级前的 Gemini 2.5 Pro 模型相同。谷歌在博文中写道,“对于正在使用 Gemini 2.5 Pro Preview 的开发者们来说,此次发布的新版本不仅能够提升编程性能,还将解决开发者提出的多项关键反馈,包括减少函数调用中的错误并提高函数调用的触发率。因此,这只是一个专为编码而生的大模型,不适合一般用途(与之前的版本相比)。

2025-05-07 18:07:25 98

转载 OpenAI公司架构进化的一封信和争议

我们对他们用我们的工具所创造的作品感到惊讶和高兴,以及他们想要使用这些工具的程度。)我们希望能够以一种可以使我们的服务广泛面向全人类的方式运作,并从中获得资源,这目前需要数千亿美元,并可能最终需要数万亿美元。我们当前无法提供世界想要的那么多人工智能,我们不得不对我们的系统进行使用限制并以较慢的速度运行它们。但现在突然有人告诉我们,他们成为历史上增长最快的初创企业之一的设定,这个设定据说是完全必不可少的,使他们与竞争对手区别开来,并且让我们能够信任他们的保护措施,全部必须尽快撤销。)将如何被构建或使用。

2025-05-07 18:07:25 52

转载 脑启发学习综述:人工神经网络的下一场革命?

突触可塑性算法作为计算模型,模拟了大脑基于神经活动强化或弱化神经元间连接(即突触)的能力,从而促进学习与记忆的形成。关键词:脑启发学习(Brain-inspired Learning),人工神经网络,脉冲神经网络,突触可塑性,神经调控,元可塑性,神经形态计算(Neuromorphic Computing),终身学习,赫布学习(Hebbian Learning),时序依赖可塑性(Spike-Timing-Dependent Plasticity, STDP),反向传播,进化算法。(a)突触连接的前后神经元;

2025-05-06 17:05:10 410

转载 深度长文|AI Agent协议暗战:谁将定义万亿智能协作的底层法则?

机票 Agent 需要天气 Agent 的数据时,它不是直接调用一个工具,而是通过 ANP 找到对应的天气 Agent,验证其身份,然后按照协商好的协议进行信息交换。想象一下,一个负责预订机票的 Agent,需要与航空公司 Agent、支付 Agent、日历 Agent 乃至天气 Agent 协同工作,但它们可能来自不同公司、基于不同框架,使用着各自孤立的“语言”和接口。等标准化协议的出现,才如同一场“语言革命”,打破了藩篱,催生了全球互联的互联网,释放了前所未有的创新潜能和经济价值。

2025-05-06 17:05:10 50

转载 大脑如何创造新的记忆?《科学》论文为揭示大脑用于学习的新“规则

精准的神经连接的调整,只有相关神经连接被强化(如正确发音对应的突触),无关连接被弱化,才能避免混淆。通过理解突触可塑性的正常运作机制,科学家或能更精准地揭示抑郁症的病理机制,并开发更有效的治疗方法。这一发现表明,单个神经元上的不同突触群,会同时应用两套规则(而非单一规则),能够更精准地调节不同类型的输入,从而在大脑中形成对新信息的恰当表征。

2025-05-06 17:05:10 21

转载 图灵奖得主:AI能力每7个月翻倍,出现自我保护意识—— Yoshua Bengio谈如何构建安全而不反噬人类的AI

他质疑当前AI研发的哲学路线,即模仿人类智能和思维的方式,提出应该构建一种完全不同类型的AI,一种只关注理解世界而不追求自身目标的系统。” 他警告,如果一家公司在AI开发上领先太多,可能会停止分享最先进的技术,并利用超级智能AI创建取代现有企业的新公司,从而“”他指出,尽管不同研究机构和行业领袖的预测有所不同,从2年到10年不等,但普遍认为人类水平AI的出现将是近期而非远期事件。”的演讲,剖析Bengio为何从企业突然转向AI安全研究、对AI安全的担忧,以及如何应对失控AI带来的潜在威胁。

2025-05-05 16:58:36 128

转载 Nature意识之争:两大理论首次正面对决

关键词:意识理论、对抗性合作、全局神经元工作区理论(GNWT)、整合信息理论(IIT)、功能磁共振成像(fMRI)、脑磁图(MEG)、颅内脑电图(iEEG)、后皮层、前额叶皮层(PFC)、神经同步。GNWT认为意识源于前额叶皮层(Prefrontal Cortex, PFC)的“全局信息广播”,而IIT主张后皮层“热区”的神经整合是意识的核心。

2025-05-05 16:58:36 497

转载 谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙

为了说明这种故障模式,本文展示了 Gemma2 2B/9B/27B 在启用和禁用 CoT 的情况下,在 64 个 MAB(包含 10 个和 20 个分支)上,并且在 50 个交互步骤中实现的平均操作覆盖率(见图 3 a 和 b)。因此,本文首先研究模型表现欠佳的原因,并确定了三种常见的故障模式:(1) 贪婪,(2) 频率偏差,以及 (3) 知 - 行差距。结果显示 RLFT 降低了遗憾值。本文探索的下一个常见故障模式是频率偏差,其特点是模型重复选择上下文中出现频率最高的动作,即使该动作的奖励很低。

2025-05-05 16:58:36 205

转载 Nature综述:大规模神经形态计算

摘要神经形态计算(Neuromorphic Computing)指脑启发的硬件与算法设计方法,研究者们借鉴神经科学中的生物智能原理来设计高效的计算系统,尤其适用于对体积、重量和功耗有严格要求的应用场景。当前,该研究领域正处于发展的关键阶段,因此明确未来大规模神经形态计算系统的发展方向至关重要。本文探讨了构建规模可扩展的神经形态计算架构的方法,并总结了其中的关键特征。此外,我们分析了可以从规模扩展中获益的潜在应用场景,以及需要解决的主要挑战。进一步地,我们审视了支持该领域持续发展的完整技术生态系统,并探讨了规

2025-05-04 16:43:50 222

转载 数学大统一梦想:朗兹兰纲领几何部分核心突破

通过群同态(少部分会有群同构),在保持运算一致情况下把这些群映射到一种我们非常熟悉的代数结构中,尤其是可逆矩阵构成的线性群,就可以通过我们熟悉的矩阵运算的性质,得出一些结论。映射过程中,同构当然非常好,可以说两个代数系统(定义了运算的非空集合)之间是完全相同的,但是多数情况下是条件稍微弱一些的同态,就相当于我们的函数是多对一的方式,而不是同构的一一对应方式,和函数相比还多了一种保持运算不变的要求。群有多种类型,比如说有限群,无限群,循环群,对称群,置换群,阿贝尔群,非阿贝尔群,还有李群等。

2025-05-04 16:43:50 320

转载 微软AI CEO万字访谈实录:AI算力的两个趋势正在同时发生

来源:数字开物4月29日,微软 AI CEO Mustafa Suleyman 接受海外播客AI Applied的访谈,本次对话探讨了将个性与情商融入AI的重要性,区分工作场景的AI Agent与个人生活的AI伴侣,AI作为“数字物种”的演进及语音交互的关键作用,AI设计中细节“技艺”的价值,AI面临的语调、个性化边界、数据归属挑战;以及AI对未来工作、人机协作模式的变革,AI Agent普及化与算力发展的趋势等话题。以下是本次对话实录经数字开物团队编译整理01个性与情商在AI发展中与智商同等重要主持人提问

2025-05-04 16:43:50 30

转载 OpenAI发长文自曝家丑:搞砸了GPT-4o更新,模型“拍马屁”复盘与总结

刚刚,OpenAI官网发布了一篇名为《Expanding on what we missed with sycophancy》的“复盘”长文,OpenAI这次公开“自曝家丑”,详细拆解了一次失败的模型更新,展现了AI模型开发和部署中的复杂性与挑战,我们来快速拆解一下。确解读反馈是他们的责任。现在用户使用的是回滚前的、行为更均衡的GPT-4o版本。

2025-05-04 16:43:50 12

转载 神经科学中的人工智能鸟瞰视角

来源:CreateAMindBird’s Eye View of Artificial Intelligence in Neuroscience 神经科学中人工智能的鸟瞰视角https://www.liebertpub.com/doi/pdf/10.1089/ains.2024.0001摘要 本综述采用了一种常见的文献计量学技术,通过分析引用模式来确定人工智能(AI)在神经科学研究中的应用领域。利用文献耦合方法构建了相关出版物的网络,重点关注包含人工智能和神经科学元素的同行评议研究文章和综述文章。在过去的

2025-05-03 16:32:33 170

转载 人工智能二位教父共同探讨人类水平人工智能的潜力、新兴风险和未来

这两位图灵奖的获得者,被视为计算机领域的最高荣誉,此次访问新加坡,是为了参加与新加坡人工智能研究周同期举办的第十三届国际学习表征大会。在讲座期间,LeCun 教授分享了他的理念,即构建具有类人智能的人工智能系统来增强人类的能力,并描绘了未来世界的图景,即人类在日常生活中的互动将通过人工智能系统得到增强。虽然LeCun教授认同人工智能的控制权不应仅掌握在少数几家企业实体手中,但他表示,构建具有类人智能的目标驱动型人工智能,对于实现他所设想的人工智能的未来——一个人人都拥有智能虚拟助手的世界——至关重要。

2025-05-03 16:32:33 142

转载 图灵奖得主杨立昆:语言不是思维的核心,人类大部分思维活动和语言无关

罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)奥雅纳:2024 塑造超级高铁(Hyperloop)的未来:监管如何推动发展与创新研究报告(28 页)

2025-05-02 18:29:30 23

转载 数学和物理学是如何相互启发、共同推动科学进步的?

而物理学则被视为"数学灵感和洞见的丰富源泉",为抽象的数学世界提供了丰富的现实案例。到了 20 世纪初,数学大师希尔伯特在他著名的 23 个问题中,将物理学的公理化列为第六个问题,希望能像几何学那样为物理理论建立严格的公理体系。早在公元前三世纪,阿基米德在求解球体体积时,最初采用了物理直观的方法,如想象用天平平衡不同形状的物体,然后才给出严格的数学证明。学家奥古斯特·孔德在他的科学分类中,将物理学和天文学置于数学之后,认为它们虽不如数学普遍,但更为复杂,因为都依赖于数学基础。

2025-05-02 18:29:30 117

转载 机器人最强出海竟然是这四类?最后一种你绝对想不到

就移动机器人成本而言,在出海方面,中国是机器人生产制造大国,具备从核心零部件、本体制造到系统集成的完备的机器人供应链,整体部件国产化率较高,对供应链的控制能力较强,因此具备成本优势,出海的物流机器人毛利率能达到。),招工难,后厨人力成本升高,老龄化问题严重,且大众对于菜品的口味稳定性也具备一定要求,激发了传统厨房向数字厨房方向的转变。以上,他们通过深入理解不同市场的特殊需求,构建了差异化的技术解决方案,成功突破了技术输出的关键瓶颈,这种高度定制化的战略也使得极智嘉实现了真正意义上的全球化运营。

2025-05-02 18:29:30 144

转载 AI未来发展受两大因素限制|扎克伯格万字访谈实录

来源:数字开物4月30日,Meta创始人兼CEO扎克伯格接受Dwarkesh播客访谈,本次对话深入探讨了Meta 在 AI 领域的最新进展,包括Llama 4 系列模型的发布、Meta AI 个性化功能探索;开源与闭源模型的发展态势、基准测试的局限性与真实用户价值的重要性。此外还探讨了 AI 自动化的潜力以及物理基础设施、人机协同进化等现实制约因素;AI对人际关系、用户体验的潜在影响与设计原则;以及全球 AI 竞争格局、基础设施建设的重要性等话题。扎克伯格明确指出过度关注排行榜等基准可能导致误判,真实的用户

2025-05-01 16:20:38 24

转载 国际聚变工程ITER完成全球最强脉冲磁磁体系统,多国合作突破能源瓶颈

当它与欧洲制造的24米直径环形磁体协同工作时,产生的电磁场能让等离子体持续燃烧500秒,实现输入50兆瓦、输出500兆瓦的十倍能量增益。这些材料需要在零下269度的极端低温下工作,印度提供的低温系统每天要循环5000升液氦,这相当于冻结整个西湖所需的制冷量。在法国南部的组装现场,俄罗斯制造的9米直径环形磁体正与中国生产的10米磁体精密对接。

2025-05-01 16:20:38 13

转载 大模型顶级排行榜被指系统性“造假”,官方紧急回应

论文声称,少数(主要是大型、专有模型)提供商被允许在Arena上进行大量“私下测试”,可以提交多个模型变体进行评估,但最终只选择性地公开表现最好的那个版本的分数,甚至可以撤回不满意的结果。最后给大家贴一下openrouter的大模型综合排行(还有各个领域的排名,涉及编程,市场,角色扮演,技术,科学,翻译,法律,金融,健康,学术等大家可以自行探索)他推测,不同团队可能投入了不同程度的精力专门针对Arena评分进行优化,导致模型更擅长Arena偏好的风格(比如嵌套列表、表情符号),而非整体能力提升。

2025-05-01 16:20:38 48

转载 意识:A beautiful loop:实现AGI的条件及证据(知道自己知道的计算模型及大量证据)

来源:CreateAMindA beautiful loop:An active inference theory of consciousness意识的主动推理理论:一个美丽的循环https://osf.io/preprints/psyarxiv/daf5n_v2摘要主动推理能模拟意识吗?我们提供了三个条件来说明它可以。第一个条件是模拟现实或生成世界模型,它决定了可以知道或采取行动的内容;即知识领域。第二个是推断竞争进入世界模型。只有那些能够连贯地减少长期不确定性的推断才能获胜,显示出我们称之为贝叶斯绑定

2025-05-01 16:20:38 10

转载 一文学习264页 Agent 综述,MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

但目前大部分 Agent 仅是基于 LLM 的简单延伸,距离真正的通用的智能尚有距离,在目前的设计下,面对复杂的真实世界,Agent 面临着推理规划、长期记忆、自主学习以及安全对齐等核心能力不足的问题。个体 Agent 的异质性、环境反馈和信息交换增强了交互的动态性,这对复杂社会网络的形成和决策策略的改进至关重要。随着多 Agent 的优势成为共识,其评估范式亦需有根本性的变革——MAS 评估应聚焦于 Agent 交互的整体性,包括协同规划的效率、信息传递的质量与群体决策的性能等关键维度。

2025-04-30 17:40:40 37

转载 扎克伯格最新专访:AI 会在知识工作和编程领域,引发一场巨大的革命

来源:亚布力企业家论坛CEF责编:许加林排版:王紫薇近日,Meta首席执行官马克·扎克伯格接受了媒体采访,全程信息量满满。访谈中,扎克伯格谈到了Meta如何看待下一步AI发展格局,并回应了外界认为“DeepSeek吊打Meta”的质疑。他表示,通过比较Llama 4 模型与 DeepSeek 的能力可知,尽管 DeepSeek 可能在特定领域取得了显著进展,但Llama 4模型能够提供更高的效率和更广泛的功能。以下为采访内容(有删节):马克·扎克伯格: 在我看来,世界会变得更加有趣、甚至有些奇特。根据我的经

2025-04-30 17:40:40 23

转载 警惕大脑数据被出售和滥用:立法者呼吁规范脑机接口技术

在致监管机构的一封联名信中,三位议员指出,从大脑直接提取的神经数据,即便是匿名化处理,也可能揭示个体的心理健康状态、情绪波动及认知模式,这类信息不仅高度私密,也具备战略敏感性。尽管公众关注多集中于侵入式植入设备,市面上更常见的是无需医疗专业介入的非侵入式设备,例如冥想耳机、用于诱导清醒梦的设备,或声称能通过分析本能反应优化用户交友软件使用体验的产品。

2025-04-30 17:40:40 18

转载 对话朱松纯:Agent喧嚣之上,“走心”才是AGI的未来?

从 OpenAI 的 Operator 到“第一个通用智能体”Manus 的出圈,“智能体元年”的呼声不绝于耳,仿佛我们距离那个能自主理解、规划、执行任务的通用人工智能(AGI)只有一步之遥。就像你看任何一个动物,它不是一个被动响应的机器,你不管它,它也在忙自己的事,有自己的情感和价值判断,这才是 Agent。他并非全盘否定大模型。“小数据、大任务”的范式,核心思想是让智能体通过与环境的互动,自主构建对物理世界和社会规则的理解(即“理”),并由内在的价值(即“心”)驱动其行为,而非仅仅拟合表层的数据模式。

2025-04-30 17:40:40 45

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除