- 博客(63)
- 收藏
- 关注
原创 【AI News | 20250509】每日AI进展
ZenCtrl 基于 OminiControl 构建,但在更精细的控制、一致的主体保持以及更完善的模型方面进行了增强,目标是构建一个由 LLM 驱动的智能视觉生成系统,用于编排图像和视频的创作。在多个领域内外的实验结果表明,ZeroSearch 的性能优于基于真实搜索引擎的模型,且 API 成本为零,并能很好地泛化到不同大小的基础和指令微调 LLM,同时支持不同的强化学习算法。字节开源了基于节点的流程构建引擎,支持固定布局和自由布局模式,提供了一套交互最佳实践,特别适合需要明确输入和输出的可视化工作流。
2025-05-10 01:31:28
917
原创 【AI News | 20250508】每日AI进展
Arxiv Daily AIGC 是一个自动化项目,每日从 arXiv 的 cs.CV 领域抓取最新论文,利用 AI (通过 OpenRouter API) 智能过滤与图像、视频和多模态生成相关的论文,并评估其价值。Mistral 推出了其 3 系列的中等规模模型 Medium 3,该模型在性能上表现卓越,多项基准测试中达到或超过 Anthropic Claude Sonnet 3.7 的 90%,并超越了 Llama4Maverick 和 Cohere Command A 等模型。
2025-05-09 00:56:57
937
原创 【AI News | 20250507】每日AI进展
Klavis AI 推出了开源 MCP 集成解决方案,旨在为开发者提供高效稳定的 AI 应用集成与部署环境。该项目已在 GitHub 开源,提供全面的工具和资源,支持在一分钟内将 AI 应用连接至生产就绪的 MCP 服务器和客户端,并具备快速扩展能力。Klavis AI 的 MCP 集成提供稳定可靠的 MCP 服务器、内置身份验证、官方或评估认证的高品质保障,以及 Slack、Discord 和 Web 等多种客户端集成方式。
2025-05-07 22:42:19
979
原创 【AI News | 20250506】每日AI进展
该项目采用复杂的客户端-服务器架构,利用WebSockets传输音频片段,RealtimeSTT进行语音转文本,LLM(默认Ollama,支持OpenAI)处理文本,RealtimeTTS将文本转回语音,并支持对话中断。英伟达在Hugging Face发布了开源ASR模型Parakeet-TDT-0.6B-V2,该模型拥有6亿参数,采用FastConformer编码器和TDT解码器架构,能在1秒内转录60分钟音频,词错误率仅为6.05%,媲美商业工具。此外,用户还可以上传图片或文档作为对话的上下文参考。
2025-05-06 22:41:36
974
原创 【AI News | 20250430】每日AI进展
Meta还推出了实验模式以模拟更真实的人类对话。Unsloth推出了Qwen3的动态量化2.0版本,通过智能层选择和优化的量化技术,在显著降低显存需求的同时保持高准确度,使得Qwen3-8B可在12GB VRAM上运行,Qwen3-235B-A22B在24GB VRAM+80GB RAM系统上也能运行。RWKV基金会开源发布RWKV7-G1 1.5B推理模型,该模型基于World v3.5数据集训练,拥有强大的推理能力和广泛的语言支持,可处理100多种自然语言,尤其在英语和多语言能力上超越同规模开源模型。
2025-05-01 01:01:58
606
原创 【AI News | 20250429】每日AI进展
ACI.dev解决了构建生产级AI智能体时面临的基础设施难题,如大规模认证、工具发现和自然语言权限管理,支持各种LLM框架和智能体架构,并提供丰富的预构建集成,助力开发者快速构建功能强大的AI应用。该技术基于先进的生成模型和图像处理技术,实现了动态图像混合和光影一致性,并支持高分辨率输出和用户友好的文本驱动交互。Cheehoo旨在将AI的力量赋予艺术家和版权持有者,解决行业痛点,提供快速创建和迭代角色动画、保持艺术风格一致性及精确控制的能力,并兼容专业动画和游戏流程,同时保障数据和知识产权安全。
2025-04-29 23:10:02
962
原创 【AI News | 20250428】每日AI进展
Qafind Labs发布了ChatDLM模型,是首个深度融合区块扩散和专家混合技术的模型,在GPU上实现了高达2800 tokens/s的超高推理速度,并支持131,072 tokens的超大上下文窗口。OpenAI将GPT-4o的强大图像生成能力集成到GPTs平台,用户可以创建自定义的图像生成机器人,实现个性化的图像创作,如生成特定风格的海报或艺术作品。“AI小蚂”致力于消除AI在旅行场景中的“幻觉”,让推荐有据可依,从而提升用户旅行规划的效率和个性化体验,推动智能旅行服务的发展。
2025-04-28 22:43:03
836
原创 【AI News | 20250425】每日AI进展
百度在开发者大会上宣布启动“AI开放计划”,旨在通过搜索开放平台接入各类AI应用,包括智能体、H5、小程序和App,为用户提供全面的AI服务,并为开发者带来流量和收益。百度创始人李彦宏强调技术的平民化,“心响”和“秒哒”的推出展示了百度在多智能体应用领域的技术实力,并为AI应用的未来发展提供了新思路。综述还详细阐述了在数据安全、预训练安全、后训练安全、模型遗忘、部署安全和应用安全等方面的防御机制,为学术界和工业界提供了全面、深入且最新的参考框架,旨在构建更安全可靠的人工智能生态系统。
2025-04-26 00:46:39
737
原创 【AI News | 20250424】每日AI进展
1、y-guiy-gui是一款基于Web的图形界面AI聊天工具,支持配置多个AI模型,并利用强大的模型上下文协议(MCP)实现高级集成。除了标准的聊天功能,y-gui还通过MCP连接Gmail进行邮件管理,集成Google Calendar进行日程安排,支持在聊天中直接生成图像,并提供可扩展的框架以添加更多MCP服务器和工具。该应用采用React前端和Cloudflare Workers后端架构,具备安全认证、暗/亮主题切换、实时更新和响应式设计,所有聊天数据存储在Cloudflare R2中。1、即梦
2025-04-24 23:41:17
1016
原创 【AI News | 20250423】每日AI进展
此外,v2.5优化了骨骼蒙皮系统和3D生成工作流,提供专业管线模板,旨在降低3D内容创作门槛,提升效率,并推动其在游戏、动画等领域的应用。该功能支持与Avimark、Cornerstone等主流PIMS系统自动同步AI生成的医疗记录,消除了手动复制粘贴的繁琐流程,显著减少了兽医的文书工作负担,使其能够更专注于动物护理和与宠物主人的互动。AvatarFX提供多样化的音频选择,并内置安全控制措施。它作为您的数字伙伴,提供研究、数据分析和日常问题解决等功能,并结合强大的能力与直观的界面,理解您的需求并交付成果。
2025-04-23 22:34:22
1013
原创 【AI News | 20250422】每日AI进展
Vidu AI最新发布的Vidu Q1模型在权威视频生成评测榜单VBench的最新一期中,以总分第一的成绩登顶VBench-1.0和VBench-2.0的文生视频榜单,超越了Runway、Sora和LumaAI等国内外知名模型,并在视频质量、语义一致性、常识推理和物理理解等多个维度达到领先水平。有两种工作模式:Agent Factory:只需描述,Cooragent就会根据需求生成一个智能体,其自动分析需求,通过记忆和扩展深入理解用户需求,挑选合适的工具自动打磨Prompt,逐步完成智能体构建;
2025-04-22 21:28:34
588
原创 【AI News | 20250421】每日AI进展
Trae v1.3.0兼容多平台,支持主流AI模型,旨在通过灵活的技术架构和广泛的应用场景,重塑AI开发生态,成为开发者首选平台。通过MIT许可协议开源,Intel旨在吸引开发者参与定制和贡献代码,推动生成式AI技术的普及和社区协作,此举被视为Intel在AI市场战略布局的重要一步,并有望促进基于Intel硬件的AI应用生态发展。目前,Gemma 3的不同尺寸版本已可在各类GPU上运行,并得到Ollama、LM Studio和MLX等开发者工具的支持,让更多用户能在资源有限的设备上体验强大的AI功能。
2025-04-21 21:17:36
721
原创 【AI News | 20250418】每日AI进展
Blender-MCP 降低了 3D 建模门槛,适用于游戏开发、概念艺术、教育培训和建筑可视化等领域,其简易的安装和使用流程受到了社区的广泛欢迎,未来计划整合更多 AI 模型并优化性能。微软开源了 MAI-DS-R1,该模型基于 DeepSeek-R1 进行了改进,显著提升了在敏感话题上的响应能力,达到了 99.3%,是原版的两倍多。评估结果显示,MAI-DS-R1 在敏感话题响应方面超越了原版及其他衍生模型,并在安全性方面表现良好,同时保持了原有的优秀推理能力,并增强了处理不当请求时的谨慎性。
2025-04-18 21:02:41
644
原创 【AI News | 20250417】每日AI进展
OpenAI发布了最新的多模态模型o4-mini和满血版o3,它们均能处理文本、图像和音频,并具备调用网络搜索、图像生成、代码解析等工具的能力,以及深度思考模式。元宝AI好友依托腾讯混元和DeepSeek模型,展现出强大的多模态能力和低延迟响应,对聊天小程序和独立AI应用如豆包、文心一言等构成显著竞争压力,并可能加速AI在社交、电商和客服等领域的普及。在决策时会参考历史类似案例,可以解释判断理由,并基于LLM对上下文的分析进行更细致的判断,并非简单的“是/否”判断,设有人工干预机制,支持详细的推理过程。
2025-04-17 21:54:51
660
原创 【AI News | 20250416】每日AI进展
生成清晰的代码结构可视化;该模型突破性发现规模效应可消除多模态任务性能折衷,7B版本在GenAI-Bench测试中超越Chameleon等模型,提供从0.5B到32B的开源版本及低成本API(输入$0.2/百万token),为短视频创作、教育内容生成等场景提供高效工具,推动多模态AI技术民主化。此次收购将结合Hugging Face的开源AI优势与Pollen的机器人硬件技术,推动医疗、服务等场景的智能化应用,标志着该平台从软件向"AI+机器人"生态的战略扩展,未来计划通过开源模式加速机器人技术研发。
2025-04-16 22:34:32
829
原创 【AI News | 20250415】每日AI进展
Mozilla为Firefox浏览器新增AI驱动的链接预览功能,用户悬停鼠标即可自动获取目标网页的智能摘要,无需点击即可快速判断内容相关性。该功能在提升浏览效率的同时,通过仅展示摘要而非全文的方式兼顾网站流量保护。虽然谷歌Chrome目前也提供链接预览但尚未整合AI技术,行业预计类似AI功能将成为浏览器标配,推动网页浏览体验的智能化升级。
2025-04-16 00:18:53
694
原创 【AI News | 20250414】每日AI进展
比如,给定一个新网站,它会自动发现技能,执行它们进行练习,并将练习经验转化为API,通过迭代探索,不断扩展API库,来增强智能体的能力。尽管存在生成限制和语言支持等初期局限,这一创新标志着生产力工具向智能化迈出关键一步,未来可能扩展更复杂的分析功能,重塑数字办公场景。项目最大亮点在于完全开源训练流程,并实现仅100美元的超低训练成本(0.1k H800GPU小时),采用创新的帧级噪声控制技术,在保持原始模型性能的同时为研究者提供了可复现的低成本开发范式,有望加速AI视频生成技术的普及与创新。
2025-04-15 01:17:16
785
原创 【AI News | 20250411】每日AI进展
该模型通过权重初始化优化和动态噪声调节等创新技术,展现出卓越的规划能力和文本连贯性,支持灵活生成顺序与质量速度调节,相关代码和模型权重已在GitHub开源,有望推动文本生成技术范式革新。其支持自定义字段或预置模板,提供置信度评分、多页处理及REST API集成,适用于多种操作系统(Linux/MacOS),并内置常见文档模板(如发票、护照),用户可灵活扩展字段或模板,满足企业级私有化部署需求。其"从辅助到执行"的理念变革,有望重塑企业运营模式,目前已在多个行业引发强烈反响,平台试用功能同步开放。
2025-04-11 23:44:54
715
原创 【AI News | 20250410】每日AI进展
该数据集旨在系统性评估大模型在多语言环境下的代码自动修复能力,推动自动化编程技术向实用化、工程化方向发展,有望显著提升开发效率和软件质量,为开发者提供更智能的错误修复支持。这一创新工具将重塑视频创作模式,推动AI在多媒体领域的深度应用。此次更新标志着谷歌在实时AI技术领域的重要突破,为开发者提供了更强大的生产级工具,将推动教育、企业服务等多个行业的智能化创新。收集整理了视觉 RAG 领域的前沿论文和研究资源,涵盖视觉理解、视频理解、多模态和视觉生成等领域的前沿 RAG 论文,并进行了清晰的分类。
2025-04-10 23:34:13
654
原创 【AI News | 20250409】每日AI进展
该技术采用两阶段训练机制,结合元奖励模型过滤机制,使Gemma-2-27B改造的DeepSeek-GRM-27B在多领域测试中超越GPT-4o等更大模型,显著提升推理可扩展性,为AI在创意任务和动态环境中的应用开辟了新路径,标志着大模型奖励机制的重要突破。其核心特点包括多模型支持(如OpenAI及国内主流模型)、灵活的多格式文档知识库、基于知识图谱的深度问答能力,以及简易的API配置和可扩展的智能体开发功能,为用户提供高效、智能的知识检索与问答服务。
2025-04-09 22:51:09
935
原创 【AI News | 20250408】每日AI进展
该模型采用MIT许可证完全开源,提供完整版和精简版选择,并配备一键式推理脚本降低使用门槛,有望成为国产AI技术在国际开源社区的代表作,为艺术创作和商业设计领域提供新的AI工具选择。谷歌推出实验性网络安全AI模型Sec-Gemini v1,该模型整合Gemini推理引擎与实时威胁情报数据,在威胁分析和漏洞识别方面表现突出,关键基准测试成绩领先竞品10.5%-11%,能快速关联威胁组织与具体漏洞,目前免费向选定机构开放测试,旨在通过AI技术提升网络安全防御效率,扭转攻防不对称局面。
2025-04-08 23:17:39
1081
原创 【AI News | 20250407】每日AI进展
微软此举不仅赋能个人,也为企业AI转型奠定基础,预示未来工作方式的变革。其卓越的长文本处理性能(相当于数百页文档)和代码生成质量引发行业关注,虽具体来源未明,但被视为下一代基础模型的雏形,为AI技术发展预示了新方向。新价格体系将重点惠及文档分析、代码复现等长文本场景用户,开发者反馈处理大篇幅文档的性价比明显提升,进一步降低了企业接入AI服务的门槛,推动大模型技术普惠化发展。专家建议企业调整招聘标准,更看重安全推理能力,同时加强培训,在AI辅助与专业素养间寻求平衡,避免技术便利演变为能力危机。
2025-04-08 01:52:23
711
原创 【AI News | 20250404】每日AI进展
亚马逊宣布测试名为"Buy for Me"的AI购物代理功能,允许用户在亚马逊App内直接购买第三方网站商品,无需跳转。相比OpenAI、Google等竞品的AI购物代理需手动输入支付信息,或像Perplexity使用预付卡,亚马逊的方案更直接,但也引发对AI误购的担忧。其核心优势在于直接干预AI的"思维过程",而非依赖传统的关键词过滤。OpenAI CEO Sam Altman宣布调整产品路线图,原已取消的o3推理模型将与新一代o4-mini在"数周内"发布,而GPT-5将推迟至"几个月后"。
2025-04-04 22:52:57
334
原创 【AI News | 20250403】每日AI进展
百度正式推出飞桨框架3.0,针对大模型开发需求提供五大核心特性,包括"动静统一自动并行"技术和"训推一体"设计,显著降低训练成本并提升推理性能。作为AI技术普及的重要资源,指南免费开放并持续更新,有望推动从内容创作到工作流自动化等广泛场景的创新应用,彰显Anthropic降低AI使用门槛的技术愿景。该功能试图创新在线约会,但实际效果仍待观察。作为平台AI战略的重要布局,饿了么同时宣布2025年前将投入超10亿元支持商家AI应用,持续优化包括智能经营分析在内的数字化服务生态,推动外卖行业效率革新。
2025-04-03 21:49:18
802
原创 【AI News | 20250402】每日AI进展
公司专注网络安全,其 GreyMatter 平台利用智能 AI 自动化安全流程,使威胁响应时间缩短至 5 分钟,调查速度提升 20 倍,准确率提高 30%。其模块化设计便于定制,友好的界面降低操作门槛。框架适配 60 余款主流芯片,开发者一次编码即可跨芯片迁移,适配成本降低 80%,覆盖训练集群、自动驾驶等场景,为大模型开发提供高效灵活的基础支持。该功能已覆盖手机版(2.11.0+)、电脑版(1.8.0+)和网页版,支持多选、拖拽及截图上传,展现元宝双模型的多模态理解能力,为多图处理提供便捷解决方案。
2025-04-02 21:05:08
765
原创 【AI News | 20250401】每日AI进展
专家呼吁自动化转型,以平衡创新与安全。综述论文显示,自2023年以来相关研究显著增加,存储库还包括统计趋势、词云分布和资源列表,旨在推动学术交流与实际应用,强调技术架构到现实用例的全面视角。生成式AI平台Krea近日上线3D生成功能并重构网站,用户可通过文本或2D图像快速生成可交互3D对象,实时调整细节,免费开放且速度快,降低建模门槛。昆仑万维推出的AI音乐生成平台Mureka近日更新,发布V1(SkyMusic)及V6双版本模型,支持12种语言,包括英语、汉语、日语等,并新增模型微调功能和API接口。
2025-04-02 01:18:53
699
原创 【AI News | 20250331】每日AI进展
新增AI模型花园与Cooper™平台,方便开发者,并展示多流视频分析及设备内AI应用,覆盖智能安防等场景,提升实时洞察与隐私保护。其核心功能包括资源、提示词、工具、采样、根目录和传输层,其中“工具”是本文重点。该模型覆盖英、美、德等多国场景,可控制时间、天气、道路类型,并同时生成五个视角视频,增强环境感知能力。百度文小言在AI DAY上宣布品牌焕新与功能升级,引入多模型融合调度技术,整合文心X1、4.5及DeepSeek-R1等模型,用户可通过“自动模式”智能选择最佳组合,提升响应速度与任务处理能力。
2025-03-31 23:13:29
1211
原创 【AI News | 20250328】每日AI进展
此外,提供AI翻译、PPT制作、语音克隆等强大多媒体功能,支持大模型接入微信,并兼容易支付、微信支付等多种支付方式,扩展性强,应用场景广泛。结合混元和DeepSeek模型,其支持多种编程语言,覆盖开发、评审、文档校对等场景,用户可通过拖拽上传文件,享受便捷智能服务。积分按月重置,未用积分不结转,免费及附加积分永不过期,使用顺序为月度、附加、免费。眼镜通过AI技术实现物品识别、餐厅信息查询等功能,类似苹果视觉智能系统,但无屏幕设计,交互依赖触摸和语音,或支持手势操控,需优化误操作问题。
2025-03-28 22:47:20
1013
原创 【AI News | 20250327】每日AI进展
清华大学与微软研究院合作推出 BizGen,一款针对商业内容的 AI 工具,能将长文转化为专业级信息图和幻灯片,解决传统工具文字不清、布局混乱的问题。腾讯开源团队推出多模态技术 HaploVL,采用单一 Transformer 架构,通过动态融合文本和视觉信息,提升 AI 在视觉-语言交互中的表现,特别在细粒度视觉理解任务上表现出色。美图旗下 AI 素材生成器 WHEE 接入 DeepSeek R1,通过提示词优化功能,将简单输入转化为专业文案,自动补全光影、构图等关键词,显著降低非专业用户的使用门槛。
2025-03-27 23:04:47
922
原创 【AI News | 20250326】每日AI进展
EnergyTS在发电预测中表现优异,T1天预测MAE为0.0233,较谷歌TimesFM-V2.0提升22.4%,T3天预测性能超越谷歌46.8%、亚马逊Chronos-Large 62.4%,助力企业优化策略,提升效率,挑战欧美能源AI技术垄断。知乎发布2024年业绩报告,全年营收36亿元,同比下降14.3%,但第四季度营收8.6亿元,实现净利润9710万元,经营利润2310万元,首次单季全面盈利。苹果承诺保护隐私,已模糊人脸与车牌,仅使用处理后的图像训练模型,并接受用户模糊房屋请求。
2025-03-26 23:53:43
807
原创 【AI News | 20250325】每日AI进展
服务提供细粒度权限控制,确保安全与灵活性,用户可通过简单URL集成快速启用,无需复杂编程。这一创新降低技术门槛,推动AI与自动化的深度融合,为企业运营优化和个人效率提升注入新动能,标志着AI助手从“生成”向“执行”的转型。通过AI驱动的洞察,企业能从反应式维护转向主动策略,优化资产性能,减少停机时间,提升效率与韧性,标志着西门子推动工业智能化的重要一步。微信小店调整政策,禁止销售AI商业应用相关课程,如“AI创业”、“获客”、“变现”等,并限制AI换脸、换声等虚假宣传内容,以及线下培训、奢侈品鉴定等课程。
2025-03-25 23:10:59
830
原创 【AI News | 20250324】每日AI进展
针对传统MoE模型需依赖昂贵GPU的问题,团队创新采用动态参数分配、混合精度调度等技术,在国产低性能GPU上高效训练3000亿参数模型,成本降至508万元/万亿token,较高端硬件节省约20%,性能媲美Qwen2.5和DeepSeek-V2.5。由Reve团队从零打造,其生成图像简洁大气,具备海报风格视觉冲击力,对提示词理解细腻,能优化简单描述生成惊艳效果,媲美市场领先技术。未来,团队计划扩展其在自然资源领域的应用,推出更多专业模型,以中文特色推动智慧海洋发展,提升中国在全球海洋治理中的影响力。
2025-03-24 23:45:07
1364
原创 【AI News | 20250323】每日AI进展
实验表明,多轮协作显著提升了LLM智能体的成功率,SWEET-RL在ColBench上的表现优于其他多轮RL算法,与GPT-4o等SOTA模型相当。紧随其后,马斯克的Grok也连夜上线了图片编辑功能,同样支持通过文字指令修改图片,甚至在手机APP上也能体验。未来,图片编辑有望从复杂的操作转变为简单的交互,AI赋能的大模型将为用户带来更便捷的体验。然而,尽管有研究者提出“测试时间计算”和“专家混合”等更高效的方法,微软等科技巨头仍计划在数据中心建设上投入巨资,表明“蛮力”扩大规模仍然是行业巨头的主要策略。
2025-03-24 00:34:40
1196
原创 【AI News | 20250322】每日AI进展
DeTikZify强大的地方在于它能理解图表的语义信息, 能识别图表中的不同组成部分及其含义,比如坐标轴、数据点等,也就是说如果你想修改图表中的某个部分,你只需修改相应的语义信息,它就能自动更新TikZ代码。一张照片几秒钟创建出一个3D数字人,这个数字人可以做各种动作,效果看起来逼真,衣服、头发、面部等细节保持的很好。隐私优先的 AI 助手和智能体构建开源工具,它能让我们在本地设备上使用开源模型进行 AI 聊天、创建智能体并将其转换为功能完整的应用,所有数据都不会离开你的机器,真正实现隐私保护。
2025-03-22 22:19:32
434
原创 【AI News | 20250321】每日AI进展
钉钉在“AI创业N次方”大会上推出新生态政策“AI创新N次方计划”,免除佣金、保证金及算力费用,并提供销售、品牌、技术、投资支持,降低AI创业门槛。蚂蚁以医疗大模型为核心,构建“机构-医生-患者”三维体系,打通诊疗到健康管理闭环,探索安全可信AI应用。天猫还推出AI直播、营销、智能客服等工具,全面提升效率,并展示AI冰箱等产品及虚拟家居体验舱,引领AI购物新趋势。此前,其“可灵AI”已整合DeepSeek R1,优化视频与图片生成,用户可通过精准提示词控制场景、镜头等元素,简化创作流程。
2025-03-22 01:10:21
980
原创 【AI News | 20250320】每日AI进展
Arcade.dev获1200万美元种子轮融资,由Laude Ventures领投,旨在为AI代理提供安全认证与集成平台,解决AI与企业及消费应用交互的安全难题。OpenAI发布o1-pro推理模型,投入更多算力提升响应质量,API定价高达输入150美元/百万token,生成600美元/百万token,是普通o1的十倍,仅限消费超5美元的开发者使用。支持多种模型和工具,可定制工作流程。T1模型备受期待,或将提升推理能力,进一步巩固腾讯在全球大模型竞争中的地位,展现其在AI领域的持续突破。
2025-03-20 23:57:32
1194
原创 【AI News | 20250319】每日AI进展
比如你想知道这个UP主讲过哪些“关于Python的内容”,直接输入问题,就能找到相关的视频片段,还会告诉你具体在哪个视频的什么时间点。克里格表示,语音交互是未来趋势,将无缝融入Claude,带来更人性化的体验。OpenAI启动“星际之门”项目,投资1000亿美元,首座数据中心落户德州阿比林,计划配备40万片英伟达AI芯片,2026年中建成,发电容量达1.2吉瓦。用户提供主题后,它生成网页搜索查询,通过Tavily收集结果,总结内容,反思知识缺口,再生成新查询,循环优化总结,用户可定义循环次数。
2025-03-19 22:57:02
734
原创 【AI News | 20250318】每日AI进展
美国劳工统计局数据显示,受AI技术影响,计算机编程就业人数降至1980年以来最低,远低于历史峰值70万,目前仅剩一半。收费按使用量计算,每次请求及工具调用$0.05,全额使用达$10,适合专业开发者及高预算用户,不含Pro套餐,需额外开启计费模式。吴泳铭在财报会上透露,未来三年将聚焦电商、科技、互联网平台三大业务,加大AI基础设施、基础模型及应用投入,升级现有业务,抓住AI时代机遇。它能够通过控制相机视角和运动路径,将已有的视频素材“重新拍摄”,生成全新的动态视角,而无需额外的拍摄设备或复杂的后期制作。
2025-03-19 01:03:39
705
原创 【AI News | 20250317】每日AI进展
OpenAI首席产品官Kevin Weil透露,GPT-5“很快推出”,或整合GPT-4与O系列能力,并预测年内AI代码自动化达99%,远超预期,称AI已超越顶级程序员。用户更新至最新版后,通过「汪仔」按钮或快捷键激活AI助手,新增「=号」搜索功能实现边聊边查,「AI划词」则支持搜索、翻译、总结等操作,无需切换应用。快手可灵AI全面接入DeepSeek-R1,增强视频与图片生成能力,用户可轻松将灵感转为专业提示词,降低创作门槛,提升效率。该项目深化阿里云AI布局,通过“借调”方式吸纳人才,提升团队创新力。
2025-03-17 23:20:25
848
原创 【AI News | 20250316】每日AI进展
将网络搜索能力集成到AI助手中的一个MCP服务:ReActMCP Web Search,相当于给AI装了个搜索引擎,可以实时查找最新的内容。它基于Exa API执行基本和高级网络搜索,高级搜索比如限制搜索的网站范围、指定日期范围、包含特定文字等。让AI与QGIS进行交互和控制的MCP,你可以通过自然语言提示让Claude直接控制QGIS,执行各种GIS 操作,比如加载数据、进行空间分析、创建地图、执行处理算法,甚至运行PyQGIS代码等。(2)MCP服务器,实现了MCP并连接到QGIS插件。
2025-03-16 23:33:01
723
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人