- 博客(691)
- 资源 (24)
- 问答 (1)
- 收藏
- 关注
原创 5个情感丰富GPT-4o图像提示词(不是吉卜力风格)
创建一个9:16垂直画布,展示九个3D可爱迷你风格贴纸,描绘一个中等肤色、深色卷发、留胡子、戴墨镜的男子,穿着休闲和半休闲服装,展示不同姿势和情绪,如挥手、思考、大笑、竖起大拇指和睡觉。确保所有九个贴纸都有可见文字,保持角色风格一致,如可爱的超大头部、富有表现力的姿势、简单细节的服装,并确保光线柔和而活泼,呈现生动、精致的外观。在这一趋势中最引人入胜的方向之一是"吉卜力风格之后"的图像的兴起——一种受到吉卜力工作室讲故事风格和美学影响的视觉语言,却应用于个人品牌、旅行、创业文化等现代概念。
2025-05-04 23:05:21
640
原创 揭秘微软与OpenAI的147亿美元决裂内幕
但微软对OpenAI要求更多算力的态度渐趋消极,尤其是在投入800亿美元建设自有AI基础设施的背景下。去年夏天,OpenAI推迟共享一个强大推理模型的代码,阻碍了微软将其整合到Copilot的计划。这一趋势体现在OpenAI的GPT商店与微软Copilot的竞争,以及微软探索替代模型上。对OpenAI而言,失去微软的算力资源可能延缓其AGI目标,特别是在面临2025年预计50亿美元亏损的情况下。OpenAI与甲骨文和CoreWeave的合作,以及微软对Phi-4的投资,表明双方都在为独立未来做准备。
2025-05-03 20:55:53
972
原创 如何使用Ollama在本地运行Qwen3并支持MCP和工具使用
将Qwen3与Qwen-Agent、MCP和Ollama结合使用,可以得到一个不依赖任何外部云服务的本地AI助手。您可以运行多轮对话,启用实时信息检索,并执行Python代码——全部在本地基础设施内完成。这使其成为开发人员、研究人员和产品团队的理想设置,特别是那些关注隐私、灵活性和可扩展性的人。随着Qwen3的不断发展,我们可以期待其对复杂任务的更强大支持和与自定义工具的无缝集成,为真正自主的本地AI代理铺平道路。
2025-05-03 02:13:30
34
原创 如何免费使用 DeepSeek-Prover-V2?
DeepSeek Prover V2在使符号推理变得易于访问和自动化方面迈出了一大步。对教育、辅导或研究非常有用。你可以将其扩展到证明、定理、逻辑谜题等更多领域。你甚至可以在官方页面的 HuggingFace 推理部分免费试用该模型。希望你能尝试这个模型。
2025-05-01 20:24:52
139
原创 免费在Colab运行Qwen3-0.6B——轻量高性能实战
Qwen3-0.6B证明了较小的模型正变得更加智能。它在其规模内表现出色,可以轻松在Colab上运行,并且采用开放使用许可。朋友可以尝试下。
2025-04-30 18:57:35
109
原创 Context7 MCP:提供实时、版本特定的文档以解决AI幻觉问题
Context7代表了编码辅助工具的新方向,通过实时上下文信息增强开发效率。它有效解决了AI编码助手最大的痛点——版本不匹配导致的API错误。未来随着更多团队采用MCP服务器和llms.txt标准,基于上下文的智能编码体验将成为开发新常态。
2025-04-28 23:53:43
110
原创 DeepWiki:AI深度搜索3万个代码库
DeepWiki代表了利用AI进行代码库理解的重大进步。通过自动生成文档并提供交互式探索工具,它降低了理解复杂软件项目的障碍。其技术基础,结合代码分析与先进的LLM,为开发者生产力、入职培训和对开源生态系统的贡献提供了切实的好处。
2025-04-27 23:46:36
28
原创 开源AI视频FramePack发布:6GB显卡本地运行
我们现在处于这样一个时代:您 — 在家中,使用中端GPU — 可以制作AI电影。无需订阅。无标记。无限制。FramePack是一个开放的创意沙盒。无论您喜欢动漫、模因、短片、讲故事还是实验,它都能让您完全掌控。而且是免费的。如果您关心AI内容创作开源工具或本地生成AI视频, 可以尝试下。
2025-04-26 23:00:09
1077
原创 OpenAI 最新 o3 集成到 Cursor 和 Cline 工作流程中
绝对值得。将o3集成到Cursor和Cline中明显增强了编码体验。Cursor凭借其原生支持提供了最简便的路径,使其成为交互式AI辅助的绝佳工具。Cline提供了对更自主、Agent驱动开发的一瞥,尽管目前通过OpenRouter为o3设置略微复杂。关键是了解每个工具的优势并相应地调整你的提示。无论是生成样板代码、调试棘手的逻辑还是自动化多步骤任务,o3都提供了强大的推理引擎。既然你已经了解了设置和潜力,你会首先构建什么?深入探索,实验,看看o3如何改变你的工作流程。
2025-04-25 19:32:31
120
1
原创 Dia-1.6B TTS: 最佳文本对话生成AI模型
现在我们有了一个新模型Dia-1.6B,它在会话式AI方面似乎比ElevenLabs和Sesame CSM 1B模型表现更好。,意味着用户可以通过提供参考音频片段来引导模型输出,影响说话者的情感表达和语调。虽然Sesame和ElevenLabs在TTS质量方面设定了高标准,但DIA的。方面表现更好,特别是在对话密集的场景中。与传统的产生僵硬或单调语音的TTS系统不同,DIA擅长捕捉。等模型所缺乏的能力,后者需要手动替换(例如"哈哈")。另外,如果你不想在本地运行,可以在这里尝试。,如笑声、咳嗽和清嗓子。
2025-04-24 20:48:26
478
原创 OpenAI 宣布有意收购 Google Chrome
虽然 Chrome 已向超过 40 亿用户免费提供,占全球浏览器市场的 67%,但这种免费分发是由谷歌的广告收入资助的,而法官声称由于公司的垄断地位,这些广告收入过高。当被问及此事时,OpenAI 的 Turley 指出,虽然该公司目前使用微软 Bing 的搜索数据,但它希望获得更多搜索数据,包括来自谷歌的数据。虽然谷歌和 OpenAI 目前不是合作伙伴,但 Turley 表示,强制共享谷歌的搜索数据可能有助于恢复市场中的健康竞争。谷歌还拥有领先的网络浏览器 Chrome,谷歌搜索在其中作为默认搜索引擎。
2025-04-23 22:06:33
278
原创 从零到多智能体:Google Agent开发套件(ADK)入门指南
ADK促进自定义工具生产的能力是其优势之一。本质上,工具只是一个带有描述性文档字符串的Python函数。
2025-04-22 23:33:57
328
1
原创 Qwen-Chat与谷歌Veo2在免费AI视频方面对比
就在几天前,谷歌宣布了一项令人惊讶的举措,在AI Studio平台上向所有用户免费开放他们最先进的AI视频生成模型Veo2。为了与之竞争,Qwen团队也发布了Qwen 2.5 Max,现在可以在他们的Qwen Chat平台上免费且无限制地生成AI视频。我测试了这两个视频生成平台,以下是我的发现:谷歌AI Studio的Veo2每个账户每天只提供两次生成机会。而在Qwen聊天平台上,我生成了4到5个视频都没有遇到任何限制。因此,在免费使用方面,Qwen聊天平台任何时候都比谷歌Veo2更具优势。
2025-04-21 23:24:15
442
原创 开源项目FastAPI-MCP:一键API转换MCP服务
FastAPI MCP是一个零配置工具,可自动将您的FastAPI端点作为模型上下文协议(MCP)工具暴露出来。FastAPI MCP的优点在于其简洁性 — 它接管您现有的API端点并使其对AI模型可访问,而无需您重写代码或创建单独的实现。使用FastAPI MCP,您可以:自动将FastAPI端点转换为MCP工具保留您的API架构和文档将MCP服务器与您的API一起部署或作为单独的服务自定义哪些端点作为工具暴露控制如何生成工具描述。
2025-04-20 23:04:06
426
原创 免费将AI生成图像放大4倍的方法
这会导致很多不同的问题,特别是对于那些想要在内容或项目中使用这些图像的人,寻找商业许可内容用于广告目的的企业,甚至是销售AI内容的个人。当然不是,但对于任何想要一个完全快速、简单且免费的解决方案来提升AI图像分辨率的人来说,这是理想的选择。4x-AnimeSharp.pth:如果你创建AI生成的动漫内容,你可以使用这个放大器获得更好的效果。如果你发现了使用任何工具提升图像分辨率的基本且简单的方法,请随时在评论区分享,帮助其他人。下载我创建的这个简单且免费的工作流程,下载完成后,只需。
2025-04-19 22:16:19
1011
原创 从PDF到播客:MIT开发的超越NotebookLM的工具
使用Hugging Face空间,你不必担心这个问题——因为它是一个Gradio应用,它会自动为你在Hugging Face上创建(或本地运行)的任何空间提供API。NotebookLM是一项令人兴奋的技术,它已经激发了开源社区和许多项目——不仅仅是这一个——将潜在的难懂文本转化为更具吸引力的格式,使即使是最困难的主题也比以往任何时候都更容易理解,而这仅仅是个开始。为了了解推理和TTS的成本有多实惠,在我在此分享的实验中,我制作了一个关于技术趋势报告的播客,大约有50页,生成了15分钟的播客。
2025-04-18 19:45:22
290
原创 读完谷歌69页提示工程白皮书后的5个核心要点
谷歌这份白皮书不仅是学术探讨,更是一份行动倡议。提示词工程代表着未来,掌握它的人将成为时代的赢家。是时候停止将AI视为黑箱,而应将其视为我们最强大的合作伙伴了。
2025-04-17 22:01:05
1108
2
原创 免费使用RooCode + Boomerang AI + Gemini 2.5 Pro开发套件
截至2025年4月,这套「RooCode+Boomerang+Gemini 2.5 Pro」组合提供了惊艳的智能开发体验,关键是完全免费!它能:✔️ 自动处理重复性工作✔️ 加速开发流程✔️ 替代日费高达$150的商用AI工具。
2025-04-16 21:32:57
113
原创 OpenAI发布GPT-4.1系列模型——开发者可免费使用
OpenAI刚刚推出GPT-4.1模型家族,包含GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano三款模型。重点是——现在全部免费开放!虽然技术升级值得关注,但真正具有变革意义的是开发者能通过Cursor、Windsurf和GitHub Copilot等平台立即免费调用这些模型。开发者朋友们,现在就去体验吧!
2025-04-15 22:28:50
652
1
原创 谷歌A2A与Anthropic MCP: AI 智能体互补双协议
当 AI Agents 开始说"同一种语言",世界将发生何种巨变?近日,谷歌宣布开放Agent2Agent(A2A)协议,在社交媒体上引发轩然大波。A2A代码实践阅读上篇文章。但在炒作背后,隐藏着一个关于技术协同的精彩故事——看似竞争的两种协议实则形成了强大的互补。让我们解码这场技术变革的深层逻辑。
2025-04-14 21:58:54
83
原创 谷歌A2A协议入门指南:附简易Python代码示例
继"关税"之后,当下最热门的词汇当属AI智能体——这种基于人工智能的软件能够执行复杂任务、实现工作流自动化并提升生产效率。但迄今为止,大多数智能体都处于各自为政的状态,难以顺畅协作。就像团队执行重大项目时,成员之间却无法交流!对于技术人员而言,一个可能遇到的典型场景是:假设你需要协调四个不同的AI服务——处理用户查询的Gemini智能体、在向量数据库进行搜索的AI应用、基于Claude的摘要生成器,以及运行专业领域逻辑的Python智能体。
2025-04-13 21:28:51
107
原创 开源Cursor替代品——Void
我原先写过很多关于Cursor文章。今天分享一个开源的 Cursor 替代方案。如果你也热爱开源项目,那么这篇文章正是为你准备的!
2025-04-11 21:03:06
134
原创 谷歌推出可免费使用的Firebase Studio:Gemini全栈AI开发利器
🔥 谷歌Firebase Studio:用AI写代码!用自然语言+60多个模板+Gemini构建应用,完全免费,浏览器即可使用。现已开放抢先体验!
2025-04-10 23:39:01
411
原创 我是如何免费获取Cursor Pro的操作教程
我是个爱钻研技巧的抠门程序员,所以当我发现能不花一分钱搞到Cursor Pro时,简直乐疯了。这款高端代码编辑器我眼馋了好久,而这个妙招在我的Windows系统上完美奏效。虽然不是什么技术大神——不过是个写了十多年代码文章的普通码农——我会用最简单的方式说清楚。
2025-04-10 00:24:56
355
原创 GPT-5、o3和o4-mini即将到来
*推理模型世代(o1/o3/o4)的更新周期不再是基础模型(GPT-2/3/4/5)的18-24个月,而是3-4个月——提速达6倍。即将推出的o4-mini在性能上可能与o3相近,但将突破这些限制,让全球用户——甚至免费用户(尽管会有速率限制)——都能用上世界顶级AI研究助手。若GPT-5真如所言"远超我们最初设想"——我个人对此深信不疑——这将直接击穿质疑者的论调,无论是"算力缩放瓶颈无法通过测试阶段计算解决",还是"OpenAI迟迟不推GPT-5必因未达预期"之类的说辞。首先,基准测试结果不佳。
2025-04-08 21:45:55
927
1
原创 如何免费使用Meta Llama 4?
作为开源模型,Llama 4存在一个重大限制——庞大的体积。该系列最小的Llama 4 Scout模型就拥有1090亿参数,如此庞大的规模根本无法在本地系统运行。如果你拥有足够强的显卡,还可以下载完整模型权重——本篇指南将为你详解所有获取方式。Hugging Face平台提供了多种精度的Llama4模型(如FP8等),适合开发者使用。OpenRouter.ai 提供免费的 Llama 4 模型 API 访问权限。:适合需要快速集成 Llama 4 API 的开发者或想免费体验最新模型的用户。
2025-04-07 21:34:34
250
原创 Llama 4架构解析与本地部署指南:MoE模型在170亿参数下的效率突破
Meta推出的16专家与128专家配置的Llama 4模型,标志着开源大语言模型发展迈出重要一步。通过采用混合专家(MoE)架构,Meta在持续突破模型性能边界的同时,有效应对了AI模型规模扩展带来的计算挑战。Scout与Maverick采用不同专家数量的设计,表明Meta正在积极探索模型容量、推理效率与任务性能之间的最优平衡点。随着这些模型向研究社区和开发者开放,我们有望获得关于如何最佳利用MoE架构的丰富新见解。
2025-04-06 21:24:53
1316
1
原创 对比Augment Code、Cursor与Windsurf:哪款AI编程工具更胜一筹?[特殊字符]
在AI驱动的编程工具领域,开发者们如今拥有众多创新选择,这些工具旨在优化工作流程并提升效率。其中Augment Code、Cursor和Windsurf堪称佼佼者。本文将深入解析它们的功能特色、核心优势与差异,助你找到最适合自己的开发利器。Augment Code凭借高效处理大型代码库的能力崭露头角,其快速索引功能尤为突出,成为开发复杂多文件项目者的优选。:快速定位错误并提供修复建议:无缝对接海量数据集:相比Cursor和Windsurf,对预算有限的开发者极具吸引力。
2025-04-05 21:25:32
1408
原创 Gemini 2.5 Pro与Claude 3.7 Sonnet编程性能对比
尽管发布已有时日,Gemini 2.5 Pro 凭借其升级的推理分析能力持续引发热潮。该功能原本仅限Gemini Advanced订阅用户专享,如今已向大众免费开放。虽为新秀,Gemini 2.5 Pro 已在部分测试中超越ChatGPT 4等对手(但编程和多轮对话领域除外)。令人意外的是,在"人类终极考试"测试中,其未启用网络搜索功能的版本竟超越了OpenAI的深度研究模型,创下惊人成绩。
2025-04-03 20:43:27
1533
2
原创 使用Claude Desktop和MCP工具创建个人编程助手
模型上下文协议(Model Context Protocol)是一个开放标准,旨在促进AI模型与外部工具/数据源间的无缝通信。该协议采用客户端-服务器架构,能安全高效地实现AI模型与各类系统的交互。
2025-04-02 21:12:48
555
原创 Colab上运行Gemma 3 + Ollama:开发者快速入门指南
至此,您已掌握:在Google Colab通过Ollama运行Gemma 3通过命令行和Python与模型交互处理文本和图像输入构建流式响应和基础聊天应用。
2025-04-01 20:09:42
85
原创 使用Google Gemini API密钥创建AI驱动的Chrome扩展程序
借助Google Gemini API,将尖端AI能力集成到Chrome扩展从未如此简单。只需几个步骤,你就能打造一个能即时回答问题、总结网页、翻译内容的全能扩展——一切触手可及!💡这仅仅是开始!通过Gemini的AI赋能,扩展的可能性无穷无尽。无论是开发自动化工具、增强浏览体验,还是提升工作效率,AI驱动扩展的未来都充满光明前景🌟!接下来呢?发挥创意,立即开始构建属于你的AI动力Chrome扩展吧!🔧💻✨。
2025-03-31 21:51:26
374
原创 我用DeepSeek Coder模型构建了AI智能体来实现代码生成与审查
你是一名资深AI开发工程师。请根据以下任务要求编写**整洁、高效且文档完整**的代码片段:必须满足以下要求:- 遵循最佳编码实践- 使用有意义的变量名和注释- 优化性能和可读性- 尽可能保持简洁和模块化任务描述:{task_description}生成代码:""")这是首个AI智能体,扮演高级开发工程师角色。它接收任务描述并生成符合以下标准的优质Python代码:语义明确的变量命名清晰的代码注释性能优化处理模块化函数设计。
2025-03-30 21:07:27
103
原创 免费使用Gemini 2.5 Pro的完整教程
谷歌Gemini 2.5 Pro发布:100万token上下文+超强推理+多模态,现可免费试用!
2025-03-26 21:12:01
1085
原创 DeepSeek V3–0324 vs DeepSeek-V3, 排名最高非推理模型
代表了人工智能领域的革命性飞跃,在性能、开放性和多功能性上树立了新标杆。凭借6850 亿参数和MIT 开源协议,它不仅让前沿 AI 技术更易获取,还在编程、推理和多语言任务中展现了卓越能力。相较于Claude 3.7和等竞品,其更高的性价比使其成为开发者和企业的理想选择。通过满足市场对高效性、可扩展性和开源创新的需求,这一模型不仅巩固了其 AI 领域的领先地位,更为未来的技术突破铺平道路。不仅是一个里程碑——更是重新定义 AI 潜能的催化剂。
2025-03-25 20:31:45
800
原创 使用Mastra.ai构建AI智能体:一次动手实践
这次Mastra初体验令人惊喜。从零开始构建AI智能体的过程异常顺畅,短短几分钟就能让首个智能体投入运行。该框架集成了记忆功能、工具整合和模块化架构等特性,使开发过程既直观又充满成就感。作为个人项目的技术选型,Mastra表现亮眼——它不仅开源且维护活跃,开发者体验也相当出色。当然,作为新生框架,Mastra还存在一些早期项目特有的不足。但开发团队在Discord社区的快速响应和专业支持令人印象深刻,这让我对其发展前景充满信心。
2025-03-24 22:55:03
130
原创 你应该信任AI来编写你的代码吗?关于Vibe编程的真相
这听起来像是终极的生产力技巧,但这种策略有利有弊。氛围编程就像在繁忙的厨房里有一位AI副厨师——它能高效地准备菜肴,但仍需要一位有才华的厨师来指导最后的呈现。想象一下,你的AI伙伴正在重写你的代码,而它完全按照你的设想工作——无需调试,无需手动编辑,只需感受氛围。然而,如果你是一个试图完全依赖AI完成任务的编程新手,你可能会遇到比解决方案更多的问题。正如AI可以以惊人的速度生成代码,审查、完善和优化代码的过程仍然需要人类的专业知识。——借助AI生成的代码,概念验证项目的部署非常简单,几乎不费吹灰之力。
2025-03-23 18:47:29
83
原创 Gemini 2.0 Flash 改变图像编辑
Google AI Studio正在引领AI驱动的图像编辑技术的快速发展。通过Gemini 2.0 Flash实验模型,您可以轻松编辑图像。只需一个指令,您就可以执行多种操作,如上色、去除水印和创意转换。开始使用Google AI Studio。
2025-03-20 19:59:02
104
原创 无需OpenAI API运行OpenManus!
Manus是一款先进的AI智能体,旨在自动化任务并分解复杂的工作流程。其创新方法迅速引起了广泛关注,并在科技社区中迅速走红。在这股热潮中,一组研究人员仅用3小时就成功创建了OpenManus!OpenManus是Manus的开源替代品,提供完整的代码访问以实现透明性和定制化。然而,尽管是开源的,OpenManus仍然依赖OpenAI或AzureOpenAI的API密钥来访问最先进的语言模型。虽然目前OpenManus代理的表现可能不如预期,但其改进潜力巨大。
2025-03-18 20:16:23
184
hadoop-2.6.1.zip
2020-06-16
plsql developer 11.zip
2019-07-22
《Spark GraphX实战》_时金魁.pdf
2019-06-30
自定义rpc框架
2018-09-29
大数据时代总结
2018-08-05
数学分析三大基本思想之分解
2018-08-05
数学分析三大基本思想之逼近
2018-08-05
js通用方法
2018-04-01
redis详细笔记
2016-10-04
推荐:数据中台-协作流程
2021-08-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人