- 博客(696)
- 资源 (69)
- 收藏
- 关注
原创 通俗易懂的Latex教程文档
本篇文档可以搭配视频讲解使用。讲解视频: 通俗易懂的Latex教程(附数学建模国赛美赛模板) 这是一份面向刚入门数模,想要快速上手Latex排版的同学的Latex教学文档。在线编辑网站overleaf:https://www.overleaf.com/我所使用的环境:TeX Live (自带编辑器TeXworks) 编辑器:TeXstudioTeX Live和TeXstud
2021-10-05 17:02:15
35090
16
原创 递归语言模型:打模型旗号,行Agent之事
今天刚好看了张小珺商业访谈录中,对Manus联合创始人季逸超的访谈[4]。他是工程师出身,在里面谈了很多技术性问题。其中有一点就是上下文腐烂这个现象:当模型上下文快到极限时,语言模型会收到上下文的压力,倾向于输出EOS(结束标记)。从表现上看,就是越到后面,模型越倾向于输出关键点(bullet point)试图简化描述。manus的解法是创建很多个子agent(sub-agent),分别做一个沙盒去并行执行。在claude code里面,也有用子agent去执行任务的思路。
2026-01-05 10:52:51
496
原创 尝试用gsplat对自己的数据进行3D高斯泼溅训练
提到,在Windows系统上,可以用gsplat进行3D高斯泼溅的训练,并训练公开的数据集,能够取得不错的效果。本篇文章将尝试将自己拍摄的数据,转换成gsplat所支持的格式,以支持训练。
2026-01-05 10:52:16
495
原创 IQuest-Coder-V1:国产大模型出现了新玩家
这个模型在架构上的创新还是有点新意的,国产开源大模型赛道又增加了一个玩家。他们的起步策略还是挺聪明的,不直接上来就搞通用大模型,而是在已经充分被市场验证价值的编程领域开始切入。模型更小,领域更垂直,有可能成为今年的新趋势。
2026-01-03 20:56:10
659
原创 DeepSeek新工作mHC:一个优化版的残差连接结构
前天,DeepSeek发布了一篇新的工作[1]。标题是:mHC: Manifold-Constrained Hyper-Connections翻译一下:mHC:流形约束的超连接这篇工作是一个阶段性的研究成果,而不是模型更迭。原文的数学性很强,本文主要从更容易理解的宏观层面,看看它在做什么。
2026-01-03 20:55:34
174
原创 FreeTool增加了四个新工具,并新增国内镜像站点
FreeTool是一个集各项实用功能于一体的工具站,近期更新中,增加了四个实用工具,并优化了侧边栏的交互体验。FreeTool访问地址:https://xdxsb.top/FreeTool与此同时,在国内服务器上部署了镜像站点,国内用户可访问以下网址,彻底解决上不去、加载慢的问题。国内镜像站网址:https://tool.zstar.website。
2025-12-31 22:38:47
200
原创 2025年终总结:和AI一起进化的一年
又到了一年年末,按照惯例对2025这一年进行总结。在写这篇文章前,看了一眼去年在此时写的。。。心态上的转变,很大程度上是得益于AI工具的进化。回看去年年末,DeepSeek尚未出圈,Cursor正在积累原始用户,豆包还在牙牙学语,国内还在讨论文心一言和通义千问谁才是更好的ChatGPT平替。而在今年年末,AI已然发生了天翻地覆的变化,我的日常AI工具,也换了好几番。。Github上的活跃图很好地浓缩了我这一年的发展,下面我将结合这一年做的各种项目,来回顾一下具体是如何和AI一同进化的。
2025-12-31 20:46:16
1313
原创 Claude Code + MiMo-V2-Flash,实际体验如何
从实际体验来看,让 MiMo-V2-Flash 去做偏复杂的代码编写任务,还有挑战。并且,感觉它的训练数据很不平衡,在没有语言限定的情况下,基本都会采用Python。鉴于 MiMo-V2-Flash 限时免费和速度快的特性,在简单编码任务和实时文本翻译等领域,目测存在用武之地。
2025-12-25 11:07:14
940
原创 小米的MiMo-V2-Flash,谷歌味挺浓
小米的风格是这样:当别人做得火热时,它先开始观望,等大家把路线探得差不多之后,它开始下场超车了。手机是如此,汽车是如此,MiMo亦是如此。总体来看,它不像是DeepSeek,能整新鲜的想法,它更多是把人家已经比较成熟的想法拼装起来。拼装的技术也是技术,就像是开源方案那么多,能整合用好,解决问题的仍然不多。MiMo-V2-Flash 一下子成绩追上来,速度还极快,确实有点超乎预期。这个模型当前仅支持文本输入,按照它的风格,下一步估计是扩展规模或者加入多模态,可以起名为 MiMo-V2-Pro了。
2025-12-22 23:30:43
973
1
原创 FreeTool新功能汇总和访问速度优化
FreeTool 网站自上线以来,总用户数已突破4k,平均每日有超过200人访问。FreeTool是一个集各项实用功能于一体的工具站,除前文提到的一些功能外,目前增加了一系列新功能,并对网站的访问速度进行了一系列优化。FreeTool访问地址:https://xdxsb.top/FreeTool。
2025-12-17 01:25:08
783
原创 Open-AutoGLM:让普通手机秒变豆包手机
体验下来,这种Agent手机能够免除很多重复性的步骤,但有一点是很难达到的,那就是人的感受。以点外卖这个场景为例,我告诉他:“我想点一个猪肝炒饭”,它会智能打开外卖平台,搜索类目,选择距离近且评分高的店铺,点击品类,最终让人来确认支付。但是,如果我自己点外卖,我可能会在打开外卖平台的时候,看到新开的推荐店铺,亦或者在打开店铺的时候,看到了新品,然后就改变想法,想试试新品。这一点,AI很难做到,AI只是严格遵循用户的命令,不达目的不罢休。达到终点固然很好,但丧失了沿途的风景,这是否值得呢?
2025-12-14 13:33:15
1534
4
原创 使用gsplat进行3D高斯泼溅的方案
gsplat 不是一个软件,而是一个深度优化CUDA的开源Python库。它的作者是 Nerfstudio 团队,这个团队最出名的项目是 Nerfstudio,是对 NeRFs 方法支持最好的一套框架。据其所述,出于对新一代技术的好奇,他们构建了 gsplat 这个库。它支持 Windows/Linux 两个系统,使用前必须准备好 Nvidia 显卡。跑这个项目真是特别费劲,官方的文档支持不够完善,以至于遇到问题,开发者们都只能在issue区里抱团取暖。
2025-12-10 20:11:37
1205
原创 ntfy:一个向手机推送信息的开源方案
昨天在Github热门榜上看到一个挺有趣的项目ntfy[1]。这个项目采用Go语言构建了一套基于HTTP的信息推送系统,设计得非常简洁且易于拓展。
2025-12-09 10:47:56
607
原创 CUDA简介与13.1版本更新内容总结
CUDA是 Nvidia 开发的一套并行计算平台,它允许开发者利用 Nvidia 的 GPU 来执行通用计算任务,而不仅仅是图形渲染。工具链:包括 NVCC 编译器、Nsight 调试器和性能分析工具等优化库:提供高性能的线性代数库(cuBLAS)、深度学习库(cuDNN)、稀疏矩阵库(cuSPARSE)等运行时环境:负责管理 GPU 资源、内存分配和任务调度要理解 CUDA 的工作原理,需要先了解 GPU 的硬件架构基础。GPU 和 CPU 的设计目标不同。
2025-12-07 22:59:21
1237
原创 next-ai-draw-io:一个用AI绘制流程架构图的方案
这个项目整体做得挺不错的,具有一定实用性。并且,通过分析它的代码,能够学习到一些提示词技巧和搭建策略。
2025-12-07 13:25:37
2057
1
原创 MinIO 和开源社区决裂,替代品有哪些?
中大型企业:考虑Ceph、SeaweedFS、CubeFS,三者有各自特点,可按照业务场景灵活使用个人级/小型团队:可尝试 Garage 和 RustFS,前者趋于稳定,后者仍在高频迭代。
2025-12-06 00:04:41
1385
原创 Nano Bonana Pro的新玩法:微缩模型
在社交平台上,看到了宝玉[1] 分享的一段Nano Bonana Pro提示词,能够生成如下图所示的效果。下面我试着用更为通用的提示词,来尝试复刻这种效果。Nano Bonana Pro 通过[2] 这个平台进行调用,该平台每日有免费的20个积分,差不多可以生成 7-8 张图片。上传图片,输入提示词:根据这张图片,生成一张Q版的微缩模型,画面比例1:1生成结果挺Q弹的,就是细节还不太丰富。下面参考歸藏[3]给的示例,增加了一些提示:任务:海报设计。
2025-12-06 00:04:02
365
原创 使用postshot实现了更好的3D高斯泼溅效果
前文已经跑通了使用全景相机进行3D高斯泼溅的流程。因此,本文尝试采用 RealityScan 和 postshot 两款软件,来进行新的尝试。整体效果有了明显的提升,效果见以下视频:3DGS演示。
2025-12-04 15:45:20
1391
原创 DeepSeekV3.2正式版:追寻极致的推理能力
之前看 llya 的访谈,他提出了一个观点:2020-2025年是Scaling时代,但现在边际效应已然递减,2025年后又将回到研究时代。所谓 Scaling 就是无限制的去扩充模型参数量以及数据训练量。DeepSeekV3.2 模型的参数量是685B,再往上就没再 Scaling 了。DeepSeekV3.2 特别是 Speciale,让人看到了一个新的研究方向,扩充模型输出长度,鼓励让模型进行更深入更持久的思考,似乎还存在性能提升的空间。这部分空间究竟有多大,有待研究者们来深入探索。
2025-12-02 00:46:08
1226
原创 阿里的Z-Image也许是当下效果最好的开源生图模型
通过真实人类打分的竞技场排名来证明模型性能,而不是只刷数据集放了多个场景的生成对比,表现其有足够的泛化性实测效果挺不错,特别是人像生成总结一下,该模型和当前最强的 Nano Bonana Pro 还有距离,但胜在开源+轻量化,一张24GB的消费级显卡就能在5秒左右生图,效率很高。
2025-12-01 13:15:02
2322
原创 使用全景相机进行高斯泼溅的构建方案
选择在白天光线充足的时候进行拍摄,同时场景中避免水面/玻璃等反射物体干扰,理论效果会更好;在计算colmap时,可以采用的方案,理论效果会比当前计算的效果更好。后面抽时间再尝试一下新方案。
2025-11-29 23:10:40
1495
1
原创 混元3D Studio在试图颠覆游戏制作流程
混元3D Studio的这套工作流让人眼前一亮,以往需要美术团队做很长时间的人物/道具,现在AI很快就能跑出结果,让游戏研发的成本骤减。不过,从当前看,这个技术相对来说还尚未成熟,特别是低模拓扑和绑骨蒙皮这两步效果相对差一些。如果再给他们一点时间把这些功能打磨好,游戏从业人员可以开一波“下岗潮”了。
2025-11-29 18:16:43
823
原创 谁是ICLR最严格的审稿人?
这个数据泄露事件再一次揭露出学术界的“乱象”。双盲机制虽然保障了审稿人不会因“人情世故”去打好评,但没有制约审稿人去打差评。比如,有人披露 NIPS 上收到的审稿意见:审稿人由于不知道Adam,因此给作者提了偏颇的意见。还有不少审稿人用AI审稿,GPT的提示都没去除:一篇文章通常由编辑/会议主席邀请文章相关的同行来进行评审,但审稿人未必是小领域的同行,可能对这方面研究不深,导致结果并不客观。
2025-11-29 18:15:58
543
原创 DeepSeekMath-V2提出了一种自我验证的思路
昨天,DeepSeek发布了这款模型。DeepSeekMath 是 DeepSeek 专为数学领域打造的垂直领域模型。DeepSeekMath-V1 只是在该领域做了初步验证,模型参数量仅只有。而 DeepSeekMath-V2 直接在最新的 DeepSeek V3.2 Exp Base 上进行训练,模型参数参数量达到了。这样的“全力进攻”取得的成效很显著,在数学竞赛评估基准ProofBench上,该模型和 Gemini Deep Think 不相上下。
2025-11-28 23:43:51
553
原创 HunyuanOCR的表现不及预期
整体来看,该模型的创新点不多,基本上都是一些比较常见的方法思路。从实际表现看,该模型不及预期,属于是实验性质的刷榜工作。
2025-11-28 23:42:52
1442
1
原创 我的高德API秘钥被人盗刷了
在一个正式项目中,如果担心秘钥被误传,最佳方案就是用gitleaks去配置一个Actions,让它对每个commit都进行检测,及时发现告警。如果发现秘钥被误传,直接覆盖是commit记录是无济于事的,如果有人在覆盖之前已经clone过仓库,它仍然会被发现,唯一的解决方案就是处理秘钥的源头。总之,这世界上“坏人”是始终存在的,安全工作是每一个开发者都需要考虑的问题。
2025-11-25 00:16:00
63
原创 我用AI做了一个3D六子棋游戏
虽然我用AI帮我写了整个项目的全部代码,但是在实践过程中,还是有很多坑靠AI是无法一次性解决的。1.联机游戏Bug这个游戏刚做完联机功能时,和室友测试了一下,发现存在了一个游戏bug,玩家1在落完一颗子后,玩家2竟然能立即落子,吞掉玩家1另一个落子机会。这个bug让策略游戏一下子变成拼手速游戏。发现后,才让AI进行修复。2.不要用 Workers KV一开始AI建议我采用Cloudfare的Workers KV去存储实时房间数据,这样就无需额外再部署后端服务器。
2025-11-23 23:08:55
853
原创 2025年,哪一款AI最适合做PPT?
V2.0:NotebookLM:生成内容完全契合原始文件V1.5:kimi:原始文件部分编辑+套模板v1.0:其它产品,仅是提取文本+套模板目前看下来,除了NotebookLM能提供一定参考之外,所有AI做PPT都达不到实用的程度,这块领域还有空间可以挖掘提升。
2025-11-22 20:16:54
823
原创 Nano Banana Pro 发布,中文能力大幅提升
测试下来,Nano Banana Pro 绝对是当下最强的图片生成模型。虽然它在很多场景下,仍有小错误,不过已经比前代好了太多,特别是中文能力,有了质变。其它做模型生成的厂商,估计又要开始加班了。
2025-11-21 01:12:43
358
原创 FreeTool:一个多功能在线工具箱
FreeTool通过把即取即用的工具整合起来,一站式解决各种问题。里面的工具会随我的使用习惯进行更新。如果你有其它想要整合的工具,欢迎在此文下面进行留言。
2025-11-20 13:33:26
1207
原创 Cloudflare宕机原因复盘
Cloudflare 是全球领先的网络基础设施公司,主要提供网站加速、DDoS防护、内容分发网络(CDN)等服务。许多网站和应用都依赖 Cloudflare 来保证访问速度和安全性。然而,2025年11月18日,Cloudflare 遭遇了严重的网络中断,导致全球很多网站无法正常加载。本文根据时候官方披露的技术博客[1],复盘一下这场罕见事故发生的全过程。
2025-11-20 13:32:30
527
原创 Gemini 3 Pro发布,谷歌再次断档式领先
Gemini 3 Pro 没有让人失望,尤其是其前端能力,再次得到了进化。这款模型的提升幅度可谓是断档式的,而且 Google 的 Token 额度一贯给得很大方,Vibe Coding 迎来黄金时期了。
2025-11-19 01:49:44
359
原创 我把NotebookLM加入了日常工作流
最近发现 Google 的 NotebookLM 这款产品挺好用的,本文来介绍一下。NotebookLM 地址:https://notebooklm.google.com。
2025-11-18 18:03:23
969
原创 2025年,谁才是Deep Research最好的产品?
此轮测试看下来,我认为效果最好的是Kimi,其次是豆包,其它的产品离实用还有差距。当然,我所测试的是某方向的学术场景,并不代表其它学术方向/其它领域的效果场景,结果仅做参考。
2025-11-18 09:45:59
1098
原创 在腾讯云开发者活动中,学了一招AI提效方法
今天收到腾讯云的邀请,参加了一场线下的开发者交流活动。听了行内专家的分享,学到了不少干货,本文来和各位读者同步一下。
2025-11-16 23:59:08
1400
原创 AI打原神是怎么做的?
看到了字节团队最近发布了一项颇有意思的研究成果,叫[1],构建了一个智能体,可以玩原神、崩铁、鸣潮等3D类型的游戏。Lumine是原神女主角的英文名,所以作者画了一个“梗图”:荧自己玩自己。这类二次元游戏的玩家群体中,有一类群体只想体验养成抽卡的快乐,而不想自己做“又臭又长”的剧情任务,他们会花钱请人代肝。这个工作相当于能够顶替人力代肝,降低人力成本,想象空间很大。这算是外挂吗?通常我们认为,外挂是一种越过官方规则,给玩家提供了“不公平优势”的方式,比如修改游戏内存、透视穿墙之类的操作。
2025-11-16 10:53:08
874
原创 体验一个舆情监控项目
最近发现 Github 上有个项目关注度很高,叫TrendRadar[1]。正如其名称“趋势雷达”所述,该项目的作用是借助自动化脚本,去各个媒体平台获取关注的信息,然后进行个性化推送。它支持微博、b站、百度等多家主流平台的热榜数据,并支持邮箱、ntfy、飞书、钉钉等平台的信息推送。它部署起来比较方便,主要依赖的是,因此不用下载,Fork 之后配置一下就能直接部署。
2025-11-15 11:14:12
1131
原创 李飞飞的空间智能,解决了高斯泼溅的局限
Marble 可以根据输入信息,构建出一个完整的3D场景,在场景中可自由漫游。图片(Image)文本(Text)多图(Muti-Image)视频(Video)三维模型(Chisel)不同档位的收费如下图所示,对于 Pro 档位,首月可优惠至$1。免费用户可支持生成4个场景,但只能通过文本和单图输入,本文来简单测试一下。体验下来,Marble 在构建一些概念场景方面,完全没问题,而且速度很快。但是,具体细节还是不够精细的,没法直接放到生产环境下去用。
2025-11-14 11:24:04
691
原创 Trae的SOLO模式,比预期要好用
体验下来,Trae 的 SOLO 模式是高于我的预期的,作为IDE,它比CLI有明显优势,它内置了浏览器、Figma以及其他组件。而CLI要做到相同的功能,则需要自己去额外配置相关MCP工具,方便度是不如IDE。目前,主流模型的UI能力是存在明显缺陷的,受某些前段组件的默认配色影响,如果你不去精确指定风格,而笼统地去说“我要一个美观的界面”,它大概率会输出蓝紫配色+ 一堆emoji表情的按钮。
2025-11-14 11:07:37
3475
原创 3D高斯泼溅的后处理方式
视频的分辨率比一般图像更低视频直接切画面帧会丢失gps等重要的数据元信息视频帧导入失败的一个可能原因是,在计算位姿匹配时,正确匹配的图像对过少,不过该方式可以通过切帧时写入元数据、用去进行计算,可以可视化观察虚拟摄像机是否出现在正确的位置上。此外,在搜集资料时,发现了一种更高效的数据采集方式,即通过全景相机来进行采集数据[5]。全景相机能够一次性采集360度的是视角,可以让数据采集的速度得到极大提升,还有人一次性同时用三个全景相机去采集数据[6],得到了非常好的3DGS效果。
2025-11-13 01:00:26
1478
1
数据集spacenet/AICrowd/CHN6-CUG/deepglobe-road-dataset/Massachuset
2022-07-07
苹果科技官网前端界面(纯H5/CSS/Javascript)
2022-06-13
Android:简单登录注册Demo
2022-06-13
【Android】husbandry项目工程文件
2022-06-13
雾霾定位探测系统(App)
2022-05-11
MLP/LeNet/AlexNet/GoogLeNet/ResNet在三个不同数据集上的分类效果实践
2022-05-02
雪堆博弈-最小节点覆盖问题程序与文档
2022-05-02
医学数据库MIMIC-III v1.4
2022-05-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅