【杂谈】最近Open AI的动静,让我 ......

最近 Open AI 的动静,我又想用AI工具了......

1. AI 工具使用体验

从前,哪里不会就问度娘;度娘广告多了,问必应;英文好点的,或者可以接收翻译插件的机翻的问, Stack Overflow…

GPT的爆火,我们的效率得到极大的提升。绝大多数问题问 GPT 都有答案。虽然答案并不一定是完全正确的,但只要 prompt 正确引导,相当一部分工作场景都有很好的解决方案回复。

随之,各种AI应用也火了一波,国内大模型也紧急起飞,短短数月,像百度、科大讯飞、阿里等大厂也相继推出各自的大语言模型。我们作为消费者与体验者,一时间,各种优秀AI应用相继有了较高的流量,多了很多大模型及其它AI工具的体验机会。

我今年 3月~7月,相继体验了各种大语言模型,趁着学生包还有机会,申请了一波 GitHub Copilot 用了 2 个月。直到今天,工作中遇到的有些疑难杂症,一些知识点的概念性问题等,我依然会扔给 GPT 3.5 或 稍微更简单一点的 Bito 寻求参考解决建议。

但可能是个人习惯原因,以及时间的推移,AI 的热度随着部分资本割韭菜稍稍降低,近几个月以来,我个人对 AI 工具的依赖减少了许多。最近,哪怕是马斯克 X 的 Gork 的推出,或是文心一言、星火等国内大模型又升级,我都没再去体验过了。

最近 Open AI 高层风波,又把 AI 话题推上风口浪尖。特别是咱们程序猿圈内,最近这场波澜起伏,极限反转的 Open AI 风波,更是成了一个大瓜。

作为吃瓜群众,虽然我并不完全了解事情的来龙去脉,以及当事人背后是否有什么手段与目的,但这个AI话题重新进入我的视野,让我有了动力去找时间争取体验更多的一些AI工具,并从中选取一些对自己工作帮助最大的使用。

于是,某个加完班的深夜,我打算注册、申请一波最近也是挺火的 Copilot 与 X Gork。

在正式开始注册流程之前,我先说说我个人对我目前常使用的 AI 工具体验:

  • Chat GPT: 常用 3.5 ,好用,够用。4.0 尝试过自己开米国信用卡,但可能是魔法工具的原因,开通失败,沉默成本。期待 GPT 5.0 时代的到来。

  • Bito: 国内 IDEA 工具插件, GPT 的 简单替代版本,无需魔法,方便。

  • Midjourney: AI 绘画。简直拯救了我这个完全不懂任何绘画、美学的白痴!通过 prompt 让 Midjourney 生成目标图片,帮助我完成了许多代码以外需要生成的图片的工作,帮助很大。但自从没有免费额度,完全收费之后,就实在用不起了。

  • GitHub Copilot:初次使用的时候会被它惊艳到!写代码基本上只需要写好注释,那么一天的工作就完成了!这个 GitHub Copilot 是我几个月前尝试了一波学生包申请,嫖了几个月。可惜自己傻逼,GitHub 个人相关信息老实地从学生改成了应届毕业生,最近免费的账号失效了。汇率等问题,再次充也太贵,还需要Paypal 等工具,折腾来折腾去太麻烦,因此最近也没用上了。但是这玩意用久了也会出现一些问题:代码生成模板稍显呆板;代码生成的也不一定是咱真正需要的,有时生了好几次都不对,恨不得关了它;代码有泄露的风险,会被开源给其它开发者做参考等等,用到后期,也就当一个代码生成器用,相比初次使用没有那么惊艳了。体验下来,想起了强哥的一句话:“我这个人脸盲,就是说我根本分不清楚谁漂亮谁不漂亮。说实话,我跟她在一起不是因为她漂亮,因为我根本不知道她漂不漂亮”。虽说如此,GitHub Copilot 还是很香的。等忙完这段时间,贵就贵点,麻烦就麻烦点,争取重新订阅一波。

  • 星火等国内大模型:国内一些大模型垂直领域十分优秀,例如星火的中文意思理解,文心一言的搜索推荐等等。平时没事拿来聊聊天可以,代码我还是会交给GPT的哈。

写这篇文章的时候是某个加完班的深夜,深夜话多。好了,现在感受写完了,准备进入今天文章的第二个主题:Gork 的申请 以及 Copilot 的注册流程。注意,这里提到的Copilot 并不是 GitHub 副驾驶智能代码生成器,据说是连接了GPT 4的神器。

接下来介绍申请步骤。

2. X Gork 申请

网址
https://grok.x.ai/

链接
X-Gork申请入口

材料
谷歌账号,或者Gmail邮箱等。

相关步骤截图

  • 官网点击:进入账号登录
    2

  • 若无 X (前推特) 的账号,需要注册或绑定谷歌账号,下图是我试图绑定谷歌账号后,X显示的需要解锁信息1- 成功访问X后,退回官网页面,重新点击登录按钮,授权在这里插入图片描述

  • 授权后已经申请成功,提示目前只对订阅用户开放5

  • 家里有矿的读者可以选择付费订阅立即体验6

可怜钱包空空如也,我止步于授权成功。期待大规模开放的一天。

3. Copilot 申请

网址
https://www.copilot.com/

链接
copilot官网

材料
网址和链接进去了若发现很卡,注册不了也没关系,Edge 也有,有个 Edge 浏览器也行

相关过程截图

  • 兴致勃勃入官网,点击登录
    7

  • 官网很卡,根本注册登录不了,算了,曲线救国,听说这玩意儿Edge里也有嘛
    8

  • 惊喜地发现这不就是 new bing 嘛,真的很像!
    10

  • 知乎搜了一下,实锤了… new bing 也体验过,前段时间 bing 国内站点不提供 new bing 服务,于是只能长期单一地依赖GPT,如今,new bing 以 Copilot 强势归来,甚是欢迎!
    11

好了,以上就是个人这一年来,作为普通用户、开发者,一年来的AI产品使用体验,以及最近个人申请/体验 的 Gork 和 Copilot 申请过程及初步体验过程的记录。

AI 浪潮还在继续,AI 本身的迭代,新的AI应用,其它产品业务线广泛接入AI相关API … 让我们紧跟时代的步伐,一起期待,一起见证!

### RT-DETRv3 网络结构分析 RT-DETRv3 是一种基于 Transformer 的实时端到端目标检测算法,其核心在于通过引入分层密集正监督方法以及一系列创新性的训练策略,解决了传统 DETR 模型收敛慢和解码器训练不足的问题。以下是 RT-DETRv3 的主要网络结构特点: #### 1. **基于 CNN 的辅助分支** 为了增强编码器的特征表示能力,RT-DETRv3 引入了一个基于卷积神经网络 (CNN) 的辅助分支[^3]。这一分支提供了密集的监督信号,能够与原始解码器协同工作,从而提升整体性能。 ```python class AuxiliaryBranch(nn.Module): def __init__(self, in_channels, out_channels): super(AuxiliaryBranch, self).__init__() self.conv = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1) self.bn = nn.BatchNorm2d(out_channels) def forward(self, x): return F.relu(self.bn(self.conv(x))) ``` 此部分的设计灵感来源于传统的 CNN 架构,例如 YOLO 系列中的 CSPNet 和 PAN 结构[^2],这些技术被用来优化特征提取效率并减少计算开销。 --- #### 2. **自注意力扰动学习策略** 为解决解码器训练不足的问题,RT-DETRv3 提出了一种名为 *self-att 扰动* 的新学习策略。这种策略通过对多个查询组中阳性样本的标签分配进行多样化处理,有效增加了阳例的数量,进而提高了模型的学习能力和泛化性能。 具体实现方式是在训练过程中动态调整注意力权重分布,确保更多的高质量查询可以与真实标注 (Ground Truth) 进行匹配。 --- #### 3. **共享权重解编码器分支** 除了上述改进外,RT-DETRv3 还引入了一个共享权重的解编码器分支,专门用于提供密集的正向监督信号。这一设计不仅简化了模型架构,还显著降低了参数量和推理时间,使其更适合实时应用需求。 ```python class SharedDecoderEncoder(nn.Module): def __init__(self, d_model, nhead, num_layers): super(SharedDecoderEncoder, self).__init__() decoder_layer = nn.TransformerDecoderLayer(d_model=d_model, nhead=nhead) self.decoder = nn.TransformerDecoder(decoder_layer, num_layers=num_layers) def forward(self, tgt, memory): return self.decoder(tgt=tgt, memory=memory) ``` 通过这种方式,RT-DETRv3 实现了高效的目标检测流程,在保持高精度的同时大幅缩短了推理延迟。 --- #### 4. **与其他模型的关系** 值得一提的是,RT-DETRv3 并未完全抛弃经典的 CNN 技术,而是将其与 Transformer 结合起来形成混合架构[^4]。例如,它采用了 YOLO 系列中的 RepNCSP 模块替代冗余的多尺度自注意力层,从而减少了不必要的计算负担。 此外,RT-DETRv3 还借鉴了 DETR 的一对一匹配策略,并在此基础上进行了优化,进一步提升了小目标检测的能力。 --- ### 总结 综上所述,RT-DETRv3 的网络结构主要包括以下几个关键组件:基于 CNN 的辅助分支、自注意力扰动学习策略、共享权重解编码器分支以及混合编码器设计。这些技术创新共同推动了实时目标检测领域的发展,使其在复杂场景下的表现更加出色。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值