- 博客(157)
- 资源 (2)
- 收藏
- 关注
原创 我们给电商老板做了个 AI 军师,看完说“我要这个”
✅ 飞书/钉钉里直接问:“今天哪个SKU退货率最高?💡 用一句话说就是——老板再也不用翻后台看数据了,直接问AI就行。✅ 提醒你:“这款商品点击高但转化低,可能图没做好”老板助理:再也不用 PPT + Excel 搞到凌晨。老板在钉钉问:“抖音和拼多多哪个店最近退货多?✅ 自动接入淘宝/拼多多/抖音等多平台数据。多平台数据接入(淘宝/抖音/拼多多/京东)✅ 建议检查抖音退款原因 + 评论关键词。抖音旗舰店近7天退款率:12.5%拼多多旗舰店退款率:4.3%电商老板:不用催人发数据。
2025-04-06 00:01:45
196
原创 无需 Docker 也能下载镜像!轻松获取 Docker 镜像文件!
这款工具大大简化了 Docker 镜像的下载和导入流程,特别适用于 Windows 端无 Docker、服务器无法 docker pull 的场景。为了解决这些痛点,我开发了一款Docker 镜像离线下载工具,让你无需本地安装 Docker,就能轻松下载并导入镜像!✅ 支持 Linux 服务器导入,下载后可直接 docker load 加载,无需 docker pull。✅ 无需本地安装 Docker,只要有 Windows 电脑,就能下载并打包镜像。💡 无法 docker pull 下载镜像?
2025-03-12 10:48:53
965
原创 颠覆传统开发!诚邀您加入AI Dev Engineer计划!
🌐 [查看详情]: (https://github.com/albert-weasker/ai_developer)过去几年,AI 在编程领域的应用越来越广泛。从 Copilot 到 ChatGPT,AI 正在帮助开发者加速代码编写、优化逻辑、修复 bug。
2025-02-26 10:38:58
368
原创 Java程序员找不到工作?BOSS已读不回?失业背后的真相:你可能只因为不会写简历!
在竞争激烈的技术行业中,一份出色的简历往往决定了你能否脱颖而出。作为一名Java程序员,你的简历不仅需要展现你的技术能力,还要体现你在复杂项目中的解决问题能力、团队协作能力,以及持续学习和成长的潜力。但在众多求职者中,如何让你的简历在招聘者眼中脱颖而出?这不仅仅是一个关于技能的展示,更是对你作为程序员职业定位和个人品牌的深度思考。
2024-11-10 21:18:19
744
原创 AI劳动力崛起:人将面临失业危机?
”帮我爬取亚马逊上所有卖激光雕刻机的商家信息和类目商品销量、库存和客户评价。我意识到AI的冲击,也促使我更加努力提升自己,不被替代,我觉得很神奇,所以问了一下除了爬虫以外还能做什么工作,这个回答比较笼统,于是我直接联系对方客户支持询问,对方给出的答复是:你只需要选择技能,告诉他需求,就像招聘一个人类,您希望他掌握什么。经过了大约半个小时的漫长等待,貂蝉提示我,任务完成了,我打开了我的mongoDb,数据已经进来了。
2024-10-21 14:35:44
757
原创 WUKONG-AI员工初体验
现在最贵的是人力,人力又不是最稳定的,人有情绪,有疲劳,一言不合就离职,要不一言不合就躺平,那有没有AI来帮我们干活呢?我带着这些问题,和他们的总监聊了一下,总监直接让我去问AI员工,听完了描述之后,我又试用了开发AI和数据AI,后面看看效果,如果真如他所说,那么我是否迟早饭碗不保呢?但是大势所趋,没有办法,还是要努力学习,不要被AI超越啊!我邀请对方来我们公司部署,大概也就十分钟,对我们宣称部署完毕,我问:“我需要做什么?结果用完了我所有的聊天机会,约来了3个候选人,我认为是完全OK的!
2024-09-09 16:17:28
971
1
原创 自动化操作被制裁解决方案
我们做自动化操作的时候,经常被浏览器检测为自动化测试工具,然后被各种制裁,例如:什么真人验证,什么同用不同源(意思是一个东西,网页上和自动化网页效果不一样),反复制裁,我就想能否有一个方案,不让浏览器知道是自动化工具在操作呢?我谷歌了一下,很多人说加什么User-agent,什么浏览器xx,其实都是不正确的,因为那是针对请求的,并不是针对自动化操作的,自动化操作最重要义是什么?这就等于是人为打开而不是使用google driver打开的浏览器,我对其一番操作得到的结果果然和我手动操作的一模一样。
2024-08-13 09:58:15
761
原创 COFFEE AI PARTNER -- 神奇的AI工具,相当我雇佣了一个AI员工,淘汰你的是会使用AI的人
COFFEE AI PARTNER是由 AI JAVA开发的一款生成式人工智能工具(又名AI助手),尝试一下。COFFEE AI PARTNER-官网。
2024-08-01 10:35:35
704
原创 python报错 ModuleNotFoundError: No module named ‘pwd‘ windows替代方案
pwd 模块是 Unix 系统特有的,在 Windows 上不可用。使用Langchain构建AI应用的时候报错。为了绕过这个问题,直接改为。记录该问题,以后直接查阅!
2024-07-22 14:12:09
1067
4
原创 OPEN-AI 回答超过最大限制问题
之前我们测试了数据分析师,后端开发机器人都没有什么问题,但是我无法保证用户会导入什么,所以我们为了测试我们产品的最大承受限度,以确保我们的核心竞争力,我们将三国演义全本导入了进去,三国演义全本接近2000页,我们训练了二十多分钟之后才训练完毕(全程我的机子呼呼呼的响)。如果当前批次的长度加上新消息的长度超过最大限制,将当前批次保存并创建一个新的批次。2.分割过长的消息:当发现单条消息长度超过最大限制时,将其内容按最大长度进行切割,并为每个切割后的部分保留原始的 role 信息。
2024-07-12 21:45:11
912
原创 记录一次解决循环依赖
这么聊吧,这是最 “可爱”的解决方案,小可爱都喜欢用,如果在什么ERP,什么OA使用那还好,如果在我们这种AI-ROBOT项目中使用,等于作死,懒加载的对象可能会引入不可预见的问题,尤其是在高并发或多线程环境中。首先我们需要知道,一般的代码中肯定不会出现循环依赖,我这里出现是因为我的email调用了我的service中发送和检查的方法,这显然本身就不是合理的。或者开启Lazy注解云云,如果有面试官这么问我,我可能要开启嘲讽模式,因为这几种方案都。那么,有人可能会问,那我应该怎么解决呢?
2024-07-04 20:34:43
759
原创 停更一个月通知
然而,由于我最近工作繁忙,我不得不做出一个艰难的决定。我将不得不暂停博客更新,这意味着在未来的一个月里,我将无法为大家分享新的技术文章。如果你有任何疑问、建议或者想要分享的想法,请随时与我联系。我非常乐意与你交流,并听取你的意见。但是,这是暂时的,一个月之后将会恢复,带着机器学习和炼丹炉回来。
2024-05-16 14:18:51
179
原创 机器学习-- 爬虫IntelliScraper 重大更新说明
IntelliScraper 是一个高级的Python网络抓取项目,专为精确解析HTML内容和特征匹配而设计,用于从特定网页提取关键信息。该项目利用了如BeautifulSoup和scikit-learn等强大的库,提供了一种高效灵活的方式来抓取和处理网络数据。
2024-04-29 21:34:08
906
原创 机器学习 -- 分类问题
探讨了一个回归任务——预测住房价格,用到了线性回归、决策树以及随机森林等各种算法。本次中我们将把注意力转向分类系统。我们曾经对MNIST进行了分类任务,这次我们重新回到这里,细致的再来一次。Scikit-Learn提供了许多助手功能来帮助你下载流行的数据集。MNIST也是其中之一。获取之:结果是:共有7万张图片,每张图片有784个特征。因为图片是28×28像素,每个特征代表了一个像素点的强度,从0(白色)到255(黑色)。先来看看数据集中的一个数字,你只需要随手抓取一个实例的特征向量,将其重新形成一个
2024-04-22 16:53:17
1350
原创 机器学习 -- 端到端的机器学习项目
自定义转换器在机器学习数据预处理和特征工程中扮演着重要的角色。它们提供了一种灵活的方法来扩展 Scikit-Learn 的预处理功能,能够整合自定义的数据清洗步骤、属性添加、以及任何其他计算或转换操作,进而适应特定数据科学任务。如之前说过的:假设我们正在处理一个房价预测模型,我们的数据集包含以下几个特征:total_rooms:区域内的总房间数total_bedrooms:区域内的总卧室数population:区域内的人口数households:区域内的家庭户数。
2024-04-11 23:14:53
1394
2
原创 机器学习--整体整理
机器学习是一种人工智能的分支,其目标是通过对数据进行学习,使计算机系统能够从数据中学习并改进,并且掌握一些规律,而无需显式地进行编程。被标记的训练数据集是指每个实例都有对应的标签或输出结果的数据集。在线学习区别于这个批量学习,批量学习指的是训练整体数据集,所谓在线学习,就是支持增量。它可以逐步接收新数据并自动适应,缺点是可能会有知识遗忘。在核外学习中,数据量太大以至于无法一次性加载到内存中,因此需要在有限的内存空间下进行模型训练和处理。
2024-04-06 21:39:45
708
原创 机器学习 -- 随机森林DEMO
之前看一些歌手或者演员选取节目的时候,上面不是一个评委,少则三五个,多则几十个,当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。机器学习也是一样的,机器学习中分为两种,投票选举和再学习,其中投票选举类似于Redis集群中选举Master,在机器学习中投票选举最流行的就是 : 随机森林(random forest)。随机森林,这是一支由许多树组成的强大舰队,每棵树都是通过观察星辰——数据的一部分,来学习并作出自己的预测。在随机森林中,限制树的深度可以帮助防止模型过于复杂和过拟合。
2024-04-01 11:06:31
1020
1
原创 机器学习--支持向量机(通俗版本+demo)
较小的C值允许较大的间隔,提高模型的泛化能力,而较大的C值会尽量减少误分类,但可能导致间隔变小,增加过拟合的风险。有些乘客可能不完全符合咱们的乘客标准(比如,穿着不整齐的),但为了整体的航行目标(比如,分类的正确性),咱们可以选择稍微放宽标准,容纳他们上船。常见的指标包括准确率(咱们正确预测的比例)、召回率(在所有正样本中,咱们正确找到的比例),以及F1分数(准确率和召回率的调和平均,用来平衡两者的性能)。这条线,就是SVM中的最优超平面,它的特点是能最大程度上把两类宝藏分开,让咱们的分类任务清晰又精准。
2024-03-30 16:58:39
1059
原创 机器学习 -- Octave基本操作
Octave语言是一种高级数值计算和数据可视化的开源软件。它提供了一种方便的方式来执行数值计算、数据分析和可视化,特别是在科学和工程领域中。今天学习了一下Octave的基本操作,记录一下。Octave的基本运算十分方便,只需输入 类似 1 + 1即可。这就是在Octave中的提现,是不是非常简单?这是一些基本操作,后面我会继续学习计算和绘图。再来,我们要结果生成2行3列结果全为1的元素。生成幻方矩阵(每行每列的和对角线的和相同)非常简单只需要, n:m 即可生成向量。在octave中,生成一个矩阵。
2024-03-03 19:20:15
635
原创 机器学习 -- 梯度下降算法加深
通过上面那个小例子,我们已经知道了,梯度下降算法常用于最小化代价函数(或损失函数),以此来优化模型的参数。代价函数衡量的是模型预测值与实际值之间的差异。通过最小化这个函数,我们可以找到模型预测最准确的参数。
2024-03-01 15:58:00
963
原创 机器学习 -- 矩阵和向量
例如,如果我们有一个数据集,其中包含有关人们年龄、身高和体重的信息,则可以使用一个矩阵来表示这个数据集,其中每一行代表一个人,每一列代表一种信息(年龄、身高、体重)。矩阵和向量的乘法是线性代数中的一个重要操作,可以视为矩阵乘以矩阵的特例,其中一个矩阵是列向量或行向量。3.数据处理:在机器学习中,数据通常以矩阵形式出现,模型参数也可以用矩阵表示,因此矩阵和向量的乘法是算法实现的基础。向量加减:用于合并或比较数据点的特征,例如,在图像处理中,可能需要调整像素值(向量表示)的亮度(通过加减标量)。
2024-02-20 18:24:45
1250
原创 IntelliScraper 更新 --可自定义最大输出和相似度 支持Html的内容相似度匹配
之前我们在使用IntelliScraper 初代版本的时候,不少人和我反馈一个问题,那就是最大输出结果只有50个,而且还带有html内容,不支持自动化,我声明一下,自动化目前不会支持,以后也不会支持,因为法律的问题,所以数据的前置和后置处理是需要自行处理,如有特殊需求,可联系我。赶紧用起来,觉得好用,不要忘记点个star支持一下呦!这段代码很好的演示了如何在h10中找到h11的相似元素,在这里我做了后续数据清洗的工作,它能够很好的达到我的预期,同样的,并没有发镜像,待其彻底稳定后,会更新镜像。
2024-02-06 11:01:42
889
原创 机器学习 - 梯度下降
它是优化算法的核心,目标是通过调整模型的参数来最小化代价模型的值,从而使模型的预测结果更接近真实值。这都是一些梯度下降算法的概念,其实结合起来比较简单了,首先上一章的代价函数是找一个最接近y的值,这一章梯度算法实际上就是,当然,你可以理解为,我初始化我的两个变量 Y = A + BX。通过计算函数的梯度,朝着梯度的反方向移动一小步,不断重复这个过程,直到达到停止条件,从而找到目标函数的最小值点。然后,你到达了新的位置,你再次观察海拔高度,并计算新位置的梯度。首先,你选择一个起始点,可以是山谷的任意位置。
2024-02-04 21:28:08
1287
2
原创 机器学习 - 代价函数
我们画了三条线,第一个(绿色的线)是 y = 140 其中c1 是140 c2是0,是一个常量;它是模型参数的函数,用于评估模型的表现。我们要做的是选择一条最贴近于房价趋势的线,我们可以采用均方误差(Mean Squared Error, MSE)来衡量模型预测值与实际值之间的差异。通过这个标准均方误差(MSE)结果,我们可以知道,红色得线是最接近我们得预测得,绿色次之,蓝色再次之,误方差越大,预测越不准,反之同理。绝对值误差:另一种回归问题中的损失函数,计算预测值与实际值之差的绝对值的平均。
2024-02-01 14:54:15
996
原创 机器学习 -- 朴素贝叶斯分类器
贝叶斯定理提供了一种计算条件概率的方法,即在已知某些信息的情况下,事件发生的概率。在这里我们可以看到是把数据先转成向量,然后划分数据集和训练集,然后训练这些数据,最后给出结果,就其原理,实际上是,将词拆开之后,对每一个词计算概率,然后对给出的这个词,看看它的概率是好评大,还是差评大。这里我们通过两种方式,第一种是python提供好的一个API,第二个我们自己根据公式来写一个简单的分类器,比对一下效果。这里事实上就是计算 好坏文档的概率,然后再计算 每一个词在好文档,坏文档中出现的概率。:基于症状预测疾病。
2024-01-16 13:24:25
646
原创 机器学习 - 余弦相似度算法和IntelliScraper
是一个先进的 Python 网络爬虫工具🕸️,专为精确解析 HTML 内容和特征匹配技术而设计,用于从特定网页提取关键信息。它使用 BeautifulSoup 和 scikit-learn 等强大的库来处理复杂的网页结构,提供高效且灵活的网页数据抓取和处理方式。
2024-01-15 16:24:09
1172
原创 机器学习 -- 余弦相似度
1.获取html文本内容,我有两个html文件(获取html很容易,自动化和http请求都可以做到,但是要注意robot.txt协议),h6是一个整体的大html ,h7是案例html,我要拿的是 所有回答的链接,所以h7就是随机一个链接的html。再或者我在找房子网上,爬到所有的房产信息,我们并不想做过多的处理,我只要告诉程序,请帮我爬一个类似 xxx 相似度为0.5的就可以了,然后我自会写一小段代码去给数据清洗,这就免去了每次不同网站写不同的一套脚本的痛苦。3.构建源html和目标html的特征。
2024-01-10 16:24:20
1230
原创 机器学习 -决策树的案例
我们将对这个特征的每个唯一值进行分割,并在每个子集上重复此过程。最佳特征的索引是 2,对应于我们数据集中的 ‘风速’ 特征。通过这些步骤,决策树逐渐在数据集的特征上进行分割,直到所有的数据都被正确分类或没有更多的特征可以用来进一步分割。如果一个特征有多个唯一值,那么 uniqueVals 将包含这些值,决策树的每个分支将对应这些值之一。现在要解决的问题是“基于当前的天气和其他条件,我们是否应该进行户外活动?这些数据分别是天气,是否闷热,风速和是否出门郊游。这是完整的代码,可以试着玩一下,可玩性还是ok的。
2024-01-08 19:00:00
930
原创 机器学习 - 决策树
熵是信息论中的一个核心概念,最初由克劳德·香农提出。它是用来量化信息中的不确定性或混乱度的度量。在信息论中,熵可以理解为传输的信息量或系统的无序程度。我们通过信息增益构建决策树,决策树类似于if else条件流程,我们可以使用python的绘图工具画出来。决策树的范例,如下,我们通过决策树就可以直接得到预测结果。
2024-01-05 17:14:08
1022
原创 机器学习 -- k近邻算法
k近邻算法是一种简单但非常有效的机器学习算法,主要用于分类和回归问题。其核心思想是基于相似性原则进行预测:即相似的数据点具有相似的输出。距离度量:改算法首先计算测试数据与每个训练数据点之间的距离。常用的距离度量方法包括欧氏距离、曼哈顿距离和闵可夫斯基距离。例如:测试样例特征是 [0,0],样本集特征是 [1,2] 那么距离就是。
2024-01-04 19:52:55
1089
1
原创 Python Web --Django Web框架
我认为可以更加了解python,因为近一个月使用Python给我的感觉比较好,代码比较简单,比java简单很多,而且python自己管理内存,更多依赖于自身的垃圾回收机制。它是免费和开源的,有活跃繁荣的社区,丰富的文档,以及很多免费和付费的解决方案。Django 的构建 对标 spirngboot 其实差不多,springboot以其开箱即用,简单易用闻名世界,Django 也一样,可以迅速得构建一个RestFul API,非常简单,代码很少。已经启动并运行了一个 Django 开发环境。
2023-12-28 13:09:27
370
原创 记录 - SpringBoot 自动配置的坑 isXXX失效
像赋值这种事,应该是在bean实例化的时候做的,所以点开注释使用者应该去找XXXPostProcessor类,果然我找到了ConfigurationPropertiesBindingPostProcessor类,点开。顿时一切都明白了,因为这个字段叫isSandbox ,他的方法也叫isSandbox ,如果想要它生效,把它换成大布尔类型,或者改名为setIsSandbox.]这大概的意思是有值就放没有就默认值的,我猜想这应该是 ${xxx} 这种赋值的。2023/12/21 - 记录。
2023-12-21 20:28:50
211
原创 低代码开发:数字化“装配线”的崛起
首先,我们不妨从低代码开发的定义和起源说起。低代码开发(Low Code Development),指通过可视化的图形界面来进行应用程序开发和部署的方式,大大降低了开发门槛,用户不需要掌握传统文本编程语言就可以进行开发。低代码开发起源于20世纪90年代,经历了3个发展阶段。第一阶段是面向部门应用的快速开发工具,典型产品有FileMaker等。第二阶段是面向企业应用开发的平台,典型产品有Mendix等。第三阶段是开放和智能化的低代码开发平台,典型产品有Airtable、Zapier等。
2023-12-13 16:51:29
337
原创 AI+爬虫 爬虫宝
有时候人操作说不定还搞错了也未可知。就算人出色的完成了,你的领导告诉你,自行车没什么用,我要山地车。我们写一个自动化程序,帮我们爬取我们要的东西,可能 自行车 改为 山地车就完事了,你也可以配置,但是如果 今天爬 亚马逊,明天不爬亚马逊了,明天要一个 Bestbuy 上的电脑产品,说 业务后天就要,蛋疼了 ,通宵了一晚上。我的主语言并非Python,我对Python的熟悉程度不过是继承于java,我对它内部构造其实了解的不多,但是它在爬取网页或者做一些脚本,学习规则上面的复杂度明显是比java小的。
2023-12-12 19:45:08
1733
1
原创 异步数据处理公共逻辑记录
使用两个异步任务:一个用于获取数据(fetchOrders),另一个用于存储数据(storeOrders)。目前我们需要对接第三方API,我们需要全量同步一些业务数据,于是编写了一套公共的处理逻辑,此处仅做记录。如果遇到异常,设置 stopSignal 和 goalSignal,并抛出异常。如遇异常,设置 stopSignal 和 goalSignal,并抛出异常。自适应任务结束:合理地处理队列空状态,确保所有数据被处理后任务能够自动结束。生产者-消费者模型:优化的多线程处理,实现数据的高效拉取和存储。
2023-12-08 15:57:40
113
原创 Claude2-SDK JAVA版本 它来啦!!!!!!!!
一个使用java实现Claude2 创建会话、聊天、发送附件、获取历史会话,清理历史记录等功能的api接口,可以对接第三方系统作为二次开发使用,且性能优越。
2023-11-29 19:47:38
326
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人