- 博客(40)
- 资源 (1)
- 收藏
- 关注
原创 比拖拉拽更快!DeepSeek 生成流程图、时序图、象限图、思维导图...再也不用自己画咯
不知道各位都用什么工具来绘制流程图呢?笔者喜欢用 Processon,因其便利性持续使用了多年,在线拖拉拽,便于备份和共享,还不用下载安装。相对于拖拉拽,有一种通过编码制图的方式,那就是 Mermaid,它是一个基于 JavaScript 的图表工具,使用类似 Markdown 的语法来创建图表。在“ AI+ ”盛行的当下,DeepSeek + Mermaid 碰撞出了有趣的玩法,一起来看看吧!
2025-05-02 17:22:53
713
原创 【2025年4月】AI 生产力工具,让牛马跑得更快!绘画、原型、编程、伴读、研报...还有什么做不到?
一、工具尝鲜快报:好玩好用的工具;二、生产力军火库:开箱即用的神器,以及一些好用的技巧;三、前沿动态速递:AI 新闻和一些可反复品读优质资料 。
2025-05-02 00:01:01
683
原创 统计学笔记:赤裸裸的数据任人打扮
拖拖拉拉两个月,终于看完了今年第一本书——《赤裸裸的统计学》,本书作者采用故事性叙述,梳理了统计学中基础而关键的知识点,作为统计学的科普读物,表述更容易让外行人接受。笔者根据自身理解对其中部分内容进行了小结,并结合《数据产品经理必修课:从零经验到令人惊艳》一书的统计学部分内容进行补充,整体以前者为主,感兴趣的同学推荐阅读两本原书。
2023-03-13 23:36:42
930
原创 关联规则之 Apriori 算法实现
Apriori 算法是电商数据挖掘中的经典算法,用于发现商品之间的关联规则,例如买了 A 和 B 的情况下是否还会买 C,通过计算商品组合之间的支持度和置信度来实现
2022-11-24 21:06:06
1940
原创 SQL练习:表妹不在,没人帮我查表,只好自己来了
对 `tp` 重新归类,原本是 a、aa、b、c、d、dd 六类,先变成 A、b、c、D 四类,并分不同时间段计数,且按指定的新分类顺序 bADc 排序
2022-08-08 21:20:01
1073
原创 从各大APP年度报告看用户画像——标签,比你更懂你自己
在忙碌的日常里,人们抽不出时间了解自己,却能抓紧所有的空闲,用手机里的APP去了解世界,在探求的过程中,也被探求着。
2022-03-27 22:21:28
2914
原创 我爬取了CSDN总榜TOP10博主的2万多篇文章,看看他们为什么这么火
笔者将 CSDN 总榜 TOP10 的大佬们的文章数据爬了下来,分析一波大佬们名利前茅的秘密所在。
2021-11-04 21:32:33
3022
20
原创 还在用收费的工具处理PDF?用Python助力冲破会员牢笼
基于 PyPDF2 与 pdfplumber 操作 PDF 文件,可对页面增删改、提取文本/表格/图片、将页面导出为图片等
2021-10-13 18:24:50
813
1
原创 分析对象竞是我自己?我在 9 月上班划水 1510 分钟!
国庆 7 天假完全没有学习!在内卷时代如此躺平,实在令人胆战心惊啊,时间都去哪儿了呢?用 pandas 和 pyecharts 分析一波吧
2021-10-11 22:05:49
1588
2
原创 用python开发一个炸金花小游戏,注意别玩上瘾了
用 Python 来实现一个类似炸金花的扑克牌小游戏,游戏使用一副除去大小王的扑克牌,共 4 个花色 52 张牌,各个玩家从中抽取 3 张牌,比较大小。各种牌型的大小顺序:同花顺 > 豹子 > 顺子 > 金花 > 对子 > 单张
2021-08-23 19:02:23
7239
6
原创 淘宝爬虫:看看房地产拍卖行情怎么样?附可视化分析
本文对杭州市法拍房数据进行了从数据采集到分析结果呈现的介绍,讲解了爬虫的知识点:分析网页结构、动态加载的数据、jsonp等,并利用多种精美的可视化呈现分析结果
2021-08-02 21:40:59
5381
16
原创 PyQt5自定义图片组件:同时显示多张图片
基于 QLabel 和 QHboxlayout 实现的可定制的图片组件类,可以翻页显示、设置每页图片数和图片显示的尺寸等
2021-06-15 21:36:32
12317
19
原创 一道题笔记:递归、嵌套列表去重与排列组合
给定 4 种面额的钞票和目标金额,找出有多少种钞票组合,满足总金额等于目标金额。例如 [1, 2, 5, 10] 这4种面额,组合成 10元,那就有 10 张 1 元 / 8 张 1 元 + 1 张 2 元 ... / 1 张 10 元等情况
2021-05-23 12:10:00
282
原创 matplotlib柱状图轴标签自定义排序
昨天一位同学提问 “matplotlib 画柱状图时,横坐标是从表格中指定列获取的,如何设置横坐标的顺序呢?” 原始数据结构如下图所示,需要对学历分组求平均工资后画柱状图,顺序应为按学历由低到高,即 ['大专', '本科', '硕士', '博士']
2021-04-24 14:12:03
7446
2
原创 数据可视化?不如用最经典的工具画最酷炫的图(EXCEL/PPT)
前言:做数据分析和做科普是类似的,科普的意义在于将晦涩难懂的科学知识,以让大众更易接受和理解的方式呈现。而数据分析中的数据可视化做的正是如此关键中的关键,即是将数据的特点以一种显而易见的形式进行呈现。但也不必说的那么高级,我们可以说数据可视化就是“画图”。能够进行可视化的工具有很多,比如 python 中的 matplotlib、pyecharts、plotly等等。可有时候我们并不想写代码,我们可以选择很多便利的在线工具,还可以用最经典的——EXCEL 和 PPT。下面,笔者将请这两位 office 老员
2021-03-26 08:04:53
2724
原创 PyQt5实战:你是成熟的软件啦,该有启动画面和加载进度条了!
笔者在最近的工作中做了一个基于PyQt5实现GUI的数据处理工具,领导表示“我想一双击就能直接看到情况啊,不要打开后还要我自己输入这个点击那个的!”好吧,既然上头有需求,打工人就得照办。想想以前用过的许多桌面软件,启动时都会有个欢迎画面,同时后台预加载一些内容。那么应该要怎么实现呢?先看看效果吧。1、界面设计首先欢迎画面要有一个好看的背景,还有进度条和进度提示信息,那么先用一个 Widget 来做容器,再把用于显示 Logo 和进度信息的 label 拖出来,最后摆上进度条 progressBa.
2021-01-31 22:27:56
7537
5
原创 实战笔记:利用pandas提升分词后过滤停用词的效率
前言:最近工作中开发了一个需要对大批量文本进行分词及统计词频的工具,主要是在 jieba 分词、过滤停用词两个环节耗时。分词部分可以考虑采用 jieba-fast 库提升速度,而过滤环节的效率一直没找到好方法,今天偶然发现了pandas可以帮助实现!1、常规方法那么开始吧!首先完成分词部分,得到一个储存了所有单词的超大列表;import pandas as pdimport jiebastopwords = [line.strip() for line in open('chineseSto.
2021-01-06 16:20:24
1650
5
原创 PyQt5实战之二维码生成器(五):待优化处和应对措施(附打包后的exe)
前言通过前四个章节,实现了一个能够嵌入多种类型数据和定制样式的二维码生成工具,其具有了生成图像、在界面中显示图像、设置图像风格、另存为图像、界面状态提示和国际化等相对完备的功能。但仍存在许多可以改进的地方,其中比较显著的问题如下:1、多行文本的字数未作强制限制,仅通过弹窗提示上限为 200;2、背景图模式下,输入数据实时修改二维码存在明显的卡顿问题;3、myqr 库的数据输入不支持中文。笔者将在这个章节,继续说明针对这三个问题的应对措施。一、多行文本的字数限制首先确定想要实现的效果:用户输
2020-10-24 11:57:42
456
1
原创 PyQt5实战之二维码生成器(四):界面的国际化与管理打包资源
前言经过上一章,我们实现了二维码的生成及样式修改,并将其显示在界面中。本章将实现界面的国际化,并说明如何管理打包资源。一、界面的国际化在之前的代码中可以发现,有些文本用 self.tr() 括了起来,这些文本就是要被翻译的内容。通过这种方法对待翻译文本做好标记后,进入命令行:pylupdate4 我的程序.py - ts zh_CN.ts如此便将待翻译文本剥离出来,生成了一个 .ts 文件。然后通过 Qt 语言家来打开它, PyQt5 中语言家的执行程序路径如下图所示:打开后可以看到一段
2020-10-13 13:14:48
327
原创 PyQt5实战之二维码生成器(三):定制化二维码
前言经过上一章,我们实现界面中各个控件的功能,本章将说明二维码的生成及样式修改。千呼万唤始出来(虽然并没有呼唤,但总要想个开头),终于到了核心功能的生成二维码部分。万能的Python生态中自然不乏生成二维码的库,笔者采用的是以下两个库,分别用于生成 logo 和背景图模式的二维码。import qrcodefrom MyQR import myqr一、自定义前景色和Logo输入的参数为:数据、尺寸(默认为5,暂未增加用户修改的功能)、图像路径(默认无图像,可以修改前景色)、颜色代码(默认黑
2020-10-08 11:34:48
566
原创 PyQt5实战之二维码生成器(二):控件功能实现
前言经过上一章,我们构建了二维码生成器的基本界面,本章将实现界面中各个控件的功能。文章目录一、工具箱的数据输入二、颜色选项卡三、图像选项卡四、菜单栏五、状态栏一、工具箱的数据输入创建一个 getQR() 方法用于生成二维码,每次生成二维码时需要对传入的参数进行验证。def getQR(self): # 生成二维码 data_flag = self.toolBox.currentIndex() # 数据类型(所选栏目) data = '' if data_flag ==
2020-10-05 20:49:20
1052
2
原创 PyQt5实战之二维码生成器(一):基本界面设计
前言本实战项目为构建一个桌面应用,功能是定制二维码,实现多种数据类型的嵌入,和二维码样式的多样化。涉及知识点:基于 PyQt5 的界面构建和功能实现(包括标签、按钮、文本框、滑块、选项卡、工具箱、菜单栏、状态栏等控件),界面国际化(文字英汉互译),基于qrcode和myqr库定制二维码(颜色、logo、背景图),用 qrc 文件管理打包资源。阅读前应具备 Python 基础和对 PyQt5 库的入门知识(可见 PyQt5初学试验记录系列文章)。文章目录一、打包后的工具使用效果预览1、生成普通二维
2020-10-04 22:27:40
2218
原创 Python动态图见得多了?Excel:我可是身经百战了
朋友圈又看到 Python 广告推送了,什么“你还在用 Excel 加班啊”、“我一进去就看见 Python 在打 Excel 啊”……Py大人,你好大的官威啊!今天就来看看,E哥是否能老骥伏枥吧
2020-09-26 16:05:58
421
1
原创 PyQt5试验:基于QTableWidget的应用
基于 QtableWidget 控件,结合时间管理四象限思想,制作一个简易的任务优先度计算器
2020-07-11 21:32:07
2049
4
原创 干货不看看嘛:比较xlsxwriter/pandas/openpyxl写入excel文件
使用 xlsxwriter/pandas/openpyxl 三个库来实现数据写入 EXCEL ,以及向已存在文件追加数据
2020-05-23 20:57:51
6073
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人