- 博客(655)
- 资源 (3)
- 收藏
- 关注
原创 Optimum详解
Optimum 是 Hugging Face 提供的 Transformers 和 Diffusers 的扩展库,旨在帮助用户在目标硬件上以最高效率训练和运行模型,同时保持易于使用的特性。
2025-05-08 18:26:18
381
原创 基于 MeloTTS.cpp 的轻量级的纯 C++ 文本转语音(TTS)库
是一个轻量级的纯 C++ 文本转语音(Text-to-Speech,TTS)库,由 MyShell.ai 开发并发布。它基于 MeloTTS 项目,支持多种语言的语音合成,包括英语、中文(混合英语)以及即将支持的日语等。
2025-04-28 14:32:36
1102
原创 electron-updater实现自动更新
electron-updater 是一个专为 Electron 应用设计的自动更新工具,能够帮助开发者轻松实现跨平台的自动更新功能。它支持 Windows、macOS 和 Linux 系统,通过简单的配置即可集成到 Electron 应用中,自动检查应用的最新版本并在后台完成更新。electron-updater 提供了灵活的更新策略,比如自动下载更新、静默安装,以及在下次启动时应用更新,从而确保用户始终使用最新版本的应用程序。
2025-04-24 19:31:20
511
原创 Electron打包支持多语言
在项目的构建资源目录(如 build 或 public)中,创建多个许可文件,并在文件名中添加语言代码后缀。:指定安装向导支持的语言列表。例如,["zh_CN", "en_US"] 表示只显示简体中文和英文。打包应用后,安装向导会显示语言选择对话框,且只包含简体中文和英文选项。选择语言后,安装向导会根据选择的语言加载对应的许可文件。license_zh_CN.txt(简体中文):设置为 true,表示创建多语言安装包。:设置为 true,显示语言选择对话框。license_en.txt(英文)
2025-04-15 15:35:39
312
原创 提取app.asar中的资源
通过以上步骤,你可以成功提取 .asar 文件中的资源。如果需要进一步操作或修改文件,可以在解压后进行编辑,完成后可以重新打包为 .asar 文件。首先,确保已安装 Node.js 和 npm。如果 .asar 文件被加固或加密,可能需要额外的工具(如 asar-plus)来解压。确保在解压前备份原始 .asar 文件,以免误操作导致数据丢失。
2025-04-15 10:24:35
353
原创 electron-builder参数详解
electron-builder 是一个用于打包和构建 Electron 应用的工具,支持 macOS、Windows 和 Linux 平台,并提供了丰富的参数配置选项。
2025-04-14 21:43:50
1177
原创 部署Fish-Speech实现声音克隆及文本转语音
FishSpeech 是由Fish Audio团队开发的一款开源文本转语音(TTS)模型,支持多语言的语音合成和识别。它采用先进的深度学习技术,能够生成自然流畅的语音,并提供高质量的语音转文字功能。FishSpeech 支持声音克隆,仅需15秒的音频样本即可生成相似语音。它还支持本地部署,用户可以在个人设备上轻松运行,仅需4GB显存。FishSpeech 广泛应用于内容创作、教育、虚拟助手、游戏和辅助工具等领域,为语音交互提供了强大的技术支持。
2025-04-12 19:02:07
447
原创 解决Server doesn‘t support Accept-Ranges问题
当启用时,更新程序会通过多个分段请求(Range: bytes=x-y)来下载更新内容,而不是一次性下载整个文件。如果服务器不支持多段请求(例如某些服务不支持 Content-Type: multipart/byteranges),则需要禁用此选项。这种方式通常通过 blockmap 文件实现,blockmap 文件记录了文件的分块信息(如哈希值和大小),用于确定需要下载的更新内容。差异更新通过对比新旧版本的文件内容,只下载发生变化的部分,从而减少更新包的大小和下载时间。
2025-04-11 11:03:29
443
原创 使用 PresentMon 获取屏幕帧率
PresentMon是一个用于捕获和分析Windows上图形应用程序高性能特性的工具集,最初由GameTechDev开发,现由英特尔维护和推广。PresentMon能够追踪关键性能指标,如CPU、GPU和显示器的帧持续时间和延迟等,并支持多种图形API(如DirectX、OpenGL和Vulkan)以及不同的硬件配置和桌面与UWP应用程序。
2025-03-13 20:59:50
1137
原创 解决Docker Desktop中ext4.vhdx文件过大的问题
ext4.vhdx是Docker Desktop在Windows系统上使用WSL2(Windows Subsystem for Linux 2)时,用于存储Linux文件系统的虚拟硬盘文件。
2025-03-13 20:48:18
700
原创 使用虚拟声卡播放音频文件作为麦克风声源
VB-CABLE虚拟声卡是一种将电脑播放的声音当作虚拟麦克风输入的工具,可用于语音聊天、直播或录制系统声音等场景。
2025-03-07 19:06:27
1842
原创 python启动关闭进程
subprocess 是 Python 的一个标准库,用于创建和管理子进程。它允许 Python 程序启动新的进程、连接到它们的输入/输出/错误管道,并获取它们的返回码。
2025-02-25 16:51:29
871
原创 基于Electron+Vue3创建桌面应用
Electron 是一个开源框架,基于 Chromium 和 Node.js,用于开发跨平台桌面应用程序。它允许开发者使用 HTML、CSS 和 JavaScript 等 Web 技术构建原生桌面应用,支持 Windows、macOS 和 Linux。Electron 以其开发便捷性、强大的功能和丰富的生态系统而广泛应用于工具类应用、媒体播放器、代码编辑器等领域。
2025-02-17 18:31:52
999
原创 OpenCV 模板匹配
cv2.matchTemplate 是 OpenCV 中用于模板匹配的函数,它可以在一幅大图像中查找与模板图像相似的区域。以下是关于该函数的详细说明和使用方法:
2025-02-12 18:54:46
1145
原创 DeepSeek本地部署
Ollama 是一个用于运行大型语言模型(如 Llama 3.3、DeepSeek-R1、Phi-4、Gemma 2 等)的框架,支持本地部署和使用。
2025-02-10 16:39:39
931
原创 使用PyInstaller将Python项目代码打包成exe
PyInstaller 是一个非常强大的工具,用于将 Python 脚本打包成独立的可执行文件(如 .exe 文件),使得 Python 应用程序可以在没有安装 Python 环境的机器上运行。
2025-01-21 20:21:01
1308
原创 微软开源AI Agent AutoGen 详解
AutoGen是微软发布的一个用于构建AI Agent系统的开源框架,旨在简化事件驱动、分布式、可扩展和弹性Agent应用程序的创建过程。
2025-01-16 14:25:12
1535
原创 AI Agent 智能体详解
是一个开源框架,用于构建AI Agent,简化了事件驱动、分布式、可扩展和弹性的Agent应用程序的创建。是一个由Toran Richards创建的流行开源项目,利用GPT4作为大脑,结合langchain的链接思想,连接各种工具和互联网资源来完成人类给予的任务。是一个基于Langchain和OpenAI基础构建的AI Agent平台,使用户能够在浏览器或个人计算机中创建、配置和部署自主AI代理。
2025-01-15 16:07:35
646
原创 Stable Video Diffusion(SVD)搭建部署
Stable Video Diffusion(SVD)是Stability AI于2023年11月21日发布的视频生成式大模型,是一种用于高分辨率、先进的文本到视频和图像到视频生成的潜在视频扩散模型。该模型不仅支持文本、图像生成视频,还支持多视角渲染和帧插入提升视频帧率,用户可以调整模型选择、视频尺寸、帧率及镜头移动距离等参数。
2025-01-14 14:39:09
1425
3
原创 使用 Optimum Habana 在 Intel Gaudi 上加速模型训练与推理
Optimum Habana 是 Hugging Face 开发的一个开源库,旨在帮助开发者在 Intel® Gaudi® AI 加速器(HPU,Habana Processing Unit) 上高效地训练和推理大规模的机器学习模型,特别是 Transformer 和 Diffuser 模型。它作为 Hugging Face Optimum 系列工具的一部分,专注于优化模型在 Gaudi 硬件上的性能,使开发者能够更轻松地利用 Gaudi 加速器的计算能力。
2025-01-06 13:05:35
968
原创 uni-app设置页面不存在时跳转到指定页面
uni-app提供了onPageNotFound事件,可以在App.vue中监听这个事件,并在事件触发时执行跳转。
2024-12-18 14:09:07
573
原创 如何设置浏览器不缓存网页
这里expires -1;表示过期时间为过去,即告诉浏览器页面已经过期,不应该被缓存。Cache-Control响应头的no-cache、no-store和must-revalidate指令进一步强化了不缓存的要求。
2024-12-18 13:57:37
1019
原创 解决matplotlib错误:“findfont: Generic family ‘sans-serif‘ not found because none of the...”
findfont: Generic family 'sans-serif' not found because none of the following families were found: SimHeiUserWarning: Glyph 19981 (\N{CJK UNIFIED IDEOGRAPH-4E0D}) missing from font(s) DejaVu Sans.
2024-12-05 14:58:44
1132
1
原创 uni-app打包H5自定义微信分享
配置好OG标签信息后,从浏览器分享到微信时,在卡片上能正常显示标题、描述、缩略图。但是在使用微信内置分享(右上角->分享到朋友等)时,描述和缩略图没有正常显示。
2024-11-22 15:06:21
1853
1
原创 使用diffusers和ControlNet进行文生图
Diffusers库是由Hugging Face团队推出的一款专门用于处理扩散模型(Diffusion Models)的工具箱,支持各种扩散模型的加载、训练和微调,能够生成高质量的图像、音频,此外,它还提供了多种噪声调度器,用于调节模型推理中的速度和质量。
2024-11-18 19:11:14
979
原创 解决VUE报错:“Error: ENOSPC: System limit for number of file watchers reached, watch ”
这个错误信息表明Node.js应用遇到了一个系统资源限制问题,具体来说是文件监视器(file watchers)的数量达到了系统限制。在Linux系统中,每个用户都有一个inotify实例限制,这是由内核参数fs.inotify.max_user_watches控制的。当这个限制被达到时,尝试创建新的文件监视器就会失败,并抛出ENOSPC错误。
2024-11-07 16:10:12
656
原创 使用html-docx-js-typescript将Html转换为Word文件
html-docx-js-typescript 是一个 JavaScript 库,它允许将 HTML 文档转换为 DOCX 格式的 Word 文档。通过 npm 来集成 html-docx-js-typescript,此外,由于该库在生成文件时通常会用到 Blob 对象,并且为了方便用户下载生成的 DOCX 文件,还会用到 file-saver 这个库。安装完成后,就可以在代码中使用这两个库来将 HTML 转换为 DOCX 文件了。
2024-10-31 11:17:26
858
原创 分类任务中评估模型性能的核心指标
在机器学习尤其是分类任务中,Accuracy(准确率)、Precision(精确率)、Recall(召回率)和F1 Score(F1分数)是评估模型性能的四个核心指标。
2024-10-18 18:49:19
985
原创 Clip模型详解
CLIP(Contrastive Language-Image Pre-training)是由OpenAI在2021年推出的一种基于对比学习的多模态预训练模型,它通过大规模的图像和文本数据进行训练,使得模型能够理解图像内容和相关文本之间的语义关系。这种模型能够同时理解文本和图像,可以看作是一个连接语言和视觉两种信息形式的桥梁。CLIP的核心贡献在于它打破了传统的固定类别标签范式,通过对比学习的方式,将图像和文本映射到同一个向量空间中,从而实现跨模态的检索和分类。
2024-10-16 20:20:29
2846
原创 Transformer的预训练模型
Transformer的预训练模型有很多,其中一些在自然语言处理(NLP)和计算机视觉等领域取得了巨大成功。
2024-10-16 19:39:31
1265
原创 Midjourney参数详解
Midjourney的参数是添加到提示词中的选项,用于更改图像的生成方式。这些参数可以调整图像的宽高比、风格、质量、随机性等多个方面。
2024-09-24 15:09:03
1338
原创 使用OpenCV检测图像是否是模糊的
在Python中检测照片是否模糊通常涉及图像处理技术,其中一个常用的库是OpenCV(Open Source Computer Vision Library)。检测图像模糊的一种常用方法是基于图像的锐度或边缘信息的多少。一个模糊的图像通常包含较少的边缘或高频信息。
2024-09-23 10:34:58
1313
原创 Transformer 架构详解
Transformer 架构是由 Ashish Vaswani 和他的同事们在 2017 年的论文《Attention is All You Need》中首次提出的。它在自然语言处理(NLP)和其他序列建模任务中取得了前所未有的成功。Transformer 模型完全基于自注意力机制,摒弃了循环和卷积操作,这使得它在处理长序列数据时具有显著优势,并且能够实现并行化计算。
2024-09-19 19:02:49
1198
原创 CNN卷积神经网络详解
卷积神经网络(Convolutional Neural Network, CNN)是一种深度学习模型,专门用于处理具有网格结构的数据,如图像、视频等。它在计算机视觉、自然语言处理、语音识别等领域有着广泛的应用。
2024-09-18 15:03:23
2076
原创 卷积核详解
卷积核(Convolution Kernel),简单来说,就是在进行图像处理或信号处理时,用来“扫描”或“滑动”过原始数据(比如一张图片)的一个小型矩阵。这个矩阵里面包含了一些数值,这些数值在滑动过程中与原始数据对应位置的数值进行特定的数学运算(通常是乘法后求和),从而生成新的数据或特征。
2024-09-18 12:10:57
963
原创 timm图像模型库
timm(PyTorch Image Models)是一个集合了多种SOTA(State of the Art)计算机视觉模型、层、实用工具、优化器、调度器、数据加载器、增强策略以及训练/验证脚本的库,旨在简化模型的选择、创建和微调过程。它支持超过700种预训练模型,并且可以轻松地进行加载和使用。
2024-09-14 11:15:30
1490
原创 RepLKNet架构详解
RepLKNet 通过引入大卷积核和重参数化技术,有效地结合了 Vision Transformer 的全局建模能力和 CNN 的高效计算优势。其设计创新在于既保持了卷积网络的结构简单性和计算效率,又通过大卷积核弥补了 CNN 在处理长距离依赖信息时的不足。因此,RepLKNet 是一种强大的模型架构,适用于各类计算机视觉任务,在大规模数据集上的表现尤其出色。
2024-09-12 15:48:58
1051
基于RoBERTa模型实现AI生成文本检测
2024-12-08
基于ViT模型实现相似图像检索
2024-11-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人