自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(515)
  • 资源 (19)
  • 收藏
  • 关注

原创 Kimi-Audio音频大模型介绍、本地部署与开发

Kimi Audio被设计为一个通用的音频基础模型,能够在一个统一的框架内处理各种音频处理任务。

2025-04-28 20:22:42 1701 4

原创 DeepSeek本地部署及训练行业数据(windows)

Ollama是一个用于部署和运行各种开源大模型的工具,能够帮助用户快速在本地运行各种大模型,极大地简化了大模型在本地运行的过程。对用户来说,只需要通过执行几条命令就能在本地运行开源大模型。主要特点:1、功能齐全:Ollama将模型权重、配置和数据捆绑到一个包中,定义成Modelfile。它优化了设置和配置细节,包括GPU使用情况,从而提高了模型运行的效率。2、轻量级:Ollama的代码简洁明了,运行时占用资源少。这使得它能够在本地高效地运行,不需要大量的计算资源。

2025-02-24 17:08:51 2540

原创 DeepSeek助力高效办公技巧

总结下面的文字,并给我一份包含关键见解和最重要事实的要点列表。【插入文字】”

2025-02-20 15:58:07 1446

原创 DeepSeek介绍与部署

DeepSeek 是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,致力于开发高效、高性能的生成式 AI 模型。自2023年7月成立以来,DeepSeek在短短一年多的时间里取得了显著的进展,推出了多个引人注目的开源模型,包括 DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3 和 DeepSeek-R1。成立时间:2023年7月17日母公司:幻方量化,一家规模超过百亿的私募量化基金,为DeepSeek提供了坚实的资金支持。

2025-01-28 14:06:17 14350 5

原创 Apache Spark 3.5介绍与部署(最新版本)

Apache Spark 是一个快速的,通用的集群计算系统。它对 Java,Scala,Python 和 R 提供了的高层 API,并有一个经优化的支持通用执行图计算的引擎。它还支持一组丰富的高级工具,包括用于 SQL 和结构化数据处理的 Spark SQL,用于机器学习的 MLlib,用于图计算的 GraphX 和 Spark Streaming。Apache Spark是一个开源的分布式计算框架,最早由加州大学伯克利分校AMPLab团队在2012年发布。

2025-01-24 12:01:30 1218

原创 Apache Flink 2.0介绍与部署(最新版本)

Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。

2025-01-22 14:17:55 2619 2

原创 数据仓库分层解析(详细)

数据仓库分层是一种组织和管理数据仓库的结构化方法,它将数据仓库划分为不同的层次或级别,每个层次具有特定的功能和目的。这种分层方法有助于管理数据仓库中的数据流程、数据处理和数据访问,并提供一种清晰的结构来支持数据管理和分析需求

2025-01-08 10:24:07 8457

原创 Apache Doris 软件部署(2.1.7版本)

如果有返回值,则是支持avx2,如果没有返回值则需要下载no avx2。vim /etc/fstab 注释掉带swap分区。如果没有返回,则不支持avx2,后续下载包有影响。修改虚拟内存区域至少2000000。编辑fe.conf文件。编辑be.conf文件。

2025-01-01 19:26:24 1510

原创 Apache Doris介绍

Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足加速等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。

2024-12-27 15:09:08 1192

原创 Apache SeaTunnel详解与部署(最新版本2.3.8)

SeaTunnel是一个非常易用、超高性能的分布式数据集成平台,支持实时海量数据同步。每天可稳定高效同步数百亿数据,已被近百家企业应用于生产。Apache SeaTunnel是中国开发者主导的项目,也是Apache基金会中第一个诞生自中国的数据集成平台项目。SeaTunnel原名Waterdrop,于2017年由乐视创建,并于同年在GitHub上开源2021年10月改名为SeaTunnel2021年12月9日SeaTunnel进入Apache孵化Apache SeaTunnel 毕业成为。

2024-11-07 22:38:20 8713 14

原创 Apache SkyWalking介绍与部署

Skywalking是分布式系统的应用程序性能监视工具,专为微服务,云原生架构和基于容器(Docker,K8S,Mesos)架构而设计它是一款优秀的APM(Application Performance Management)工具,包括了分布式追踪,性能指标分析和服务依赖分析等。Skywalking是由国内开源爱好者开源并提交到Apache孵化器的开源项目,SkyWalking成为Apache孵化项目,17日SkyWalking从Apache基金会的孵化器毕业成为。

2024-10-30 10:45:47 838

原创 Apache Celeborn详解与部署应用

Apache Celeborn 源于自研的 EMR Remote Shuffle Service,旨在解决中间数据遇到的及问题。

2024-10-26 12:06:36 1799

原创 Apache ShenYu介绍与部署

是一个异步的,高性能的,跨语言的,高性能,多协议,易扩展,响应式的API网关。兼容各种主流框架体系,支持热插拔,用户可以定制化开发,满足用户各种场景的现状和未来需求,经历过大规模场景的锤炼。HttpgRPCDubboSOFARPCMotanTars等等。Apache ShenYu成为顶级项目的时间是2022年7月28日。这一天,Apache软件基金会发布了博客,宣布ShenYu正式毕业,成为Apache顶级项目(TLP)

2024-10-24 22:31:19 1205 1

原创 Apache Linkis介绍与部署

Apache Linkis 计算中间件项目,是由微众银行大数据平台团队在2019年7月进行开源,并于2021年8月正式捐献给全球顶级开源社区 Apache 软件基金会(ASF),成为 ASF 孵化项目。Apache 软件基金会(ASF)孵化器于2022年12月03日,通过了 Apache Linkis 计算中间件项目的孵化毕业投票。2023年01月18日,Apache 软件基金会官方宣布 Apache Linkis 顺利毕业,成为 Apache 顶级项目(TLP)。

2024-10-17 09:15:39 1526

原创 Apache Livy介绍与部署

Apache Livy 是一个为 Apache Spark 提供的强大而灵活的 RESTful 接口,旨在让开发者无论在何处,都能轻松地与 Spark 进行交互。这个开源项目支持执行代码片段或程序,并且可以在本地 Spark 环境或 Apache Hadoop YARN 集群中运行。应用场景总的来说,Apache Livy 是一个强大、开放且易于使用的工具,对于那些希望在 Spark 上构建更高效、更灵活的数据处理系统的开发者而言,它是一个理想的选择。

2024-10-16 11:14:01 1513

原创 Apache Baremaps 矢量瓦片地图服务

是一个工具包和一组用于创建、发布和操作在线地图的基础结构组件。

2024-10-11 09:51:15 433

原创 PostgreSQL17(最新版)安装部署

Postgres作为最先进的开源数据库,2024年7月,Stackoverflow 2024年度调查报告发布,超过6万名数据库开发人员参与了Stackoverflow年度数据库使用调查。报告显示,有48.7%的开发者正在使用PostgreSQL,并连续第二年成为最受欢迎的数据库。在所有的有效问卷中(52,418位受访者),PostgreSQL展现出了强劲的增长势头,其受欢迎程度逐渐提升。具体而言,今年有48.7%开发者选择使用PostgreSQL,相比较23年的45.55%,24年的使用比例逐渐提升。

2024-10-11 09:50:00 6893 2

原创 计算机领域最牛项目与技术分享【强力推荐】

GitHubDaily 专注分享 GitHub 最新的优质开源项目。

2024-09-22 17:24:26 2503

原创 Linux环境下Hive4.0.0(最新版本)部署

hive4.0.0部署

2024-08-04 20:05:51 3366 5

原创 Linux环境下Hadoop3.4.0(最新版本)集群部署

hadoop3.4.0集群部署

2024-08-04 19:35:46 1712

原创 AI大模型之分布式训练概述

随着大语言模型(LLMs)的参数量和训练数据量的指数级增长,传统单设备训练方式已无法满足需求,分布式训练技术因此成为推动大语言模型发展的核心驱动力。分布式训练通过将训练任务分解到多个计算设备上并行执行,有效解决了单设备资源瓶颈问题,显著提升了训练速度。然而,分布式训练也面临计算墙、显存墙和通信墙等挑战,如单个设备的计算能力、内存容量和通信带宽的限制。尽管存在这些挑战,分布式训练在大语言模型如OPT、BLOOM和LLaMA的训练中已得到广泛应用,并随着技术的进步,预计将逐步克服现有问题,为人工智能领域带来更强

2025-05-13 19:05:35 783

原创 离散与组合考前快速测验

本文列举了多个数学题目,主要涉及个数计算、整除问题、排列组合以及方程求解等内容。题目包括:在特定范围内求不能被某些数整除的数的个数;

2025-05-13 16:40:08 193 1

原创 组合数学-隔板法

隔板法是组合数学中用于解决将不可区分对象分配到可区分盒子问题的方法。根据对象分配的限制条件,分为正整数解和非负整数解两种情况。

2025-05-13 16:24:43 284

原创 探索大语言模型开源数据集

在大语言模型(LLM)的发展中,开源数据集起到了关键作用。本文介绍了四个具有代表性的开源数据集:Pile、ROOTS、RefinedWeb和SlimPajama。

2025-05-11 22:38:50 1026 1

原创 深入剖析大模型预训练数据:来源、处理与影响

大语言模型(LLM)的预训练数据是决定其性能的关键因素,尽管缺乏完善的理论分析,但数据对模型效果和泛化能力的影响被广泛认可。

2025-05-11 22:27:55 819

原创 LLaMA模型结构与注意力机制优化

大语言模型(LLMs)如GPT系列和LLaMA的快速发展,推动了人工智能技术的革新。这些模型主要基于Transformer架构,通过自回归方式处理自然语言,展现出强大的能力。

2025-05-10 14:31:19 1025 2

原创 深入剖析 GPT 及模型实践

在自然语言处理(NLP)领域,生成式预训练语言模型GPT和HuggingFace开源库具有重要地位。GPT模型由多层Transformer构成,通过无监督预训练和有监督下游任务微调,具备强大的语义表示能力。HuggingFace提供了丰富的工具和模型库,支持从数据集准备、词元分析器训练到模型训练和使用的完整流程

2025-05-10 13:58:09 243 1

原创 Transformer 结构全解析-大模型的核心基石

Transformer结构自2017年由谷歌提出以来,已成为大语言模型(LLMs)的核心基础,彻底改变了自然语言处理的格局。该结构主要由编码器和解码器组成

2025-05-09 21:55:47 728 2

原创 深入剖析大语言模型构建流程

大语言模型(LLMs)凭借其强大的语言理解和生成能力,在智能客服、内容创作和智能辅导等领域得到广泛应用。构建这些模型的过程包括几个关键阶段:首先是预训练阶段,利用海量数据训练基础语言模型;其次是有监督微调阶段,通过高质量数据集合赋予模型个性化能力;接着是奖励建模阶段,构建文本质量对比模型以评估输出质量;最后是强化学习阶段,通过用户反馈优化模型性能。每个阶段都至关重要,共同构成了大语言模型的复杂构建流程。

2025-05-09 20:29:15 905

原创 一文读懂大规模语言模型:概念、发展

大规模语言模型(Large Language Models,LLM),也叫大语言模型或大型语言模型是用包含数百亿以上参数的深度神经网络构建的语言模型。它通常采用自监督学习方法,通过大量无标注文本进行训练。2018 年以来,Google、OpenAI、Meta、百度、华为等公司和研究机构纷纷发布了 BERT、GPT 等多种模型。这些模型在几乎所有自然语言处理任务中都表现出色。2019 年大模型迎来爆发式增长,2022 年 11 月 ChatGPT 发布后,更是引发全球关注。

2025-05-08 17:08:03 1343 1

原创 智慧招聘解决方案

此外,系统能够综合、全面考虑求职者的各项素质,包括软技能和文化适配性,以及发展潜力,从而协助企业做出更符合当下需求和长期发展的招聘决策。大模型由于其广泛的训练数据和强大的泛化能力,可以理解多个行业和领域的专业知识,支持跨行业的知识迁移和应用,能够为用人单位快速筛选出合适的候选人,并为企业输出是否推荐面试的建议。1)职业描述生成:能够自动化地根据企业的具体需求快速产出职位描述,保证文本的专业性,不仅提高了撰写效率,减少了人力资源部门的负担,还提升了职位描述的吸引力,并确保了信息的清晰度和准确性,

2025-05-08 16:21:41 584 1

原创 Ubuntu22.4部署及更新cuda11.8与cuda12.1

注:默认11.5无法满足要求,更新至11.8还是无法满足需求,最后更新至12.1。

2025-05-02 21:59:26 338 1

原创 Ubuntu镜像国内下载地址

2025-04-30 21:10:10 193

原创 【推荐】同等学力申硕-计算机综合-学习资料汇总!!!

如果毫无基础,不想看书学习,看真题有觉得散乱,可从下面是十个章节内容学习(目录为个人总结)

2025-04-28 17:27:00 1065

原创 逻辑符号表达总结

个人总结,仅供参考!!! 案例参考地址:【同等学力】01-逻辑符号表达_逻辑学如何使用逻辑符号来表达给定的语句例题

2025-04-28 16:30:30 287 1

原创 UML-类图

❝一个公司拥有多个部门,公司和部门之间是组合关系,公司破产了,部门就不复存在了。部门和员工是聚合关系,部门被裁掉,员工就换下家了。

2025-04-18 17:45:47 32 1

原创 MindManager中便签样式修改

主题下的便签就不再显示边框,若要查看便签,点击菜单栏的扩展,即可显示具体便签位置

2025-04-12 18:51:45 149

原创 指数型母函数-组合数学

指数型母函数(Exponential Generating Function, EGF)是组合数学中用于解决多重集排列问题的一种工具。对于一个序列a0​a1​a2​,…,an其指数型母函数定义为:其中,(a_i) 是序列中的第 (i) 个元素,(i!) 是 (i) 的阶乘。

2025-04-08 16:38:53 375

原创 鸽笼原理-离散数学

把多于mn(m乘以n)个的物体放到n个抽屉里,则至少有一个抽屉里有不少于m+1的物体。抽屉原理的一般含义为:“如果每个抽屉代表一个集合,每一个苹果就可以代表一个元素

2025-04-08 15:44:18 44

原创 容斥原理-组合数学

在计数时,必须注意有没有重复,没有遗漏。为了使重叠部分不被重复计算,人们研究出一种新的计数方法

2025-04-07 22:59:03 31

同等学力 逻辑符号表达 规律与案例归总

同等学力 逻辑符号表达 规律与案例归总

2025-04-28

graphviz-2.38

生成决策树图形工具

2025-02-06

Windows环境下部署Redis

Windows环境下部署Redis

2024-10-28

Python人力资源数据分析案例使用数据

Python人力资源数据分析案例使用数据

2024-10-06

dlib python3.7

dlib python3.7

2024-09-23

天眼人脸识别系统-数据库

mysql库表

2024-09-22

天眼人脸识别系统-人脸识别登录依赖资源文件

天眼人脸识别系统-人脸识别登录依赖资源文件

2024-09-19

基于部署的百川大模型与Django编写后台调用服务

基于部署的百川大模型与Django编写后台调用服务

2024-09-05

股票客户流失数据样例-逻辑回归

股票客户流失数据样例

2024-08-14

git及TortoiseGit软件包

git及TortoiseGit软件包

2024-08-08

Spark3.5.1集群安装

Spark3.5.1集群安装

2024-08-05

Pandas操作案例数据

Pandas操作案例数据

2024-07-31

dbeaver-ce-24.1.3-x86-64-setup与mysql-connector-java-8.0.15.jar

开源数据库连接客户端

2024-07-29

Zookeeper编程案例

Zookeeper文件系统与订阅机制

2024-07-29

MapReduce实现对象系列化案例

wordcount、对象系列化

2024-07-26

HarmonyOS NEXT-表单智能自动填充

本示例展示了使用智能填充服务提供场景化的输入建议,实现复杂表单一键填充,帮助用户轻松地完成表单填写。

2024-07-25

英语真题,MR单词计数测试使用

英语真题,MR单词计数测试使用

2024-07-25

HDFS接口调用与编程代码示例

java针对hdfs编程,实现文件查看、上传、下载等

2024-07-25

HarmonyOS NEXT-给应用添加通知和提醒

通知旨在让用户以合适的方式及时获得有用的新消息,帮助用户高效地处理任务。应用可以通过通知接口发送通知消息,用户可以通过通知栏查看通知内容,也可以点击通知来打开应用

2024-07-24

hadoop编程依赖的dll文件,适用于hadoop3以上版本

dll文件,Java开发针对hdfs编程使用

2024-07-24

pandoc-3.2.1-windows-x86-64.msi

pandoc-3.2.1-windows-x86_64.msi安装文件

2024-07-22

大规模语言模型:从理论到实践

大规模语言模型:从理论到实践书籍、资料、PPT,内容有大模型基础、评估、强化学习、应用、训练数据、大模型微调等

2024-07-17

大规模语言模型:从理论到实践

大规模语言模型:从理论到实践

2024-07-17

从零开始大模型开发与微调基于PyTorch与ChatGLM

从零开始大模型开发与微调基于PyTorch与ChatGLM

2024-07-17

大模型落地应用案例集资料

大模型落地应用案例集资料

2024-07-17

Openlayer地图叠加瓦片

Openlayer地图叠加瓦片,通过传入瓦片路径或者服务,和空间范围,进行叠加显示

2018-07-12

C# ArcEngine 镶嵌数据集操作源码实例

C# ArcEngine代码,镶嵌数据集操作,包含创建、添加移除栅格数据等,适合于初学者对镶嵌数据集的操作

2018-07-06

odjbc6g.jar sdoapi-11.2.0

odjbc6g.jar 是oracle数据库的链接版本,Maven中央仓库不含有,因此要自己进行插入。sdoapi-11.2.0 是oracle数据库中的包,Maven中央仓库不含有,需要自己进行插入

2018-06-22

机器学习资料

机器学习是一种让计算机在没有事先明确的编程的情况下做出正确反应的科学。在过去的十年中,机器学习已经给我们在自动驾驶汽车,实用语音识别,有效的网络搜索,以及提高人类基因组的认识方面带来大量帮助

2018-06-19

hellocharts-library-1.5.8.jar

Charting library for Android compatible with API 8+(Android 2.2).

2017-11-06

hibernate-spatial-4.3

http://mvnrepository.com/找不到的hibernate-spatial-4.3.jar................................................

2017-09-12

ICSharpCode.SharpZipLib压缩解决中文乱码dll和代码

ICSharpCode.SharpZipLib压缩解决中文乱码dll和代码

2016-01-23

ArcGIS 10.1破解以及SDE和service授权文件

ArcGIS 10.1破解文件 ArcGIS 10.1破解以及SDE和service授权文件

2013-08-18

C#绿色打包成exe文件

将C#工程文件下的所有文件,打包成一个exe绿色程序

2013-06-27

好看图标,晶莹剔透

很好看的图标Very good-looking icon

2012-10-31

ERDASwin7 64位破解

ERDSA 9.2window 7系统 64位破解资料。破解的方法和32位的破解方法一样!

2012-10-18

AE实现文本的数据导入

本代码可以方面的实现文本形式的坐标形式数据导入到ArcGIS里面shapefile文件。是AE中数据管理的一部分!

2012-07-30

简易Web浏览器的制作

通过C#语言开发出的浏览器!其中带有的功能:刷新、前进、后退、主页、查找等

2012-07-30

研究生信息管理系统

实习ADO.NET的必不可少的程序实例!

2012-07-30

渐变窗体显示背景

渐变窗体显示背景

2012-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除