- 博客(515)
- 资源 (19)
- 收藏
- 关注

原创 Kimi-Audio音频大模型介绍、本地部署与开发
Kimi Audio被设计为一个通用的音频基础模型,能够在一个统一的框架内处理各种音频处理任务。
2025-04-28 20:22:42
1701
4

原创 DeepSeek本地部署及训练行业数据(windows)
Ollama是一个用于部署和运行各种开源大模型的工具,能够帮助用户快速在本地运行各种大模型,极大地简化了大模型在本地运行的过程。对用户来说,只需要通过执行几条命令就能在本地运行开源大模型。主要特点:1、功能齐全:Ollama将模型权重、配置和数据捆绑到一个包中,定义成Modelfile。它优化了设置和配置细节,包括GPU使用情况,从而提高了模型运行的效率。2、轻量级:Ollama的代码简洁明了,运行时占用资源少。这使得它能够在本地高效地运行,不需要大量的计算资源。
2025-02-24 17:08:51
2540

原创 DeepSeek介绍与部署
DeepSeek 是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,致力于开发高效、高性能的生成式 AI 模型。自2023年7月成立以来,DeepSeek在短短一年多的时间里取得了显著的进展,推出了多个引人注目的开源模型,包括 DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3 和 DeepSeek-R1。成立时间:2023年7月17日母公司:幻方量化,一家规模超过百亿的私募量化基金,为DeepSeek提供了坚实的资金支持。
2025-01-28 14:06:17
14350
5

原创 Apache Spark 3.5介绍与部署(最新版本)
Apache Spark 是一个快速的,通用的集群计算系统。它对 Java,Scala,Python 和 R 提供了的高层 API,并有一个经优化的支持通用执行图计算的引擎。它还支持一组丰富的高级工具,包括用于 SQL 和结构化数据处理的 Spark SQL,用于机器学习的 MLlib,用于图计算的 GraphX 和 Spark Streaming。Apache Spark是一个开源的分布式计算框架,最早由加州大学伯克利分校AMPLab团队在2012年发布。
2025-01-24 12:01:30
1218

原创 Apache Flink 2.0介绍与部署(最新版本)
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。
2025-01-22 14:17:55
2619
2

原创 数据仓库分层解析(详细)
数据仓库分层是一种组织和管理数据仓库的结构化方法,它将数据仓库划分为不同的层次或级别,每个层次具有特定的功能和目的。这种分层方法有助于管理数据仓库中的数据流程、数据处理和数据访问,并提供一种清晰的结构来支持数据管理和分析需求
2025-01-08 10:24:07
8457

原创 Apache Doris 软件部署(2.1.7版本)
如果有返回值,则是支持avx2,如果没有返回值则需要下载no avx2。vim /etc/fstab 注释掉带swap分区。如果没有返回,则不支持avx2,后续下载包有影响。修改虚拟内存区域至少2000000。编辑fe.conf文件。编辑be.conf文件。
2025-01-01 19:26:24
1510

原创 Apache Doris介绍
Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足加速等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。
2024-12-27 15:09:08
1192

原创 Apache SeaTunnel详解与部署(最新版本2.3.8)
SeaTunnel是一个非常易用、超高性能的分布式数据集成平台,支持实时海量数据同步。每天可稳定高效同步数百亿数据,已被近百家企业应用于生产。Apache SeaTunnel是中国开发者主导的项目,也是Apache基金会中第一个诞生自中国的数据集成平台项目。SeaTunnel原名Waterdrop,于2017年由乐视创建,并于同年在GitHub上开源2021年10月改名为SeaTunnel2021年12月9日SeaTunnel进入Apache孵化Apache SeaTunnel 毕业成为。
2024-11-07 22:38:20
8713
14

原创 Apache SkyWalking介绍与部署
Skywalking是分布式系统的应用程序性能监视工具,专为微服务,云原生架构和基于容器(Docker,K8S,Mesos)架构而设计它是一款优秀的APM(Application Performance Management)工具,包括了分布式追踪,性能指标分析和服务依赖分析等。Skywalking是由国内开源爱好者开源并提交到Apache孵化器的开源项目,SkyWalking成为Apache孵化项目,17日SkyWalking从Apache基金会的孵化器毕业成为。
2024-10-30 10:45:47
838

原创 Apache Celeborn详解与部署应用
Apache Celeborn 源于自研的 EMR Remote Shuffle Service,旨在解决中间数据遇到的及问题。
2024-10-26 12:06:36
1799

原创 Apache ShenYu介绍与部署
是一个异步的,高性能的,跨语言的,高性能,多协议,易扩展,响应式的API网关。兼容各种主流框架体系,支持热插拔,用户可以定制化开发,满足用户各种场景的现状和未来需求,经历过大规模场景的锤炼。HttpgRPCDubboSOFARPCMotanTars等等。Apache ShenYu成为顶级项目的时间是2022年7月28日。这一天,Apache软件基金会发布了博客,宣布ShenYu正式毕业,成为Apache顶级项目(TLP)
2024-10-24 22:31:19
1205
1

原创 Apache Linkis介绍与部署
Apache Linkis 计算中间件项目,是由微众银行大数据平台团队在2019年7月进行开源,并于2021年8月正式捐献给全球顶级开源社区 Apache 软件基金会(ASF),成为 ASF 孵化项目。Apache 软件基金会(ASF)孵化器于2022年12月03日,通过了 Apache Linkis 计算中间件项目的孵化毕业投票。2023年01月18日,Apache 软件基金会官方宣布 Apache Linkis 顺利毕业,成为 Apache 顶级项目(TLP)。
2024-10-17 09:15:39
1526

原创 Apache Livy介绍与部署
Apache Livy 是一个为 Apache Spark 提供的强大而灵活的 RESTful 接口,旨在让开发者无论在何处,都能轻松地与 Spark 进行交互。这个开源项目支持执行代码片段或程序,并且可以在本地 Spark 环境或 Apache Hadoop YARN 集群中运行。应用场景总的来说,Apache Livy 是一个强大、开放且易于使用的工具,对于那些希望在 Spark 上构建更高效、更灵活的数据处理系统的开发者而言,它是一个理想的选择。
2024-10-16 11:14:01
1513

原创 PostgreSQL17(最新版)安装部署
Postgres作为最先进的开源数据库,2024年7月,Stackoverflow 2024年度调查报告发布,超过6万名数据库开发人员参与了Stackoverflow年度数据库使用调查。报告显示,有48.7%的开发者正在使用PostgreSQL,并连续第二年成为最受欢迎的数据库。在所有的有效问卷中(52,418位受访者),PostgreSQL展现出了强劲的增长势头,其受欢迎程度逐渐提升。具体而言,今年有48.7%开发者选择使用PostgreSQL,相比较23年的45.55%,24年的使用比例逐渐提升。
2024-10-11 09:50:00
6893
2
原创 AI大模型之分布式训练概述
随着大语言模型(LLMs)的参数量和训练数据量的指数级增长,传统单设备训练方式已无法满足需求,分布式训练技术因此成为推动大语言模型发展的核心驱动力。分布式训练通过将训练任务分解到多个计算设备上并行执行,有效解决了单设备资源瓶颈问题,显著提升了训练速度。然而,分布式训练也面临计算墙、显存墙和通信墙等挑战,如单个设备的计算能力、内存容量和通信带宽的限制。尽管存在这些挑战,分布式训练在大语言模型如OPT、BLOOM和LLaMA的训练中已得到广泛应用,并随着技术的进步,预计将逐步克服现有问题,为人工智能领域带来更强
2025-05-13 19:05:35
783
原创 离散与组合考前快速测验
本文列举了多个数学题目,主要涉及个数计算、整除问题、排列组合以及方程求解等内容。题目包括:在特定范围内求不能被某些数整除的数的个数;
2025-05-13 16:40:08
193
1
原创 探索大语言模型开源数据集
在大语言模型(LLM)的发展中,开源数据集起到了关键作用。本文介绍了四个具有代表性的开源数据集:Pile、ROOTS、RefinedWeb和SlimPajama。
2025-05-11 22:38:50
1026
1
原创 深入剖析大模型预训练数据:来源、处理与影响
大语言模型(LLM)的预训练数据是决定其性能的关键因素,尽管缺乏完善的理论分析,但数据对模型效果和泛化能力的影响被广泛认可。
2025-05-11 22:27:55
819
原创 LLaMA模型结构与注意力机制优化
大语言模型(LLMs)如GPT系列和LLaMA的快速发展,推动了人工智能技术的革新。这些模型主要基于Transformer架构,通过自回归方式处理自然语言,展现出强大的能力。
2025-05-10 14:31:19
1025
2
原创 深入剖析 GPT 及模型实践
在自然语言处理(NLP)领域,生成式预训练语言模型GPT和HuggingFace开源库具有重要地位。GPT模型由多层Transformer构成,通过无监督预训练和有监督下游任务微调,具备强大的语义表示能力。HuggingFace提供了丰富的工具和模型库,支持从数据集准备、词元分析器训练到模型训练和使用的完整流程
2025-05-10 13:58:09
243
1
原创 Transformer 结构全解析-大模型的核心基石
Transformer结构自2017年由谷歌提出以来,已成为大语言模型(LLMs)的核心基础,彻底改变了自然语言处理的格局。该结构主要由编码器和解码器组成
2025-05-09 21:55:47
728
2
原创 深入剖析大语言模型构建流程
大语言模型(LLMs)凭借其强大的语言理解和生成能力,在智能客服、内容创作和智能辅导等领域得到广泛应用。构建这些模型的过程包括几个关键阶段:首先是预训练阶段,利用海量数据训练基础语言模型;其次是有监督微调阶段,通过高质量数据集合赋予模型个性化能力;接着是奖励建模阶段,构建文本质量对比模型以评估输出质量;最后是强化学习阶段,通过用户反馈优化模型性能。每个阶段都至关重要,共同构成了大语言模型的复杂构建流程。
2025-05-09 20:29:15
905
原创 一文读懂大规模语言模型:概念、发展
大规模语言模型(Large Language Models,LLM),也叫大语言模型或大型语言模型是用包含数百亿以上参数的深度神经网络构建的语言模型。它通常采用自监督学习方法,通过大量无标注文本进行训练。2018 年以来,Google、OpenAI、Meta、百度、华为等公司和研究机构纷纷发布了 BERT、GPT 等多种模型。这些模型在几乎所有自然语言处理任务中都表现出色。2019 年大模型迎来爆发式增长,2022 年 11 月 ChatGPT 发布后,更是引发全球关注。
2025-05-08 17:08:03
1343
1
原创 智慧招聘解决方案
此外,系统能够综合、全面考虑求职者的各项素质,包括软技能和文化适配性,以及发展潜力,从而协助企业做出更符合当下需求和长期发展的招聘决策。大模型由于其广泛的训练数据和强大的泛化能力,可以理解多个行业和领域的专业知识,支持跨行业的知识迁移和应用,能够为用人单位快速筛选出合适的候选人,并为企业输出是否推荐面试的建议。1)职业描述生成:能够自动化地根据企业的具体需求快速产出职位描述,保证文本的专业性,不仅提高了撰写效率,减少了人力资源部门的负担,还提升了职位描述的吸引力,并确保了信息的清晰度和准确性,
2025-05-08 16:21:41
584
1
原创 Ubuntu22.4部署及更新cuda11.8与cuda12.1
注:默认11.5无法满足要求,更新至11.8还是无法满足需求,最后更新至12.1。
2025-05-02 21:59:26
338
1
原创 【推荐】同等学力申硕-计算机综合-学习资料汇总!!!
如果毫无基础,不想看书学习,看真题有觉得散乱,可从下面是十个章节内容学习(目录为个人总结)
2025-04-28 17:27:00
1065
原创 UML-类图
❝一个公司拥有多个部门,公司和部门之间是组合关系,公司破产了,部门就不复存在了。部门和员工是聚合关系,部门被裁掉,员工就换下家了。
2025-04-18 17:45:47
32
1
原创 指数型母函数-组合数学
指数型母函数(Exponential Generating Function, EGF)是组合数学中用于解决多重集排列问题的一种工具。对于一个序列a0a1a2,…,an其指数型母函数定义为:其中,(a_i) 是序列中的第 (i) 个元素,(i!) 是 (i) 的阶乘。
2025-04-08 16:38:53
375
原创 鸽笼原理-离散数学
把多于mn(m乘以n)个的物体放到n个抽屉里,则至少有一个抽屉里有不少于m+1的物体。抽屉原理的一般含义为:“如果每个抽屉代表一个集合,每一个苹果就可以代表一个元素
2025-04-08 15:44:18
44
HarmonyOS NEXT-给应用添加通知和提醒
2024-07-24
odjbc6g.jar sdoapi-11.2.0
2018-06-22
机器学习资料
2018-06-19
hellocharts-library-1.5.8.jar
2017-11-06
hibernate-spatial-4.3
2017-09-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人