- 博客(480)
- 收藏
- 关注

原创 AI大模型技术之RAG、模型微调、知识蒸馏
中的核心技术,是指在已训练好的大规模预训练模型(如GPT、BERT、T5等)基础上,针对特定任务(如文本分类、问答、翻译)或领域(如医疗、法律),通过少量标注数据进一步训练,调整模型参数,使其在目标任务上表现更优的技术。(如“猫”90%、“狗”8%、“兔子”2%),其中包含了类别间的隐含关系(如“猫”和“狗”的相似度高于“猫”和“兔子”)。(Generation)的自然语言处理(NLP)技术,旨在通过外部知识的检索来增强模型的生成能力,解决传统生成模型(如GPT)在处理需要。时引入一个温度参数T。
2025-04-12 17:09:45
756

原创 Ollama DeepSeek + AnythingLLM 实现本地私有AI知识库
本文主要介绍了如何使用AnythingLLM结合Ollama部署的DeepSeek-r1模型来实现私有的本地AI知识库。
2025-02-18 21:47:10
1154

原创 项目管理中的常用工件(二):可视化工件
可视化数据和信息是以图表、图形、矩阵和示意图等可视化格式组织和呈现数据和信息的工件。将数据可视化可使人们更容易理解数据,并将之转化为信息。可视化工件通常是在收集和分析数据后生成的。这些工件有助于决策和确定优先级。
2024-07-25 20:41:04
1872

原创 Oracle数据泵跨大版本迁移数据库
🦈:将测试环境中一台Oracle 11g数据库迁移到另一台新搭建的19c数据库中。🤔:由于是跨数据库大版本,无法通过RMAN进行备份恢复来迁移数据库。数据库整体数据量较小,约1T左右,source库有充足的停机时间,因此可以采用数据泵技术来迁移数据库。
2024-02-25 00:30:00
2752
原创 滥用绑定变量导致Oracle实例宕机
如果只是为了避免实例crash,可以为数据库安装临时补丁12578873。但是这种情况下,如果后续应用在sql或plsql中使用了超过。最一劳永逸的解决办法是应用修改SQL代码,避免一次性使用超过。该Bug的触发条件是在sql或plsql中使用了超过。从时间顺序来看,数据库首先在15:50:54发生了。个绑定变量,还是会收到SQL执行报错。异常,随后数据库实例被PMON终止。异常,然后在15:52:43发生了。根据异常关键字在MOS中检索,与。,然后导致实例crash。注:以上代码由AI生产。
2025-05-02 10:44:03
123
原创 OceanBase租户扩缩容的三种方法
缩容是扩容的反操作,本质上是降低租户的服务能力,包括计算能力和存储容量。可以是调小资源规格,从而降低单节点的服务能力;也可以是通过减少服务节点,包括减少Primary Zone个数和减少Unit Number。
2025-05-02 10:40:27
855
原创 OceanBase数据库磁盘空间管理
OceanBase数据盘空间满的情况一般比较少见,但是在写满后也会导致无法转储、无法合并、内存无法释放的问题,进而导致集群无法写入。当遇到clog日志盘空间满的问题时,集群一般表现为无主选举,写入失败,缺副本等现象。主动停止租户的写入,防止clog盘临时腾挪的空间再次快速被业务写入打满,无法修复。停止集群写入后,临时调大clog盘阈值比例,由95%调整到98%。🦁 OBServer可以使用的日志盘总容量由集群级别的配置项。🦁 OBServer可以使用的数据盘总容量由集群级别的配置项。左右,避免频繁扩容。
2025-04-27 10:29:37
781
原创 OceanBase单机重启和配置修改
OceanBase数据库自身并没有提供重启集群的命令。OceanBase数据库提供了停止和启动某个副本(zone级别或者server级别)的功能,并且只允许停止少数派节点。所以,OceanBase集群的重启是靠外部操作。)的配置项不能通过用户租户设置,也不可以通过sys租户指定为用户租户设置。OB节点重启适用于对机器进行短暂维修,以及修改系统配置项后需要重启生效的场景。重启节点的主要流程为:转储 => 关闭进程 => 启动进程。视图中的scope字段来查看配置项是集群级别还是租户级别。
2025-04-27 10:28:53
612
原创 OceanBase TPCC测试常见报错汇总
是租户级参数,该参数是调整写入速度的阈值,当MemStore已使用的内存达到该阈值时,触发写入限速。,也就是租户内存中可用于MemStore写入的比例,默认为0,表示租户使用MemStore的内存占其总可用内存的百分比由系统进行自适应调整。转储后,系统就会释放占用的MemStore内存。修改集群的数据文件大小(修改时不支持缩小,只支持扩大),无需重启OBserver即可生效。这里我们tpcc租户原本的内存规格就很大,感觉应该不是租户内存不足的问题。转储前数据会大量占据内存,快速转储结束能释放被占用的内存,
2025-04-27 10:27:49
946
原创 基于BenchmarkSQL的OceanBase数据库tpcc性能测试
建表脚本如下,采用分区表方式创建,大部分表按照仓库ID做HASH分区。分区数取决于要测试的数据规模和机器数。如果集群只有1台或3台机器,分区数设置9个即可。如果是5000仓以上,或者集群中节点数较多,则分区数可以调整到99。📖 在开始性能测试之前,建议您先登录到对应租户做一次集群合并(major freeze),获得更好的测试结果。您可以通过如下的方式手动触发合并,这个过程并不是必须的。是使用BenchmarkSQL进行性能测试的主要配置文件。是生成的测试报告,png文件是报告中包含的图片。
2025-04-27 10:23:00
802
原创 OceanBase租户管理:创建与删除
OceanBase数据库中的(Tenant)可以类比为传统Oracle数据库的(Instance)。租户通过资源池与CPU、内存、磁盘空间、IO等物理资源关联。在租户下可以创建database、table、user等数据库对象。
2025-04-18 17:18:08
1092
原创 OceanBase企业版集群部署:oatcli命令行方式
本文介绍了如何通过命令行方式部署OceanBase企业版集群环境。是管理OceanBase管理者工具(OceanBase Admin Toolkit,简称:OAT)资源的命令行工具。
2025-04-12 09:25:17
1227
1
转载 OceanBase数据库的基本概念
在OceanBase中,Zone是指一个数据中心或一个物理区域,它是一个逻辑上的概念,通常包含多个存储节点,这些节点在物理上可以分布在不同的机房、不同的机架或不同的服务器上。,其具有节点、Zone、Region等位置属性,节点是服务器的抽象,Zone是机房的抽象,Region是地域的抽象,通过调整Unit的位置属性从而调整租户的部署方式。Primary Zone指的是分区的主副本所在的Zone,可以为分区指定一个Zone的列表,当分区需要切主的时候,容灾策略会按照这个列表的顺序决定新主的偏好位置。
2025-04-10 19:19:35
56
原创 Oracle触发器使用(三):设计规范和禁用启用
如果行级别的BEFORE触发器的触发事件语句是一条与正在运行的UPDATE语句冲突的UPDATE或DELETE语句,那么数据库会透明地回滚到保存点(SAVEPOINT),并重新启动触发事件语句。例如,如果全局包变量的当前值取决于行级触发器正在处理的行,那么不要在行级触发器中为该全局包变量赋值。(idempotent)的,即触发器的写法应当保证每次后续执行的结果保持一致。如果创建的触发器包含一条访问远程数据库的语句,那么要将该语句的异常处理程序放在一个子存储过程中,并从触发器中调用该子程序。
2025-04-04 01:00:00
36
原创 Oracle触发器使用(一):DML触发器
Oracle数据库中的触发器(Trigger)本质上也是PL/SQL代码,触发器可以被Enable或者Disable,但是不能像存储过程那样被直接调用执行。触发器不能独立存在,而是定义在表、视图、模式或者整个数据库上的。定义触发器时可以指定触发器在触发事件执行之前或执行之后被激活生效。如果触发事件影响到多行数据,也可以选择是否每一行都激活。当触发器被激活(fires)时,定义了触发器的表很可能正处于某个事务中。触发器定义语句中的SQL也遵循事务的读一致性。
2025-04-03 22:45:00
281
原创 大坑!GaussDB数据库批量插入数据变只读
如果此时还在运行中的进程持有这个已经被删除的文件句柄,那么这个文件就不会真正在磁盘中被删除,分区超级块中的信息也就不会更改,df命令仍会统计这个被删除的文件。从操作系统看磁盘空间降下来了(从77G降到34M),但还是有被删除文件的句柄被gaussdb进程占用,不过比直接DROP时少很多。通过lsof命令查询处于deleted状态的文件,被删除的文件在系统中被标记为deleted。了几张数据总量300G的表之后,重新建表插入数据的时候遇到的报错,而新插入的的数据量只有几十个G,不可能把磁盘空间占满。
2025-04-03 17:50:30
295
原创 MySQL中的CREATE TABLE LIKE和CREATE TABLE SELECT
【代码】MySQL中的CREATE TABLE LIKE和CREATE TABLE SELECT。
2025-03-30 20:02:55
611
原创 向量数据库:A Brief Introduction
向量数据库()是一种专门用于存储和管理向量数据,并通过向量索引等技术实现高效的向量相似性查询,以召回率等指标衡量性能的数据库系统。
2025-03-15 16:40:01
628
原创 Oracle中的INHERIT PRIVILEGES权限
PL/SQL存储过程或用户自定义函数的AUTHID属性会影响该代码块在运行时所发出的SQL语句的命名解析和权限检查。该属性值可以在数据字典中查询。AUTHID值为的代码块被称为调用者权限()代码块,或简称IR unit。AUTHID值为DEFINER的代码块被称为定义者权限()代码块,或简称DR unit。命名解析的上下文是。所检查的权限是的权限以及已启用Roles的权限。当开启一个会话时,的值是所拥有的模式的值,而与的值相同。可以通过函数进行确认。在会话期间,可以使用SQL语句。
2025-03-14 19:20:31
275
原创 Oracle数据恢复:闪回表
在误删除业务数据时,Oracle数据库通常支持以下几种数据恢复途径。闪回表()操作主要用于在特定场景下恢复表的早期状态。当出现人为错误,如误删除、误更新表数据时,可通过该操作将表恢复到误操作前。在应用程序出错导致数据异常时,也能利用它回退表状态。不过,其能闪回的时间取决于系统中的UNDO数据量。并且,若执行过改变表结构的DDL操作,就无法通过该操作恢复到这些操作之前的状态。它主要适用于数据层面错误恢复。在进行闪回表操作期间,Oracle数据库会对闪回列表中指定的所有表获取。
2025-03-09 09:59:01
276
原创 Oracle数据恢复:闪回查询
在误删除业务数据时,Oracle数据库通常支持以下几种数据恢复途径。Oracle闪回查询()是Oracle数据库提供的一种强大的功能,它允许用户查询数据库在过去某个时间点或特定SCN(系统更改号)时的数据状态,而无需进行复杂的恢复操作。Oracle数据库通过在Undo表空间中存储数据的旧版本来实现闪回查询功能。当事务对数据进行修改时,在将新数据写入数据块之前,Oracle会将旧数据复制到Undo表空间中。这些旧数据会在一定时间内保留,以便进行闪回操作等。
2025-03-09 09:51:48
220
原创 一次GaussDB内存不足导致宕机的问题排查
发现auditd服务占用了47%的物理内存。这应该是Kylin Linux操作系统的bug。应用反馈测试环境的一套GaussDB单机库宕机,无法连接。可以看到DN节点宕机,集群不可访问。
2025-03-01 11:00:07
134
原创 如何在不重启数据库的前提下重启MMON和MMNL进程
MMON进程负责处理AWR快照的生成、以及ADDM自动诊断分析。MMNL进程负责历史会话活动信息抓取。在某些情况下,例如MMON进程夯死导致AWR快照无法正常生成时,可能需要重启MMON和MMNL进程。注意restricted模式下,应用无法新建到数据库的连接,但已经建立的连接不受影响。📖如何在不重启数据库的前提下重启MMON/MMNL进程?
2025-03-01 10:59:07
64
原创 Oracle Enterprise Manager (OEM)安装部署
OEM有两个不同的版本,分别是:database control和grid control。Database control通常用于监控和管理本地单个数据库或者RAC数据库。Grid control则用于管理大规模、复杂的系统环境,它可以管理包括主机、数据库、web服务器、监听器、服务等在内的整个基础设施。这里我们安装第一个版本(database control)。管理仓库(management repository):Oracle管理仓库用于存放由管理代理收集的所有信息。
2025-03-01 10:55:42
497
原创 GaussDB存储过程使用(一)
🍎 本文涉及的内容仅适用于部署下的模式的GaussDB。GaussDB数据库中存储过程与PL/SQL语言函数的创建与应用方法基本一致。
2025-03-01 10:53:37
223
原创 Oracle性能调优(一):时间模型统计
查看数据库实例启动以来汇总统计的DB Time等时间模型统计信息(单位为微秒)。查看当前所有连接会话累计消耗的DB Time等时间模型统计信息(单位为微秒)。
2025-03-01 10:51:13
238
原创 GaussDB会话超时参数与最大连接数设置
如果一个客户端没有在这段时间里完成与服务器端的认证,则服务器自动中断与客户端的连接,这样就避免了出问题的客户端无限制地占用连接数。
2025-02-20 21:03:57
271
原创 GaussDB密码策略与账户锁定
GaussDB管理控制台 => 集群管理 => 集群详情 => 参数修改 => 参数列表。),系统将自动锁定该帐户,默认值为10。次数设置越小越安全,但是在使用过程中会带来不便。),则当前帐户自动解锁,默认值为1天。时间设置越长越安全,但是在使用过程中会带来不便。若管理员发现某帐户被盗、非法访问等异常情况,可手动锁定该帐户。为了保证帐户安全,如果用户输入密码次数超过一定次数(当管理员认为帐户恢复正常后,可手动解锁该帐户。等特殊字符,在终端中登录时需要带上单引号。当帐户被锁定时间超过设定值(
2025-02-08 02:45:00
1427
1
原创 GaussDB对象权限的注意事项
原因是用户在testdb数据库中没有自己的Schema,也没有对public模式的CREATE权限。授予对public模式的CREATE权限后,可以在public模式下建表。经测试无需额外授予CREATE ON DATABASE权限。经测试无需额外授予CREATE ON SCHEMA权限。
2025-02-07 22:09:04
1132
原创 GaussDB用户权限管理
GaussDB数据库中的权限管理可以分为三个级别:🐘与权限相关的的系统视图命名大都以、和前缀开头,且同时位于和模式下。查看数据库中的用户:📖 系统视图adm_users中的字段含义:查看用户的系统权限:视图只有管理员可以查看,其中privilege列会显示用户的系统权限或ANY权限。查看所有用户的ANY权限:系统权限授予授予或撤销一般系统权限,使用CREATE、ALTER语法:SYSADMIN系统权限也可以通过ALL PRIVILEGES关键字授予或撤销授权:授予或撤销ANY权限,使用GRA
2025-02-07 22:08:06
1120
原创 如何在Window计算机本地部署DeepSeek-r1模型
本文介绍了如何使用Ollama在Windows计算机本地部署DeepSeek-r1模型。
2025-02-05 21:42:53
668
原创 Transformer模型与Attention机制是什么
由 Google 团队在 2017 年提出(论文《Attention Is All You Need》)。它彻底改变了传统的序列建模方式(如 RNN 和 CNN),成为现代大语言模型(如 GPT、BERT)和跨模态模型(如 Vision Transformer)的核心基础。
2025-02-04 16:11:26
843
原创 GaussDB表空间和磁盘空间管理
🐘不同于Oracle数据库,GaussDB数据库中的表空间直接对应磁盘上的文件系统路径,无需添加数据文件,关注磁盘空间使用量即可。列出所有数据库,可以看到数据库占用的空间和使用的表空间。命令现实的表大小是数据文件的大小,不包含索引占用的空间。列出当前数据库中的所有表,可以看到表的大小。列出所有表空间,但是看不到表空间的大小。注意这里只会显示public模式下的表。为空表示无限制(unlimited)。对当前数据库中的所有。
2025-01-23 18:03:08
694
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人