自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 workload案例

原因:web程序中有jar包冲突,org.jboss.resteasy.spi.ResteasyDeployment存在于resteasy-jaxrs-4.0.0.Beta5.jar和resteasy-core-spi-5.0.2.Final.jar两个jar包中,并且定义是不一样的。如果在10:55:00 kube-proxy已经删除所有节点上的iptables规则,这时候流量就进不来这个旧pod了,而此时新的pod又没起来,所以进不去新pod。可能是容器启动命令/脚本中某个命令报错,尝试重置节点解决。

2025-03-20 13:14:47 1762

原创 lsof中处于deleted状态的文件,不停止进程的情况下释放空间

通过lsof命令看到大量处于deleted状态中的文件,被进程占用,该如何处理。该操作并不会删除文件,而是通过清空内容释放空间,文件依然存在。最安全的方法依然是重启进程,避免清空文件导致进程出问题。磁盘空间满了,du显示使用量小于df显示的使用量。若不想停掉进程,可以尝试找对应文件的句柄,随后清空。

2025-03-19 16:45:55 145

原创 docker容器退出码

退出状态码的区间 • 必须在 0-255 之间,0 表示正常退出 • 外界将程序中断退出,状态码在 129-255 • 程序自身异常退出,状态码一般在 1-128 • 假如写代码指定的退出状态码时不在 0-255 之间,例如: exit(-1),这时会自动做一个转换,最终呈现的状态码还是会在 0-255 之间。Exit Code 139 • 表明容器收到了SIGSEGV信号,无效的内存引用,对应kill -11 • 一般是代码有问题,或者 docker 的基础镜像有问题。

2025-03-18 16:41:09 304

原创 定位资源占用高的容器

说明:一步步寻找进程的父进程,如果父进程显示有containered-shim的进程,就不用找了,说明这个进程一定是容器化运行的,我们就可以找到具体的业务进程了,如果父进程未出现containered-shim进程,那么说明此进程是主机启动。容器中异常消耗资源的不是容器的主进程,此时top查询的Pid和遍历容器的pid可能不一致,此时需要将top异常的pid,ppid,一直到 container-shim的pid,将这些pid和遍历容器的容器Pid进行对比。根据进程的Pid寻找他的Ppid(父进程)

2025-03-18 16:37:33 211

原创 Windows下所有的bat脚本全部变成txt文件格式的图标,且无法运行

Windows下所有的bat脚本全部变成文本格式,运行bat脚本结果是直接以记事本打开该脚本,无法正常运行该脚本。必须以管理员用户才能执行,执行后会将所有.bat的文件初始值还原方法一、 1、使用管理员权限运行regedit。打开注册表窗口。 2、转到:\ HKEY_CURRENT_USER \ Software \ Microsoft \ Windows \ CurrentVersion \ Explorer \ FileExts.bat 3、找到'UserChoice',这里面就是用户指定的打开方式。 

2025-03-18 16:33:42 360

原创 windows新建卷提示无法装载路径

磁盘管理中可以看见,但计算机中不显示该盘,可知是因为磁盘驱动器号分配失败导致无法访问相关磁盘。1、打开磁盘管理器,在故障磁盘上的卷上,右键点击‘更改驱动器号和路径‘3、重新打开计算机(这台电脑), 数据盘已出现。windows格式创建新卷,提示无法装载路径。

2025-03-18 14:32:24 215

原创 window系统启动慢分析

3.重启系统复现问题,重启后运行procmon.exe,这时会提示 Boot-Time 活动已经记录,是否保存数据,选择"是"保存日志,保存文件到指定目录下,默认文件名为LogBoot.PML,保存完关闭成后procmon.exe。4.使用ProcMon程序打开保存的文件,菜单栏中选择Filter --> Filter,选择过滤规则:operation is 'Process Start'|'Process Exit',查看系统启动过程中启动的进程,可根据进程启动的时间查看系统在哪个步骤耗时较多。

2025-03-18 14:21:37 396

原创 windows 2012 R2蓝屏

适用于Windows 2012 R2 系列版本,当系统无法启动,可按照该文档操作。但是该文档不能够处理蓝屏所有问题,当无法处理时,请寻找其他解决方法。5.选择最近一次的正确配置(高级),如果不能修复,尝试重复1-4,,如能进入安全模式,重启尝试。1.强制重启,系统会自动进入恢复模式,点击查看高级修复选项。系统在强制重启、意外下电或更新出现兼容问题后,进入蓝屏。4.选择重启,系统会进入高级启动项。需要重启系统,如有业务正在跑请评估。2.选择疑难解答 -> 高级选项。

2025-03-18 12:51:35 253

原创 ntp案例

(1)确认业务无影响的情况下,停止ntp进程,service ntp stop 或者service ntpd stop(ntp服务一般对业务无影响,如果是数据库等业务的节点,要和业务同事确认下)先检查自己本机的防火墙设置,iptables –L,然后检查ntp服务器上的(一般都不开启),最后联系网络同事检查交换机上的。(3)如果报错如下:那说明NTP服务器不可达,如果能够正常同步。(2)如确认偏差过大(600s以上),手动同步时间后重启ntp服务器。(2)NTP服务器异常,那么排查一下ntp服务器的问题。

2025-03-17 16:16:50 245

原创 集群外部通信报SSLconnection timeout

正常情况下,服务端还送两次ACK,但是在容器报文中,并没有收到相应的ACK报文。即服务器下一次发过来报文的序号应该从seq=162开始,但是抓包显示从客户端却收到了服务器回应的seq=2942,len=1292的报文。怀疑是云上对mtu限制,云上在一键部署集群时,会添加gw网卡如图,限制mtu为1450,超过可能发生通信丢包,导致ssl超时。当天外部服务侧做了防火墙变更后,集群无法连接,尝试修复,将防火墙设置为any:any后,节点通信正常,pod仍无法访问。从pod内部调用外部服务,突发。

2025-03-17 12:54:05 171

原创 Zabbix监控

对于监控系统在企业架构中不是新的技术,但却是必不可少的重要组成部分,所谓无监控,不运维!监控系统可以帮助运维、开发、测试等人员及时的发现服务器出现的故障,并及时的发送告警通知。对于监控软件所应该具备的功能如下:指标数据采集抓取指标数据存储(数据库)白盒指标数据可视化(Zabbix可以切换中文)故障告警功能(黑盒)系统监控:CPU利用率、内存利用率、磁盘IO速度、进程数量、内核完整性等...

2025-03-03 16:40:24 1682

原创 容器句柄数

设置容器句柄数(例如文件描述符数量或进程句柄限制)是为了优化资源管理和保障系统稳定性。:容器运行时(如Docker/Kubernetes)未正确配置。检查实际生效的配置。

2025-02-26 20:07:35 151

原创 K8S运维问题

节点存在污点(Taints)或Pod未定义容忍(Tolerations)。修改ConfigMap或Secret后,Pod未加载新配置。Pod未监听ConfigMap/Secret变更。网络策略(NetworkPolicy)阻止流量。应用启动失败(如配置错误、依赖缺失)。镜像名称错误或权限不足(私有仓库)。节点网络问题(如无法访问镜像仓库)。存储卷(PV/PVC)未正确绑定。资源限制(如内存不足触发OOM)。节点资源耗尽(如磁盘空间不足)。节点资源不足(CPU/内存)。存储后端(如NFS)权限问题。

2025-02-26 18:58:38 280

原创 dockerfile常见问题

1.使用多阶段构建,将编译环境和运行环境分离。

2025-02-26 18:31:48 139

原创 python常用简易脚本

2、监控服务状态并发送告警。4、检查磁盘空间使用情况。1、自动清理过期文件。3、增量备份指定目录。

2025-02-26 18:20:43 117

原创 shell常用脚本

1、自动清理过期日志文件。2、监控服务状态并重启。3、增量备份指定目录。

2025-02-26 18:15:31 70

原创 root用户无法登陆,报incorrect

排查后发现,客户私有镜像内/etc/securetty文件为空,查阅资料了解:该文件是控制root用户通过TTY设备登录的关键文件。通过修改该文件,可以允许或禁止root用户通过特定的TTY设备登录。确认密码正确,尝试过单用户重置密码,仍报incorrect。通过添加tty1后,可以正常登陆。

2025-02-24 18:00:28 315

原创 切换到SUSE12SP5后,网卡丢失

云上通过cloud-init插件修改虚机元数据,包括密码,名称等,怀疑是插件不包含对私有SUSE镜像正确处理,切换OS时,未更改网卡配置文件,导致此问题。找到大佬排查,了解SUSE网卡配置文件和Centos配置文件不一致,修改为STARTMODE=“auto”后,解决问题。3、怀疑使用的镜像的操作系统中打开了网卡保留规则,导致网卡漂移;2、查看网卡配置文件,正常配置,尝试更改为静态IP重启后无效。1、查看网络服务network,正常启动,未发现错误日志。查看并删除网络规则目录下,文件名同时包含。

2025-02-24 13:18:54 163

原创 (0x0010): DB version too old [0.23], expected [0.24] for domain implicit_files!

(0x0010): DB version too old [0.23], expected [0.24] for domain implicit_files!

2024-06-21 13:17:33 3777

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除