- 博客(19)
- 收藏
- 关注
原创 workload案例
原因:web程序中有jar包冲突,org.jboss.resteasy.spi.ResteasyDeployment存在于resteasy-jaxrs-4.0.0.Beta5.jar和resteasy-core-spi-5.0.2.Final.jar两个jar包中,并且定义是不一样的。如果在10:55:00 kube-proxy已经删除所有节点上的iptables规则,这时候流量就进不来这个旧pod了,而此时新的pod又没起来,所以进不去新pod。可能是容器启动命令/脚本中某个命令报错,尝试重置节点解决。
2025-03-20 13:14:47
1762
原创 lsof中处于deleted状态的文件,不停止进程的情况下释放空间
通过lsof命令看到大量处于deleted状态中的文件,被进程占用,该如何处理。该操作并不会删除文件,而是通过清空内容释放空间,文件依然存在。最安全的方法依然是重启进程,避免清空文件导致进程出问题。磁盘空间满了,du显示使用量小于df显示的使用量。若不想停掉进程,可以尝试找对应文件的句柄,随后清空。
2025-03-19 16:45:55
145
原创 docker容器退出码
退出状态码的区间 • 必须在 0-255 之间,0 表示正常退出 • 外界将程序中断退出,状态码在 129-255 • 程序自身异常退出,状态码一般在 1-128 • 假如写代码指定的退出状态码时不在 0-255 之间,例如: exit(-1),这时会自动做一个转换,最终呈现的状态码还是会在 0-255 之间。Exit Code 139 • 表明容器收到了SIGSEGV信号,无效的内存引用,对应kill -11 • 一般是代码有问题,或者 docker 的基础镜像有问题。
2025-03-18 16:41:09
304
原创 定位资源占用高的容器
说明:一步步寻找进程的父进程,如果父进程显示有containered-shim的进程,就不用找了,说明这个进程一定是容器化运行的,我们就可以找到具体的业务进程了,如果父进程未出现containered-shim进程,那么说明此进程是主机启动。容器中异常消耗资源的不是容器的主进程,此时top查询的Pid和遍历容器的pid可能不一致,此时需要将top异常的pid,ppid,一直到 container-shim的pid,将这些pid和遍历容器的容器Pid进行对比。根据进程的Pid寻找他的Ppid(父进程)
2025-03-18 16:37:33
211
原创 Windows下所有的bat脚本全部变成txt文件格式的图标,且无法运行
Windows下所有的bat脚本全部变成文本格式,运行bat脚本结果是直接以记事本打开该脚本,无法正常运行该脚本。必须以管理员用户才能执行,执行后会将所有.bat的文件初始值还原方法一、 1、使用管理员权限运行regedit。打开注册表窗口。 2、转到:\ HKEY_CURRENT_USER \ Software \ Microsoft \ Windows \ CurrentVersion \ Explorer \ FileExts.bat 3、找到'UserChoice',这里面就是用户指定的打开方式。
2025-03-18 16:33:42
360
原创 windows新建卷提示无法装载路径
磁盘管理中可以看见,但计算机中不显示该盘,可知是因为磁盘驱动器号分配失败导致无法访问相关磁盘。1、打开磁盘管理器,在故障磁盘上的卷上,右键点击‘更改驱动器号和路径‘3、重新打开计算机(这台电脑), 数据盘已出现。windows格式创建新卷,提示无法装载路径。
2025-03-18 14:32:24
215
原创 window系统启动慢分析
3.重启系统复现问题,重启后运行procmon.exe,这时会提示 Boot-Time 活动已经记录,是否保存数据,选择"是"保存日志,保存文件到指定目录下,默认文件名为LogBoot.PML,保存完关闭成后procmon.exe。4.使用ProcMon程序打开保存的文件,菜单栏中选择Filter --> Filter,选择过滤规则:operation is 'Process Start'|'Process Exit',查看系统启动过程中启动的进程,可根据进程启动的时间查看系统在哪个步骤耗时较多。
2025-03-18 14:21:37
396
原创 windows 2012 R2蓝屏
适用于Windows 2012 R2 系列版本,当系统无法启动,可按照该文档操作。但是该文档不能够处理蓝屏所有问题,当无法处理时,请寻找其他解决方法。5.选择最近一次的正确配置(高级),如果不能修复,尝试重复1-4,,如能进入安全模式,重启尝试。1.强制重启,系统会自动进入恢复模式,点击查看高级修复选项。系统在强制重启、意外下电或更新出现兼容问题后,进入蓝屏。4.选择重启,系统会进入高级启动项。需要重启系统,如有业务正在跑请评估。2.选择疑难解答 -> 高级选项。
2025-03-18 12:51:35
253
原创 ntp案例
(1)确认业务无影响的情况下,停止ntp进程,service ntp stop 或者service ntpd stop(ntp服务一般对业务无影响,如果是数据库等业务的节点,要和业务同事确认下)先检查自己本机的防火墙设置,iptables –L,然后检查ntp服务器上的(一般都不开启),最后联系网络同事检查交换机上的。(3)如果报错如下:那说明NTP服务器不可达,如果能够正常同步。(2)如确认偏差过大(600s以上),手动同步时间后重启ntp服务器。(2)NTP服务器异常,那么排查一下ntp服务器的问题。
2025-03-17 16:16:50
245
原创 集群外部通信报SSLconnection timeout
正常情况下,服务端还送两次ACK,但是在容器报文中,并没有收到相应的ACK报文。即服务器下一次发过来报文的序号应该从seq=162开始,但是抓包显示从客户端却收到了服务器回应的seq=2942,len=1292的报文。怀疑是云上对mtu限制,云上在一键部署集群时,会添加gw网卡如图,限制mtu为1450,超过可能发生通信丢包,导致ssl超时。当天外部服务侧做了防火墙变更后,集群无法连接,尝试修复,将防火墙设置为any:any后,节点通信正常,pod仍无法访问。从pod内部调用外部服务,突发。
2025-03-17 12:54:05
171
原创 Zabbix监控
对于监控系统在企业架构中不是新的技术,但却是必不可少的重要组成部分,所谓无监控,不运维!监控系统可以帮助运维、开发、测试等人员及时的发现服务器出现的故障,并及时的发送告警通知。对于监控软件所应该具备的功能如下:指标数据采集抓取指标数据存储(数据库)白盒指标数据可视化(Zabbix可以切换中文)故障告警功能(黑盒)系统监控:CPU利用率、内存利用率、磁盘IO速度、进程数量、内核完整性等...
2025-03-03 16:40:24
1682
原创 容器句柄数
设置容器句柄数(例如文件描述符数量或进程句柄限制)是为了优化资源管理和保障系统稳定性。:容器运行时(如Docker/Kubernetes)未正确配置。检查实际生效的配置。
2025-02-26 20:07:35
151
原创 K8S运维问题
节点存在污点(Taints)或Pod未定义容忍(Tolerations)。修改ConfigMap或Secret后,Pod未加载新配置。Pod未监听ConfigMap/Secret变更。网络策略(NetworkPolicy)阻止流量。应用启动失败(如配置错误、依赖缺失)。镜像名称错误或权限不足(私有仓库)。节点网络问题(如无法访问镜像仓库)。存储卷(PV/PVC)未正确绑定。资源限制(如内存不足触发OOM)。节点资源耗尽(如磁盘空间不足)。节点资源不足(CPU/内存)。存储后端(如NFS)权限问题。
2025-02-26 18:58:38
280
原创 root用户无法登陆,报incorrect
排查后发现,客户私有镜像内/etc/securetty文件为空,查阅资料了解:该文件是控制root用户通过TTY设备登录的关键文件。通过修改该文件,可以允许或禁止root用户通过特定的TTY设备登录。确认密码正确,尝试过单用户重置密码,仍报incorrect。通过添加tty1后,可以正常登陆。
2025-02-24 18:00:28
315
原创 切换到SUSE12SP5后,网卡丢失
云上通过cloud-init插件修改虚机元数据,包括密码,名称等,怀疑是插件不包含对私有SUSE镜像正确处理,切换OS时,未更改网卡配置文件,导致此问题。找到大佬排查,了解SUSE网卡配置文件和Centos配置文件不一致,修改为STARTMODE=“auto”后,解决问题。3、怀疑使用的镜像的操作系统中打开了网卡保留规则,导致网卡漂移;2、查看网卡配置文件,正常配置,尝试更改为静态IP重启后无效。1、查看网络服务network,正常启动,未发现错误日志。查看并删除网络规则目录下,文件名同时包含。
2025-02-24 13:18:54
163
原创 (0x0010): DB version too old [0.23], expected [0.24] for domain implicit_files!
(0x0010): DB version too old [0.23], expected [0.24] for domain implicit_files!
2024-06-21 13:17:33
3777
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人