大数据与AI实验室-CSDN博客

原创【Elasticsearch】大慢查询隔离（二）：选择插件

本文分类介绍了 Elasticsearch 中用于查询隔离、限流和保护的主要插件。首先介绍了官方和主流插件如 Search Guard 和 ReadonlyREST，它们提供基于角色的查询限制、速率控制等功能。其次介绍了专用查询管理插件 Query Guard 和 Search Profiler，专注于查询保护和诊断。文章还展示了自定义开发插件的示例代码，以及监控告警插件如 HQ 和 Prometheus 的配置方法。这些插件共同构成了 Elasticsearch 查询隔离和保护的技术方案。

2025-12-13 22:48:41 961

原创【Elasticsearch】大慢查询隔离（一）：最佳实践

Elasticsearch 的大慢查询隔离机制通过资源限制和队列隔离防止耗时查询影响集群性能。核心配置包括线程池隔离、查询级限制（如超时设置、文档数限制）和索引级参数控制。最佳实践建议采用分层架构、读写分离和冷热数据分离策略，同时结合慢查询日志监控和用户权限控制。该机制需在性能保护与业务需求间取得平衡，通过动态调整和查询优化保障集群稳定性，避免单个慢查询导致系统雪崩。

2025-12-13 17:10:57 500

原创【云计算】云平台权限治理（六）：企业项目的管理结构

VDC 是“资源容器和管理边界”，它天生就是深层的树形结构，用于构建治理体系。企业项目是“逻辑分组和成本中心”，它通常是扁平或浅层树形，用于构建财务和项目管理体系。它们的最佳实践是协同工作，而不是相互替代。使用 VDC 的树形结构来构建你云上资源的 “行政管理骨架”，实现隔离、安全和权限下放。使用企业项目在这个骨架上，按照业务项目、成本中心等进行“横向切分”，实现精准的成本核算和项目管理。

2025-12-07 20:28:38 959

原创【云计算】云平台权限治理（五）：VDC 的树形管理结构

VDC 的树形管理结构是将企业复杂的行政管理和资源分配逻辑，直接翻译成云平台操作语言的一种强大范式。它不仅是技术上的资源划分，更是一套完整的、反映企业运营方式的治理模型。

2025-12-07 16:44:02 1205 1

原创【云计算】云平台权限治理（四）：VDC、企业项目、用户组

公有云通过 “账户（天然 VDC）+ 企业项目 + IAM 用户组” 这三驾马车，实现了混合云中通过 “VDC + 企业项目 + 用户组” 所要达成的同等甚至更精细的治理目标。这就是为什么会在混合云平台上更清晰地看到 VDC 这个概念，因为它需要被作为一个显性的、可交付的产品功能来设计和售卖。

2025-12-06 22:03:34 1205

原创【云计算】云平台权限治理（三）：为什么公有云没有 VDC ？

公有云通常没有明确的 VDC 概念，而混合云/私有云则广泛采用 VDC，这源于两者不同的目标客户和交付模式。公有云面向单个企业内的团队或开发者，其账户本身已提供强隔离，通过多账户体系和企业项目实现类似 VDC 的功能。而混合云/私有云服务于单一大型组织，需要在同一租户内为多个部门创建隔离的"子租户"，VDC 作为标准化的IT服务交付单元，封装了底层异构资源的复杂性。

2025-12-06 19:57:41 613

原创【Elasticsearch】索引状态管理（ISM）实战（万字长文）

本文详细介绍了 OpenDistro 的 ISM（Index State Management）功能，并与 Elasticsearch 的 ILM 进行了对比。ISM 是 AWS OpenDistro 开源方案，采用 Apache 2.0 许可证，而 ILM 是 Elastic 官方商业功能。ISM 为开源用户提供了完善的索引生命周期管理方案，适合需要免费自动化索引管理的场景。

2025-11-30 20:47:43 1724

原创【Elasticsearch】索引别名 aliases

本文探讨了 Elasticsearch 索引别名与写入索引的关系。主要内容包括：（1）错误演示：当多个索引同时设置为同一别名的写入索引时会报错；（2）三种解决方案：先移除旧索引写入权限再设置新索引、使用原子操作一次性切换、创建时不设置写入索引后续再切换；（3）验证方法：查看别名指向的索引和当前写入索引；（4）实际应用场景：基于时间的索引滚动和索引重建。文章强调一个别名可指向多个索引，但只能有一个写入索引，这种机制是实现索引滚动等高级功能的基础。

2025-11-30 11:47:49 1435

原创【Elasticsearch】索引字段设置 “index”: false 的作用

本文解释了 Elasticsearch 中 "index": false 的作用，澄清了该设置仅禁止字段被搜索和聚合，但仍允许在结果中返回。通过图书馆的比喻，说明不可搜索字段如同没有索引卡片的书籍，虽无法通过关键词查找，但可直接获取。文章演示了如何通过 _source 控制字段返回，并列举了密码字段、原始请求数据等典型应用场景。最后对比了不同操作对 index 和 _source 的依赖关系，帮助用户正确理解和使用这一配置。

2025-11-29 23:46:34 812 1

原创【Elasticsearch】动手创建一个索引

本文介绍了 Elasticsearch 索引创建与配置的完整流程。主要内容包括：1）创建名为 test-index 的索引，配置3个主分片和1个副本，设置15秒刷新频率，并定义 log-index 别名作为写入索引；2）索引包含多种字段类型（日期、关键词、文本、数值、布尔值等），特别针对中文文本配置了IK分词器；3）详细说明了默认摄入管道的功能，它可以在数据索引前进行预处理和转换；4）解释了字段数据统计机制（fielddata 和 doc_values）的作用，使文本字段支持排序和聚合操作。

2025-11-28 22:38:51 1156

原创【云计算】云平台权限治理（二）：VDC 与企业项目

VDC（虚拟数据中心）与企业项目在云平台权限管理中协同作用，而非相互替代。企业项目作为资源分组和财务核算单位，关注“谁花钱”和项目归属；VDC 则提供底层技术隔离，定义资源分配、网络架构等基础规则。关键区别在于：企业项目是逻辑分组，依赖标签系统；VDC 实现强隔离，构建独立资源池。

2025-11-25 23:33:03 1071

原创【云计算】云平台权限治理（一）：虚拟数据中心 VDC

总而言之，VDC 不仅仅是一个资源集合的概念，更是一个强大的组织和治理工具。它通过将混合云复杂的物理和逻辑资源，封装成符合企业业务逻辑的、自包含的单元，从而使得大规模云环境的权限管理、资源治理和运维自动化变得可行、高效和安全。它是企业实现 “云治理” 而非 “云混乱” 的基石。

2025-11-22 13:08:02 788

原创【Java】Java 运行时数据区域（二）：案例讲解

本文通过一个Java代码示例详细讲解了运行时数据区域的协同工作过程。程序启动时，方法区存储类结构、静态变量和方法字节码；执行new操作时在堆中创建对象实例；虚拟机栈存储方法调用的栈帧和局部变量；程序计数器记录指令地址。重点演示了递归调用导致栈溢出的场景，并说明了直接内存和本地方法栈的作用。最后通过表格总结了各代码部分对应的数据区域，清晰展示了栈存引用、堆存对象、方法区存类蓝图的协作机制。

2025-11-21 23:58:53 889

原创【Java】Java 运行时数据区域（一）：名词概念

Java 运行时数据区域分为线程私有和共享区域。线程私有区域包括程序计数器（记录字节码指令地址）、虚拟机栈（存储方法栈帧）和本地方法栈（服务于 Native 方法）。共享区域包括 Java 堆（存放对象实例，GC 主战场）和方法区（存储类信息、常量等）。此外，直接内存（NIO 使用的堆外内存）虽不属于运行时数据区，但也会影响内存分配。各区域可能抛出 StackOverflowError 或 OutOfMemoryError 异常。JDK8 后方法区由永久代改为元空间实现。

2025-11-21 23:58:06 876

原创【人工智能】OpenAI 重磅推出 Sora2

OpenAI 推出新一代视频生成模型 Sora2，在视频质量、音画同步、可控性等方面显著提升，新增个性化 Cameo 功能及社交平台 Sora App。Sora2 标志着AI视频从"可用"到"好用"的跨越，同时完善了安全审核、肖像保护等内容治理机制。

2025-10-08 23:42:20 1262

原创【Linux】MobaXterm 工具介绍

MobaXterm 的核心价值在于：集成与便携。它通过一个统一的平台，集成了多种分散的工具，极大地提升了工作效率，特别适合需要频繁与远程系统（尤其是 Linux / Unix）打交道的用户。无论是开发者、IT 支持还是科研人员，它都能成为你手中那把得心应手的“瑞士军刀”。

2025-10-06 23:02:37 2171 1

原创【软件测试】Fortify 代码安全扫描

Fortify 是一套由 Micro Focus（现属 OpenText）公司开发的、业界领先的静态应用程序安全测试工具集。它的核心任务是帮助开发者在软件开发生命周期的早期发现、分析和修复源代码中的安全漏洞和质量缺陷。您可以把它想象成一个功能极其强大的 “代码安全扫描仪” 或 “安全专家助手”。

2025-09-27 14:21:06 1192

原创【网络】测试 IP 端口连通性方法总结

ping 命令本身使用的是 ICMP 协议，它只能测试到 IP 地址的连通性，无法检测特定端口的状态。要检查 IP 地址的特定端口是否开放，需要使用其他工具。最常用和简单的方法是使用 telnet 命令，或者在 Windows 上使用更现代的 Test-NetConnection PowerShell 命令。

2025-09-27 12:09:40 3032

原创【安全】TLS 协议介绍

TLS（传输层安全协议，Transport Layer Security）是一种加密协议，旨在为计算机网络通信提供安全和数据完整性保障。你几乎每天都在使用它，当你在浏览器中看到地址栏有一个小锁图标时，就表示你正在使用 TLS。它的前身是更广为人知的 SSL（安全套接字层），因此人们也常称之为 SSL/TLS。

2025-09-26 22:55:51 1895

原创【云计算】存（云主机）算（云硬盘）分离

公有云的 “存算分离” 架构通过将计算与存储在物理、网络和管理层面彻底解耦，利用高速网络连接和强大的分布式存储系统，实现了高可用、弹性伸缩、成本优化、灵活数据管理等核心优势。它解决了传统紧耦合架构中计算节点故障导致数据不可用、资源扩展不灵活、存储利用率低等问题，是现代云原生应用和有状态服务在云上运行的基石架构。虽然存在网络延迟、缓存一致性等挑战，但云厂商持续的网络优化和分布式存储技术的进步，使得存算分离的性能和可靠性已能满足绝大多数企业级应用的需求。

2025-08-04 14:00:00 1233

原创【云计算】对象存储（以图书馆找书为案例说明）

用一句话概括对象存储：它像一个拥有无限空间的智能仓库，你给每件物品（数据）贴上一个唯一且复杂的条形码（ID）和一个超大信息标签（元数据），然后仓库系统会自动把它扔到某个位置（分布式存储），并且偷偷复制几份藏到别处（冗余）。你需要时，只要报出条形码，系统就能瞬间从茫茫货海中把它找出来给你。

2025-08-04 10:00:00 1143

原创【云计算】云主机的亲和性策略（四）：云主机组

本文详细探讨了云主机组在实现亲和性与反亲和性策略中的应用。云主机组作为策略载体，通过显式声明组策略类型来约束虚拟机调度。文章分析了调度器的工作流程，包括策略存储、宿主机筛选和最优选择等关键步骤，并比较了 AWS、Azure 等主流云平台的实现差异。此外，还介绍了标签选择器等其他实现方法，特别是 Kubernetes 中的节点亲和性和 Pod反亲和性配置。这些技术可确保关键业务分散部署，避免单点故障，提升系统可用性。

2025-08-02 10:54:18 1471

原创【云计算】云主机的亲和性策略（三）：云主机 & 宿主机

本文阐述了云主机与宿主机的核心关系及技术原理。云主机通过虚拟化技术在宿主机上创建，共享底层硬件资源但相互隔离，类似公寓与大楼的关系。关键点包括：虚拟化层实现资源隔离与调度；资源超卖、快速弹性和故障隔离是主要优势；但存在“吵闹邻居”、性能损耗等风险。公有云中用户无需感知宿主机，由云平台统一调度。文章还对比了容器与裸金属服务器的差异，强调理解这一关系对云架构设计的重要性。

2025-08-02 09:38:38 1394

原创【云计算】云主机的亲和性策略（二）：集群节点组

本文通过云计算场景中的集群节点组（Master/Core/Task）和宿主机调度，解释了反亲和性策略的实现过程。通过创建不同严格程度的反亲和性组，确保关键节点（Master/Core）分散部署以提升高可用性，同时允许弹性计算节点（Task）适度集中以优化资源利用率。文章还模拟了宿主机故障场景，验证了分层反亲和策略的有效性，并分析了不同节点组采用差异化策略的设计考量。

2025-08-01 10:15:00 1396

原创【云计算】云主机的亲和性策略（一）：快乐旅行团

本文通过旅行团分车的生动比喻，解释了云主机组的反亲和性策略原理。文章将 30 名员工类比为 30 台云主机，大巴车对应宿主机，安全分散组对应反亲和性云主机组。调度员（云平台调度器）根据 "同一部门员工必须分散在不同车辆" 的规则进行分配，确保单点故障时影响最小化。相比自由选座、标签分组或指定车队等方法，云主机组策略具有用户省心、调度高效和故障隔离三大优势。文章还补充了 "车辆不足" 等现实场景的技术对应，最终强调这种智能分散策略能有效保障业务连续性。

2025-08-01 10:00:00 2297

原创【ELasticsearch】集群故障模拟方案（二）：磁盘空间满、重选主节点

本文介绍了 Elasticsearch 集群故障模拟的两种场景：磁盘空间满和主节点选举问题。针对磁盘空间满模拟，详细说明了通过 dd 和 fallocate 命令快速填充磁盘的方法，对比了两种命令的差异及适用场景，同时提供了集群状态监控和清理方案。对于主节点选举问题，给出了识别主节点、停止主节点服务并观察选举过程的步骤。最后强调了安全注意事项和关键监控指标，为测试集群容错能力提供指导。全文包含具体命令示例和参数说明，适合运维人员参考实施。

2025-07-31 10:15:00 1455

原创【ELasticsearch】集群故障模拟方案（一）：节点宕机、节点离线

本文介绍了两种 Elasticsearch 集群故障模拟方案。节点宕机模拟：通过 kill 进程或停止服务强制终止节点，观察集群响应和恢复情况；节点网络隔离模拟：使用 iptables 阻断节点间的 9300 端口通信，测试集群容错机制。两种方案均包含详细的操作步骤、命令解释和恢复方法，特别说明了 iptables 规则的作用原理及注意事项。该方案可用于验证 Elasticsearch 集群的容错能力和故障恢复机制。

2025-07-31 10:00:00 1994

原创【ELasticsearch】案例：AWS 上 Elasticsearch 对接 NLB / ALB

本文详细介绍了在 AWS 上通过 NLB/ALB 对接 Elasticsearch 集群的方案。重点说明如何配置专用协调节点作为请求入口，并创建 NLB 或 ALB 进行负载均衡。关键配置包括节点角色设置、安全组规则、健康检查策略，以及客户端访问方式。架构实现了流量入口与数据处理的分离，协调节点处理请求聚合，数据节点专注分片操作，主节点负责集群管理。对比显示 NLB 更适合 ES场景，因其高性能、低延迟和源 IP 保留特性。该方案显著提升了 Elasticsearch 在云环境下的可用性和扩展性。

2025-07-28 15:00:00 1518

原创【ELasticsearch】搭建有负载均衡 ELB 的 ES 集群

本文探讨了在公有云上为 Elasticsearch 集群封装 ELB 负载均衡器的设计优势。ELB 提供单一入口点，简化客户端配置，实现高可用性、负载均衡和集群可扩展性，同时增强安全性。相比直接连接 ES 节点，ELB 方案降低了客户端复杂度，避免了单点故障风险，并优化了流量分发。文中指出，ELB 应仅对接专用协调节点而非所有节点，以提升性能并确保集群稳定性。这是生产环境中 ES 集群部署的最佳实践，特别适用于中大规模集群场景。

2025-07-28 14:00:00 827

原创【ELasticsearch】温、冷数据节点能是同一个节点吗

在 Elasticsearch 中，虽然技术上可以让一个节点同时承担“温”和“冷”数据层的角色，但这通常不是最佳实践。温层节点需要较好的 CPU、内存和高速磁盘以支持查询，而冷层节点侧重低成本、高密度存储。混合部署会导致硬件需求冲突、资源干扰风险，增加管理复杂度，并削弱分层存储的优化效果。建议在生产环境中使用独立的物理节点分别作为温节点和冷节点，以实现性能隔离和成本效益。仅在小规模测试或开发环境中可考虑临时混合配置。

2025-07-27 13:48:31 1603

原创【ELasticsearch】节点角色分离最佳实践

本文介绍了一个分层 Elasticsearch 生产集群设计方案，包含热、温、冷、冷冻四层存储架构。热层采用高性能 NVMe SSD 处理实时写入和高频查询；温层使用 SAS SSD 存储近期访问数据；冷层配置大容量 HDD 存储历史数据；冷冻层则结合对象存储实现长期归档。文章详细说明了各层的硬件配置、节点角色设置和分片策略，并提供了数据流动逻辑示意图和 ILM 策略示例。该架构通过严格分层实现了性能隔离和成本优化，SSD 使用量减少 70% 以上，存储成本可降低 5 倍，同时保持灵活的扩展性和合规性。

2025-07-27 11:18:02 1318

原创【ELasticsearch】节点角色分类与作用解析

ELasticsearch 集群通过角色隔离实现性能与稳定性的平衡 —— 热层追求速度，协调层消化流量，主节点专注决策，温冷层优化成本。各角色各司其职，构建高可用分布式系统。

2025-07-26 18:40:16 1935 1

原创【Elasticsearch】跨集群检索（Cross-Cluster Search）

跨集群检索（CCS）是 Elasticsearch 应对分布式数据挑战的利器，完美实现了 “数据物理分散，逻辑集中查询”。它解决了数据驻留、扩展性、简化应用访问等核心问题。然而，其性能高度依赖网络，且在生产中需谨慎处理版本兼容性、安全配置、网络优化、监控运维以及理解其功能限制（如不支持事务）。合理规划和配置 CCS，能极大地提升大规模、分布式 Elasticsearch 部署的灵活性和价值。

2025-07-23 22:38:56 1155 1

原创【Elasticsearch】快照生命周期管理 SLM（实战篇）

本文详细介绍了 Elasticsearch 快照生命周期管理 SLM 的实战应用，以电商平台日志集群为例，展示如何实现自动化备份与保留策略。

2025-07-23 10:15:00 1744

原创【Elasticsearch】快照生命周期管理 SLM（理论篇）

Elasticsearch 的快照生命周期管理（SLM）和索引生命周期管理（ILM）是两大核心数据治理工具。SLM 专注于自动化备份与恢复，通过定时创建/删除快照（如每日备份至 S3）确保灾备能力；ILM 则优化在线数据存储，将索引按热、温、冷阶段分层迁移，最终自动删除过期数据。两者核心区别在于：SLM 操作快照副本（外部仓库），由时间触发；ILM 管理原始索引（集群内部），基于年龄/大小等条件。典型协作场景中，ILM 处理数据的"生老病死"，SLM 负责"拍遗照"留存，共同实现存储成本优化与数据可恢复性。

2025-07-22 10:30:00 1192

空空如也

空空如也