自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(399)
  • 收藏
  • 关注

原创 EasyOps®5月热力焕新:三大核心模块重构效能边界

在应用系统管理中,我们将管理对象从「服务实例」优化为「部署实例」,这一改变旨在提升管理效率与数据展示清晰度。此前,系统以 “IP + Port” 组合定义服务实例。当同一 IP 下启用多个进程或端口时,会产生多个服务实例。比如一台主机上运行多个应用服务端口,就会被拆分为多个实例展示。这种方式虽能清晰呈现每个应用进程提供的服务,但在实际运维管理中,颗粒度过于细致。多数运维人员更习惯从应用在主机的实际部署视角出发,关注应用安装在哪些主机、具体目录位置,这与「部署实例」概念更为契合,也更适配 K8S 和云资源的部

2025-05-13 10:21:18 827

原创 机器学习模型(3/4课时):梯度下降

如果我们绘制梯度下降过程中的权重和偏置点图表,这些点看起来就像从山上滚落的球,最终会在没有下坡的点停止。在训练过程中直观呈现模型的快照状态,有助于加深对更新权重和偏差、降低损失和模型收敛之间的联系的理解。您可以看到,在前几次迭代中,损失会大幅下降,然后逐渐下降,在第 1,000 次迭代左右趋于平稳。当模型收敛时,进行更多迭代不会进一步降低损失,因为梯度下降法已找到几乎能将损失降至最低的权重和偏差。请注意,黑色损失点形成了损失曲线的确切形状:先急剧下降,然后逐渐向下倾斜,直到达到损失表面上的最低点。

2025-05-13 10:14:17 731

原创 行业首次:优维EasyOps平台能力全面MCP化,打造AI时代人机协同

企业AI大脑准备好了,急需Model Context Protocol(MCP)扮演了“智能协作基座”的角色:其通过标准化资源接口、动态上下文管理与工具调度协议,首次实现了“模型决策流”与“自动化工作流”的毫秒级对齐。在我们的蓝图中,运维核心系统将进化为企业的“数字决策中枢”,它不仅是系统稳定性的守护者,更是业务创新的策源地。2025年,优维将逐步释放专家大模型的完整能力,涵盖智能巡检、成本优化、风险预测等核心场景,重新定义“运维即服务”的行业标准。

2025-05-12 12:03:00 1121

原创 机器学习模型(2/4课时):损失函数

例如,以下图片显示了使用 MAE 训练的模型和使用 MSE 训练的模型。离群值更接近使用 MSE 训练的模型,而不是使用 MAE 训练的模型。例如,3,000 磅的车重属于典型的车重范围,而每加仑 40 英里的油耗属于典型的油耗范围。但是,对于模型的预测而言,重 3,000 磅的汽车每加仑能行驶 40 英里属于离群值,因为模型会预测重 3,000 磅的汽车每加仑能行驶 18 到 20 英里。例如,如果模型预测值为 2,但实际值为 5,我们并不关心损失为负值 −3(2−5=−3)。损失函数侧重于值之间的。

2025-04-18 11:47:47 722

原创 偷偷研究了Grok3后,优维悟了……

话说回来,运维行业应该警惕“唯Benchmark论”或其他任何唯一论,转而关注技术-场景-成本的三角平衡,驾龄20年的老司机都知道的朴素道理:开长途车不能长时间占用超车道,如果要稳,要学会回归右侧行车道。xAI的实践给了我们这样的提示:未来运维领域的竞争将聚焦于“可落地的智能”——即在高精度、低延迟与可解释性之间的动态最优解。Grok 3 Beta通过混合训练框架(Hybrid Training)融合领域知识库,其法律场景的条款识别准确率提升19%,验证了xAI在复杂结构化数据处理的优势。

2025-04-18 11:42:29 300

原创 机器学习模型(1/4课时):线性回归

例如,使用此模型,一辆重 4,000 磅的汽车的预测油耗为每加仑汽油行驶 15.6 英里。虽然本部分的示例仅使用一项特征(汽车的重量),但更复杂的模型可能依赖于多项特征,每项特征都有一个单独的权重 (w1、w2 等)。随着汽车发动机的增大,其每加仑的英里数评级通常会降低。使用该模型,一辆重 4,000 磅的汽车的预测油耗为每加仑 15.6 英里。随着汽车马力的增加,每加仑的英里数评级通常会降低。一个包含五个特征的模型,用于预测汽车的每加仑汽油能行驶的英里数。y 是每加仑行驶英里数,即我们要预测的值。

2025-04-11 14:33:07 349

原创 优维HAO案例:香港联交所上市企业「智能运维平台」项目

将现有数据进行梳理规整,针对应用资源类、项目组织信息类、平台资源类模型进行优化设计,补充遗漏、删除重复模型字段,将运管的资产信息保存到CMDB中,分析一期模型间关系,将IT资产信息合理汇聚,优化防火墙策略,互联网暴露面的梳理;通过将防火墙、阿里云策略、NAT、F5VS、域名等模型的大量数据通过显性或隐性关系组织起来,可实现私有云及阿里云上各类项目互联网暴露资产的统筹管理,快速定位各系统的互联网暴露面服务与项目、主机、进程等的对应关系,实现风险的快速排查定位,提高处置效率。跟APM对接的压缩优化;

2025-04-03 15:36:18 870

原创 房地产+优维:存量时代数字化运维的场景化突围之路

很多人认为现在从业务视角谈房地产已经不合时宜了,但所谓“外行看热闹,内行看门道”,从尚未远去的2024年看,房地产市场依然具备明显的“冰火两重天”特征:CRIC数据显示,百强房企权益销售额同比下降5.7%,但TOP10企业市场占有率突破48.5%,行业集中度加速提升。在房地产行业穿越周期的关键时点,数字化转型已进入“硬核能力”比拼阶段。优维科技通过将运维系统从“后台保障”升级为“业务使能平台”,正在帮助领先房企构建新的竞争力内核——这或许就是数字化时代企业生存的终极法则:用底层效率革命,赢得前端创新资格。

2025-04-03 15:35:46 659

原创 腾讯,崩了!

诚然,理论上说专业的运维本可以让这类状况更可控。但我们这次不扯什么“世界是个巨大的草台班子”,不过相比这个,牛马们的讨论似乎显得更劲爆。不如试试把告警响应从人工智障升级成人工智能。昨天下午,腾讯会议服务异常引发巨大关注。与其在热搜上表演运维版《保持通话》,我们不理论了,我们只看评论。毕竟在优维的理想国里。

2025-04-03 15:35:13 115

原创 优维EasyOps®Q1焕新:CMDB效率革命×智能监控赋能核心系统「智效双升」

用户登录后,能清晰看到我们支持的资源发现类型,尤其突出了服务进程的发现,聚焦于可快速出效果的模块采集。融合后,无论是监控态势感知中的指标面板,还是更多资源下的各资源分析面板,展现形式均统一为左侧分析视图菜单、右侧具体分析视图,有效避免了用户选择视图时的困惑。过去,我们具备多种指标视图能力,但存在不统一的情况,且不同用户对视图需求各异,为解决这些问题,我们对视图展示能力进行了融合优化。在采集任务管理过程中,我们发现采集配置的编辑入口过深,操作繁琐,影响维护效率,为此,我们更新了采集配置项的批量编辑功能。

2025-04-02 17:05:14 809

原创 优维HAO案例:某头部券商高效持续交付平台打造新质生产力

通过持续交付体系的深度重构,客户不仅实现了业务发布的秒级响应与零风险管控,更将运维团队从重复劳动中解放,使其真正成为驱动业务创新的核心引擎。未来,优维科技将继续以行业场景为锚点,深化技术创新与生态协同,助力更多企业在数字化浪潮中,以“既快又稳”的步伐,迈向高质量增长的新高度。支持用户个性化编排,通过并行化部署与自动化验证,实现100秒内完成系统级变更,中断时间下降75%,业务验证覆盖率100%。通过一站式答疑与自动化工单部署,用户问题解决效率提升50%,运维团队得以从重复劳动中抽身,转向高价值技术攻坚。

2025-03-31 15:51:53 394

原创 QKV矩阵:优维大模型自注意力机制的数学之美

优维大模型将QKV的抽象计算逻辑具象化为运维场景的智能决策引擎,赋予系统“理解-推理-行动”的全链路能力。1. 相似度计算:Q与K的点积(图1)衡量Token间相关性,如“告警”与“日志”的关联强度。Q来自解码器状态,K、V来自编码器输出,实现上下文对齐(如故障诊断中“数据库”指向具体实例)。将用户自然语言查询解析为Q向量,与CMDB资源的K向量匹配(图4)。3. 价值聚合:加权求和V矩阵(图3),生成上下文感知的向量表示。:将用户问题映射为Q,从知识库K/V中检索答案(图6)。

2025-03-14 18:05:31 543

原创 词向量:优维大模型语义理解的深度引擎

词向量是Transformer突破传统NLP技术瓶颈的核心,它通过稠密向量空间映射,将离散符号转化为连续语义表示。优维大模型基于词向量技术,构建了运维领域的“语义地图”,实现从数据到知识的智能跃迁。在Transformer中,词向量通过嵌入层将Token映射为512维向量(图1),并作为自注意力机制的输入。通过多头注意力机制(图2/图3),同一词在不同语境中(如“端口占用”vs“端口开放”)获得差异化表示。将CPU、内存、网络等监控指标的向量表示融合,精准定位瓶颈(如“CPU骤增由磁盘IO引发”)。

2025-03-14 18:03:45 461

原创 Token:优维大模型高效处理序列数据的基石

为此,Transformer引入位置编码(Positional Encoding)(图2),通过正弦函数生成与位置相关的特征向量,并与词嵌入相加,确保模型能感知序列顺序。在Transformer中,输入文本首先被拆分为Token序列(如单字或子词),每个Token通过词嵌入(Token Embedding)转换为高维向量(图1)。自注意力机制通过Token间的交互计算权重,例如解码器在生成“机”字时,需综合历史Token(如“BEGIN”)和编码器输出的上下文信息(图3)。

2025-03-14 18:00:52 441

原创 优维大模型春季上新:「9能力+1智能体开发平台」十分提效

企业运维的数字化转型,亟需从“人找数据”转向“数据找人”——这个问题我们论述过很多次了,今天只上“纯干货”——以看得见+摸得着的方式,一口气给大家安排了9大核心能力和1个智能体开发平台的实操演示(实际库存远不止这些)。之所以选择在这个时节打出一记拳拳到肉的组合拳,只为用朴素的臻功夫诠释“通过AI技术实现运维场景的深度解耦与灵活编排,助力企业精准降本、高效提效”的实战效果。支持按属性、跨层级关系、多条件组合查询,例如“查询所有部署在华东区域且CPU使用率>90%的主机”。”,AI自动解析拓扑关系并输出答案。

2025-03-14 17:53:52 559

原创 优维眼中的Manus:AI工程化思维重构Agent的运维端启示

当Manus演示视频中那个自动生成的PPT带着些许不完美的排版问世时,我们看到的不是技术缺陷,而是一个新时代的隐喻——真正的智能化不在于追求完美无瑕的单个操作,而在于构建可观测、可干预、可演进的技术体系。我们曾经在某头部券商的案例中提到,正是通过类似的「决策-执行-验证」三层架构,实现了数据中心百万级资源的智能调度。这种工程化思维很容易让我们联想到优维的「运维原子能力库」理念——优维Murphy平台将复杂的运维操作拆解为可编排的原子指令,Manus正在构建面向通用场景的AI原子能力矩阵——

2025-03-07 14:37:28 637

原创 信创互认:优维科技携手统信软件共促信创成果再进阶

优维科技的EasyOps平台与统信操作系统的适配,为企业提供了可靠选择,可助力企业提升运维效率,降低成本,保障业务稳定运行,加速数字化与信创转型进程。此次在多平台的成功适配,意味着我们能够为不同硬件架构的用户提供稳定、高效、安全的运维解决方案,有效解决企业在信创转型中面临的技术适配难题。未来,优维科技将持续深化与统信软件等信创产业伙伴的合作,加大研发投入,拓展产品适配范围,不断提升产品和服务质量,为推动信创产业蓬勃发展贡献力量,携手各界共同繁荣国产信创生态。与统信软件技术有限公司的。

2025-02-27 15:38:59 395

原创 北大福利 | DeepSeek手把手零门槛:全民玩转AI效率革命(附北大原版PPT)

从大模型技术内核到百行百业落地公式,从“推理之王”DeepSeek-R1的逆袭逻辑到普通人秒变AI高手的提效密码——我们通过圈子渠道拿到了热乎的,并拆解了这两份硬核资料,看过都说好,文末附完整PPT获取方式,错过再等N个AI年哦~_“生成量化交易代码+自动DEBUG”_ → 开发效率提升4倍(案例见PPT2-Page41);_“公文写作模板库”_ → 通知/请示/会议纪要一键生成(案例见PPT2-Page38)。“我要做XX,给XX用,希望达到XX效果,但担心XX问题” → 精准控制输出边界。

2025-02-27 15:37:17 436

原创 20年鲸变 | 大厂信创国产化布局成果

从2006年政策萌芽开始,到2023年进入成熟期,再到今天的飞跃期,不管在过程中你如何看待信创国产化,国内的巨头们都已经在前线高地上摇旗呐喊。国产化倒逼企业重构技术栈,例如阿里云推动金融行业核心系统从IOE向分布式架构转型‌。信创设备虽初期体验不佳,但可规避海外技术断供风险(如Windows停服威胁)‌。长期看,国产软硬件适配成熟后,企业IT支出可降低20%-30%‌。我们认为,国产化替代的深层逻辑主要体现在以下三大核心需求:‌。

2025-02-27 15:36:04 180

原创 快过DeepSeek!欧洲AI闪击中美,IT运维生态将这样重构

美国时间2025年2月10日凌晨,硅谷的科技精英们还在沉睡,杭州汇金国际大厦12楼的DeepSeek工程师还在为访问过载问题召开下午茶会议,而清晨的埃菲尔铁塔下,数字革命已悄然爆发——「马克龙豪掷1090亿开欧洲星际之门」的新闻与「LeChat登顶AppStore法国区免费下载榜」的捷报同步刷屏,法国总统亲自站台呼吁国民下载LeChat,这款由法国Mistral公司开发的AI产品在72小时内突破千万下载量,其开源架构与多模态交互能力直接对标ChatGPT,而训练成本仅为后者的1/20。

2025-02-18 11:20:09 665

原创 优维大模型+DeepSeek:Murphy解锁运维新效能

引入集成DeepSeek能力的Murphy大模型后,运维效率得到了显著提升——在一次业务高峰期,系统出现了响应缓慢的问题,Murphy通过对海量交易数据和系统日志的分析,快速定位到是由于某个数据库表的索引失效导致查询效率降低。作为一家技术立司的服务商,我们很难如此感性地作出评判,但这次集成确实让我们看到,Murphy在功能和效率上展现出了更好的素质,无论是应对复杂的运维场景,还是满足企业对数据安全和定制化的需求,集成DeepSeek后的Murphy都展现出了卓越的性能和落地价值。

2025-02-10 16:09:57 825

原创 鸭先知 | 优维2025年运维趋势简报

这份2025年IT运维行业发展趋势预测简报,是优维技术委员会的老司机利用假期闲暇阅读大量权威材料后整理而成。运维行业的机会与挑战,全都被我们浓缩在这12张大字报里,献给我们热爱的这项事业,预祝大家:旗开得胜🚩😀。那不如先从一组干净利落的数据开始,为阔别重逢的工作找找方向,为酝酿已久的想法找找灵感。春节过完,回归职场,节日惯性还在,工作完全没有头绪?撰文:优维技术委员会 / 制图:人间清醒。

2025-02-05 11:42:52 273

原创 探秘 Neat 公司的自动测试架构:如何高效创造与价值保持

这使得学科团队成员能够凭借自身的领域知识,运用测试自动化团队提供的工具编写新的测试,而测试自动化团队则主要通过对其他团队编写的测试代码进行代码审查的方式提供专业指导,双方紧密协作,共同推动测试工作的高效开展。通过这样的方式,我们既能充分发挥测试自动化的高效性和准确性,又能借助人类的智慧和创造力,在测试过程中发现那些潜在的、不易被机器察觉的问题,从而实现更全面、更可靠的软件质量保障,推动软件开发与交付过程朝着更加优化、高效的方向发展。此时,明确阐释 “为什么”,即解释倡导该做法的原因,就显得尤为关键。

2024-12-26 12:58:56 1101

原创 优维HAO案例:央企SDIC控股全牌照综合类券商CMDB配置管理平台

此外,通过CMDB紧密配合监控系统、架构可视化系统等系统建设,依据项目中互联网运维、系统平台室、网络管理室、安全治理室、规划架构室等多部门的实际需求,成功构建多样化消费场景,全方位提升运维管理的效能与质量,为ESS整体业务的稳定与拓展提供强劲支撑。此前,优维曾携手ESS圆满完成了CMDB的一期、二期建设,打下了坚实的数据管理生态基础,并在生产环境接受了海量数据的严酷验证,整体表现可圈可点,双方都建立了广泛的自信与相互信任。推动数据运营赋能与消费场景落地,挖掘数据价值,提升业务效能与数据驱动力。

2024-12-26 09:49:08 972

原创 优维HAO案例:百年央企旗下中国500强跨境券商分布链路追踪建设

该计划旨在以核心交易为核心切入点,深入剖析交易流程中的潜在风险点与故障高发区域,建立快速响应与精准修复机制,有效减少核心交易的线上问题平均修复时间(MTTR),从而为CMS交易业务的持续、顺畅开展筑牢坚实基础,全面强化CMS的市场竞争力。CMS是百年央企CMG集团旗下的证券公司,位列中国500强企业榜单,跨境业务布局广泛,在中国香港、英国、韩国设子公司,借助CMS国际等开展跨境证券经纪等多元业务,CMS得以广泛服务国内外客户,并全面支持企业国际化与个人跨境资产配置。

2024-12-18 12:00:00 653

原创 基于 Cell 架构的安全防护:现代应用程序领域的深度剖析与应对策略

同时,API 网关提供的全面的日志记录和监控功能,为了解流量模式、性能指标以及潜在安全威胁提供了宝贵的见解,从而有助于主动识别和解决问题,维持系统的稳健性和效率。通过合理运用 OAuth 进行授权以及JWT 进行安全信息传输,能够在基于 Cell 的架构中实现精准的访问控制,确保 Cell 仅访问被允许使用的资源,从而最大限度地降低未经授权访问的风险。除了安全性方面的作用,服务网格还通过提供对所有服务交互的一致日志记录、跟踪和监控,增强了基于 Cell 的架构的可见性和弹性。

2024-12-17 11:39:13 1229

原创 现代应用程序中基于 Cell 架构的安全防护之道

此外,该网关还具备全面的日志记录与监控功能,这些功能可提供有关流量模式、性能指标以及潜在安全威胁的宝贵信息,有助于主动识别并解决问题,在维持系统稳健性与效率的同时,基于 API 网关所提供的支持,有效的日志记录和监控对于事件响应以及整体系统运行状况起着极为关键的作用。这种响应式的单元健康管理方式可降低级联故障的风险,提升系统从事件中快速恢复的能力,进而最大程度减少安全威胁的影响,维护架构的整体安全状况。凭借这样的监督机制,基于单元的架构便能够在面对不断变化的威胁时,始终保持良好的弹性与可靠性。

2024-11-29 16:15:26 1112

原创 优维HAO案例:全球TOP15汽车零件供应商「IT运维自动化」创新工程

通过自动纳管工厂产线主机硬件、系统等信息,并定时上报CMDB更新数据,同时定制化开发采集插件,借助作业调度平台自动采集基础设备、软件、中间件等数据,以此极大减少人工维护成本,有效确保数据准确率。利用批量调度可简化任务,如统一软件安装时,设定好参数与范围,就能自动分发任务并监控进度,提高运维效率,让运维人员专注其他工作。各基地工厂应用信息繁杂,CMDB可纳管并整合,结合自动发现数据呈现应用资源详情,像某生产关键应用的服务器、关联关系等信息,为运维优化、资源调配等提供数据支撑。

2024-11-26 14:28:50 672

原创 利用基于 Cell 的架构构建弹性和容错系统

基于单元的架构在过去几年已成为新兴范式,为不少公司所采用,比如 Slack(将关键的面向用户服务从单体架构迁移至基于单元的架构)、Flickr(用联合方法将用户数据存储在多个服务的分片或集群上)、Salesforce(依据 Pod 设计解决方案,其独立功能由 50 个节点构成)和 Facebook(提出使用名为 cells 的服务构建块,每个 cell 包含一个集群、一个元数据存储和 Zookeeper 中的控制器)。在实现弹性和容错时,基于单元的架构的支持者一直依靠可观测性,它在补充实施中起着关键作用。

2024-11-25 10:13:59 690

原创 优维EasyOps®双11上新:以应用系统为中心的产品价值落地

通过系统及采集方式,可明确不同监控的用途,如拨测用于可用性/存活监控,日志用于业务监控等,能清晰了解一个系统下的采集情况。另外,有些情况并非以系统为单位进入,例如主机运维,我们将主机的监控应用视图和自定义视图进行了融合,既可以使用出厂默认的指标视图,也可以根据需要采集指标来自定义视图,甚至可以将自定义视图设置为默认概览页。采集的具体操作如下:点击采集后新建采集时,需先选择采集对象所属的系统和环境,接着设置采集实例时,所选实例范围仅为已选系统和环境下的资源实例,不会出现其他实例。

2024-11-22 12:01:52 711

原创 现代分布式系统新法宝:基于单元的架构

但是,它们也提供了一个机会,可以将相关的应用程序服务分组到特定于领域的集群中,从而有助于架构和组织结构,促进高内聚和低耦合,并减轻工程团队的认知负担。虽然基于单元的架构在分布式系统的上下文中提供了许多优势,但实现这种方法需要额外的努力并带来挑战,因此它可能并不适合每个组织,例如仍在迭代产品市场适合度的投资的初创公司。除了基础设施和应用程序服务的供应和部署之外,基于 Cell 的架构还需要额外的功能,专门用于管理和监控 Cell、在可用 Cell 之间划分和放置流量,以及在 Cell 之间迁移数据。

2024-11-19 11:51:13 879

原创 优维HAO案例:500强旗下全牌照综合性券商CMDB平台项目

同时构建实时的数据同步机制,改变目前数据不能及时同步且高度依赖人工维护的局面,降低数据维护成本,使得运维数据能够在各相关环节和系统之间实时、顺畅地同步,为运维工作提供坚实可靠的数据支持,以适应HS公司不断发展的业务需求和提升整体运维效率。关键是深挖配置数据价值,从多维度分析,如对比不同场景数据找优化方向,利用技术挖掘与业务性能关联,为决策提供支撑。该项目旨在通过整合和优化配置管理流程,集中管理IT资源数据,提升数据的质量和可用性,从而为HS的IT运维工作提供更坚实的基础,助力公司业务的稳定发展和创新升级。

2024-11-18 14:19:26 856

原创 向量搜索:信息检索领域的变革力量

在大规模应用中,如 Facebook 的社区问答神经搜索系统,文档可以预先进行编码和存储,而在搜索过程中只需对查询进行实时编码,从而大大提高了搜索效率,尤其适用于对索引速度和查询延迟要求严格的场景。这些标签不仅可用于传统的关键词搜索,还能应用于语义向量搜索,为用户提供了丰富多样的搜索方式和更加智能的搜索体验,进一步拓展了搜索的深度和广度。例如,在新闻聚合平台中,使用 Vespa 可以在新文章发布的瞬间进行索引,并立即提供给用户进行搜索,确保用户始终能够获取到最新的信息,极大地提高了信息的时效性和可用性。

2024-11-12 09:30:00 989

原创 云时代基础设施模型:可变与不可变之析

基础设施的混合方法结合了可变和不可变模型的优点,为有状态系统和遗留系统提供灵活性,同时确保无状态服务的一致性和可扩展性。此外,重要的是要注意,当使用不可变基础设施时,证据会更新。在基础设施管理的领域中,存在两种起着主导作用的方法,也就是可变基础设施与不可变基础设施。它们决定着资源的部署以及维护的模式,对更新的实施途径、基础设施的演进方向,还有不同环境之间的一致性保障起着关键的作用。在这种设置中,不可变基础设施发挥关键作用,确保每项服务都能一致且独立地部署,有助于避免配置错误风险,提高整个系统的可靠性。

2024-11-11 11:20:11 649

原创 优维好案例:某银行系理财公司的IT基础资源服务管理平台

结合金融业和互联网实施成功的案例,建立基于CMDB为核心,外围系统围绕核心运转的体系,打通底层基础能力、系统关联分析、生命周期管理等多维壁垒,为上层应用提供底层支撑,为应用本地化场景提供基础资源封装,建立模型间或资源间关系,提升资源变更、应用变更时影响范围分析便利性,外围系统围绕CMDB建立数据共享和消费通道,使IT资源来源与流转得到管理。在数据管理方面,可能存在数据分散在不同系统和部门,缺乏统一整合与管理的问题,导致数据一致性难以保证,无法及时为决策提供准确全面的信息支持,影响资源整合和业务协同的效率。

2024-10-30 08:00:00 548

原创 MongoDB 8.0 全新登场:究竟如何?

据 MongoDB 称,这个广受欢迎的NoSQL 数据库的最新版本提供了更快的重新分片功能、读取速度最高可提升 36%,批量插入速度最高可提升 56%。“这是个好消息,但我们先别太激动。新版本受到了社区的好评,有人表示其性能有了显著提升,尤其是聚合方面的改进以及嵌入式配置服务器在降低成本方面发挥了重要作用,鼓励用户尝试。“我们的内部构建系统——我们的软件开发人员每天都在使用——构建在 MongoDB 之上,当我们升级到 MongoDB 8.0 时,我们看到查询延迟下降了大约 75%。

2024-10-28 08:00:00 853

原创 以同理心铸就卓越平台:探索与启示

▏沉痛之鉴:从昂贵代价中汲取教训在获得利益相关者首肯后,我们开启了一项扩展云原生平台的项目,欲借强大的 Netflix 堆栈及其蓝绿部署等工具,化解平台现存的可用性难题。我们对平台需求自信满满,旋即投入开发。然而,当向与项目利益相关者不同的用户展示新功能时,却遭遇负面反馈。历经反复迭代与演示,用户期望与我们的开发方向之间的巨大鸿沟愈发凸显。最终,我们不得不承认用户永远不会接纳我们的成果,项目遂被取消。预算付诸东流,回报渺无踪迹。这个初衷良善、意在赋能团队的尝试,以失望落幕,深刻揭示了我们

2024-10-25 14:58:52 747

原创 优化变更发布流程:从预防到快速恢复的全面指南

另一种类似A/B 测试的方法是,系统以 1%、5%、10%、25%、50%和 100%的客户增量启用新变更的效果,可更好地控制有问题变更的影响。重要的一点是,即使单机环境处理生产流量,其指标也应与生产环境的指标分开。在此情况下,需专注构建自定义指标,如每个客户级别的可用性(PCA)指标,它能衡量所有客户的体验,无论客户产生大量流量还是只占总体流量一小部分。在这种情况下,询问开发人员是否需要更好的方法或流程来将系统恢复到先前的安全状态是有用的,同时思考可以采取哪些行动来提高系统状态恢复的速度。

2024-10-12 17:34:21 795

原创 10月更新:优维EasyOps®需求解决更彻底,功能体验再升级

本次联动架构视图能力,研发团队花费小半年的时间反复打磨,未来我们还将计划将架构视图的能力进一步拓展至更多应用场景,如基于架构视图的自动化巡检、变更管理等,以全面提升系统的运维管理水平。通过任务历史记录,用户可以迅速定位问题时间段内的任务执行情况,并借助采集的配置信息、Agent版本、Sampler状态及版本合规性等相关数据,结合系统提供的错误信息提示,全面剖析异常原因,高效解决采集异常排查问题。同时,通过悬停或点击操作,用户可快速访问该资源的黄金指标数据及详细的监控详情,极大地提升了问题排查与响应的效率。

2024-10-10 10:52:31 676

原创 优化Kafka存储:热冷数据分层策略

根据下游应用程序的需求对摄入 Kafka 主题的数据进行分类后,我们可以在 Kafka 集群中将数据层指定为热数据的热层和冷数据的冷层。最初,在存储系统领域,数据分层是一种降低数据存储成本的策略。同时,这种优化存储资源的方式也为企业在数据驱动的时代中赢得了更多的竞争优势,使企业能够更加从容地应对各种挑战,开启更加辉煌的未来篇章。像 Amazon S3 和 Azure Blob(Azure Storage)这样的对象存储类别,既具备显著的成本效益,又拥有对象存储的诸多优点,同时还无需复杂的设置和管理。

2024-10-08 11:27:46 1236

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除