自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

石榴姐yyds

数据开发与数据挖掘

  • 博客(653)
  • 资源 (783)
  • 收藏
  • 关注

原创 闭坑记录:Hive中ROW_NUMBER()排序不稳定性分析与解决方案

这是消除Hive窗口函数计算结果不确定性的唯一根本方法。通过业务主键、时间戳、UUID等字段补充排序条件,可彻底规避分布式计算中的顺序风险。

2025-05-06 09:00:00 29

原创 SQL进阶技巧 | 如何取多个表中某一字段不为空且时间最新的值?

name王二2222022张三1232019李四8642021。

2025-05-06 08:15:00 858

原创 SQL进阶技巧:高效处理版本号排序与序号生成

字符串处理与类型转换 • 灵活使用substrsplit分解复杂字符串。• 通过CAST确保数值比较(避免字符串按字典序排序的错误)。窗口函数的高级用法 •解决并列排名问题,生成连续序号。• 结合可实现分组排序(如按产品线独立排名)。默认值处理 • 使用COALESCE或NVL填充缺失字段,避免NULL值干扰排序。动态调整序号起点 • 通过-1+1等操作调整序号范围,适应业务需求。

2025-04-29 08:30:00 822

原创 李荣浩vs某游戏公司:数仓建设中,如果用户表频繁更新,像事实表一样细长,怎么解决?

问题本质:维度表高频更新是模型设计未能匹配业务动态性的结果,需通过数据域重构解决。阿里经验提炼:坚持“维度静态化、状态事实化”原则,以离线批处理支撑动态属性的高效管理。关键结论高频更新属性必须事实化:避免维度表承担动态数据写入压力。离线批处理是核心手段:通过每日快照平衡存储与查询性能。最佳实践属性分类:设计阶段明确区分静态属性与动态属性。自动化运维:通过调度工具(如Airflow)管理快照生成任务。监控告警:跟踪事实表的数据增长速率和快照任务执行时长。

2025-04-28 16:10:03 45

原创 增量抽取的场景下,周期快照表最新分区的数据是如何生成?

数据表:用户账户余额表(更新频率:源系统每日通过增量方式推送变更(增、删、改)目标表:每日生成全量快照分区,记录当天最终账户状态查询需求:支持按分区快速查询历史任意日期的账户余额通过本文提出的全量覆盖与ACID事务两种方案,可在Hive环境下高效生成周期快照表。实际生产中需根据集群版本、数据规模、实时性要求综合选择策略。未来随着Hive 3.x的普及和Iceberg/Hudi等表格式的集成,事务型快照表的管理将更加便捷。建议在架构设计时预留扩展能力,逐步向实时数仓演进。附录。

2025-04-28 14:22:13 730

原创 面试提问:你设计的模型是通用的吗?如何量化?| 通用模型 vs 自定义模型

数据仓库建设本质是在不确定中寻找确定性的过程。建议技术团队:建立模型健康度看板:监控指标包括需求命中率、重构频率、存储成本/查询量比设计灰度升级机制:新模型先在5%流量验证,通过A/B测试对比效果培养"标准化优先"文化:强制要求所有定制开发必须证明其无法被现有模型覆盖最终,优秀的数仓架构师应像围棋高手:在标准定式与妙手偶得间找到最佳平衡点。

2025-04-27 09:00:00 33

原创 「数仓的哲与思」:一场数据工程的思维盛宴与实战精要

如《分主题预计算》案例所示:单个业务域的预计算优化是局部理性,但多主题的无限衍生将导致存储成本超线性增长——这恰似哈耶克“自发秩序”理论在数据架构中的映射。”(某案例中,将延迟从5分钟降至5秒,并未改变运营策略,反浪费百万资源)。:《维度退化》系列揭示了反范式设计的深层逻辑——“存储冗余”本质是用空间换时间,但何时退化、退化到何种程度,需追踪到“业务查询的时空分布规律”。:康德“二律背反”的现代演绎——唯有建立“先验规范+自治空间”的弹性架构(如指标字典+动态视图),才能实现“规范下的自由”。

2025-04-26 09:00:00 1152

原创 DeepSeek 赋能全流程数据治理:构建智能化数据价值链

DeepSeek为代表的大模型技术,通过。

2025-04-25 09:00:00 1567

原创 妹爷vs快手数仓:DWS层构建好后,新来了一个需求,需要添加某个维度字段,你是怎么考虑和设计的?

DWS层的设计本质是在稳定性与灵活性间寻找平衡。最小化侵入:优先通过逻辑层解耦(视图/外键化)按需物化:高频维度预计算,长尾维度动态关联自动化兜底:用数据质量监控+元数据治理降低风险业务驱动演进:避免技术理想化设计,贴合实际查询模式最终,优秀的数仓架构应像乐高积木一样——每个模块可独立替换,但整体始终稳固可靠。

2025-04-25 08:30:00 52

原创 Dify vs RAGFlow:如何选择适合你的RAG与低代码AI平台?

随着大模型技术在企业场景的落地加速,开发者常面临工具选型难题:是否应该选择低代码平台快速搭建AI应用,还是采用垂直工具实现专业级文档处理?本文聚焦两款热门工具——Dify与RAGFlow,从技术架构、功能特性到应用场景进行全方位对比,为开发者提供选型决策依据。一、工具定位与核心差异1.1 Dify:低代码通用AI应用工厂定位:面向非技术用户的AI应用开发平台,支持快速构建对话机器人、内容生成、数据分析等场景。核心优势:• 低代码/无代码交互:通过可视化界面拖拽编排工作流,无需编码即可调用大模型能力。

2025-04-25 08:00:00 870

原创 大语言模型生成控制参数详解:温度、Top-K与Top-P

温度、Top-K和Top-P的灵活组合,为LLM生成结果的可控性提供了多层次解决方案。开发者需深入理解各参数的数学本质,结合实际场景需求,通过系统化实验找到最佳配置。随着自适应参数调整技术的发展,未来或将实现更智能的上下文感知生成策略。

2025-04-23 09:00:00 997

原创 智能体应用现状、挑战及发展路径综述

智能体(AI Agent)作为人工智能技术的重要载体,正逐步渗透至生产与生活的各个领域,成为推动产业升级和社会变革的核心驱动力。中国电子信息产业发展研究院发布的《智能体应用现状挑战及建议》报告系统梳理了智能体的技术框架、发展现状、全球动向及未来挑战,并提出了针对性的发展建议。本文基于该报告内容,结合学术视角,从技术特征、产业生态、区域策略、瓶颈问题及优化路径等方面展开综述,以期为智能体技术的深化研究与应用提供参考。

2025-04-23 08:15:00 972

原创 面试提问:数仓里面指标计算的正确性如何验证,有好的方法吗?

按“数据输入→处理→业务→输出→监控→流程”分层展开,体现系统性。

2025-04-22 09:00:00 252

原创 SQL 中 GROUPING SETS 结合多个 COUNT(DISTINCT) 的数据膨胀问题与优化实践

在中,数据膨胀指中间计算结果(如哈希表、临时数据)因分组组合和去重操作的叠加效应,导致数据量远超原始输入的现象。原始数据量:1 亿条订单记录。膨胀后中间数据量:可能达到数十亿条。在 SQL 中使用结合多个时,数据膨胀问题的本质是组合爆炸与去重成本叠加的共同作用。通过预聚合、分步计算或近似计数等方案,可有效缓解性能瓶颈。实际场景中需结合数据规模、精确性要求和计算资源综合权衡,选择最优策略。

2025-04-22 09:00:00 176

原创 猪小明vs飞猪数据团队:数仓中既然有了主题域,为什么还要划分数据域?

简要说明主题域和数据域的概念。

2025-04-21 09:00:00 195

原创 腾讯云-DeepSeek+企业知识库:大模型员工助手,助力企业人效提升和业务增长

核心内容概述报告围绕腾讯云的DeepSeek+企业知识库解决方案,展示了如何通过大模型技术(如RAG、WorkFlow、Agent模式)构建智能员工助手,助力企业提升人效、优化业务流程并实现业务增长。重点覆盖知识管理、复杂任务处理、多模态数据解析等场景,结合实际客户案例验证产品价值。产品核心功能与模式三大应用模式标准模式(RAG):快速部署知识问答系统,适用于严肃问答场景(如企业规章制度查询)。工作流模式:通过可视化拖拽编排复杂业务流程(如保险建议书生成),支持零代码开发。Agent模式。

2025-04-21 08:00:00 1143

原创 数仓多源异构数据整合策略:融合与分离的实践指南

面对多源异构数据整合的复杂挑战,企业需采取"分而治之,合而为一"的策略。通过建立清晰的决策框架、设计灵活的技术方案、实施严格的质量控制,最终实现数据资产的全局可管、可控、可用。未来随着Data Mesh等新范式的普及,数据治理将进入更智能、更自治的新阶段。

2025-04-20 08:30:00 1133

原创 检索增强生成(RAG)系统的技术演进、核心架构与优化实践

在人工智能领域,问答系统的发展经历了从基于规则匹配到深度学习的巨大跨越。早期的系统如IBM Watson依赖复杂的规则库和知识图谱,但其灵活性和泛化能力受限于人工设计的逻辑。随着预训练语言模型(如BERT、GPT)的崛起,生成式AI展现了强大的文本理解和创作能力,但其“幻觉”(Hallucination)问题始终是落地应用的瓶颈。的提出,标志着一种全新的技术范式。它通过将外部知识检索与生成模型动态结合,既保留了生成模型的创造力,又通过引入实时数据降低了幻觉风险。

2025-04-19 08:15:00 819

原创 CIO企业数据治理平台规划建设方案

某地市级大数据治理平台:围绕“一舱一中心、两门户两体系九平台”进行建设,构建城市驾驶舱,实现数据赋能。- 某县级公安大数据平台:建立数据资源池,提供数据治理方案,实现数据标准化、融合化等治理工作。方案通过详细的观点阐述、设计方案、功能设计以及实际案例的介绍,全面展示了企业数据治理平台的规划建设思路和具体实施方案。

2025-04-18 11:05:36 441

原创 面试灵魂拷问:原子指标需要支持开窗函数吗?

在数据仓库与指标体系的构建中,原子指标的定义一直是核心争议点之一。原子指标是否需要原生支持开窗函数?本文将从设计哲学分层架构工程实践三个维度展开分析,结合具体案例探讨这一问题的本质,最终给出可落地的建议。面试背景公司:某头部电商平台(数据中台团队)岗位:数据仓库开发工程师(高级)面试官:数据架构师(10年经验)问题背景:面试官希望考察候选人对数据建模、指标体系的深度理解,以及技术权衡能力。问题“原子指标需要支持开窗函数吗?为什么?面试场景还原面试官:小撒同学,我看你简历里提到负责过电商指标体系的建设。

2025-04-18 08:30:00 37

原创 网约车平台数仓设计与核心业务分析

从业务流程到数据模型的落地,本质是将现实世界的“交互关系”转化为可计算、可分析的数据资产。通过ER模型定义数据结构,数仓分层规范数据处理流程,最终用指标体系支撑决策,这是所有互联网业务数据化的必经之路。如果你在实际建模中遇到字段冗余、性能优化等问题,欢迎在评论区留言讨论~延伸思考若增加“动态调价”模块,ER图需要新增哪些实体?如何用Hive的分区(Partition)和分桶(Bucket)优化订单表的查询性能?司机服务评分的计算(如近30天平均分),应该放在数仓的哪一层处理?

2025-04-17 09:00:00 742

原创 财务数字化转型:战略重构、技术赋能与未来展望

财务数字化转型并非一蹴而就,而是持续迭代的过程。未来的财务部门将不再是“后台支持者”,而是企业价值的“核心引擎”——通过数据驱动决策、通过技术赋能创新、通过协同创造生态价值。唯有以开放心态拥抱变化,方能在数字经济的洪流中立于不败之地。

2025-04-17 08:15:00 1890

原创 晋升答辩提问:既然业务需求已经很明确了,你数仓建模的价值体现在哪?

建模是「需求与数据的解耦器」短期需求:直接写SQL更快,但会制造技术债务(如烟囱式报表);长期架构:建模通过分层与抽象,将业务需求解耦为可复用的数据组件(事实表、维度表、聚合表),让数据从「项目制交付」升级为「产品化服务」。最终目标:即使需求明确,建模也是为不确定性做准备需求明确解决的是「要什么」,而建模解决的是「如何高效、稳定、可持续地实现」。就像一个建筑师不仅需要理解客户想要「三居室」,更需通过结构设计、材料选型、管线规划,让房屋既满足当前需求,又具备未来改造的可能性。

2025-04-16 09:00:00 110

原创 AI大模型在供应链领域应用研究

一、应用场景与技术手段智能采购提升采购流程自动化与智能化,全链路科学决策能力增强。通过智能分类分级供应商、动态评估与风险管理,降低采购成本约15%-20%。场景痛点:物资编码混乱、SKU管理难、供应商数据维护难、信息不透明等。技术应用:生成式AI(AIGC)、自然语言处理(NLP)、智能寻源、智能合同与核价等。成效供应链计划与排产需求预测准确率提升13%,库存周转天数下降15%。智能排产系统将排产耗时从6小时缩短至1.5分钟,交付效率提升20%。场景痛点。

2025-04-16 09:00:00 660

原创 Hive 窗口函数详解及使用场景总结【基于面试被提问】

在数据分析与处理的面试场景中,窗口函数(Window Function)作为SQL中高阶且实用的功能,常被视为考察候选人实际应用能力与对数据操作深度的关键问题。近日,某同学在技术面试中被要求详细阐述窗口函数的核心用法、典型场景及其与传统聚合函数的区别。面试结束后,该同学结合自身实践与资料整理,对这一问题进行了系统性复盘,发现窗口函数不仅是解决复杂查询问题的利器,更是面试中高频出现的"分水岭"题型——掌握其原理者往往能脱颖而出,而理解不足则可能暴露对SQL进阶能力的短板。本文基于该同学的面试总结,从。

2025-04-16 08:30:00 39

原创 Hive 中 MERGE INTO 的语法及应用案例详解【文末附具体场景及案例】

通过上述案例可以看出,

2025-04-15 08:15:00 50

原创 大数据治理运营整体解决方案总结

狭义数据治理聚焦数据质量管理,核心目标是消除数据不一致性,建立规范的数据应用标准,提升数据准确性,确保数据在业务和管理中的可靠使用。广义数据治理涵盖数据的全生命周期管理,包括数据采集、清洗、存储、共享、安全、开发与应用等环节,并通过构建数据资产目录、标准管理体系、质量监控机制等,实现数据资产的价值转化。核心要素组织保障:明确数据治理责任主体,建立跨部门协作机制。制度规范:制定数据管理政策、流程与标准(如元数据标准、数据质量标准)。技术支撑:依赖专业化的数据治理平台,实现流程自动化与智能化。

2025-04-15 08:15:00 2437

原创 数字工厂指标体系全解析:从理论建模到数仓落地实践

随着数字孪生、元宇宙等新技术的发展,未来工厂指标体系将呈现三大趋势:虚实映射:物理工厂与数字模型的指标实时镜像自愈能力:基于指标异动的自动归因系统价值延伸:碳足迹、社会效益等ESG指标纳入体系往期精彩川普vs某互联网金融科技公司:面试提问数据建模,必须由数仓团队来做吗?业务系统不能做吗?浙江大学《智能金融:AI驱动的金融变革》潘子vs小红书数仓团队:数仓分主题预计算的好处和坏处是什么?关注我们,获取《装备制造企业数字化转型白皮书》完整版!

2025-04-14 09:00:00 773

原创 川普vs某互联网金融科技公司:面试提问数据建模,必须由数仓团队来做吗?业务系统不能做吗?

近日川建国(资深数仓工程师)同志面试某互金科技公司惨遭失败,被面试官问到“数据建模,必须由数仓团队来做吗?业务系统不能做吗?” 这一问题时不知道该如何回答。川建国吐槽:“看来现在数仓面试都在玩哲学,作为数仓界的扛把子,这些问题,我是重来没想到过的,看来我还得继续修炼,至少得读读唯物辩证法”。以下是整个面试的过程,我们一起来看一下川建国的遭遇。

2025-04-14 08:15:00 181

原创 潘子vs小红书数仓团队:数仓分主题预计算的好处和坏处是什么?

提到技术趋势(如湖仓一体、实时数仓)会加分,例如: “现在许多公司尝试湖仓一体架构,将预计算与原始数据共存,通过动态查询加速技术(如Databricks Delta Lake)兼顾灵活性和性能。好处嘛,就是查询快,因为数据提前算好了。: “预计算通过提前加工高频使用的指标(如销售额、用户留存),将复杂查询转为轻量查询,适合BI报表、看板等固定分析场景,显著降低查询延迟。未来,随着实时数仓与湖仓一体技术的成熟,预计算可能与动态查询加速进一步融合,但“用存储换时间”的核心思想将始终是数据架构设计的底层逻辑。

2025-04-12 09:00:00 121

原创 数据建模到底该谁干?业务团队与数仓团队的“世纪之争”

数据建模的权责之争,本质是企业如何在“敏捷创新”与“可持续运营”之间寻找平衡点。业务系统与数仓团队不应是对立的甲乙双方,而是数据价值链上的共生伙伴——前者是数据的生产者,后者是价值的挖掘者。唯有建立“规则下的自由”协作框架,才能让数据从成本负担进化为战略资产,真正驱动企业的指数级增长。往期精彩。

2025-04-11 13:34:29 941

原创 浙江大学《智能金融:AI驱动的金融变革》

本报告基于郑小林教授团队的学术研究与产业实践,系统梳理了自然语言处理、强化学习、模型蒸馏等前沿技术的演进路径,并结合信贷风控、智能投研、反洗钱分析等实际案例,剖析AI在金融领域的创新应用与核心挑战。随着大语言模型(LLM)、强化学习(RL)等技术的突破,金融行业逐步迈入以“数据驱动、智能决策”为核心的“智能金融”时代。:AI正通过大模型、强化学习与隐私计算等技术,驱动金融行业在风控、营销、投研等场景的智能化变革,未来需持续突破可解释性、安全合规等挑战,构建可信、高效的人机协同生态。

2025-04-11 09:00:00 1239

原创 如何使用DeepSeek制作数学动态可视化课件?

这里的提示词最重要的是描述清楚需求,无论你要生成哪个知识点的图片信息,都要加上动态图片、动画效果等字眼,一般动态图片是gif文件格式,但是DeepSeek会告诉你它无法直接生成GIF动态图片文件,它会给你html文件格式,所以我们一般告诉它以html的格式输出,你也无需想以前把代码复制出来手动修改再运行,DeepSeek直接帮我们内嵌的html文件解析,你只需要直接点击即可运行查看效果。数学的公式,很多时候直接上手都比较难以理解,但是如果通过可视化的方式,就会变得相对容易很多。现在我们来看一下怎么做吧。

2025-04-10 11:01:36 466

原创 王小虎 vs 快手面试官:指标生命周期管理在指标下线阶段会从哪些维度来评估判断下线? 下线的流程是什么?

方法论沉淀:能否将指标下线抽象为标准化流程,而非依赖临时决策。风险预判:是否对“下线动作”可能引发的业务、技术、法律风险有预判和应对方案。价值导向:能否从数据资产管理的角度,说明下线动作对企业的长期价值(如降本增效)。仅回答了“What”(下线做什么),却未体现“Why”(为何要评估这些维度)和“How”(如何安全落地),而这正是数据治理岗位的核心能力要求。~~【文末附面试满分回答模板】~~一、为什么指标下线比上线更难?指标下线看似是简单的“删除动作”,实则是业务、技术、合规的三角博弈业务风险。

2025-04-10 08:15:00 121

原创 小杨哥vs滴滴数仓负责人: 如何证明你建的模型就比别人的好?

未将技术优化与业务增长(如订单转化率、用户留存)关联,仅停留在技术实现层。

2025-04-10 08:15:00 145

原创 数字化转型深水区:2025年CIO战略突围的五大核心命题

在数字化转型的深水区,CIO的角色正在从技术管理者进化为数字商业架构师。技术策源力:把握技术演进与商业价值的共振点生态构建力:创建跨部门、跨企业的价值网络风险驾驭力:在创新速度与稳健运营间动态平衡未来三年,那些能成功整合AI、数据和网络安全能力,并转化为商业价值的CIO,将引领企业跨越数字化鸿沟,在技术革命的新周期中建立持久竞争优势。正如Gartner所强调的,这场转型"不是技术的马拉松,而是组织能力的接力赛",CIO需要成为当之无愧的领跑者。往期精彩。

2025-04-10 08:15:00 1001

原创 SQL用户Session分析实战:5分钟动态Session切割 × 多阶段行为路径追踪 × 漏斗转化率精确计算

数据准备:原始日志清洗 → 分区表构建Session切割:时间差值计算 → 动态标识路径分析:行为序列化 → 关键路径提取漏斗计算:阶段标记 → 多级聚合效果评估:ROI计算 → 品类维度下钻。

2025-04-09 08:30:00 104

原创 数据模型评估的四维黄金法则:从技术验证到业务价值证明

当滴滴出行的新模型评估报告最终呈现时,业务VP与技术总监达成了罕见共识:在GMV提升12%的同时,计算成本下降35%。这标志着评估体系从技术工具升级为商业语言。在数据驱动决策的时代,优秀的模型评估能力正在成为核心竞争优势。正如《Designing Data-Intensive Applications》作者Martin Kleppmann所言:"系统的真正价值,不在于它有多精妙,而在于它如何改变组织的行为模式。

2025-04-08 23:25:26 988

原创 Hive 动态分区小文件过多问题优化

动态分区易产生海量小文件。假设输入数据1TB,启用2000 Mapper任务且每个任务生成100分区,则总文件数为2000×100=200,000,远超。

2025-04-08 08:00:00 124

原创 从0到1构建用户画像系统全流程解析

在实际开发画像的过程中,由于运营人员对业务更为熟悉、而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则确定由运营人员和数据人员共同协商确定;:这类标签是最为基础也最为常见的标签类型,例如对于某个用户来说,他的性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费类数据中统计得出。用户画像建模其实就是对用户进行打标签,从对用户打标签的方式来看,一般分为三种类型:1、基于统计类的标签;2、基于规则类的标签、3、基于挖掘类的标签。

2025-04-07 10:00:00 1590

资产管理数字化顶层设计方案19页PPT

制造模式转型下资产管理数字化转型顶层设计方案【19页PPT】

2025-05-05

2025消费增长新路径:以“标签科学”重构营销确定性-Nint任拓.pdf### 【电商与营销】基于标签科学的2024年消费品市场趋势分析及营销策略优化分析了20

内容概要:文章《2025消费增长新路径:以“标签科学”重构营销确定性》由Nint任拓集团CMO曹力撰写,探讨了如何通过“标签科学”来重构营销的确定性。文章详细分析了2024年多个消费品类(如服装、美妆、食饮大健康等)在主流货架电商和内容电商平台的表现,揭示了不同消费群体的需求变化和市场趋势。例如,在服装领域,女装和内衣增长迅速;在美妆领域,国货品牌增速显著;在食饮大健康领域,益生菌和咖啡/麦片/冲饮表现亮眼。此外,文章还介绍了“标签科学”的具体应用,包括内容标签、人群标签和货品标签的使用方法,以及如何通过标签组合挖掘产品创新机会,提升营销效果。 适用人群:市场营销人员、品牌运营者、电商平台从业者以及对消费品市场感兴趣的投资者。 使用场景及目标:①帮助品牌和营销人员更好地理解消费者需求,制定精准的营销策略;②利用标签科学进行产品创新和内容创作,提高市场竞争力;③优化电商平台的商品推荐和流量分发机制,提升转化率。 其他说明:文章强调了在当前复杂的市场环境中,传统的营销手段逐渐失效,而基于AI和大数据的“标签科学”能够为企业带来新的增长机遇。同时,文中提供了大量实际案例和数据分析,具有较高的参考价值。阅读时建议重点关注各品类的市场趋势和标签科学的应用实例,结合自身业务场景进行思考和实践。

2025-05-05

Dify智能体:AI智能问数.yml

Dify智能体:AI智能问数.yml

2025-05-05

Dify智能体:图文混排输出 (1).yml

Dify智能体:图文混排输出 (1).yml

2025-05-05

Dify智能体:数据可视化实战.zip

Dify智能体:数据可视化实战.zip

2025-05-04

Dify智能体:多轮记忆聊天实战.yml

Dify智能体:多轮记忆聊天实战.yml

2025-05-04

AI问数系统+Echarts可视化+数据分析

AI问数系统+Echarts可视化+数据分析

2025-05-04

低代码数据平台MCP (2).yml

Dify智能体:低代码数据平台MCP .yml

2025-05-04

人工智能大模型交互技巧与提示词优化:提升GPT应用效果的用户指南

内容概要:本文主要介绍了如何有效地与大模型(如GPT)进行沟通,通过定义任务目标、编写合适的提示词并根据生成的结果进行调整,以达到更好的交互效果。文中详细解释了一个提示词公式:提示词=定义角色+背景信息+任务目标+输出要求,并通过多个实例展示了如何运用这一公式。此外,文章强调了提供充足上下文信息的重要性,以及与大模型进行连续对话的价值,使得用户能够更清晰地表达需求并获得更贴合实际的回答。 适合人群:对大模型有一定兴趣,希望提高与大模型交互效率的用户,尤其是具备一定编程基础的研发人员和技术爱好者。 使用场景及目标:①帮助用户明确与大模型交互时的任务目标;②教会用户如何编写有效的提示词,以获取更精准的回答;③指导用户根据生成的结果进行调整,优化交互过程;④适用于与各类大模型的沟通,不仅限于GPT。 其他说明:文章还提供了具体的练习题,鼓励读者实践所学内容,并分享与大模型的对话经历。提示词公式的应用不仅限于GPT,对于其他大模型也同样适用,用户可以根据实际情况灵活调整提示词,以满足不同的需求。

2025-05-04

国内某知名大型制药企业制药数字化转型项目汇报方案

国内某知名大型制药企业制药数字化转型项目汇报方案 下载后,修改后缀名为.pptx可以打开

2025-05-04

Dify智能体:生成SFT微调数据集.yml

Dify智能体:生成SFT微调数据集.yml

2025-04-30

Dify智能体:网站爬虫分析.yml

Dify智能体:网站爬虫分析.yml

2025-04-30

Dify智能体:Jina Reader Jinja.yml

Dify智能体:Jina Reader Jinja.yml

2025-04-30

Dify智能体:simple-kimi.yml

Dify智能体:simple-kimi.yml

2025-04-30

Dify智能体:春联生成器.yml

Dify智能体:春联生成器.yml

2025-04-30

Dify智能体:全书翻译.yml

Dify智能体:全书翻译.yml

2025-04-30

Dify智能体:中译英.yml

Dify智能体:中译英.yml

2025-04-30

Dify智能体:根据用户的意图进行回复.yml

Dify智能体:根据用户的意图进行回复.yml

2025-04-30

Excel解析生成图表.yml

Excel解析生成图表.yml

2025-04-29

mcp查询数据库(DbHub).yml

mcp查询数据库(DbHub).yml

2025-04-29

Dify教程.pdfDify教程(1).pdf

Dify教程.pdfDify教程(1).pdf

2025-04-29

数据分析指标异动贡献度实操计算中的5个常见问题及详细解答:归因方法解析与应用

内容概要:本文围绕“指标异动”贡献度实操计算中的5个常见问题进行详细解答,旨在帮助读者更好地理解和应用指标异动归因方法。文章首先回顾了常见的指标分类及其归因方式,包括加法类、乘法类和除法类指标的构成形式及变化比计算方法。接着,针对读者在实操过程中遇到的高频问题进行了深入剖析,重点探讨了“组间组内拆解法”的适用场景、核心思想及其在新增或减少维度因子时的具体操作方法。此外,文章还对比了两种不同的拆解方式,指出了各自的优缺点及适用范围。 适合人群:数据分析师、从事数据分析相关工作的专业人士,尤其是对指标异动归因有一定了解并希望深入掌握实操技巧的人群。 使用场景及目标:①帮助读者理解不同类型指标(如加法类、乘法类、除法类)的构成及变化比计算方法;②解决实操过程中遇到的具体问题,如组间组内拆解法的应用、新增或减少维度因子的处理等;③通过对比不同拆解方式,选择最适合业务场景的归因方法。 其他说明:本文基于作者之前发布的“指标异动”系列文章,结合读者反馈,提炼出最具代表性的5个问题进行解答。建议读者结合实际业务场景,灵活运用文中提供的方法和技巧,同时关注作者后续更新的内容以获取更多实用信息。

2025-04-28

【人力资源管理】基于DeepSeek提示词的人才发展全流程指南:从规划到保留的系统化策略设计

内容概要:本文档围绕HR在人才发展各个阶段的工作展开,涵盖人才规划、招聘、培养、评估、激励和保留六个方面。人才规划中强调组织架构分析优化与人才需求预测;人才招聘部分介绍岗位JD撰写优化及候选人筛选方法;人才培养聚焦于培训需求分析和课程设计;人才评估方面,通过绩效指标设定和360度评估报告分析确保客观公正;人才激励从薪酬体系设计和非物质激励方案两方面着手;人才保留则关注员工离职原因分析和员工关怀计划制定,每个环节都提供了具体的提示词帮助HR更好地完成工作任务。 适合人群:人力资源从业者,尤其是从事招聘、培训、绩效管理等工作的HR专员或经理。 使用场景及目标:①帮助HR人员在日常工作中更高效地完成各项任务;②为企业提供科学合理的人才发展战略指导;③提升企业内部人才管理水平,促进员工个人发展与企业目标的一致性。 其他说明:文档以提示词的形式为HR工作者提供了实际操作指南,有助于提升工作效率和质量。提示词内容详实具体,便于使用者直接应用到实际工作中,同时可根据自身情况进行适当调整。

2025-04-28

【人力资源管理】基于DeepSeek的员工关系管理全流程提示词:招聘至离职环节高效沟通指南

内容概要:本文档详细介绍了在员工关系管理中利用DeepSeek提升工作效率的方法,涵盖了从招聘到离职的全流程提示词。在招聘环节,提供了招聘需求明确、职位描述优化、招聘渠道分析、简历筛选标准制定、电话初筛问题设计和面试问题生成的指导;入职环节则包括入职准备清单生成、入职第一天流程规划、入职培训内容设计和试用期跟进计划制定;在职管理环节涉及员工绩效改进计划制定、员工冲突处理方案设计、员工满意度调查设计、员工职业发展规划模板创建、公司政策变更通知撰写和远程员工管理方案制定;离职环节有离职面谈问题清单设计、离职交接工作流程梳理、离职文件准备清单生成和离职员工关系维护策略制定。 适合人群:企业人力资源管理者、HR专员以及负责员工关系管理的相关工作人员。 使用场景及目标:①帮助HR在各个管理环节中与DeepSeek进行高效沟通,提高工作效率;②确保每个环节的操作都有据可依,减少人为疏漏;③为员工关系管理提供标准化流程,促进企业内部管理规范化。 阅读建议:此文档为HR日常工作提供了详尽的操作指南,在阅读过程中可以结合自身企业的实际情况灵活运用,并根据实际需求调整相关提示词的内容。

2025-04-28

知识库DB描述案例模板.md

知识库DB描述案例模板.md

2025-04-28

NL2SQL LLM提示词模板.md

NL2SQL LLM提示词模板.md

2025-04-28

Dify智能体:数据库文档标注模板.md

Dify智能体:数据库文档标注模板.md

2025-04-28

Dify智能体:一键生成品牌Slogan

Dify智能体:一键生成品牌Slogan

2025-04-28

提示词:数据驱动决策顾问.md

提示词:数据驱动决策顾问.md

2025-04-28

提示词:利用Mermaid生成图表提示词.md

提示词:利用Mermaid生成图表提示词.md

2025-04-28

提示词:将任何文档变为可视化网页.md

提示词:将任何文档变为可视化网页.md

2025-04-28

人工智能ChatGPT提示词教程:结构化表达与Markdown格式在AI交互中的应用及优化

内容概要:本文详细介绍了ChatGPT提示词的概念及其优化技巧。首先解释了提示词作为AI模型指令的基础意义,随后重点探讨了结构化提示词的应用,包括任务描述、写作指南和内容素材的划分,并举例说明了如何通过语气、语言风格和写作结构来指导AI生成高质量文本。接着,文章阐述了巧用标记符号撰写指令的方法,特别是Markdown格式的优势,如简化复杂信息、消除歧义和提升可读性,并给出了使用Markdown撰写“旅游美食攻略”的实际案例。最后,文章强调了层次布局、列表使用以及关键词强调等技巧对提高提示词效果的重要性。; 适合人群:对AI写作工具有兴趣的初学者、希望提高ChatGPT使用效率的内容创作者和技术爱好者。; 使用场景及目标:①帮助用户构建清晰、高效的提示词,以获取更精准的AI响应;②掌握结构化表达和标记符号的使用方法,优化与AI交互的质量;③通过具体示例学习如何设计和应用提示词,特别是在社交媒体和内容创作领域。; 阅读建议:本文内容详实,建议读者仔细研读每个部分,尤其是结构化提示词和Markdown格式的应用实例,结合自身需求进行实践。在实际操作中不断调整提示词的结构和内容,逐步积累经验,以达到最佳的AI交互效果。

2025-04-28

Dify智能体运维工单.yml运维工单.yml

Dify智能体运维工单.yml运维工单.yml

2025-04-27

translation-workflow.yml

translation_workflow.yml

2025-04-27

dify-o1.yml

dify-o1.yml

2025-04-27

【AI技术发展与应用】基于DeepSeek的多场景智能解决方案:从AIGC技术到企业私有化部署实践

内容概要:本文介绍了AI技术的发展趋势及其在DeepSeek中的应用实践。首先阐述了AIGC(人工智能生成内容)的定义及其广泛应用,如文本、图像、音频、视频等领域的生成。接着分析了AIGC技术发展的关键要素,包括算力竞争、算法优化和数据依赖。然后详细介绍了DeepSeek的性能优势、成本与策略优势以及创新实践,如低成本训练和技术绕过。此外,还探讨了DeepSeek的部署意义与价值,尤其是在提升效率、数据安全和推动转型方面的作用。最后,展示了DeepSeek在智能客服、企业私有知识库、数据整合与可视化展示、数字员工与老板驾驶舱等多个场景中的应用,强调了其在提升工作效率、客户满意度和辅助科学决策等方面的价值。 适用人群:对AI技术感兴趣的从业者、研究人员以及企业管理者,尤其是希望了解AI技术最新进展和应用的企业决策者。 使用场景及目标:①了解AIGC技术的发展趋势及其在多领域的应用;②掌握DeepSeek的性能优势和部署价值,特别是如何通过本地化部署提升工作效率和数据安全性;③学习DeepSeek在智能客服、企业私有知识库、数据整合与可视化展示等场景中的具体应用,提升企业运营效率和客户满意度。 其他说明:本文不仅提供了DeepSeek的技术特点和应用场景,还详细介绍了其部署步骤和使用技巧,帮助用户更好地理解和应用这一先进的AI工具。建议读者在学习过程中结合实际需求,逐步实践DeepSeek的各项功能,以充分发挥其潜力。

2025-04-26

数据治理体系建设方案.pdf

数据治理体系建设方案.pdf

2025-04-26

云音乐数据治理探索与实践.pdf数据治理云音乐数据治理探索与实践:从数据规范到资产治理的全流程优化

内容概要:本文由资深数据开发工程师宋志毅撰写,围绕云音乐数据治理展开探讨。文章首先概述了云音乐的整体情况及其面临的问题与挑战,包括无设计模式、数据凌乱、开发周期长、计算与存储成本增长迅速等问题。接着阐述了数据规范的重要性,提出了设计规范、开发规范等措施,强调高稳定性和高效率,确保数据的一致性和准确性。针对埋点治理,文中介绍了通过SDK、数据仓库、归因设计等技术方案以及流程管理来解决埋点定义混乱、质量问题多等痛点。最后,资产治理部分聚焦于降本提效,通过数据流治理和生命周期治理,优化任务管理和存储使用,提升整体效率。 适合人群:具备一定数据处理经验的数据分析师、数据工程师以及对数据治理感兴趣的从业者。 使用场景及目标:①帮助团队建立和完善数据治理体系,提高数据质量和可用性;②优化数据生产和消费流程,减少开发周期和维护成本;③通过合理的资产治理,降低存储和计算成本,提高资源利用率。 阅读建议:本文内容详实,涉及多个数据治理的关键环节,建议读者在阅读过程中重点关注各部分的具体实施方法和技术细节,并结合自身业务场景进行思考和实践。

2025-04-26

109页解读华为数据之道.pdf

109页解读华为数据之道.pdf

2025-04-26

华为-供应链管理.ppt.pdf

华为-供应链管理.ppt.pdf

2025-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除