- 博客(556)
- 资源 (16)
- 收藏
- 关注

原创 博通(Broadcom)官网Greenplum下载方式及文档连接
然而从2008年Greenplum进入到国内后,就受到了国内的众多忠实用户群体,同时也培养了国的智能数仓管理和数据分析领域培养了众多的专业人才,这些人才也为国内的各种产业发展贡献了关键力量。同时Greenplum作为一款高性能开源的并行数据仓库解决方案,其独特的分布式架构和强大的数据分析能力,也吸引了众多企业和学术机构的关注,促进了中国在数据科学领域的教育和培训。如果需要下载最新的GP软件作为测试使用,但最好还是按照博通(Broadcom)的流程注册会员,在注册时最好使用google的邮箱。
2024-07-31 00:09:14
2460
4

原创 Greenplum的诞生与成长过程
Greenplum于2003年在美国硅谷成立,在2006年发布了基于PostgreSQL(8.x)的MPP数据库产品,作为与公司同名的MPP数据库,专为分析和管理海量数据集而设计,支持复杂的数据分析和商业智能应用,支撑数据仓库、BI业务等业务。在2008年Greenplum发布了其数据仓库产品,并且同一年推出了GreenplumMapReduce。
2024-07-27 17:01:58
776

原创 超融合时序数据库YMatrixDB与PostGIS案例
YMatrix适用于各种规模设备的数据融合与物联网时序应用场景,本案例以具体的案例来说明YMatrix在PostGIS中的数据加载、处理和分析的能力以及时空数据的具体使用方法。
2022-12-02 16:49:54
1223
原创 数据化管理应用管理图
链接: https://pan.baidu.com/s/193Y_unXr7N6I9C3DsJi-qQ?pwd=gnjv 提取码: gnjv。
2022-09-07 11:25:16
446
原创 linux使用sed替换中文字符
1、有时候需要替换csv中的汉字2、使用以下命令进行替换使用以下命令替换中文,替换的比较全LANG=C sed -r -i "s/[\x81-\xFE][\x40-\xFE]//g" test.csv或LANG=C sed -r -i "s/[\x81-\xFE]//g" test.csv
2022-05-31 10:05:10
1895
原创 MatrixDB是Hive的25.8倍是Impala+Kudu的8.8倍
概述1、大数据的发展历程和面临的痛点2、MatrixDB超融合时序数据库介绍3、MatrixDB TPCH是Hive的25.8倍4、MatrixDB TPCH是Impala + Kudu的8.8倍5、MatrixDB TPC-B 达到百万TPS大数据发展历程 过去大家提到大数据就会联想到Hadoop,而Hadoop是从2003-2004年开始,Google公布了GFS\ MapReduce\BigTable 三篇论文后,开始了从Lucene–>Nutch—>H...
2022-05-27 23:34:19
1198
1
原创 greenplum数据库安装
3.1.3 修改系统参数3.1.3.1 修改hostname临时修改# hostnamectl set-hostname test-cn-01永久修改# vi /etc/sysconfig/network# Created by anacondaHOSTNAME=test-cn-01以下是对所有的节点进行修改vi /etc/hosts192.168.***.*** gpmaster192.168.***.*** gpstandby1
2021-12-20 16:11:38
865
原创 SHELL自动获取硬件信息
#!bin/bashecho -e "------ os release ------"cat /etc/redhat-releasecat /etc/issue | grep Linuxecho -e "\n ------ cpu physical ------"cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -lecho -e "------ cpu info ------"cat /proc/cpuinfo | .
2021-12-16 18:23:21
436
转载 PostgreSQL DBA最常用SQL
根据数据字典创建相关视图,方便查询create schema dba; create view dba.ro_conflicts as select datname,pg_stat_get_db_conflict_all(oid) conflict_all,pg_stat_get_db_conflict_bufferpin(oid) conflict_bufferpin,pg_stat_get_db_conflict_lock(oid) conflict_lock,pg_stat_get_d
2021-12-15 22:40:48
870
原创 Greenplum 常见错误及解答方式
连接超时问题描述:ERROR "failed to acquire resources on one or more segments", "could not connect to server: Connection timed out"原因分析: (1) 查看网络连接情况 (2) 查看TCP/UDP连接情况解答方式: sudo sysctl net.netfilter.nf_conntrack_buckets=262144 sudo sysctl net.ne...
2021-12-14 14:43:48
7907
原创 Canceling query because of high VMEM usage. Used: 4943MB, available 564MB, red zone: 5102MB
运行最大的内存gpconfig -s gp_vmem_protect_limitgpconfig -c gp_vmem_protect_limit -m 10240 -v 10240设置触发终止查询的Greenplum数据库vmem内存的百分比。gpconfig -s runaway_detector_activation_percent值为0禁用基于使用vmem百分比的查询。gpconfig -c runaway_detector_activation_perc...
2021-12-14 12:11:53
5792
转载 keepalived实现greenplum的自动切换高可用
详细文章可以查看:keepalived实现greenplum的自动切换高可用_Danger-CSDN博客
2021-12-04 17:55:45
376
原创 readline library not found
在编译postgresql源码时出现以下的错误**********checking for library containing shmget... none requiredchecking for library containing readline... noconfigure: error: readline library not foundIf you have readline already installed, see config.log for details on th.
2021-11-19 23:36:09
3791
原创 greenplum时区相差8小时
1、中国标准时区(CST)和美国中部时区(CST)重名2、GP默认会将CST识别为美国中部时区3、导致国内时区为CST的服务器在事件计算时出现意外结果4、解决方法 4.1 修改GP安装目录下/share/postgresql/timezonesets/Default 4.2 找到CST - 21600这行,修改为CST 28800 4.3 所有Segment和Master服务器全部修改 4.4 重新启动GODB 4.5 修...
2021-10-29 11:06:38
527
1
原创 mxgate是gpcopy同步速度的2倍
目录1、构造测试的数据2、查看数据的大小和行数3、创建表语句参考资料MatrixDB - 时序数据库加载性能测试过程进入四维纵横yMatrix官网,体验超融合时序数据库MatrixDB。https://ymatrix.cn/blog/load-test-steps集群的架构序列 数据库 服务器 segment master 访问端口 1 Greenplum6.0.0 sdw2 16primary+1...
2021-10-27 14:57:19
500
原创 查看Greenplum集群中的创建的类型
查看Greenplum集群中的创建的类型SELECT (current_database())::information_schema.sql_identifier AS udt_catalog, (nc.nspname)::information_schema.sql_identifier AS udt_schema, (c.relname)::information_schema.sql...
2021-10-27 13:48:06
171
原创 grafana解决时间多8小时问题
如上如只需要强转一下即可:SELECT requesttime::timestamp with time zone AS "time", requestresult AS metric, count(requestresult) AS "requestresult"FROM sdfGROUP BY 1,2ORDER BY 1,2
2021-10-04 23:30:53
2327
原创 Greenplum使用pg_dump备份表数据文件
#!bin/bash # 表文件和该文件的行数 tablefile="ods_tablename.sql" lines=`cat $tablefile|wc -l` # 导入密码 export PGPASSWORD=gpadmin # 循环开始备份表中的数据 for tablename in `cat $tablefile` do # 获取该该表的位置 currentlin=`cat $tablefile |grep -rn -w "$tablename"|awk -..
2021-03-26 17:51:47
676
原创 腾讯云文章总结列表
文章标题 文章链接 Greenplum主节点与数据节点硬件详细信息 https://cloud.tencent.com/developer/article/1344293 Greenplum使用TPC-H测试过程及结果 https://cloud.tencent.com/developer/article/1344308 Linux(一)目录 https://cloud.tencent.com/developer/article/1346253 Linux 常用命令(
2021-03-02 20:24:19
408
1
原创 Greenplum数据库快速调优
Greenplum数据库快速调优目录第一节 集群规划中影响性能的原因 1、 架构设计 2、服务器配置 3、Segment 实例数量第二节 数据库性能优化内容 1、内存管理 2、资源队列的内存管理 3、 资源队列 4、资源组 5、资源组与资源队列的区别 6、表储存 7、储存模式及对比 8、数据加载 9、其他优化点第三节 日常维护对性能的提升 1、统计信息 2、收集统计信息 3、数据膨胀 4、检测膨胀 5、膨胀处理 6、数据倾斜 7、计算倾斜 8、计算倾斜排查过程
2021-02-01 17:14:28
1485
原创 Greenplum生态与工具
Greenplum生态与工具目录第一节 Greenplum 生态介绍 1、Greenplum 发展历史 2、商业版与开源版的差异 3 Greenplum 生态软件第二节 Greenplum 运维工具 1、 商业监控--GPCC 2、开源监控Prometheus+Grafana 3、gpxxx 运维工具第三节 Greenplum 管理工具 1、常用的管理工具datagrip 2、常用的管理工具navicat 3、常用的管理工具dbeaver 4、度版本比较第四节 Greenplu
2021-02-01 17:13:51
1249
原创 Greenplum迁移指南
Greenplum迁移指南目录第一节 Greenplum数据迁移方法论 1.1 为什么要进行数据迁移 1.2 迁移整体的流程第二节Greenplum数据迁移工具 2.1 迁移工具 2.2 迁移工具--pra2pg 2.3 迁移工具--sqluldr2 2.4 迁移工具--sqldata第三节 如何实现自己的数据迁移程序 3.1 数据迁移全周期功能第四节 Oracle到Greenplum的数据迁移 4.1 为什么要从Oracle迁移到GPDB 4.2 迁移场景 4.3 元数据迁移
2021-02-01 17:13:10
928
2
原创 Greenplum常见问题的分析与处理
目录第一节 排查问题的方法目录 1、 不能只看表象,要去看日志,找规律,去复现 2、去哪看日志,有哪些日志 3、管理工具的日志 4、GP数据库日志 5、 CSV日志 6、遇到问题解决方式第二节 数据库启动停止的问题分析 1、gpstop 有哪些几步操作 2、too many clients alrrady 3、database is in recovery mode / is starting up 4、gpstart 有哪些几步操作 5、postmaster.pid 不存在
2021-02-01 17:07:58
4849
3
原创 Greenplum常见的链接驱动
以下为Greenplum常见的链接驱动,官网推荐的为Pivotal Greenplum JDBC API 驱动名称 下载链接 JDBC Driver Pivotal Greenplum JDBC https://network.pivotal.io/products/pivotal-gpdb#/releases/700113/file_groups/2702 Gre.
2020-10-21 16:38:35
1745
原创 Greenplum集群Master与Standby相互切换
Greenplum集群Master与Standby相互切换1 概述 12 查看集群的基本信息 22.1 查看集群的配置信息 22.2 快速查看down segments节点 22.3 查看Master Standby节点的运行状态 22.4 查看Master与Master Standby的配置 33 移除掉Standby 节点 33.1 移除掉Standby节点 33.2 查看Standby的配制 44 在Master节点上创建表 54.1 创建一张测试表 5
2020-10-19 10:05:11
1273
原创 Greenplum集群扩容总结
Greenplum集群扩容总结Greenplum集群扩容总结 11 概述 22 扩容前准备 23 扩容方案对比 23.1 使用gpexpand进行数据库扩容 23.2 新建Greenplum集群,重新导入数据 34 查看集群的基本信息 34.1 查看集群的版本 34.2 查看master和stadby信息 44.3 查看segment信息 44.4 当前集群链接检查 44.5 查看集群的运行状态信息 44.6 使用gpstate命令查看集群信息 45
2020-10-09 18:11:11
1703
原创 Greenplum备份安全与高可用
Greenplum备份安全与高可用目录Greenplum备份安全与高可用目录1 Greenplum高可用 1.1 管理节点 1.2 数据节点 1.3 交换机 1.4 服务器 1.5 Master高可用 1.6 Segment高可用 1.7 系统表高可用 1.8 系统视图高可用2 Greenplum安全 2.1 身份认证 2.1.1 pg_hba.conf配置连接类型 2.1.2 pg_hba...
2020-09-03 17:32:22
1007
原创 Greenplum快速上手
Greenplum快速上手目录快速上手Greenplum 1目录 11 Greenplum的介绍 21.1 Greenplum产品发展历程 22 Greenplum市场地位 33 Greenplum架构设计 43.1 Scale up架构 43.2 Greenplum架构图 43.3 Greenplum架构组成 53.3.1 Master Hosts功能 53.3.2 Interconnect功能 53.3.3 Segment Hosts功能 53.4
2020-08-26 14:34:05
739
原创 Greenplum数据库服务器常见配置参数
官网介绍:https://gp-docs-cn.github.io/docs/ref_guide/config_params/guc-list.html#enable_bitmapscan参数名字 默认值 参数含义 enable_bitmapscan on 启用或禁用位图查询优化器。 enable_groupagg on 启用或禁用组聚集计划优化器。 enable_hashagg on 启用或禁用哈希优化器。 enable_hashjo
2020-07-28 16:10:19
857
转载 Foreign data wrappers
转载地址:https://wiki.postgresql.org/index.php?title=Foreign_data_wrappers&spm=a2c6h.12873639.0.0.68097480atbVAhForeign data wrappersContents[hide]1Foreign Data Wrappers 1.1Generic SQL Database Wrappers 1.2Specific SQL Database Wrappers 1.3N..
2020-07-15 17:45:31
697
1
原创 Greenplum查询优化揭秘
Greenplum查询优化揭秘学习地址:https://space.bilibili.com/489184136Greenplum查询优化揭秘 1目录 11 Greenplum查询优化器和查询计划介绍 11.1 Greenplum查询优化器介绍 11.2 Greenplum查询计划介绍 11.3 计划节点的类型 22 Greenplum查询优化器的的具体处理过程 22.1 查询树的预处理 22.1.1 查询树的预处理(早期) 32.1.2 查询树的预处理(后期).
2020-07-13 11:11:43
881
原创 greenplum集成mysql_fdw插件
greenplum集成mysql_fdw插件1 安装说明2 编译安装PostgreSQL 与mysql 2.1 把下载的PostgreSQL\mysql\MYSQL_FDW放在同目录下 2.2 编译PostgreSQL 9.4.24 2.3 复制mysql_fdw-master插件3 编译mysql_fdw插件 3.1 建立libmysqlclient.so的软连接 3.2 导入环境变量 3.3 编译mysql_fdw插件4 greenplum集成mysql_fdw插件5 gree
2020-07-04 21:08:29
915
原创 Greenplum 元数据信息
Greenplum 元数据信息Greenplum 元数据信息1、 获取集群中数据库信息 1.1 集群中的创建的数据库信息 1.2 查看每个数据库的储存大小 1.3 查看集群中hostname 1.4 查看集群数据库的版本信息 1.5 查看集群master与segment安装的信息2、 查看数据库下schema信息 2.1 查看数据库下创建的schema信息 2.2 查看数据库下每个schema的大小3、 查看schema下表的信息 3.1 查看schema下的表的
2020-07-02 10:27:42
1391
原创 Greenplum使用oralce_fdw连接oracle
Greenplum使用oralce_fdw连接oracle目录Greenplum使用oralce_fdw连接oracle 11 下载oracle客户端,放到/data目录下(主节点) 12 在root和gpadmin用户下配置环境变量(主节点) 12.1 配置环境变量 12.2 建立软连接 22.3 修改权限 23 下载编译oracle_fdw(主节点) 24 编译(主节点) 25 复制编译文件到所有节点 46 分发oracle客户端到所有节点 47 动态连接
2020-06-21 22:01:38
811
原创 Greenplum6.x安装PXF插件
目录Greenplum6.x安装PXF插件目录1 安装Hadoop与Hive的客户端 1.1 在大数据平台的主节点(namenode)上打包客户端 1.2 把文件scp到Greenplum的master节点上2 Greenplum的master节点解压文件配置环境变量 2.1 解压文件 2.2 对文件重命名 2.3 为 gpadmin配置环境变量3 PXF安装 3.1 PXF 初始化 3.2 创建新的文件夹 3.3 修改px
2020-06-18 13:37:57
2139
1
原创 Greenplum内核揭秘之执行引擎
Greenplum内核揭秘之执行引擎目录Greenplum内核揭秘之执行引擎 1目录 11 执行器介绍 21.1 什么是执行器 21.2 PlanNode(执行计划节点) 21.3 PlanTree(执行计划树) 21.3 执行模型 31.3.1 迭代模型(Pipeline模型,Pull方式) 31.3.2 向量化模型(VECTORIZATION Model) 31.3.3 PUSH执行模型 41.3.4 PUSH模型的优势 41.3.5 GPDB使用的模
2020-06-09 21:44:16
551
原创 Greenplum针对最常见的内存错误OOM
针对最常见的内存错误OOM,需要说明(针对4.1之后版本,早起版本请前去查询相关文档):单语句的内存消耗受3个参数控制:gp_resqueue_memory_policy、statement_mem、max_statement_mem A、缺省gp_resqueue_memory_policy配置为eager_free,在此情况下,内存将物尽其用(我从词面理解的,官方并未给出详细说明),但不能超过max_statement_mem的限制以及resource queue的memory_limit...
2020-06-03 17:51:49
1268
greenplum-db-7.1.0-el8-x86-64和greenplum-db-7.2.0-el9-x86-64下载
2024-07-24
Greenplum不同集群之间同步数据方法及性能.pdf
2019-06-14
Greenplum数据库巡检报告.pdf
2019-06-14
Greenplum数据库使用总结
2019-01-02
Greenplum释放AO表SHELL脚本
2018-10-17
小徐的《BigData总结》
2018-08-13
cronhub调度器需要的数据库
2018-04-18
Myeclipse10破解工具
2017-04-10
spark HTML查看文档
2017-02-26
CDH安装word
2017-02-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人