Flink SQL填坑记3:两个kafka数据关联查询

本文记录了一个项目中使用Flink SQL处理Kafka数据关联查询的问题。最初尝试直接在Kafka上进行Join操作导致性能下降,随后通过转换为upsert-kafka解决数据去重和性能问题,避免了在MySQL上的性能瓶颈。文中详细描述了错误的建表语句及其引发的异常,以及修正后的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在一个项目中,实时生成的统计数据需要关联另外一张表(并非维表),需要统计的数据表是Kafka数据,而需要关联的表,由于不是维度,不能按照主键查询,所以如果放在MySQL上,将存在严重的性能问题,这个时候我想到用将两张表的数据都生成为Kafka数据,然后进行Join操作。中途发现这种性能特别差,而且表变更会产生多条kakfa记录,导致计算越来越来,最后改成upsert-kafka,下面记录下处理过程。

刚开始用kafka,建表语句如下:

Create Table `kafka_t_test1` (
  `f_id` bigint,
  `f_name` string,
  PRIMARY KEY (`f_corp_id`,`f_id`) NOT ENFORCED
  ) WITH (
    'connector' = 'kafka',
    'topic' = 't_test',
    'pr
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值