Canal与Redis集成实战

cheniy2025/8/15大约 14 分钟

Canal与Redis集成实战

前置知识

在开始本教程之前，建议您具备以下基础知识：

Canal的基本原理和使用方法
Redis的基本概念和操作
Java开发环境
Spring Boot基础
消息队列(Kafka)的基本概念

为什么需要Canal与Redis集成

在现代高并发系统中，Redis作为缓存中间件被广泛应用，用于减轻数据库压力、提高系统响应速度。然而，保持数据库与缓存的一致性一直是一个挑战。传统的缓存更新策略主要有以下几种：

更新数据库时同时更新缓存：在应用代码中，每次更新数据库时，同时更新缓存。这种方式实现简单，但存在以下问题：
- 代码侵入性强，需要在每个更新操作中添加缓存更新逻辑
- 分布式环境下可能出现并发问题，导致缓存数据不一致
- 当更新操作较多时，会增加代码复杂度
缓存失效策略：更新数据库后，直接删除对应的缓存，等待下次查询时重新加载。这种方式也存在问题：
- 可能出现缓存穿透，导致数据库压力增大
- 在高并发环境下，可能出现数据不一致的情况
定时任务同步：通过定时任务，定期将数据库数据同步到缓存。这种方式的问题是：
- 实时性差，可能出现数据延迟
- 全量同步资源消耗大

使用Canal与Redis集成，可以实现数据库变更实时同步到Redis缓存，解决上述问题：

实时性：数据库变更实时同步到Redis，保证数据的实时一致性
解耦：缓存更新逻辑与业务代码解耦，降低代码复杂度
增量同步：只同步变更的数据，减少资源消耗
统一管理：集中管理缓存更新逻辑，便于维护和扩展

Canal与Redis集成架构

整体架构

Canal与Redis的集成架构如下图所示：

MySQL Binlog --> Canal Server --> 消息队列(Kafka) --> Canal客户端 --> Redis

在这个架构中：

MySQL产生binlog日志
Canal Server模拟MySQL slave，解析binlog
Canal Server将解析后的数据发送到消息队列
Canal客户端从消息队列消费数据
Canal客户端根据数据变更类型，更新Redis缓存

为什么使用消息队列

在Canal与Redis的集成中，我们引入了消息队列作为中间层，主要有以下几个原因：

解耦：通过消息队列，将Canal Server与Redis客户端解耦，使系统更加灵活
缓冲：消息队列可以缓冲大量的数据变更消息，防止突发流量冲击Redis
可靠性：消息队列提供消息持久化和重试机制，保证数据不丢失
扩展性：多个消费者可以同时消费同一个主题的消息，便于系统扩展

环境准备

1. 安装Redis

首先，我们需要安装Redis。可以从Redis官网下载最新版本，或者使用Docker安装：

# 使用Docker安装Redis
docker run --name redis -p 6379:6379 -d redis:latest

2. 安装Kafka

如果您还没有安装Kafka，可以参考上一篇文章中的Kafka安装步骤，或者使用Docker安装：

# 使用Docker安装Zookeeper和Kafka
docker run -d --name zookeeper -p 2181:2181 wurstmeister/zookeeper
docker run -d --name kafka -p 9092:9092 --link zookeeper --env KAFKA_ADVERTISED_HOST_NAME=localhost --env KAFKA_ZOOKEEPER_CONNECT=zookeeper:2181 wurstmeister/kafka

3. 配置Canal Server

修改Canal Server的配置，使其将数据发送到Kafka。如果您已经完成了上一篇文章中的配置，可以直接使用，否则需要按照以下步骤配置：

修改canal.properties

# 修改canal.properties文件，设置serverMode为kafka
canal.serverMode = kafka

# 设置kafka相关配置
canal.mq.servers = 127.0.0.1:9092

# 设置flatMessage，扁平化消息
canal.mq.flatMessage = true

# 设置批量获取数据的大小
canal.mq.batchSize = 50

# 设置获取数据的超时时间
canal.mq.fetchTimeout = 100

修改instance.properties

# 修改instance.properties文件，设置消息队列相关配置

# 设置消息主题，可以为每个instance设置不同的主题
canal.mq.topic = canal-topic

# 设置分区，-1表示随机分区，也可以指定具体分区
canal.mq.partition = -1

# 设置消息队列的过滤规则，与canal的过滤规则一致
canal.instance.filter.regex = .*\..*

开发Canal与Redis集成应用

接下来，我们将开发一个Spring Boot应用，用于消费Canal发送到Kafka的消息，并将数据同步到Redis。

1. 创建Spring Boot项目

首先，创建一个Spring Boot项目，并添加以下依赖：

<dependencies>
    <!-- Spring Boot Starter -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter</artifactId>
    </dependency>
    
    <!-- Spring Kafka -->
    <dependency>
        <groupId>org.springframework.kafka</groupId>
        <artifactId>spring-kafka</artifactId>
    </dependency>
    
    <!-- Spring Data Redis -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-redis</artifactId>
    </dependency>
    
    <!-- JSON处理 -->
    <dependency>
        <groupId>com.alibaba</groupId>
        <artifactId>fastjson</artifactId>
        <version>1.2.83</version>
    </dependency>
    
    <!-- Lombok -->
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>
</dependencies>

2. 配置应用

在application.yml中添加Kafka和Redis配置：

spring:
  kafka:
    bootstrap-servers: localhost:9092
    consumer:
      group-id: canal-redis-consumer
      auto-offset-reset: earliest
      key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
      value-deserializer: org.apache.kafka.common.serialization.StringDeserializer
  redis:
    host: localhost
    port: 6379
    database: 0

3. 创建消息实体类

创建Canal消息的实体类：

package com.example.canal.model;

import lombok.Data;
import java.util.List;
import java.util.Map;

@Data
public class CanalMessage {
    private List<Map<String, String>> data;  // 数据变更内容
    private String database;                // 数据库名
    private Long es;                        // 事件时间戳(毫秒)
    private Integer id;                     // 消息ID
    private Boolean isDdl;                  // 是否是DDL语句
    private Map<String, String> mysqlType;  // 字段的MySQL类型
    private List<Map<String, String>> old;  // 变更前的数据(仅在UPDATE操作时有值)
    private List<String> pkNames;           // 主键名称
    private String sql;                     // 原始SQL语句(仅在isDdl=true时有值)
    private Map<String, Integer> sqlType;   // 字段的Java类型
    private String table;                   // 表名
    private Long ts;                        // 消息产生时间戳(毫秒)
    private String type;                    // 操作类型: INSERT/UPDATE/DELETE/CREATE/ALTER/ERASE...
}

4. 创建Redis服务

创建一个Redis服务类，用于操作Redis：

package com.example.canal.service;

import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.data.redis.core.StringRedisTemplate;
import org.springframework.stereotype.Service;

import java.util.Map;
import java.util.concurrent.TimeUnit;

@Slf4j
@Service
@RequiredArgsConstructor
public class RedisService {

    private final StringRedisTemplate redisTemplate;
    
    /**
     * 设置缓存
     */
    public void set(String key, String value) {
        redisTemplate.opsForValue().set(key, value);
        log.info("Set cache, key: {}, value: {}", key, value);
    }
    
    /**
     * 设置缓存，带过期时间
     */
    public void set(String key, String value, long timeout, TimeUnit unit) {
        redisTemplate.opsForValue().set(key, value, timeout, unit);
        log.info("Set cache with timeout, key: {}, value: {}, timeout: {}, unit: {}", key, value, timeout, unit);
    }
    
    /**
     * 设置Hash缓存
     */
    public void hset(String key, String hashKey, String value) {
        redisTemplate.opsForHash().put(key, hashKey, value);
        log.info("Set hash cache, key: {}, hashKey: {}, value: {}", key, hashKey, value);
    }
    
    /**
     * 设置Hash缓存，多个字段
     */
    public void hmset(String key, Map<String, String> map) {
        redisTemplate.opsForHash().putAll(key, map);
        log.info("Set hash cache, key: {}, map: {}", key, map);
    }
    
    /**
     * 删除缓存
     */
    public void delete(String key) {
        redisTemplate.delete(key);
        log.info("Delete cache, key: {}", key);
    }
    
    /**
     * 删除Hash缓存中的字段
     */
    public void hdel(String key, Object... hashKeys) {
        redisTemplate.opsForHash().delete(key, hashKeys);
        log.info("Delete hash cache, key: {}, hashKeys: {}", key, hashKeys);
    }
}

5. 实现Canal消息处理服务

创建一个服务类，用于处理Canal消息并更新Redis缓存：

Canal消息处理服务完整代码

package com.example.canal.service;

import com.example.canal.model.CanalMessage;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Service;

import java.util.Map;
import java.util.concurrent.TimeUnit;

@Slf4j
@Service
@RequiredArgsConstructor
public class CanalMessageProcessor {

    private final RedisService redisService;
    
    /**
     * 处理Canal消息
     */
    public void process(CanalMessage message) {
        // 根据操作类型处理消息
        switch (message.getType()) {
            case "INSERT":
                handleInsert(message);
                break;
            case "UPDATE":
                handleUpdate(message);
                break;
            case "DELETE":
                handleDelete(message);
                break;
            default:
                log.info("Unsupported operation type: {}", message.getType());
        }
    }
    
    /**
     * 处理插入操作
     */
    private void handleInsert(CanalMessage message) {
        log.info("Processing INSERT: database={}, table={}", message.getDatabase(), message.getTable());
        
        // 获取表名
        String table = message.getTable();
        
        // 遍历所有插入的数据
        message.getData().forEach(row -> {
            // 获取主键值
            String primaryKey = getPrimaryKeyValue(message, row);
            if (primaryKey == null) {
                log.warn("Primary key not found, skip processing");
                return;
            }
            
            // 构建Redis键
            String redisKey = buildRedisKey(message.getDatabase(), table, primaryKey);
            
            // 更新Redis缓存
            updateRedisCache(redisKey, row);
        });
    }
    
    /**
     * 处理更新操作
     */
    private void handleUpdate(CanalMessage message) {
        log.info("Processing UPDATE: database={}, table={}", message.getDatabase(), message.getTable());
        
        // 获取表名
        String table = message.getTable();
        
        // 遍历所有更新的数据
        for (int i = 0; i < message.getData().size(); i++) {
            Map<String, String> row = message.getData().get(i);
            
            // 获取主键值
            String primaryKey = getPrimaryKeyValue(message, row);
            if (primaryKey == null) {
                log.warn("Primary key not found, skip processing");
                continue;
            }
            
            // 构建Redis键
            String redisKey = buildRedisKey(message.getDatabase(), table, primaryKey);
            
            // 更新Redis缓存
            updateRedisCache(redisKey, row);
        }
    }
    
    /**
     * 处理删除操作
     */
    private void handleDelete(CanalMessage message) {
        log.info("Processing DELETE: database={}, table={}", message.getDatabase(), message.getTable());
        
        // 获取表名
        String table = message.getTable();
        
        // 遍历所有删除的数据
        message.getData().forEach(row -> {
            // 获取主键值
            String primaryKey = getPrimaryKeyValue(message, row);
            if (primaryKey == null) {
                log.warn("Primary key not found, skip processing");
                return;
            }
            
            // 构建Redis键
            String redisKey = buildRedisKey(message.getDatabase(), table, primaryKey);
            
            // 删除Redis缓存
            redisService.delete(redisKey);
        });
    }
    
    /**
     * 获取主键值
     */
    private String getPrimaryKeyValue(CanalMessage message, Map<String, String> row) {
        // 如果没有主键，使用第一个字段作为主键
        if (message.getPkNames() == null || message.getPkNames().isEmpty()) {
            if (row.isEmpty()) {
                return null;
            }
            return row.values().iterator().next();
        }
        
        // 使用第一个主键字段
        String pkName = message.getPkNames().get(0);
        return row.get(pkName);
    }
    
    /**
     * 构建Redis键
     */
    private String buildRedisKey(String database, String table, String primaryKey) {
        return String.format("%s:%s:%s", database, table, primaryKey);
    }
    
    /**
     * 更新Redis缓存
     */
    private void updateRedisCache(String redisKey, Map<String, String> row) {
        // 方式一：将整行数据序列化为JSON字符串，存储为String类型
        // String jsonValue = JSON.toJSONString(row);
        // redisService.set(redisKey, jsonValue, 1, TimeUnit.HOURS); // 设置1小时过期
        
        // 方式二：将每个字段存储为Hash类型
        redisService.hmset(redisKey, row);
    }
}

6. 实现Kafka消费者

创建Kafka消费者，用于消费Canal发送的消息：

package com.example.canal.consumer;

import com.alibaba.fastjson.JSON;
import com.example.canal.model.CanalMessage;
import com.example.canal.service.CanalMessageProcessor;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.kafka.annotation.KafkaListener;
import org.springframework.stereotype.Component;

@Slf4j
@Component
@RequiredArgsConstructor
public class CanalKafkaConsumer {

    private final CanalMessageProcessor canalMessageProcessor;

    @KafkaListener(topics = "canal-topic")
    public void onMessage(String message) {
        log.info("Received message: {}", message);
        try {
            // 解析Canal消息
            CanalMessage canalMessage = JSON.parseObject(message, CanalMessage.class);
            
            // 处理Canal消息
            canalMessageProcessor.process(canalMessage);
        } catch (Exception e) {
            log.error("Error processing message: {}", message, e);
        }
    }
}

7. 创建应用主类

创建Spring Boot应用的主类：

package com.example.canal;

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;

@SpringBootApplication
public class CanalRedisApplication {

    public static void main(String[] args) {
        SpringApplication.run(CanalRedisApplication.class, args);
    }
}

测试Canal与Redis集成

1. 准备测试数据库

首先，我们需要创建一个测试数据库和表：

-- 创建测试数据库
CREATE DATABASE canal_test;

-- 使用测试数据库
USE canal_test;

-- 创建用户表
CREATE TABLE `user` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(50) NOT NULL,
  `age` int(11) DEFAULT NULL,
  `email` varchar(50) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

-- 插入测试数据
INSERT INTO `user` (`name`, `age`, `email`) VALUES ('张三', 28, 'zhangsan@example.com');
INSERT INTO `user` (`name`, `age`, `email`) VALUES ('李四', 32, 'lisi@example.com');

2. 启动应用

启动Canal Server和我们开发的Spring Boot应用。

3. 执行数据库操作

执行一些数据库操作，观察Redis缓存的变化：

-- 插入数据
INSERT INTO `user` (`name`, `age`, `email`) VALUES ('王五', 25, 'wangwu@example.com');

-- 更新数据
UPDATE `user` SET `age` = 29 WHERE `id` = 1;

-- 删除数据
DELETE FROM `user` WHERE `id` = 2;

4. 验证Redis缓存

使用Redis CLI或其他Redis客户端工具，查看Redis缓存的变化：

# 连接Redis
redis-cli

# 查看所有键
KEYS *

# 查看Hash类型的数据
HGETALL canal_test:user:1
HGETALL canal_test:user:3

如果一切正常，我们应该能看到Redis中存储了用户数据，并且随着数据库的变更而实时更新。

实战案例：常见缓存场景

在实际应用中，Canal与Redis的集成可以应用于多种缓存场景。以下是几个常见的应用场景：

1. 商品信息缓存

在电商系统中，商品信息是高频访问的数据，通常会缓存在Redis中以提高查询性能。

缓存结构：使用Hash结构存储商品详情，使用List或Sorted Set存储商品列表
缓存策略：商品基本信息变更时更新缓存，库存变更时可以单独更新库存字段
应用场景：商品详情页、商品列表页、搜索结果页

2. 用户信息缓存

用户信息也是常见的缓存对象，特别是用户的基本信息、权限信息等。

缓存结构：使用Hash结构存储用户详情，使用Set存储用户角色和权限
缓存策略：用户信息变更时更新缓存，登录状态变更时更新会话信息
应用场景：用户中心、权限验证、个人主页

3. 配置信息缓存

系统配置、业务参数等信息变更频率低但访问频率高，适合缓存。

缓存结构：使用String或Hash结构存储配置信息
缓存策略：配置变更时更新缓存，可以设置较长的过期时间
应用场景：系统参数、业务规则、动态配置

4. 实现思路

针对不同的表和业务场景，我们可以实现不同的缓存处理服务：

// 根据表名路由到不同的缓存处理服务
public void processMessage(CanalMessage message) {
    String table = message.getTable();
    switch (table) {
        case "product":
            productCacheService.process(message);
            break;
        case "user":
            userCacheService.process(message);
            break;
        case "config":
            configCacheService.process(message);
            break;
        default:
            defaultCacheService.process(message);
    }
}


## 缓存更新策略

在实际应用中，缓存更新策略是一个复杂的问题，需要根据业务场景选择合适的策略。以下是几种常见的缓存更新策略：

### 1. 更新模式

#### 直接更新模式

当数据库数据变更时，直接更新缓存。这种模式的优点是实时性高，缺点是如果更新缓存失败，可能导致数据不一致。

```java
// 数据库更新成功后，更新缓存
redisService.set(key, value);

失效模式

当数据库数据变更时，删除对应的缓存，等待下次查询时重新加载。这种模式的优点是实现简单，缺点是可能出现缓存穿透。

// 数据库更新成功后，删除缓存
redisService.delete(key);

异步更新模式

当数据库数据变更时，将更新消息发送到消息队列，由专门的缓存更新服务异步更新缓存。这种模式的优点是解耦、可靠性高，缺点是实时性略差。

// 数据库更新成功后，发送消息到消息队列
kafkaTemplate.send("cache-update-topic", message);

2. 缓存一致性保证

在分布式环境下，保证缓存一致性是一个挑战。以下是几种常见的一致性保证方式：

过期时间

为缓存设置合理的过期时间，即使缓存更新失败，也能在一定时间后自动失效，保证最终一致性。

// 设置缓存过期时间
redisService.set(key, value, 1, TimeUnit.HOURS);

版本号

为缓存数据添加版本号，只有当版本号匹配时才更新缓存，避免并发更新问题。

// 使用版本号更新缓存
String oldVersion = redisService.hget(key, "version");
if (oldVersion.equals(newVersion)) {
    redisService.hmset(key, data);
}

分布式锁

使用分布式锁保证同一时间只有一个进程更新缓存，避免并发更新问题。

// 使用分布式锁更新缓存
String lockKey = "lock:" + key;
if (redisService.setIfAbsent(lockKey, "1", 10, TimeUnit.SECONDS)) {
    try {
        redisService.set(key, value);
    } finally {
        redisService.delete(lockKey);
    }
}

注意事项

缓存更新失败应该有重试机制，保证数据最终一致性
缓存穿透、缓存击穿、缓存雪崩等问题需要特别关注
缓存数据应该设置合理的过期时间，避免长期不一致
对于高并发场景，应该考虑使用分布式锁或版本号机制

性能优化

在Canal与Redis集成的应用中，性能是一个重要的考虑因素。以下是几种常见的性能优化方式：

1. 批量处理

将多个缓存操作合并为一个批量操作，减少网络往返次数，提高性能。

// 批量更新缓存
redisService.pipelined(operations -> {
    operations.set(key1, value1);
    operations.set(key2, value2);
    operations.set(key3, value3);
});

2. 异步处理

将缓存更新操作异步处理，避免阻塞主线程，提高响应速度。

// 异步更新缓存
CompletableFuture.runAsync(() -> {
    redisService.set(key, value);
});

3. 缓存预热

在系统启动时，提前加载热点数据到缓存，避免系统运行初期的缓存穿透。

// 缓存预热
@PostConstruct
public void preloadCache() {
    List<Product> products = productRepository.findTop100ByOrderByViewCountDesc();
    products.forEach(product -> {
        redisService.hmset("product:" + product.getId(), convertToMap(product));
    });
}

4. 合理的缓存粒度

根据业务需求，选择合适的缓存粒度，避免缓存过多无用数据。

// 缓存字段过滤
Map<String, String> filteredData = row.entrySet().stream()
    .filter(entry -> !ignoredFields.contains(entry.getKey()))
    .collect(Collectors.toMap(Map.Entry::getKey, Map.Entry::getValue));
redisService.hmset(key, filteredData);

建议

对于频繁变更的数据，考虑使用较短的缓存过期时间
对于不常变更的数据，可以使用较长的缓存过期时间
对于热点数据，可以考虑使用本地缓存+分布式缓存的多级缓存架构
监控缓存命中率，根据实际情况调整缓存策略

总结

本文详细介绍了Canal与Redis的集成方案，实现MySQL数据库与Redis缓存的实时同步。通过引入消息队列作为中间层，我们实现了系统的解耦和可靠性保证。

我们还通过一个实际的案例——商品缓存更新，展示了如何在实际应用中使用Canal与Redis集成。同时，我们讨论了缓存更新策略和性能优化方面的考虑。

通过Canal与Redis的集成，我们可以解决传统缓存更新方式存在的问题，实现数据库与缓存的实时一致性，提高系统的性能和可靠性。

下一步学习

学习Canal的高级特性和最佳实践
探索Canal在微服务架构中的应用
了解Canal与其他数据存储系统的集成

希望这篇文章对您有所帮助！如果您有任何问题，欢迎在评论区讨论。