文档首页/ 数据治理中心 DataArts Studio/ 常见问题/ 数据集成(实时作业)/ 如何查看实时作业已消费位点并恢复作业?
更新时间:2025-08-27 GMT+08:00
分享

如何查看实时作业已消费位点并恢复作业?

需要查看已消费位点的场景有哪些?

  • 用户停止作业后重新启动作业,无法确认“启动配置”中的起始时间,此时需要获取作业在停止前的已消费位点,并设置重启作业的启动时间不晚于已消费位点,确保新起作业不丢数。
  • 用户长时间暂停作业或者是长时间未处理异常事件,导致重新恢复作业时CDC日志数据已丢数(比如常见的MySQL binlog过期),作业无法正常恢复,此时需要获取作业在暂停前的已消费位点以确认丢数的起始时间,及时通过离线补数。
  • 作业合并,作业合并时涉及到表在不同作业间的迁移,合并后作业的启动起始时间不能晚于合并前作业的已消费位点,否则会有丢数风险。

如何确认作业的已消费位点

不同的数据源确认已消费位点的方式不同,详情请参考下表:

使用已消费位点恢复作业

通过如何确认作业的已消费位点获取到作业的已消费位点后,以参考已消费位点重新启动作业。

以MySQL为例,通过查看日志的binlog offset,获取已消费位点为 ts_sec=1753757800=2025-07-29 10:56:40

图1 查看日志
图2 已消费位点

重新启动作业,为了保证数据完整性,建议用户根据已消费位点时间再提前5-10min启动作业,以上例子中建议作业启动时间配置为2025-07-29 10:50:00

图3 重启作业

图4 配置启动时间

相关文档