问题描述
20231127上午客户反馈绩效系统20231125、20231126出现2次YAS-02020 snapshot too old的问题,测试也有类似问题。
该过程是客户新增的存储过程,目的是通过PRO_RUN_JOB作为主控,调度其他存储过程,后续不用其他调度引擎。
原因分析
错误信息收集分析
分析存储过程报错日志,核查UNDO_RETENTION、undo表空间
看了相应的优化建议,可以增大参数UNDO_RETENTION的值,或者使用更大的undo表空间。
客户环境目前UNDO_RETENTION配置了600,该参数单位是秒。临时修改客户测试环境的配置为3000,试图规避问题。
正常理解,MVCC用于高并发的情形,会出现该错误,而该存储过程执行是串行的,不符合预期!需要继续分析。
UNDO、MVCC机制分析
了解背后机制,snapshot too old是由于db需要做多版本控制(mvcc),在数据commit之后,仍然会保留undo一段时间,在超过这段时间之后undo的空间会被复用,如果需要还原的数据超过了这个时间,则还原不了,触发该错误。
崖山db快照隔离级别的核心就是MVCC(Multi-Version Concurrency Control),多版本并发控制
快照本质上就是一个时间点。记录版本的时间点为事务提交的时间点。
可见性可分为2类情况:
1、事务内的语句可见性