PostgreSQL实战之启动恢复读取checkpoint记录失败的条件详解
2、如果读取失败,slave直接abort退出,master再次读取ControlFile- prevCheckPoint指向的checkpoint
StartupXLOG-
| checkPointLoc = ControlFile- checkPoint;
| record = ReadCheckpointRecord(xlogreader, checkPointLoc, 1, true):
| if (record != NULL){
}else if (StandbyMode){
ereport(PANIC,(errmsg( could not locate a valid checkpoint record )));
}else{
checkPointLoc = ControlFile- prevCheckPoint;
record = ReadCheckpointRecord(xlogreader, checkPointLoc, 2, true);
if (record != NULL){
InRecovery = true;//标记下面进入recovery
}else{
ereport(PANIC,(errmsg( could not locate a valid checkpoint record )));
}
}
一、那么什么条件下读取的checkpoint记录record==NULL
1、ControlFile- checkPoint % XLOG_BLCKSZ SizeOfXLogShortPHD
2、ReadRecord(xlogreader, ControlFile- checkPoint, LOG, true)返回NULL
3、ReadRecord读到的record!=NULL record- xl_rmid != RM_XLOG_ID
4、ReadRecord读到的record!=NULL info != XLOG_CHECKPOINT_SHUTDOWN info != XLOG_CHECKPOINT_ONLINE
5、ReadRecord读到的record!=NULL record- xl_tot_len != SizeOfXLogRecord + SizeOfXLogRecordDataHeaderShort + sizeof(CheckPoint)
二、ReadRecord函数返回NULL的条件
ReadRecord(xlogreader, ControlFile- checkPoint, LOG, true)
| record = XLogReadRecord(xlogreader, ControlFile- checkPoint, errormsg);
| 2.1 record==NULL !StandbyMode
| 2.2 record!=NULL !tliInHistory(xlogreader- latestPageTLI, expectedTLEs)
/*
note:只要读取了一页xlog,就会赋值为该页第一个记录的时间线
XLogReaderValidatePageHeader
xlogreader- latestPageTLI=hdr- xlp_tli;
*/
三、XlogReadRecord读取checkpoint返回NULL的条件?
XLogReadRecord(xlogreader, ControlFile- checkPoint, errormsg)
targetPagePtr = ControlFile- checkPoint (ControlFile- checkPoint % XLOG_BLCKSZ);
targetRecOff = ControlFile- checkPoint % XLOG_BLCKSZ;
readOff = ReadPageInternal(state,targetPagePtr, Min(targetRecOff + SizeOfXLogRecord, XLOG_BLCKSZ));
pageHeaderSize = XLogPageHeaderSize((XLogPageHeader) state- readBuf);
record = (XLogRecord *) (state- readBuf + RecPtr % XLOG_BLCKSZ);
total_len = record- xl_tot_len;
-
1、readOff 0
2、0 targetRecOff pageHeaderSize
3、(((XLogPageHeader) state- readBuf)- xlp_info XLP_FIRST_IS_CONTRECORD) targetRecOff == pageHeaderSize
page头有跨页的record并且checkpoint定位的偏移正好在页头尾部
4、targetRecOff = XLOG_BLCKSZ SizeOfXLogRecord
!ValidXLogRecordHeader(state, ControlFile- checkPoint, state- ReadRecPtr, record,randAccess)
(record- xl_tot_len SizeOfXLogRecord || record- xl_rmid RM_MAX_ID || record- xl_prev != state- ReadRecPtr)
5、targetRecOff XLOG_BLCKSZ SizeOfXLogRecord total_len SizeOfXLogRecord
6、total_len state- readRecordBufSize !allocate_recordbuf(state, total_len)
一旦该记录损坏,total_len的长度非常大的话,就需要allocate_recordbuf扩展state- readbuf,可能因此分配失败abort
记录的checksum需要等待全部读取完整记录后才校验
-
三、ReadPageInternal返回的readOff返回小于0的条件
ReadPageInternal(state,targetPagePtr, Min(targetRecOff + SizeOfXLogRecord, XLOG_BLCKSZ))
1、第一次read wal文件,readLen = state- read_page:读取第一页。readLen 0
2、readLen 0 !XLogReaderValidatePageHeader(state, targetSegmentPtr, state- readBuf)
3、读取checkpoint所在页readLen = state- read_page: readLen 0
4、readLen 0 readLen = SizeOfXLogShortPHD
5、!XLogReaderValidatePageHeader(state, pageptr, (char *) hdr)
四、XLogPageRead何时返回值 0
/*
1、WaitForWALToBecomeAvailable open失败
2、lseek 失败 !StandbyMode
3、read失败 !StandbyMode
4、校验page头失败 !StandbyMode
如果是StandbyMode,则会重新retry- WaitForWALToBecomeAvailable,切换日志源进行open
*/
!WaitForWALToBecomeAvailable(targetPagePtr + reqLen,private- randAccess,1,targetRecPtr)//open
| return -1
readOff = targetPageOff;
if (lseek(readFile, (off_t) readOff, SEEK_SET) 0){
!StandbyMode:: return -1
}
if (read(readFile, readBuf, XLOG_BLCKSZ) != XLOG_BLCKSZ){
!StandbyMode:: return -1
}
XLogReaderValidatePageHeader(xlogreader, targetPagePtr, readBuf)
!StandbyMode:: return -1
五、WaitForWALToBecomeAvailable何时返回false?
XLOG_FROM_ARCHIVE | XLOG_FROM_PG_WAL
1、先XLogFileReadAnyTLI open日志:
1、遍历时间线列表里的每一个时间线,从最新的开始
2、当读取checkpoint的时候,source是XLOG_FROM_ANY
3、先找归档的日志进行open;如果open失败再找WAL日志进行open
4、如果都没有open成功,则向前找时间线,open前一个时间线segno和文件号相同的文件进行open
5、open成功后expectedTLEs被赋值为当前时间线列表的所有值
2、如果open失败,则切换日志源:XLOG_FROM_ARCHIVE | XLOG_FROM_PG_WAL - XLOG_FROM_STREAM
3、切换日志源后,XLOG_FROM_ARCHIVE | XLOG_FROM_PG_WAL 则:
slave promote :return false
!StandbyMode:return false
XLOG_FROM_STREAM
1、!WalRcvStreaming()即receiver进程挂了,切换日志源
2、CheckForStandbyTrigger()切换日志源
3、XLOG_FROM_STREAM- XLOG_FROM_ARCHIVE
本篇文章到此结束,如果您有相关技术方面疑问可以联系我们技术人员远程解决,感谢大家支持本站!
我想要获取技术服务或软件
服务范围:MySQL、ORACLE、SQLSERVER、MongoDB、PostgreSQL 、程序问题
服务方式:远程服务、电话支持、现场服务,沟通指定方式服务
技术标签:数据恢复、安装配置、数据迁移、集群容灾、异常处理、其它问题
本站部分文章参考或来源于网络,如有侵权请联系站长。
数据库远程运维 PostgreSQL实战之启动恢复读取checkpoint记录失败的条件详解
相关文章
- Postgresql源码(73)两阶段事务PrepareTransaction事务如何与会话解绑(上)
- PostgresqlIO 对于PG的 过去,现在 , 未来 (1 过去和我们曾经解决的问题)
- 深入浅出PostgreSQL性能调优
- 详解提升PostgreSQL批量导数据入性能的多种方法
- PostgreSQL数据库开发基础 之 单引号与双引号用法详解
- PostgreSQL中的collations用法详解
- Postgresql的pl/pgql使用操作–将多条执行语句作为一个事务
- PostgreSQL数据库中跨库访问解决方案
- PostgreSQL教程(十三):数据库管理详解
- PostgreSQL 23000: integrity_constraint_violation 报错 故障修复 远程处理
- PostgreSQL 42712: duplicate_alias 报错 故障修复 远程处理
- RedHat Linux上安装PostgreSQL详解数据库
- PostgreSQL语法结构详解数据库
- PostgreSQL更新和删除详解数据库
- PostgreSQL连接python,postgresql在python 连接,创建表,创建表内容,插入操作,选择操作,更新操作,删除操作。详解数据库
- 给PostgreSQL添加MySQL的unix_timestamp与from_unixtime函数详解数据库
- Postgresql数据迁移:简单、高效、可靠(postgresql迁移)
- 安装PostgreSQL 极速上手(postgresql安装)
- PostgreSQL简介:开源关系型数据库系统(postgresql简介)
- 如何简单快速地安装PostgreSQL在Linux系统上(linux安装postgresql)
- postgresqlOracle vs PostgreSQL两种不同的数据库引擎(oracle中不像)
- 2017数据库大趋势 PostgreSQL最受关注