您现在的位置是：首页 > 数据库

当前栏目

Postgresql在SyncOneBuffer时，为什么可以不加锁判断页面是否为脏（race condition第三篇）

postgresql 判断为什么页面是否可以加锁 condition

2023-06-13 09:11:01 时间

1 问题定义

在SyncOneBuffer拿到一个脏页时，决定是否需要刷脏需要拿到desc中的标志位来判断。
这里取标志位时没有加content lock，那么如果这里刚刚检查完不需要flush，马上并发一个写入把页面标记为脏了怎么办，会不会丢数据？

static int
SyncOneBuffer(int buf_id, bool skip_recently_used, WritebackContext *wb_context)
{
	BufferDesc *bufHdr = GetBufferDescriptor(buf_id);
	int			result = 0;
	uint32		buf_state;
	BufferTag	tag;

	ReservePrivateRefCountEntry();

	/*
	 * Check whether buffer needs writing.
	 *
	 * We can make this check without taking the buffer content lock so long
	 * as we mark pages dirty in access methods *before* logging changes with
	 * XLogInsert(): if someone marks the buffer dirty just after our check we
	 * don't worry because our checkpoint.redo points before log record for
	 * upcoming changes and so we are not required to write such dirty buffer.
	 */
	buf_state = LockBufHdr(bufHdr);

	if (BUF_STATE_GET_REFCOUNT(buf_state) == 0 &&
		BUF_STATE_GET_USAGECOUNT(buf_state) == 0)
	{
		result |= BUF_REUSABLE;
	}
	else if (skip_recently_used)
	{
		/* Caller told us not to write recently-used buffers */
		UnlockBufHdr(bufHdr, buf_state);
		return result;
	}

	if (!(buf_state & BM_VALID) || !(buf_state & BM_DIRTY))
	{
		/* It's clean, so nothing to do */
		UnlockBufHdr(bufHdr, buf_state);
		return result;
	}

	/*
	 * Pin it, share-lock it, write it.  (FlushBuffer will do nothing if the
	 * buffer is clean by the time we've locked it.)
	 */
	PinBuffer_Locked(bufHdr);
	LWLockAcquire(BufferDescriptorGetContentLock(bufHdr), LW_SHARED);

	FlushBuffer(bufHdr, NULL);

	LWLockRelease(BufferDescriptorGetContentLock(bufHdr));

	tag = bufHdr->tag;

	UnpinBuffer(bufHdr, true);

	ScheduleBufferTagForWriteback(wb_context, &tag);

	return result | BUF_WRITTEN;
}

2 场景举例

正常场景：heap_insert中先标记buffer为脏，后写insert的XLOG。

buffer标记脏在写xlog前，那么如果checkpoint在sync时没发现buffer为脏：

那么一定可以得出结论：insert的xlog还没写。
进一步可以得出结论：checkpoint的redo稳点一定在insert xlog位点之前。
进一步：这次检查点的redo位点包含这次插入的xlog。

错误场景：heap_insert中先写insert的XLOG，后标记buffer为脏。

buffer标记脏在写xlog后，那么如果checkpoint在sync时没发现buffer为脏：

存在可能性：插入的xlog已经在很早前就写了，但是一直没有标记。checkpoint的刷脏环节漏掉了这个buffer。
所以：redo位点在插入的xlog位点后，redo位点无法覆盖这次插入。
结论：这个检查点存在问题，如果按这个检查点恢复，redo位点后都做完了，也没有做到刚才insert的xlog；并且数据也没有sync到磁盘上，这个insert的数据彻底丢失了！

猜你喜欢

关于代码的那些事
MySQL Error number: MY-012182; Symbol: ER_IB_MSG_357; SQLSTATE: HY000 报错故障修复远程处理
Netty 实现长连接服务的难点和优化点
却没有日志文件Oracle数据文件孤立：缺乏日志文件（oracle只有数据文件）
处理空值：Oracle中IS NULL函数（oracle判断为空函数）
技术使用Linux DDNS技术轻松实现远程访问（linuxddns）
Linux 视频播放全攻略：25个常用命令汇总（linux播放视频命令）
ORA-31036: XSL processing context initialization failed ORACLE 报错故障修复远程处理
31省区市新增本土确诊81例河南新增本土确诊24例：切记戴好口罩
【CompletableFuture】CompletableFuture中join()和get()方法的区别
php数组函数序列之each()-获取数组当前内部指针所指向元素的键名和键值，并将指针移到下一位
HBase-1.2.1之Get操作源码学习详解大数据
MySQL中的簇索引：全面解析（mysql簇索引）
Linux下部署ArcGIS的最佳实践（linuxarcgis）
软件测试流程及主要用例设计方法[通俗易懂]
玩转Linux：WDT的极致体验（linuxwdt）
利用 Oracle 数据库给游标赋值（oracle给游标赋值）
intro.js页面引导简单用法分享
密码Linux下创建Root账号密码（linux创建root）