1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
| /**
* 事务隔离级别管理器
* 根据不同隔离级别实现相应的并发控制策略
*/
class Isolation_level_manager {
public:
/**
* 根据隔离级别执行一致性读取
* 这是不同隔离级别差异化处理的核心函数
* @param trx 事务对象
* @param index 索引对象
* @param tuple 搜索条件
* @param mode 搜索模式
* @param cursor B+树游标
* @param mtr 迷你事务
* @return 数据库错误码
*/
static dberr_t consistent_read(trx_t *trx, dict_index_t *index,
const dtuple_t *tuple, page_cur_mode_t mode,
btr_cur_t *cursor, mtr_t *mtr) {
switch (trx->isolation_level) {
case TRX_ISO_READ_UNCOMMITTED:
return read_uncommitted_impl(trx, index, tuple, mode, cursor, mtr);
case TRX_ISO_READ_COMMITTED:
return read_committed_impl(trx, index, tuple, mode, cursor, mtr);
case TRX_ISO_REPEATABLE_READ:
return repeatable_read_impl(trx, index, tuple, mode, cursor, mtr);
case TRX_ISO_SERIALIZABLE:
return serializable_impl(trx, index, tuple, mode, cursor, mtr);
default:
ut_error; // 无效的隔离级别
return DB_ERROR;
}
}
private:
/**
* READ UNCOMMITTED实现:脏读
* 直接读取最新版本,不进行任何可见性检查
*/
static dberr_t read_uncommitted_impl(trx_t *trx, dict_index_t *index,
const dtuple_t *tuple, page_cur_mode_t mode,
btr_cur_t *cursor, mtr_t *mtr) {
// 直接进行B+树搜索,不创建ReadView
dberr_t err = btr_cur_search_to_nth_level(index, 0, tuple, mode,
BTR_SEARCH_LEAF, cursor,
0, __FILE__, __LINE__, mtr);
LogDebug(TRX_LOG, "READ UNCOMMITTED: trx %lu read latest version directly",
trx->id);
return err;
}
/**
* READ COMMITTED实现:语句级快照
* 每个语句开始时创建新的ReadView
*/
static dberr_t read_committed_impl(trx_t *trx, dict_index_t *index,
const dtuple_t *tuple, page_cur_mode_t mode,
btr_cur_t *cursor, mtr_t *mtr) {
// 1. 为当前语句创建新的ReadView
ReadView *stmt_read_view = nullptr;
trx_sys->mvcc->view_open(stmt_read_view, trx);
// 2. 执行B+树搜索
dberr_t err = btr_cur_search_to_nth_level(index, 0, tuple, mode,
BTR_SEARCH_LEAF, cursor,
0, __FILE__, __LINE__, mtr);
if (err != DB_SUCCESS) {
trx_sys->mvcc->view_close(stmt_read_view, false);
return err;
}
// 3. 使用新ReadView进行可见性检查
const rec_t *rec = btr_cur_get_rec(cursor);
if (!stmt_read_view->is_record_visible(rec, index, heap_no)) {
// 记录不可见,需要查找历史版本
const rec_t *old_vers = trx->get_visible_version(rec, index, offsets,
stmt_read_view, mtr);
if (old_vers != nullptr) {
// 找到可见版本,更新游标位置
btr_cur_position(old_vers, cursor);
} else {
err = DB_RECORD_NOT_FOUND;
}
}
// 4. 关闭语句级ReadView
trx_sys->mvcc->view_close(stmt_read_view, false);
LogDebug(TRX_LOG, "READ COMMITTED: trx %lu created statement-level ReadView",
trx->id);
return err;
}
/**
* REPEATABLE READ实现:事务级快照
* 使用事务开始时创建的ReadView
*/
static dberr_t repeatable_read_impl(trx_t *trx, dict_index_t *index,
const dtuple_t *tuple, page_cur_mode_t mode,
btr_cur_t *cursor, mtr_t *mtr) {
// 1. 确保存在事务级ReadView
if (trx->read_view == nullptr) {
trx_sys->mvcc->view_open(trx->read_view, trx);
}
// 2. 执行B+树搜索
dberr_t err = btr_cur_search_to_nth_level(index, 0, tuple, mode,
BTR_SEARCH_LEAF, cursor,
0, __FILE__, __LINE__, mtr);
if (err != DB_SUCCESS) {
return err;
}
// 3. 使用事务级ReadView进行可见性检查
const rec_t *rec = btr_cur_get_rec(cursor);
if (!trx->read_view->is_record_visible(rec, index, heap_no)) {
// 查找历史版本
const rec_t *old_vers = trx->get_visible_version(rec, index, offsets,
trx->read_view, mtr);
if (old_vers != nullptr) {
btr_cur_position(old_vers, cursor);
} else {
err = DB_RECORD_NOT_FOUND;
}
}
LogDebug(TRX_LOG, "REPEATABLE READ: trx %lu used transaction-level ReadView",
trx->id);
return err;
}
/**
* SERIALIZABLE实现:串行化读取
* 在REPEATABLE READ基础上增加读锁
*/
static dberr_t serializable_impl(trx_t *trx, dict_index_t *index,
const dtuple_t *tuple, page_cur_mode_t mode,
btr_cur_t *cursor, mtr_t *mtr) {
// 1. 首先执行可重复读逻辑
dberr_t err = repeatable_read_impl(trx, index, tuple, mode, cursor, mtr);
if (err != DB_SUCCESS) {
return err;
}
// 2. 对读取的记录加共享锁(防止幻读)
const rec_t *rec = btr_cur_get_rec(cursor);
buf_block_t *block = btr_cur_get_block(cursor);
ulint heap_no = page_rec_get_heap_no(rec);
err = lock_clust_rec_read_check_and_lock(0, block, rec, index,
LOCK_S, LOCK_ORDINARY, trx);
if (err != DB_SUCCESS) {
LogErr(ERROR_LEVEL, ER_LOCK_WAIT_TIMEOUT);
return err;
}
// 3. 对间隙也加锁(防止插入新记录)
err = lock_rec_insert_check_and_lock(0, rec, block, index,
trx, nullptr);
LogDebug(TRX_LOG, "SERIALIZABLE: trx %lu acquired shared locks for serializable read",
trx->id);
return err;
}
};
/**
* 事务管理器:统一管理所有事务的生命周期
* 参考《MySQL事务系统架构解析》
*/
class Transaction_manager {
private:
// 全局事务系统
static trx_sys_t *global_trx_sys;
// 事务对象池
static Object_pool<trx_t> trx_pool;
// 统计信息
static std::atomic<ulint> active_trx_count;
static std::atomic<ulint> committed_trx_count;
static std::atomic<ulint> rolled_back_trx_count;
public:
/**
* 初始化事务管理器
*/
static void init() {
// 初始化全局事务系统
global_trx_sys = UT_NEW_NOKEY(trx_sys_t());
// 初始化事务对象池
trx_pool.init(1000); // 预分配1000个事务对象
// 重置统计信息
active_trx_count.store(0);
committed_trx_count.store(0);
rolled_back_trx_count.store(0);
LogInfo(SYSTEM_LOG, "Transaction manager initialized");
}
/**
* 创建新事务
* @param mysql_thd MySQL线程句柄
* @param read_write 是否为读写事务
* @return 新创建的事务对象
*/
static trx_t* create_transaction(THD *mysql_thd, bool read_write) {
// 1. 从对象池获取事务对象
trx_t *trx = trx_pool.get();
if (trx == nullptr) {
trx = UT_NEW_NOKEY(trx_t());
}
// 2. 初始化事务对象
init_transaction_object(trx, mysql_thd);
// 3. 启动事务
trx->start(read_write);
// 4. 更新统计信息
active_trx_count.fetch_add(1);
LogDebug(TRX_LOG, "Created %s transaction %lu for thread %lu",
read_write ? "read-write" : "read-only",
trx->id, mysql_thd ? mysql_thd->thread_id() : 0);
return trx;
}
/**
* 销毁事务对象
* @param trx 要销毁的事务
*/
static void destroy_transaction(trx_t *trx) {
LogDebug(TRX_LOG, "Destroying transaction %lu", trx->id);
// 1. 确保事务已结束
ut_ad(trx->state == TRX_STATE_COMMITTED_IN_MEMORY ||
trx->state == TRX_STATE_ABORTED);
// 2. 清理事务资源
cleanup_transaction_resources(trx);
// 3. 返回对象池或删除
if (trx_pool.size() < trx_pool.max_size()) {
trx_pool.put(trx);
} else {
UT_DELETE(trx);
}
// 4. 更新统计信息
active_trx_count.fetch_sub(1);
}
/**
* 执行事务自动提交
* @param trx 事务对象
* @return 操作结果
*/
static dberr_t auto_commit_transaction(trx_t *trx) {
if (!trx->auto_commit) {
return DB_SUCCESS; // 非自动提交事务
}
LogDebug(TRX_LOG, "Auto-committing transaction %lu", trx->id);
trx->commit();
committed_trx_count.fetch_add(1);
return DB_SUCCESS;
}
/**
* 检查并处理长时间运行的事务
* @param max_runtime 最大运行时间(秒)
* @return 处理的事务数量
*/
static ulint check_long_running_transactions(time_t max_runtime) {
ulint processed = 0;
time_t current_time = time(nullptr);
trx_sys_mutex_enter();
trx_t *trx = UT_LIST_GET_FIRST(trx_sys->rw_trx_list);
while (trx != nullptr) {
trx_t *next_trx = UT_LIST_GET_NEXT(trx_list, trx);
if (current_time - trx->start_time > max_runtime) {
LogWarning(TRX_LOG, "Long-running transaction detected: %lu (runtime=%ld seconds)",
trx->id, current_time - trx->start_time);
// 可以在这里实现自动回滚或告警逻辑
processed++;
}
trx = next_trx;
}
trx_sys_mutex_exit();
return processed;
}
/**
* 获取事务统计信息
* @return 统计信息结构
*/
static transaction_statistics get_statistics() {
transaction_statistics stats;
stats.active_transactions = active_trx_count.load();
stats.committed_transactions = committed_trx_count.load();
stats.rolled_back_transactions = rolled_back_trx_count.load();
// 获取ReadView统计
stats.active_read_views = trx_sys->mvcc->size();
// 获取锁统计
stats.lock_waits = lock_sys->n_lock_waits;
stats.deadlocks = lock_sys->n_deadlocks;
return stats;
}
private:
/**
* 初始化事务对象
*/
static void init_transaction_object(trx_t *trx, THD *mysql_thd) {
// 重置事务状态
memset(trx, 0, sizeof(trx_t));
// 设置MySQL集成信息
trx->mysql_thd = mysql_thd;
if (mysql_thd != nullptr) {
// 从MySQL会话获取隔离级别
trx->isolation_level = static_cast<trx_isolation_level_t>(
thd_get_trx_isolation(mysql_thd));
// 设置自动提交标志
trx->auto_commit = thd_test_options(mysql_thd, OPTION_AUTOCOMMIT);
// 设置约束检查标志
trx->check_foreigns = thd_test_options(mysql_thd, OPTION_NO_FOREIGN_KEY_CHECKS) == 0;
trx->check_unique_secondary = thd_test_options(mysql_thd, OPTION_RELAXED_UNIQUE_CHECKS) == 0;
} else {
// 后台事务默认配置
trx->isolation_level = TRX_ISO_REPEATABLE_READ;
trx->auto_commit = false;
trx->check_foreigns = true;
trx->check_unique_secondary = true;
}
// 初始化链表节点
UT_LIST_NODE_INIT(trx->trx_list, trx);
UT_LIST_NODE_INIT(trx->mysql_trx_list, trx);
UT_LIST_NODE_INIT(trx->read_only_trx_list, trx);
}
/**
* 清理事务资源
*/
static void cleanup_transaction_resources(trx_t *trx) {
// 清理锁相关资源
if (trx->lock.lock_heap != nullptr) {
mem_heap_free(trx->lock.lock_heap);
trx->lock.lock_heap = nullptr;
}
// 清理undo段
if (trx->insert_undo != nullptr) {
trx_undo_insert_cleanup(trx);
trx->insert_undo = nullptr;
}
if (trx->update_undo != nullptr) {
trx_undo_update_cleanup(trx);
trx->update_undo = nullptr;
}
// 清理ReadView
if (trx->read_view != nullptr) {
trx_sys->mvcc->view_close(trx->read_view, false);
trx->read_view = nullptr;
}
// 重置MySQL集成信息
trx->mysql_thd = nullptr;
trx->mysql_log_file_name = nullptr;
trx->mysql_log_offset = 0;
}
};
|