MySQL系列之源码浅析

  • Post author:
  • Post category:mysql


源码才是王道。

真正的高手从来不是临场发挥,随机应变是外人看来的错觉。

1. 主函数sql/mysqld.cc中,代码如下:

int main(int argc, char **argv) //标准入口函数
{
    MY_INIT(argv[0]);//调用mysys/My_init.c->my_init(),初始化mysql内部的系统库
    logger.init_base(); //初始化日志功能
    init_common_variables(MYSQL_CONFIG_NAME,argc, argv, load_default_groups) //调用load_defaults(conf_file_name, groups, &argc, &argv),读取配置信息
    user_info = check_user(mysqld_user);//检测启动时的用户选项
    set_user(mysqld_user, user_info);//设置以该用户运行
    init_server_components();//初始化内部的一些组件,如table_cache, query_cache等。
    network_init();//初始化网络模块,创建socket监听
    start_signal_handler();// 创建pid文件
    mysql_rm_tmp_tables() || acl_init(opt_noacl)//删除tmp_table并初始化数据库级别的权限。
    init_status_vars(); // 初始化mysql中的status变量
    start_handle_manager();//创建manager线程
    handle_connections_sockets();//主要处理函数,处理新的连接并创建新的线程处理
}

2.监听连接: sql/mysqld.cc – handle_connections_sockets:

pthread_handler_t handle_connections_sockets(void *arg __attribute__((unused))) {
    FD_SET(unix_sock,&clientFDs); // unix_socket在network_init中被打开
    while (!abort_loop) { // abort_loop是全局变量,在某些情况下被置为1表示要退出。
        readFDs=clientFDs; // 需要监听的socket
        select((int) max_used_connection,&readFDs,0,0,0); // select异步(?科学家解释下是同步还是异步)监听,当接收到??以后返回。
        new_sock = accept(sock, my_reinterpret_cast(struct sockaddr *) (&cAddr),   &length); // 接受请求
        thd= new THD; // 创建mysqld任务线程描述符,它封装了一个客户端连接请求的所有信息
        vio_tmp=vio_new(new_sock, VIO_TYPE_SOCKET, VIO_LOCALHOST); // 网络操作抽象层
        my_net_init(&thd->net,vio_tmp)); // 初始化任务线程描述符的网络操作
        create_new_thread(thd); // 创建任务线程
    }
}

3. 创建连接 sql/mysqld.cc create_new_thread/create_thread_to_handle_connection:

static void create_new_thread(THD *thd) {
    NET *net=&thd->net;
    if (connection_count >= max_connections + 1 || abort_loop) { // 看看当前连接数是不是超过了系统配置允许的最大值,如果是就断开连接。
        close_connection(thd, ER_CON_COUNT_ERROR, 1);
        delete thd;
    }
    ++connection_count;
    thread_scheduler.add_connection(thd); // 将新连接加入到thread_scheduler的连接队列中。
}

4. 线程调度器thread_scheduler – create_thread_to_handle_connection

void create_thread_to_handle_connection(THD *thd) {
    if (cached_thread_count > wake_thread) { //看当前工作线程缓存(thread_cache)中有否空余的线程
      thread_cache.append(thd);
      pthread_cond_signal(&COND_thread_cache); // 有的话则唤醒一个线程来用
   } else {
      threads.append(thd);
      pthread_create(&thd->real_id,&connection_attrib,   handle_one_connection,   (void*) thd))); //没有可用空闲线程则创建一个新的线程
   }
}

5.handle_one_connection

pthread_handler_t handle_one_connection(void *arg) {
    thread_scheduler.init_new_connection_thread(); // 初始化线程预处理操作
    setup_connection_thread_globals(thd); //载入一些Session级变量
    for (;;) { 
        lex_start(thd); //初始化LEX词法解析器
        login_connection(thd); // 进行连接身份验证
        prepare_new_connection_state(thd); // 初始化线程Status,即show status看到的
        do_command(thd); // 处理命令
        end_connection(thd); //没事做了关闭连接,丢入线程池
    }
}

6.执行语句 sql/sql_parse.cc – do_command函数

bool do_command(THD *thd) {
    NET *net= &thd->net;
    packet_length = my_net_read(net);
    packet = (char*) net->read_pos;
    command = (enum enum_server_command) (uchar) packet[0]; // 解析客户端传过来的命令类型
    dispatch_command(command, thd, packet+1, (uint) (packet_length-1));
}

7.指令分发 sql/sql_parse.cc定义dispatch_command

bool dispatch_command(enum enum_server_command command, THD *thd, char* packet, uint packet_length) {
    NET *net = &thd->net;
    thd->command = command; 
    switch (command) { //判断命令类型
        case COM_INIT_DB: ...;
        case COM_TABLE_DUMP: ...;
        case COM_CHANGE_USER: ...;
        ...
        case COM_QUERY: //如果是Query
            alloc_query(thd, packet, packet_length); //从网络数据包中读取Query并存入thd->query
            mysql_parse(thd, thd->query, thd->query_length, &end_of_stmt); //送去解析
    }
}

8.sql/sql_parse.cc mysql_parse函数负责解析SQL

void mysql_parse(THD *thd, const char *inBuf, uint length, const char ** found_semicolon) {
    lex_start(thd); //初始化线程解析描述符
    if (query_cache_send_result_to_client(thd, (char*) inBuf, length) <= 0) { // 看query cache中有否命中,有就直接返回结果,否则进行查找
        Parser_state parser_state(thd, inBuf, length);   
        parse_sql(thd, & parser_state, NULL); // 解析SQL语句
        mysql_execute_command(thd); // 执行
    }
}

9.执行命令 mysql_execute_command

int mysql_execute_command(THD *thd) {
    LEX  *lex= thd->lex;  // 解析过后的SQL语句的语法结构
    TABLE_LIST *all_tables = lex->query_tables;   // 该语句要访问的表的列表
    switch (lex->sql_command) {
        ...
        case SQLCOM_INSERT:
            insert_precheck(thd, all_tables);
            mysql_insert(thd, all_tables, lex->field_list, lex->many_values, lex->update_list, lex->value_list, lex->duplicates, lex->ignore);
            break; ... 
        case SQLCOM_SELECT:
            check_table_access(thd, lex->exchange ? SELECT_ACL | FILE_ACL :  SELECT_ACL,  all_tables, UINT_MAX, FALSE);    // 检查用户对数据表的访问权限
            execute_sqlcom_select(thd, all_tables);     // 执行select语句
            break;
    }
}

10.接下来sql/sql_insert.cc中mysql_insert函数

bool mysql_insert(THD *thd,
                   TABLE_LIST *table_list,      // 该INSERT要用到的表
                   List<Item> &fields,             // 使用的项
                   ....) {
    open_and_lock_tables(thd, table_list); // 这里的锁只是防止表结构修改
    mysql_prepare_insert(...);
    foreach value in values_list {
        write_record(...);
    }
} //里面还有trigger,错误,view之类的杂七杂八的东西,我们都忽略

11.接着看真正写数据的函数write_record (在sql/sql_insert.cc),精简代码如下:

int write_record(THD *thd, TABLE *table,COPY_INFO *info) {  // 写数据记录
    if (info->handle_duplicates == DUP_REPLACE || info->handle_duplicates == DUP_UPDATE) { //如果是REPLACEUPDATE则替换数据
        table->file->ha_write_row(table->record[0]);
        table->file->ha_update_row(table->record[1], table->record[0]));
    } else {
        table->file->ha_write_row(table->record[0]);
    }
}

int handler::ha_write_row(uchar *buf) { //这是啥? Handler API !
    write_row(buf);   // 调用具体的实现
    binlog_log_row(table, 0, buf, log_func));  // 写binlog
}

请求数据流



这里写图片描述



版权声明:本文为u013291818原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。