CreateDatabase API执行流程_milvus源码解析

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介: CreateDatabase API执行流程_milvus源码解析

CreateDatabase API执行流程源码解析

整体架构:

architecture.png

CreateDatabase 的数据流向:

create_database数据流向.jpg

1.客户端sdk发出CreateDatabase API请求。

from pymilvus import (
    connections,
    db,
)

_HOST = '192.168.230.71'
_PORT = '19530'

def connect_to_milvus(db_name="default"):
    print("connect to milvus")
    connections.connect(host=_HOST,
                        port=_PORT,
                        db_name=db_name,
                        )


if __name__ == '__main__':
    connect_to_milvus(db_name="default")

    if "db1" not in db.list_database():
        print("create database: db1")
        db.create_database(db_name="db1")

    print("list databases:")
    print(db.list_database())

客户端SDK向proxy发送一个CreateDatabase API请求,创建一个名为db1的数据库。

2.客户端接受API请求,将request封装为createDatabaseTask,并压入ddQueue队列。

代码路径:internal\proxy\impl.go

func (node *Proxy) CreateDatabase(ctx context.Context, request *milvuspb.CreateDatabaseRequest) (*commonpb.Status, error) {
   
   
    ......
    // request封装为task
    cct := &createDatabaseTask{
   
   
        ctx:                   ctx,
        Condition:             NewTaskCondition(ctx),
        CreateDatabaseRequest: request,
        rootCoord:             node.rootCoord,
        replicateMsgStream:    node.replicateMsgStream,
    }
    ......
    // 将task压入ddQueue队列
    if err := node.sched.ddQueue.Enqueue(cct); err != nil {
   
   

    }
    ......
    // 等待cct执行完
    if err := cct.WaitToFinish(); err != nil {
   
   

    }
}

3.执行createDatabaseTask的3个方法PreExecute、Execute、PostExecute。

PreExecute()一般为参数校验等工作。

Execute()一般为真正执行逻辑。

代码路径:internal\proxy\task_database.go

func (cdt *createDatabaseTask) Execute(ctx context.Context) error {
   
   
    var err error
    cdt.result, err = cdt.rootCoord.CreateDatabase(ctx, cdt.CreateDatabaseRequest)
    if cdt.result != nil && cdt.result.ErrorCode == commonpb.ErrorCode_Success {
   
   
        SendReplicateMessagePack(ctx, cdt.replicateMsgStream, cdt.CreateDatabaseRequest)
    }
    return err
}

从代码可以看出调用了rootCoord的CreateDatabase接口。

4.进入rootCoord的CreateDatabase接口。

代码路径:internal\rootcoord\root_coord.go

继续将请求封装为rootcoord里的createDatabaseTask

func (c *Core) CreateDatabase(ctx context.Context, in *milvuspb.CreateDatabaseRequest) (*commonpb.Status, error) {
   
   
    ......
    // 封装为createDatabaseTask
    t := &createDatabaseTask{
   
   
        baseTask: newBaseTask(ctx, c),
        Req:      in,
    }
    // 加入调度
    if err := c.scheduler.AddTask(t); err != nil {
   
   
        ......
    }
    // 等待task完成
    if err := t.WaitToFinish(); err != nil {
   
   
        ......
    }

    ......
}

5.执行createDatabaseTask的Prepare、Execute、NotifyDone方法。

Execute()为核心方法。

代码路径:internal\rootcoord\create_db_task.go

func (t *createDatabaseTask) Execute(ctx context.Context) error {
   
   
    db := model.NewDatabase(t.dbID, t.Req.GetDbName(), etcdpb.DatabaseState_DatabaseCreated)
    return t.core.meta.CreateDatabase(ctx, db, t.GetTs())
}

在这里重点研究t.core.meta.CreateDatabase()这个方法做了什么事情。

调用栈如下:

t.core.meta.CreateDatabase()(internal\rootcoord\create_db_task.go)
  |--mt.createDatabasePrivate()(internal\rootcoord\meta_table.go)
    |--mt.catalog.CreateDatabase()(同上)
      |--kc.Snapshot.Save()(internal\metastore\kv\rootcoord\kv_catalog.go)
        |--ss.MetaKv.MultiSave()(internal\metastore\kv\rootcoord\suffix_snapshot.go)
          |--kv.executeTxn()(internal\kv\etcd\etcd_kv.go)
            |--txn.Then(ops...).Commit()(使用clientv3操作etcd)

create_database堆栈.jpg

在etcd会产生2个key。

==by-dev/meta/root-coord/database/db-info/445629732221365773==

==by-dev/meta/snapshots/root-coord/database/db-info/445629732221365773_ts445630347829575684==

value的值的结构为etcdpb.DatabaseInfo,然后进行protobuf序列化后存入etcd。

因此etcd存储的是二进制数据。

&pb.DatabaseInfo{
   
   
    TenantId:    db.TenantID,
    Id:          db.ID,
    Name:        db.Name,
    State:       db.State,
    CreatedTime: db.CreatedTime,
}

dbinfo.jpg

func (kc *Catalog) CreateDatabase(ctx context.Context, db *model.Database, ts typeutil.Timestamp) error {
   
   
    // key的规则
    key := BuildDatabaseKey(db.ID)
    // value的值
    dbInfo := model.MarshalDatabaseModel(db)
    // 序列化
    v, err := proto.Marshal(dbInfo)
    if err != nil {
   
   
        return err
    }
    return kc.Snapshot.Save(key, string(v), ts)
}

跟踪BuildDatabaseKey()函数,即可以得到key的规则。

这里整理如下:

key规则:

  • 前缀/root-coord/database/db-info/{dbID}

  • 前缀/snapshots/root-coord/database/db-info/{dbID}_ts{时间戳}

默认数据库名为default,dbID为1。

ID和时间戳都是一串数字,由physicalTime+logicalTime组成。

总结:

  • CreateDatabase由proxy传递给协调器rootCoord操作etcd。
  • CreateDatabase最终会在etcd上写入2个key。
目录
相关文章
|
6天前
|
存储 缓存 Java
什么是线程池?从底层源码入手,深度解析线程池的工作原理
本文从底层源码入手,深度解析ThreadPoolExecutor底层源码,包括其核心字段、内部类和重要方法,另外对Executors工具类下的四种自带线程池源码进行解释。 阅读本文后,可以对线程池的工作原理、七大参数、生命周期、拒绝策略等内容拥有更深入的认识。
什么是线程池?从底层源码入手,深度解析线程池的工作原理
|
10天前
|
开发工具
Flutter-AnimatedWidget组件源码解析
Flutter-AnimatedWidget组件源码解析
|
6天前
|
设计模式 Java 关系型数据库
【Java笔记+踩坑汇总】Java基础+JavaWeb+SSM+SpringBoot+SpringCloud+瑞吉外卖/谷粒商城/学成在线+设计模式+面试题汇总+性能调优/架构设计+源码解析
本文是“Java学习路线”专栏的导航文章,目标是为Java初学者和初中高级工程师提供一套完整的Java学习路线。
手机上网流程解析
【9月更文挑战第5天】
|
18天前
|
XML JSON API
淘宝京东商品详情数据解析,API接口系列
淘宝商品详情数据包括多个方面,如商品标题、价格、图片、描述、属性、SKU(库存量单位)库存、视频等。这些数据对于买家了解商品详情以及卖家管理商品都至关重要。
|
20天前
|
持续交付 jenkins Devops
WPF与DevOps的完美邂逅:从Jenkins配置到自动化部署,全流程解析持续集成与持续交付的最佳实践
【8月更文挑战第31天】WPF与DevOps的结合开启了软件生命周期管理的新篇章。通过Jenkins等CI/CD工具,实现从代码提交到自动构建、测试及部署的全流程自动化。本文详细介绍了如何配置Jenkins来管理WPF项目的构建任务,确保每次代码提交都能触发自动化流程,提升开发效率和代码质量。这一方法不仅简化了开发流程,还加强了团队协作,是WPF开发者拥抱DevOps文化的理想指南。
39 1
|
12天前
|
缓存 网络协议 Linux
DNS的执行流程是什么?
DNS的执行流程是什么?
25 0
|
20天前
|
持续交付 jenkins C#
“WPF与DevOps深度融合:从Jenkins配置到自动化部署全流程解析,助你实现持续集成与持续交付的无缝衔接”
【8月更文挑战第31天】本文详细介绍如何在Windows Presentation Foundation(WPF)项目中应用DevOps实践,实现自动化部署与持续集成。通过具体代码示例和步骤指导,介绍选择Jenkins作为CI/CD工具,结合Git进行源码管理,配置构建任务、触发器、环境、构建步骤、测试及部署等环节,显著提升开发效率和代码质量。
37 0
|
20天前
|
C# 开发者 Windows
震撼发布:全面解析WPF中的打印功能——从基础设置到高级定制,带你一步步实现直接打印文档的完整流程,让你的WPF应用程序瞬间升级,掌握这一技能,轻松应对各种打印需求,彻底告别打印难题!
【8月更文挑战第31天】打印功能在许多WPF应用中不可或缺,尤其在需要生成纸质文档时。WPF提供了强大的打印支持,通过`PrintDialog`等类简化了打印集成。本文将详细介绍如何在WPF应用中实现直接打印文档的功能,并通过具体示例代码展示其实现过程。
79 0
|
22天前
|
监控 网络协议 Java
Tomcat源码解析】整体架构组成及核心组件
Tomcat,原名Catalina,是一款优雅轻盈的Web服务器,自4.x版本起扩展了JSP、EL等功能,超越了单纯的Servlet容器范畴。Servlet是Sun公司为Java编程Web应用制定的规范,Tomcat作为Servlet容器,负责构建Request与Response对象,并执行业务逻辑。
Tomcat源码解析】整体架构组成及核心组件

热门文章

最新文章

推荐镜像

更多