您现在的位置是：首页 > 大数据

当前栏目

21MyCat - 分片join（catlet人工智能）

人工智能 Join 分片

2023-09-11 14:15:41 时间

解决跨分片的SQL JOIN的问题，远比想象的复杂，而且往往无法实现高效的处理，既然如此，就依靠人工的智力，去编程解决业务系统中特定几个必须跨分片的SQL的JOIN逻辑，MyCAT提供特定的API供程序员调用，这就是MyCAT创新性的思路——人工智能。

以一个跨节点的SQL为例：

Select a.id,a.name,b.title from a,b where a.id=b.id

其中a在分片1，2，3上，b在4，5，6上，需要把数据全部拉到本地（MyCAT服务器）,执行JOIN逻辑，具体过程如下（只是一种可能的执行逻辑）：

EngineCtx ctx=new EngineCtx();//包含MyCat.SQLEngine
String sql=,“select a.id ,a.name from a ”;

//在a表所在的所有分片上顺序执行下面的本地SQL

ctx.executeNativeSQLSequnceJob(allAnodes,new DirectDBJoinHandler());

DirectDBJoinHandler类是一个回调类，负责处理SQL执行过程中返回的数据包，这里的这个类，主要目的是用a表返回的ID信息，去b表上查询对应的记录，做实时的关联：

 Private HashMap<byte[],byte[]> rows;//Key为id,value为一行记录的Column原始Byte数组，这里是
a.id,a.name,b.title这三个要输出的字段
 Public Boolean onHeader(byte[] header)
{ 
//保存Header信息，用于从Row中获取Field字段值
}
 Public Boolean onRowData(byte[] rowData)
{
 String id=getColumnAsString(“id”);
//放入结果集,b.title字段未知，所以先空着
rows.put(getColumnRawBytes(“id”),rowData);
 //满1000条，发送一个查询请求
String sql=”select b.id, b.name from b where id in (………….)”;
//此SQL在B的所有节点上并发执行，返回的结果直接输出到客户端
 ctx.executeNativeSQLParallJob(allBNodes,sql ,new MyRowOutPutDataHandler(rows));
}
 Public Boolean onRowFinished()
 {
 }
Public void onJobFinished()
 {
 If(ctx.allJobFinished())
 {///used total time ….
 }
}}

最后，增加一个Job事件监听器，这里是所有Job完成后，往客户端发送RowEnd包，结束整个流程。

ctx.setJobEventListener(new JobEventHandler(){public void onJobFinished(){ client.writeRowEndPackage()}});

以上提供一个SQL执行框架，完全是异步的模式执行，并且以后会提供更多高质量的API，简化分布式数据处理，比如内存结合文件的数据JOIN算法，分组算法，排序算法等等。

猜你喜欢

CAD怎么画3D模型？CAD画三维实体和曲面方法技巧
SpringBoot使用Redis
ubuntu gcc的下载链接，比较快的。
Android数据库框架——GreenDao轻量级的对象关系映射框架，永久告别sqlite
mysql LAST_INSERT_ID 使用与注意事项
【python】实现retry场景代码示例
3D设计软件中如何快速建模？浩辰3D快速建模教程
UI自动化测试之ddt实战
干货丨乔俊飞：面向污水处理过程控制的多目标智能优化方法研究
listalias - 列出用户和系统别名
C++调用Java的Jar包
自动化测试的数据依赖和独立

相关主题

人工智能应用
关于人工智能
AR中的人工智能
Python 人工智能：21~23
Python 人工智能：11~15
Python 人工智能：1~5
什么是人工智能？
人工智能的未来
2021.46 人工智能之父
2018世界人工智能大会
人工智能与深度学习
人工智能(第2版)
人工智能课程
人工智能简介

zl程序教程

当前栏目

21MyCat - 分片join（catlet人工智能）

相关文章