FATE Board 执行流程探索

2024-08-30 10:36
文章标签 board 流程 探索 执行 fate

本文主要是介绍FATE Board 执行流程探索,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景介绍

FATE Board 是 FATE 提供的一个工程,用于给 FATE 提供可视化能力,方便在联邦学习训练中实时查看执行状态,更好地定位执行中遇到的问题。

查看 FATE 架构可以看到 FATE Board 是建立在 MySQL 和 FATE Flow Server 的基础上的,看起来数据来源是来自于这两者。FATE Flow Server 在之前的文章 中已经介绍过,FATE 中隐私计算的主要调度流程都是实现在这个服务中。

请添加图片描述

FATE Board 代码仓库地址 https://github.com/FederatedAI/FATE-Board, 本文的探索基于 v1.11.1,后续版本可能有所不同

FATE Board 实现探索

FATE Board 工程中包含前端与后端的实现,前端是基于 Vue 实现的,后端则是基于 Java 实现。本文在探索时主要基于两个场景串联了一下完整的流程,分别是主页面的 job 列表页,以及 job 日志详情,通过查看完整的调用链路,对 FATE Board 建立基础的认识。

Job 列表页

请添加图片描述

通过 Chrome 调试模式查看对应的请求,即可比较容易发现获取 job 列表数据对应的请求为 /job/query/page/new , 通过对应的接口路径全局搜索可以发现后端的实现为 src/main/java/com/webank/ai/fate/board/controller/JobManagerController.java 中的 queryPagedJob() 方法,对应的代码实现如下:

public PageBean<Map<String, Object>> queryPagedJobs(PagedJobQO pagedJobQO) {String jobId = pagedJobQO.getJobId();FlowJobQO flowJobQO = new FlowJobQO();if (jobId != null && 0 != jobId.trim().length()) {flowJobQO.setJob_id(pagedJobQO.getJobId());}// 构造请求参数 ...// 实际获取数据Map<String, Object> jobMap = getJobMap(flowJobQO);// ... 冗长的业务处理
}

可以看到的真正的数据获取部分基本就是直接调用 getJobMap() ,对应的实现如下所示:

private Map<String, Object> getJobMap(Object query) {result = flowFeign.post(Dict.URL_JOB_QUERY, JSON.toJSONString(query));// ... 冗长的结果转换
}

实际的获取是通过一次 HTTP 请求获取到,对应的请求地址为 /v1/job/list/job,看情况应该是调用 FATE Flow Server 获取的,在 FATE-Flow 中看到的对应的接口,处于路径 FATE-Flow/python/fate_flow/apps/job_app.py 中的 list_job(),实际的实现就是一次简单的数据库查询,不再进一步展开。

Job 日志

请添加图片描述

通过 chrome 调试模式看到实际获取 Job 日志是通过 websocket 获取的,请求的地址为 /log/new/202307260855242117390/host/8889/default,目前来看日志的获取和 job 列表的获取存在一些差异

依旧利用请求地址搜索对应的代码实现,可以确认后端对应的实现路径为 src/main/java/com/webank/ai/fate/board/websocket/LogWebSocketController.java 中的 LogWebSocketController 类实现,对于 websocket 的服务端,消息处理都是在 onMessage 实现的,我们可以看到对应的代码实现如下:

@OnMessage
public void onMessage(String message,Session session,@PathParam("jobId") String jobId,@PathParam("role") String role,@PathParam("partyId") String partyId,@PathParam("componentId") String componentId) throws Exception {synchronized (session) {LogQuery logQuery = JSON.parseObject(message, LogQuery.class);// 根据类型主要包含 logSize 和 logCat,其中 logSize 用于获取日志行数,logCat 获取日志内容if (logQuery.getType().equals(LogTypeEnum.LOG_SIZE.boardValue)) {logSize(session, jobId, role, partyId, componentId, logQuery);} else {logCat(session, jobId, role, partyId, componentId, logQuery);}}
}

可以看到的通过路径获取 jobId, role, partyId, componentId 的参数,然后调用 logSize()logCat() 执行实际的处理,我们主要关注日志内容的获取,可以看到 logCat() 对应的实现如下所示:

private void logCat(Session session, String jobId, String role, String partyId, String componentId, LogQuery logQuery) {// 构造请求FlowLogCatReq flowLogCatReq = new FlowLogCatReq();flowLogCatReq.setJob_id(jobId);flowLogCatReq.setLog_type(Dict.logTypeMap.get(logQuery.getType()));flowLogCatReq.setRole(role);flowLogCatReq.setParty_id(Integer.valueOf(partyId));flowLogCatReq.setComponent_name(componentId);flowLogCatReq.setInstance_id(logQuery.getInstanceId());flowLogCatReq.setBegin(logQuery.getBegin());flowLogCatReq.setEnd(logQuery.getEnd());// 实际获取数据FlowResponse<List<FlowLogCatResp>> resultFlow = flowLogFeign.logCat(flowLogCatReq);// 构造响应数据LogContentResponse logContentResponse = new LogContentResponse();logContentResponse.setType(logQuery.getType());logContentResponse.setData(resultFlow.getData().stream().map(LogContentResponse.LogContent::fromFlowContent).collect(Collectors.toList()));try {session.getBasicRemote().sendText(JSON.toJSONString(logContentResponse));} catch (IOException e) {e.printStackTrace();logger.error("websocket send error: {}", logContentResponse);}
}

根据最核心的数据获取是调用 flowLogFeign.logCat() ,对应的实现:

@FeignClient(url = RouteTargeter.URL_PLACE_HOLDER + "/v1/log", name = "flowLogFeign", configuration = FeignRequestInterceptor.class)
public interface FlowLogFeign {// 构造 http 请求@RequestMapping(value = "/cat", method = RequestMethod.POST)FlowResponse<List<FlowLogCatResp>> logCat(FlowLogCatReq request);@RequestMapping(value = "/size", method = RequestMethod.POST)FlowResponse<FlowLogSizeResp> logSize(FlowLogSizeReq request);
}

最后兜了一圈,看起来还是转换了一次网络请求,看起来还是发送给了 FATE Flow Server,追踪 FATE-Flow 工程中的对应实现,可以看到对应的网络请求位于 FATE-Flow/python/fate_flow/apps/log_app.py 路径下,具体的实现位于 FATE-Flow/python/fate_flow/utils/log_sharing_utils.py 中的 cat_log() 方法中,实现如下:

def cat_log(self, begin, end):line_list = []log_path = self.get_log_file_path()if begin and end:cmd = f"cat {log_path} | tail -n +{begin}| head -n {end-begin+1}"elif begin:cmd = f"cat {log_path} | tail -n +{begin}"elif end:cmd = f"cat {log_path} | head -n {end}"else:cmd = f"cat {log_path}"lines = self.execute(cmd)if lines:line_list = []line_num = begin if begin else 1for line in lines.split("\n"):line = replace_ip(line)line_list.append({"line_num": line_num, "content": line})line_num += 1return line_list

可以看到最终就是调用系统的 cat 命令,最终文件对应的内容,整体实现简单直接。

总结

通过对 FATE-Board 两个请求的调用链路的跟踪,可以对 FATE-Board 工程有了一些了解,看起来 FATE-Board 是建立在 FATE-Flow 基础上的一个简单可视化,使用的能力基本都是通过 FATE-Flow 提供,而 FATE-Board 仅仅提供必要的数据包装与前端的展示呈现,过程简单清晰。后续如果希望了解 FATE-Board 对应的可视化的能力范围,直接查看 FATE-Flow 对应提供的接口即可

这篇关于FATE Board 执行流程探索的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1120576

相关文章

Python实现NLP的完整流程介绍

《Python实现NLP的完整流程介绍》这篇文章主要为大家详细介绍了Python实现NLP的完整流程,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 编程安装和导入必要的库2. 文本数据准备3. 文本预处理3.1 小写化3.2 分词(Tokenizatio

SpringBoot使用minio进行文件管理的流程步骤

《SpringBoot使用minio进行文件管理的流程步骤》MinIO是一个高性能的对象存储系统,兼容AmazonS3API,该软件设计用于处理非结构化数据,如图片、视频、日志文件以及备份数据等,本文... 目录一、拉取minio镜像二、创建配置文件和上传文件的目录三、启动容器四、浏览器登录 minio五、

如何使用 Bash 脚本中的time命令来统计命令执行时间(中英双语)

《如何使用Bash脚本中的time命令来统计命令执行时间(中英双语)》本文介绍了如何在Bash脚本中使用`time`命令来测量命令执行时间,包括`real`、`user`和`sys`三个时间指标,... 使用 Bash 脚本中的 time 命令来统计命令执行时间在日常的开发和运维过程中,性能监控和优化是不

C#如何优雅地取消进程的执行之Cancellation详解

《C#如何优雅地取消进程的执行之Cancellation详解》本文介绍了.NET框架中的取消协作模型,包括CancellationToken的使用、取消请求的发送和接收、以及如何处理取消事件... 目录概述与取消线程相关的类型代码举例操作取消vs对象取消监听并响应取消请求轮询监听通过回调注册进行监听使用Wa

PHP执行php.exe -v命令报错的解决方案

《PHP执行php.exe-v命令报错的解决方案》:本文主要介绍PHP执行php.exe-v命令报错的解决方案,文中通过图文讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录执行phpandroid.exe -v命令报错解决方案执行php.exe -v命令报错-PHP War

Oracle数据库执行计划的查看与分析技巧

《Oracle数据库执行计划的查看与分析技巧》在Oracle数据库中,执行计划能够帮助我们深入了解SQL语句在数据库内部的执行细节,进而优化查询性能、提升系统效率,执行计划是Oracle数据库优化器为... 目录一、什么是执行计划二、查看执行计划的方法(一)使用 EXPLAIN PLAN 命令(二)通过 S

Nginx、Tomcat等项目部署问题以及解决流程

《Nginx、Tomcat等项目部署问题以及解决流程》本文总结了项目部署中常见的four类问题及其解决方法:Nginx未按预期显示结果、端口未开启、日志分析的重要性以及开发环境与生产环境运行结果不一致... 目录前言1. Nginx部署后未按预期显示结果1.1 查看Nginx的启动情况1.2 解决启动失败的

Security OAuth2 单点登录流程

单点登录(英语:Single sign-on,缩写为 SSO),又译为单一签入,一种对于许多相互关连,但是又是各自独立的软件系统,提供访问控制的属性。当拥有这项属性时,当用户登录时,就可以获取所有系统的访问权限,不用对每个单一系统都逐一登录。这项功能通常是以轻型目录访问协议(LDAP)来实现,在服务器上会将用户信息存储到LDAP数据库中。相同的,单一注销(single sign-off)就是指

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于