关于Keras里的Sequential(序列模型)转化为Model(函数模型)的问题

2024-01-31 09:50

本文主要是介绍关于Keras里的Sequential(序列模型)转化为Model(函数模型)的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 一、序列模型
  • 二、改为函数模型
    • 1.错误代码
  • 总结


前言

想在keras模型上加上注意力机制,于是把keras的序列模型转化为函数模型,结果发现参数维度不一致的问题,结果也变差了。跟踪问题后续发现是转为函数模型后,网络共享层出现了问题。

一、序列模型

该部分采用的是add添加网络层,由于存在多次重复调用相同网络层的情况,因此封装成一个自定义函数:

  def create_base_network(input_dim):seq = Sequential()seq.add(Conv2D(64, 5, activation='relu', padding='same', name='conv1', input_shape=input_dim))seq.add(Conv2D(128, 4, activation='relu', padding='same', name='conv2'))seq.add(Conv2D(256, 4, activation='relu', padding='same', name='conv3'))seq.add(Conv2D(64, 1, activation='relu', padding='same', name='conv4'))seq.add(MaxPooling2D(2, 2, name='pool1'))seq.add(Flatten(name='fla1'))seq.add(Dense(512, activation='relu', name='dense1'))seq.add(Reshape((1, 512), name='reshape'))

整体代码,该模型存在多个输入(6个):

	def create_base_network(input_dim):seq = Sequential()seq.add(Conv2D(64, 5, activation='relu', padding='same', name='conv1', input_shape=input_dim))seq.add(Conv2D(128, 4, activation='relu', padding='same', name='conv2'))seq.add(Conv2D(256, 4, activation='relu', padding='same', name='conv3'))seq.add(Conv2D(64, 1, activation='relu', padding='same', name='conv4'))seq.add(MaxPooling2D(2, 2, name='pool1'))seq.add(Flatten(name='fla1'))seq.add(Dense(512, activation='relu', name='dense1'))seq.add(Reshape((1, 512), name='reshape'))return seqbase_network = create_base_network(img_size)input_1 = Input(shape=img_size)input_2 = Input(shape=img_size)input_3 = Input(shape=img_size)input_4 = Input(shape=img_size)input_5 = Input(shape=img_size)input_6 = Input(shape=img_size)print('the shape of base1:', base_network(input_1).shape)   # (, 1, 512)out_all = Concatenate(axis=1)([base_network(input_1), base_network(input_2), base_network(input_3), base_network(input_4), base_network(input_5), base_network(input_6)])print('****', out_all.shape)   # (, 6, 512)lstm_layer = LSTM(128, name = 'lstm')(out_all)out_puts = Dense(3, activation = 'softmax', name = 'out')(lstm_layer)model = Model([input_1,input_2,input_3,input_4,input_5,input_6], out_puts)model.summary()

网络模型:
在这里插入图片描述

二、改为函数模型

1.错误代码

第一次更改网络模型后,虽然运行未报错,但参数变多,模型性能也下降了,如下:

   def create_base_network(input_dim):x = Conv2D(64, 5, activation='relu', padding='same')(input_dim)x = Conv2D(128, 4, activation='relu', padding='same')(x)x = Conv2D(256, 4, activation='relu', padding='same')(x)x = Conv2D(64, 1, activation='relu', padding='same')(x)x = MaxPooling2D(2, 2)(x)x = Flatten()(x)x = Dense(512, activation='relu')(x)x = Reshape((1, 512))(x)return xinput_1 = Input(shape=img_size)input_2 = Input(shape=img_size)input_3 = Input(shape=img_size)input_4 = Input(shape=img_size)input_5 = Input(shape=img_size)input_6 = Input(shape=img_size)base_network_1 = create_base_network(input_1)base_network_2 = create_base_network(input_2)base_network_3 = create_base_network(input_3)base_network_4 = create_base_network(input_4)base_network_5 = create_base_network(input_5)base_network_6 = create_base_network(input_6)# print('the shape of base1:', base_network(input_1).shape)   # (, 1, 512)out_all = Concatenate(axis = 1)(  # 维度不变, 维度拼接,第一维度变为原来的6[base_network_1, base_network_2, base_network_3, base_network_4, base_network_5, base_network_6])print('****', out_all.shape)   # (, 6, 512)lstm_layer = LSTM(128, name = 'lstm')(out_all)out_puts = Dense(3, activation = 'softmax', name = 'out')(lstm_layer)model = Model(inputs = [input_1, input_2, input_3, input_4, input_5, input_6], outputs = out_puts)  # 6个输入model.summary()

结果模型输出如下:
在这里插入图片描述
可以看到,模型的参数变为了原来的6倍多,改了很多次,后来发现,原来是因为序列模型中的base_network = create_base_network(img_size)相当于已将模型实例化成了一个model,后续调用时只传入参数,而不更改模型结构。

而改为Model API后:
base_network_1 = create_base_network(input_1)
...
base_network_6 = create_base_network(input_6)

前面定义的 def create_base_network( inputs),并未进行实例化,后续相当于创建了6次相关网络层,应该先实例化,应当改为以下部分:

# 建立网络共享层
x1 = Conv2D(64, 5, activation = 'relu', padding = 'same', name= 'conv1')
x2 = Conv2D(128, 4, activation = 'relu', padding = 'same', name = 'conv2')
x3 = Conv2D(256, 4, activation = 'relu', padding = 'same', name = 'conv3')
x4 = Conv2D(64, 1, activation = 'relu', padding = 'same', name = 'conv4')
x5 = MaxPooling2D(2, 2)
x6 = Flatten()
x7 = Dense(512, activation = 'relu')
x8 = Reshape((1, 512))input_1 = Input(shape = img_size)   # 得到6个输入
input_2 = Input(shape = img_size)
input_3 = Input(shape = img_size)
input_4 = Input(shape = img_size)
input_5 = Input(shape = img_size)
input_6 = Input(shape = img_size)base_network_1 = x8(x7(x6(x5(x4(x3(x2(x1(input_1))))))))
base_network_2 = x8(x7(x6(x5(x4(x3(x2(x1(input_2))))))))
base_network_3 = x8(x7(x6(x5(x4(x3(x2(x1(input_3))))))))
base_network_4 = x8(x7(x6(x5(x4(x3(x2(x1(input_4))))))))
base_network_5 = x8(x7(x6(x5(x4(x3(x2(x1(input_5))))))))
base_network_6 = x8(x7(x6(x5(x4(x3(x2(x1(input_6))))))))# 输入连接
out_all = Concatenate(axis = 1)(                            # 维度不变, 维度拼接,第一维度变为原来的6[base_network_1, base_network_2, base_network_3, base_network_4, base_network_5, base_network_6])# lstm layer
lstm_layer = LSTM(128, name = 'lstm3')(out_all)
# dense layer
out_layer = Dense(3, activation = 'softmax', name = 'out')(lstm_layer)
model = Model(inputs = [input_1, input_2, input_3, input_4, input_5, input_6], outputs = out_layer)  # 6个输入
model.summary()

总结

Keras里的函数模型,如果想要多个输入共享多个网络层,
还是得将各个层实例化,不能偷懒。。。

这篇关于关于Keras里的Sequential(序列模型)转化为Model(函数模型)的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/663352

相关文章

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

Python的Darts库实现时间序列预测

《Python的Darts库实现时间序列预测》Darts一个集统计、机器学习与深度学习模型于一体的Python时间序列预测库,本文主要介绍了Python的Darts库实现时间序列预测,感兴趣的可以了解... 目录目录一、什么是 Darts?二、安装与基本配置安装 Darts导入基础模块三、时间序列数据结构与

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

Vue3绑定props默认值问题

《Vue3绑定props默认值问题》使用Vue3的defineProps配合TypeScript的interface定义props类型,并通过withDefaults设置默认值,使组件能安全访问传入的... 目录前言步骤步骤1:使用 defineProps 定义 Props步骤2:设置默认值总结前言使用T

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

GO语言中函数命名返回值的使用

《GO语言中函数命名返回值的使用》在Go语言中,函数可以为其返回值指定名称,这被称为命名返回值或命名返回参数,这种特性可以使代码更清晰,特别是在返回多个值时,感兴趣的可以了解一下... 目录基本语法函数命名返回特点代码示例命名特点基本语法func functionName(parameters) (nam

Python Counter 函数使用案例

《PythonCounter函数使用案例》Counter是collections模块中的一个类,专门用于对可迭代对象中的元素进行计数,接下来通过本文给大家介绍PythonCounter函数使用案例... 目录一、Counter函数概述二、基本使用案例(一)列表元素计数(二)字符串字符计数(三)元组计数三、C

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据