Simple-STNDT使用Transformer进行Spike信号的表征学习(一)数据处理篇

本文主要是介绍Simple-STNDT使用Transformer进行Spike信号的表征学习(一)数据处理篇,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 1.数据处理部分
      • 1.1 下载数据集
      • 1.2 数据集预处理
      • 1.3 划分train-val并创建Dataset对象
      • 1.4 掩码mask操作

数据、评估标准见NLB2021
https://neurallatents.github.io/

以下代码依据
https://github.com/trungle93/STNDT

原代码使用了 Ray+Config文件进行了参数搜索,库依赖较多,数据流过程不明显,代码冗杂,这里进行了抽丝剥茧,将其中最核心的部分提取出来。

1.数据处理部分

1.1 下载数据集

需要依赖 pip install dandi
downald.py

root = "D:/NeuralLatent/"
def downald_data():from dandi.download import downloaddownload("https://dandiarchive.org/dandiset/000128", root)download("https://dandiarchive.org/dandiset/000138", root)download("https://dandiarchive.org/dandiset/000139", root)download("https://dandiarchive.org/dandiset/000140", root)download("https://dandiarchive.org/dandiset/000129", root)download("https://dandiarchive.org/dandiset/000127", root)download("https://dandiarchive.org/dandiset/000130", root)

1.2 数据集预处理

需要依赖官方工具包pip install nlb_tools
主要是加载锋值序列数据,将其采样为5ms的时间槽
preprocess.py

## 以下为参数示例
# data_path = root + "/000129/sub-Indy/"
# dataset_name = "mc_rtt"
## 注意 "./data" 必须提前创建好from nlb_tools.make_tensors import make_train_input_tensors, make_eval_input_tensors, combine_h5def preprocess(data_path, dataset_name=None):dataset = NWBDataset(datapath)bin_width = 5dataset.resample(bin_width)make_train_input_tensors(dataset, dataset_name=dataset_name, trial_split="train", include_behavior=True, include_forward_pred=True, save_file=True,save_path=f"./data/{dataset_name}_train.h5")make_eval_input_tensors(dataset, dataset_name=dataset_name, trial_split="val", save_file=True, save_path=f"./data/{dataset_name}_val.h5")combine_h5([f"./data/{dataset_name}_train.h5", f"./data/{dataset_name}_val.h5"], save_path=f"./data/{dataset_name}_full.h5")## './data/mc_rtt_full.h5' 将成为后续的主要分析数据

1.3 划分train-val并创建Dataset对象

读取'./data/mc_rtt_full.h5'中的数据并创建dataset
dataset.py

import h5py
import numpy as np
import torch
from torch.utils import data
# data_path = "./data/mc_rtt_full.h5"class SpikesDataset(data.Dataset):def __init__(self, spikes, heldout_spikes, forward_spikes) -> None:self.spikes = spikesself.heldout_spikes = heldout_spikesself.forward_spikes = forward_spikesdef __len__(self):return self.spikes.size(0)def __getitem__(self, index):r"""Return spikes and rates, shaped T x N (num_neurons)"""return self.spikes[index], self.heldout_spikes[index], self.forward_spikes[index]def make_datasets(data_path):with h5py.File(data_path, 'r') as h5file:h5dict = {key: h5file[key][()] for key in h5file.keys()}if 'eval_spikes_heldin' in h5dict: # NLB dataget_key = lambda key: h5dict[key].astype(np.float32)train_data = get_key('train_spikes_heldin')train_data_fp = get_key('train_spikes_heldin_forward')train_data_heldout_fp = get_key('train_spikes_heldout_forward')train_data_all_fp = np.concatenate([train_data_fp, train_data_heldout_fp], -1)valid_data = get_key('eval_spikes_heldin')train_data_heldout = get_key('train_spikes_heldout')if 'eval_spikes_heldout' in h5dict:valid_data_heldout = get_key('eval_spikes_heldout')else:valid_data_heldout = np.zeros((valid_data.shape[0], valid_data.shape[1], train_data_heldout.shape[2]), dtype=np.float32)if 'eval_spikes_heldin_forward' in h5dict:valid_data_fp = get_key('eval_spikes_heldin_forward')valid_data_heldout_fp = get_key('eval_spikes_heldout_forward')valid_data_all_fp = np.concatenate([valid_data_fp, valid_data_heldout_fp], -1)else:valid_data_all_fp = np.zeros((valid_data.shape[0], train_data_fp.shape[1], valid_data.shape[2] + valid_data_heldout.shape[2]), dtype=np.float32)train_dataset = SpikesDataset(torch.tensor(train_data).long(),            # [810, 120, 98]torch.tensor(train_data_heldout).long(),    # [810, 120, 32]torch.tensor(train_data_all_fp).long(),     # [810, 40, 130])val_dataset = SpikesDataset(torch.tensor(valid_data).long(),            # [810, 120, 98]torch.tensor(valid_data_heldout).long(),    # [810, 120, 32]torch.tensor(valid_data_all_fp).long(),     # [810, 40, 130])return train_dataset, val_dataset

1.4 掩码mask操作

dataset.py

# Some infeasibly high spike count
UNMASKED_LABEL = -100def mask_batch(batch, heldout_spikes, forward_spikes):batch = batch.clone() # make sure we don't corrupt the input data (which is stored in memory)mask_ratio = 0.31254mask_random_ratio = 0.876mask_token_ratio = 0.527labels = batch.clone()mask_probs = torch.full(labels.shape, mask_ratio)# If we want any tokens to not get masked, do it here (but we don't currently have any)mask = torch.bernoulli(mask_probs)mask = mask.bool()labels[~mask] = UNMASKED_LABEL  # No ground truth for unmasked - use this to mask loss# We use random assignment so the model learns embeddings for non-mask tokens, and must rely on context# Most times, we replace tokens with MASK tokenindices_replaced = torch.bernoulli(torch.full(labels.shape, mask_token_ratio)).bool() & maskbatch[indices_replaced] = 0# Random % of the time, we replace masked input tokens with random value (the rest are left intact)indices_random = torch.bernoulli(torch.full(labels.shape, mask_random_ratio)).bool() & mask & ~indices_replacedrandom_spikes = torch.randint(batch.max(), labels.shape, dtype=torch.long)batch[indices_random] = random_spikes[indices_random]# heldout spikes are all maskedbatch = torch.cat([batch, torch.zeros_like(heldout_spikes)], -1)labels = torch.cat([labels, heldout_spikes.to(batch.device)], -1)batch = torch.cat([batch, torch.zeros_like(forward_spikes)], 1)labels = torch.cat([labels, forward_spikes.to(batch.device)], 1)# Leave the other 10% alonereturn batch, labels

下一篇: https://blog.csdn.net/weixin_46866349/article/details/139906187

这篇关于Simple-STNDT使用Transformer进行Spike信号的表征学习(一)数据处理篇的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088377

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi