basset专题

Basset:CNN学习新的染色体开放位点

尝试着将神经网络的元件与生物学意义联系起来。大胆假设,小心求证! PMC | Genome Res. | GitHub 下载 从ENCODE Project Consortium下载125种细胞类型的数据。从Roadmap Epigenomics Consortium下载39种细胞类型的数据。数据形式为DNase-seq的peak信息,保存在BED格式的文件中。使用未去重叠(overlap)的