python:lxml 生成思维导图 Freemind(.mm)文件

2024-02-02 15:20

本文主要是介绍python:lxml 生成思维导图 Freemind(.mm)文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

请参阅:从PDF中提取目录 或者 java : pdfbox 读取 PDF文件内书签

pip install lxml ; 

lxml-5.1.0-cp310-cp310-win_amd64.whl (3.9 MB)

读目录.txt文件,使用 lxml 生成思维导图 Freemind(.mm)文件

编写 txt_etree_mm.py 如下

# -*- coding: utf-8 -*-
""" 读目录.txt文件,使用 lxml 生成思维导图 Freemind(.mm)文件"""
import os
import sys
import codecs
from lxml import etreeif len( sys.argv ) ==2:f1 = sys.argv[1]
else:print(u'usage: txt_etree_mm.py  file1.txt')sys.exit(1)fn,ext = os.path.splitext(f1)
if ext not in ('.txt', '.TXT'):print('ext is not .txt')sys.exit(2)# 创建根节点
map = etree.Element("map")
map.set('version', '1.0.1')fp = codecs.open(f1, mode="r", encoding="utf-8")
# 读取第一行:书名
title = fp.readline()
# 创建主题节点
root: etree.ElementBase = etree.Element("node")
root.set('ID', str(0))
root.set('STYLE', 'bubble') # 泡框
root.set('TEXT', title.strip())
map.append(root)
# 定义连线的颜色:红色
edge: etree.ElementBase = etree.Element("edge")
edge.set('COLOR', "#ff0000")
root.append(edge)
# 用缩排表现层级关系,假设最多5个层级
indent1 = ''
indent2 = ' '*2
indent3 = ' '*4
indent4 = ' '*6
indent5 = ' '*8
n = 1  
for line in fp:if len(line.strip()) ==0:continueelif len(line.strip()) >0 and line[0] !=' ':# 创建主题的子节点(1级节点)node1: etree.ElementBase = etree.Element("node")node1.set('ID', str(n))node1.set('TEXT', line.strip())root.append(node1)elif line.startswith(indent2):# 创建node1的子节点(2级节点)node2: etree.ElementBase = etree.Element("node")node2.set('ID', str(n))node2.set('TEXT', line.strip())node1.append(node2)elif line.startswith(indent3):# 创建node2的子节点(3级节点)node3: etree.ElementBase = etree.Element("node")node3.set('ID', str(n))node3.set('TEXT', line.strip())node2.append(node3)elif line.startswith(indent4):# 创建node3的子节点(4级节点)node4: etree.ElementBase = etree.Element("node")node4.set('ID', str(n))node4.set('TEXT', line.strip())node3.append(node4)elif line.startswith(indent5):# 创建node4的子节点(5级节点)node5: etree.ElementBase = etree.Element("node")node5.set('ID', str(n))node5.set('TEXT', line.strip())node4.append(node5)else:print(line)n += 1
fp.close()# 转换成 str,方便导出
map_bytes = etree.tostring(map, pretty_print=True)# 导出到 .mm 格式的文件中
f2 = fn +'.mm'
with open(f2, 'w+b') as fp:fp.write(map_bytes)print(f"line number: {n}")

运行 python txt_etree_mm.py your_pdf_dir.txt

这篇关于python:lxml 生成思维导图 Freemind(.mm)文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671145

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri