python实现word转anki制卡格式

2023-12-28 04:30

本文主要是介绍python实现word转anki制卡格式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录阿

    • 超级长的吐槽前言
    • 目标简述
    • 第一歩:将段落格式转换为英文和汉字分开并且以tab制表符分开
    • 第二步:使用有道翻译url带入短语参数获取例句信息
    • 第三步:导入anki

超级长的吐槽前言

最近需要背一下短语,没有在各大背单词app上面找到我需要背的词书.没办法了,去网上找到了某垃圾教育网站的word,…,这个格式,简直惨不忍睹,???那个憨憨做的文档??分栏不会吗居然手打空格来分栏,我佛了np,来感受一下
在这里插入图片描述

好吧,我承认光是把格式改成一条词汇一行我就花了半个小时…
在这里插入图片描述

目标简述

首先需要将上一张图片的格式转换为英文和汉字分开并且以tab制表符分开,(在anki导入卡片的时候使用制表符分割字段)
在这里插入图片描述
然后还需要给短语加上例句,变成这样
在这里插入图片描述
最后进行导入操作,得到
在这里插入图片描述

第一歩:将段落格式转换为英文和汉字分开并且以tab制表符分开

import re
# 
# 用于anki卡片txt制作,简单实现对英文和中文的分割,分隔符为\t
# python 3.5版本
# 正则匹配中文,固定形式:\u4E00-\u9FA5
# 
with open("1.txt","r") as tt: #1.txt为目标文档for i in tt.readlines():text = iregex_str = ".*?([\u4E00-\u9FA5|\W]+).*?" #构造pattench = re.findall(regex_str, text) #读取所有中文en = re.findall('[a-zA-Z0-9]+',text) #读取所有英文if ch:#如果读取到了中文rc="" #初始化中文翻译结果变量Re="" #初始化短语结果变量for j in ch:rc=rc+j#组装中文结果if en:#如果读取到了英文for k in en:Re=Re+k+" "#组装短语结果,单词与单词之间还需要加一个空格print(Re)with open("2.txt","a") as tt2:tt2.write(Re+"\t"+rc)#写入结果(追加)

第二步:使用有道翻译url带入短语参数获取例句信息

这里用到了requests库用于发送翻译请求,BeautifulSoup库用于读取指定内容,html库用于去除所有的html标记(太方便了这个库)
这里主要是在上一步的"判断如果读取到了英文"后面加入内容

import re,requests
from bs4 import BeautifulSoup
from w3lib import html
# 
# 用于anki卡片txt制作,简单实现对英文和中文的分割,分隔符为\t
# python 3.5版本
# 正则匹配中文,固定形式:\u4E00-\u9FA5
# 
with open("1.txt","r") as tt:for i in tt.readlines():text = iregex_str = ".*?([\u4E00-\u9FA5|\W]+).*?"ch = re.findall(regex_str, text)en = re.findall('[a-zA-Z0-9]+',text)if ch:rc=""Re=""for j in ch:rc=rc+jif en:for k in en:Re=Re+k+" "print(Re)url="http://dict.youdao.com/w/eng/"+Re#构造翻译请求链接Rs=requests.get(url)#发送链接Rs=BeautifulSoup(Rs.text,'html.parser')#指定解析方式为htmlif Rs.select('.examples'):#先判断有没有提供柯林斯英汉双解大词典例句 注释1Rs=Rs.select('.examples') #注释2else:#如果没有就找普通例句Rs=Rs.select('#bilingual')#注释2Rs= str(html.remove_tags(str(Rs)))#去掉所有html代码Rs = Rs.replace("《柯林斯英汉双解大词典》","").replace("《牛津词典》","").replace("\n","").replace("更多双语例句","").replace("精选例句","")#去掉不必要的信息with open("2.txt","a") as tt2:tt2.write(Re+"\t"+rc.replace("\n","")+str(Rs)+"\n")#写入数据并且英文与答案之间以tab隔开
  • 注释1:随便翻译一个词汇发现结果界面会有2个地方出现例句,第一个是柯林斯英汉双解大词典例句,第二个是其他大辞典里面的例句.不过有些词汇的翻译并没有柯林斯英汉双解大词典例句.
    在这里插入图片描述
    查看网页源代码发现柯林斯英汉双解大词典例句的class=examples.
    在这里插入图片描述

  • 注释2:仔细观察后发现普通例句的id为bilingual
    在这里插入图片描述

第三步:导入anki

如下即可
在这里插入图片描述

尾巴:还是想吐槽一下,为什么这些教育网站都那么垃圾阿,界面也low,都几十年前的风格了吧,还卡…

这篇关于python实现word转anki制卡格式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/545064

相关文章

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码