【毕业设计】后端实现——账单通过关键词简单分析收支

2023-10-20 03:30

本文主要是介绍【毕业设计】后端实现——账单通过关键词简单分析收支,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

🌈据说,看我文章时 关注、点赞、收藏帅哥美女们 心情都会不自觉的好起来。

前言:
🧡作者简介:大家好我是 user_from_future ,意思是 “ 来自未来的用户 ” ,寓意着未来的自己一定很棒~
✨个人主页:点我直达,在这里肯定能找到你想要的~
👍专栏介绍:个人记账分析系统 ,专门记录制作过程,每天进步一点点~

想看往期历史文章,可以浏览此博文: 历史文章目录,后续所有文章发布都会同步更新此博文~

人生苦短,我用python

后端实现——账单通过关键词简单分析收支

  • 说明
  • 预设计
  • 设计规则
  • 设计处理函数

说明

在上一次获取到的数据中,不难发现不是所有都被列为收入/支出的,还有一部分比如花呗的还款成功实际上算是第二次记录了,之前每次花呗消费已经在账单里了,这些是要去除,还有收/支为其他的,要结合其他列的关键词进行判断,本文就是来处理这里数据的。

预设计

先客观尝试判断这样是否可以实现:

wx = alipay_analysis(open('data/微信支付账单(XXXXXXXX-XXXXXXXX).csv', 'r').read())
for w in wx['data']:if w[4] == '收入':print('+' + w[5])elif w[4] == '支出':print('-' + w[5])else:if '充值' in w[1]:print('+' + w[5])else:print(w)
zfb = alipay_analysis(open('data/alipay_record_XXXXXXXX_XXXXXX.csv', 'r').read())
for z in zfb['data']:if z[0] == '收入':if z[6] != '交易关闭':print('+' + z[5])else:print(z)elif z[0] == '支出':if z[6] != '交易关闭':print('-' + z[5])else:print(z)else:if z[6] in ['退款成功'] or z[7] in ['投资理财']:print('+' + z[5])elif z[6] in ['还款成功', '信用服务使用成功', '解冻成功']:print('-' + z[5])else:print(z)

简单处理后,发现满足我们的需求了,所有账单已经明确是收入还是支出了,接下来就设计通用规则,并能方便修改。

设计规则

由于涉及到每一列关键词判断,所以设计了一套判断规则:

{title: {  # 标题'+in': []  # 完全相等时判断为收入'+have': []  # 部分匹配时判断为收入'-in': []  # 完全相等时判断为支出'-have': []  # 部分匹配时判断为支出'ignore': []  # 忽略交易的关键字(比如交易关闭)}
}

这样包括了各种目前发现的可能的情况,如果不够,以后可以添加条目。
优先级为 ignore > in > have
ignore 为忽略账单的部分,比如花呗还款;
in 为固定账单中的词语,可以判断固定类别;
have 为账单中可能包含的关键词,可以灵活判断。
+ 代表收入,- 代表支出。
默认在 “ 收/支 ” 列判断有没有收入和支出作为判断:

def check_in_out_default(alipay: list):"""生成默认的规则字典:param alipay: alipay_analysis 中的 table:return: 默认的规则字典(优先级:ignore > in > have){title: {  # 标题'+in': []  # 完全相等时判断为收入'+have': []  # 部分匹配时判断为收入'-in': []  # 完全相等时判断为支出'-have': []  # 部分匹配时判断为支出'ignore': []  # 忽略交易的关键字(比如交易关闭)}}"""# print(json.dumps(check_in_out_default(table), indent=4, ensure_ascii=False))# return {title: {'+in': ['收入'] if title == '收/支' else [], '+have': [], '-in': ['支出'] if title == '收/支' else [], '-have': [], 'ignore': []} for title in alipay[0]}return {title: {'+in': ['收入'], '+have': [], '-in': ['支出'], '-have': [], 'ignore': []} for title in alipay[0] if title == '收/支'}

默认一般返回 {'收/支': {'+in': ['收入'], '+have': [], '-in': ['支出'], '-have': [], 'ignore': []}} ,根据这个拓展就可以。
我目前的规则设置为:

# 微信规则
wx_rules = {"交易类型": {"+in": [],"+have": ["充值"],"-in": [],"-have": [],"ignore": []},"收/支": {"+in": ["收入"],"+have": [],"-in": ["支出"],"-have": [],"ignore": []}
}
# 支付宝规则
zfb_rules = {"收/支": {"+in": ["收入"],"+have": [],"-in": ["支出"],"-have": [],"ignore": []},"交易状态": {"+in": ["退款成功"],"+have": [],"-in": ["信用服务使用成功", "解冻成功"],"-have": [],"ignore": ["交易关闭", "还款成功"]},"交易分类": {"+in": ["投资理财"],"+have": [],"-in": [],"-have": [],"ignore": []}
}

目前用这套规则后,数据分类正常,打算在个人用户里可以设置处理这个。

设计处理函数

def check_in_out(alipay: list, rules: dict = None):"""分析收入支出数据:param alipay: alipay_analysis 中的 table:param rules: 规则字典(优先级:ignore > in > have):return: table, unchecked_table"""if not rules:rules = check_in_out_default(alipay)titles = alipay[0]table = [titles]indexs = {titles.index(title): rules[title] for title in rules}for row in alipay:for index in indexs:if row[index] in indexs[index].get('ignore', []):continueif row[index] in indexs[index].get('+in', []):row[titles.index('收/支')] = '+'table.append(row)continueif row[index] in indexs[index].get('-in', []):row[titles.index('收/支')] = '-'table.append(row)continuefor item in indexs[index].get('+have', []):if item in row[index]:row[titles.index('收/支')] = '+'table.append(row)breakelse:continuefor item in indexs[index].get('-have', []):if item in row[index]:row[titles.index('收/支')] = '-'table.append(row)breakelse:continuereturn table, [a for a in alipay[1:] if a[titles.index('收/支')] not in ['+', '-']]ok, failed = check_in_out(alipay_analysis(open('data/alipay_record_20221104_173011.csv', 'r').read())['data'], zfb_rules)
ok, failed = check_in_out(alipay_analysis(open('data/微信支付账单(20220904-20221104).csv', 'r').read())['data'], wx_rules)

返回处理好的列表和未被处理的列表,然后前端可以根据未处理列表信息进行判断修改规则。

这篇关于【毕业设计】后端实现——账单通过关键词简单分析收支的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/244339

相关文章

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

MySQL中的表连接原理分析

《MySQL中的表连接原理分析》:本文主要介绍MySQL中的表连接原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、表连接原理【1】驱动表和被驱动表【2】内连接【3】外连接【4编程】嵌套循环连接【5】join buffer4、总结1、背景

浏览器插件cursor实现自动注册、续杯的详细过程

《浏览器插件cursor实现自动注册、续杯的详细过程》Cursor简易注册助手脚本通过自动化邮箱填写和验证码获取流程,大大简化了Cursor的注册过程,它不仅提高了注册效率,还通过友好的用户界面和详细... 目录前言功能概述使用方法安装脚本使用流程邮箱输入页面验证码页面实战演示技术实现核心功能实现1. 随机