pase.py 解析文字中包含的成语

2023-11-05 11:50
文章标签 文字 解析 py 成语 pase

本文主要是介绍pase.py 解析文字中包含的成语,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

# -*- coding: UTF-8 -*-
# tanj
# 2018-01-15
import ConfigParserimport MySQLdb
import pandas as pdconfig = None# get config
def getConfig():global configif config is None:config = ConfigParser.ConfigParser()config.read("config.ini")return config# get database connect
def get_con():global configconfig = getConfig()mysql_host = config.get('localdb', 'host')mysql_port = config.get('localdb', 'port')mysql_user = config.get('localdb', 'user')mysql_passwd = config.get('localdb', 'password')mysql_db = config.get('localdb', 'database')mysql_charset = config.get('localdb', 'charset')config = Noneconn = MySQLdb.connect(host=mysql_host, port=int(mysql_port), user=mysql_user, passwd=mysql_passwd, db=mysql_db,charset=mysql_charset)return conndef query(sql):# 使用cursor()方法获取操作游标conn = get_con()# 使用cursor()方法获取操作游标cursor = conn.cursor()try:cursor.execute(sql, None)result = cursor.fetchall()except Exception, e:print "mysql query error: %s", ereturn Nonefinally:cursor.close()conn.close()return resultfile = open("workdata/word.txt")
words =set()
while True:lines = file.readlines(1)if not lines:breakfor line in lines:words.add(line)pass  # do something
file.close()result_list=[]
for line in words:for word in line.split(','):select_sql = "select chengyu from idioms_dic WHERE chengyu like '%" + word + "%'"result = query(select_sql)for row in result:result_list.append(row[0])# print row[0]def test4():from  collections import Counterimport operator#进行统计a = dict(Counter(result_list))#进行排序b= sorted(a.items(), key=operator.itemgetter(1),reverse=True)return bif __name__ == '__main__':lis=test4()for row in lis:# print row[0],row[1]if  row[1] == 4 :print row[0]# for line in words:
#     select_sql=""
#     for word in line.split(','):
#         select_sql_chil = "select chengyu from idioms_dic WHERE chengyu like '%" + word + "%'"
#         select_sql = select_sql_chil + " union " + select_sql
#     print select_sql[:-6]
#     result = query(select_sql)
#     print result
#     # for row in result:
#     #     print row[0]
#数据库配置
[localdb]
host = 127.0.0.1
port = 3306
database = test
user = root
password = 123456
charset=utf8

转载于:https://my.oschina.net/u/2510243/blog/1608080

这篇关于pase.py 解析文字中包含的成语的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/349654

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

多线程解析报表

假如有这样一个需求,当我们需要解析一个Excel里多个sheet的数据时,可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完之后,程序需要提示解析完成。 Way1 join import java.time.LocalTime;public class Main {public static void main(String[] args) thro

ZooKeeper 中的 Curator 框架解析

Apache ZooKeeper 是一个为分布式应用提供一致性服务的软件。它提供了诸如配置管理、分布式同步、组服务等功能。在使用 ZooKeeper 时,Curator 是一个非常流行的客户端库,它简化了 ZooKeeper 的使用,提供了高级的抽象和丰富的工具。本文将详细介绍 Curator 框架,包括它的设计哲学、核心组件以及如何使用 Curator 来简化 ZooKeeper 的操作。 1