[SQL] 通过工商信息筛选潜在客户

2024-02-27 22:50

本文主要是介绍[SQL] 通过工商信息筛选潜在客户,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今日心情 :佛系的很


对于业务来说,经常会碰到一种需求:手里有一个公司名单(可能也就十几二十个公司名称),深入接触了几次之后,发现这类公司似乎合作意向都很大,具有很大的开发潜力。如果能找到跟这些公司相类似的企业,说不定能扩大客户池,进而带来业绩的增长,收获很多小钱钱。

如果还不会数据挖掘算法,如何先给出一份比较可靠的同类公司名单呢?头大。。。

不过既然要找相似企业,免不了要检索全国所有公司,如果数据库里有全国企业的工商信息数据,可以考虑用SQL先来应个急。

声明:本文重点在于介绍处理这类问题的思路,数据都是东拼西凑的。如有相同,纯属巧合

第一步:获取样本企业的相关信息

已知,样本企业名单如下:

公司A、公司B、公司C、公司D、公司E、公司F、公司G、公司H、公司I、公司J、公司K、公司L、公司M、公司N、公司O、公司P、公司Q、公司R、公司S、公司T

企业工商信息表结构(表结构参考 国家企业信用信息公式系统 中企业的营业执照信息)如下:

表名:enterprise (企业工商信息表)
字段含义字段名称
统一社会信用代码crn
企业名称entity_name
企业类型entity_type
法定代表人legal_repr
注册资本(万)regist_capital
成立日期establish_date
营业期限自start_from
营业期限至start_to
登记机关register_org
核准日期approve_date
登记状态status
住所address
经营范围scope

在工商数据表中查询样本企业的工商信息:

select * from enterprise where entity_name in ('公司A''公司B''公司C''公司D''公司E''公司F''公司G''公司H''公司I''公司J''公司K''公司L''公司M''公司N''公司O''公司P''公司Q''公司R''公司S''公司T')

在这里插入图片描述

第二步:提取样本企业的特征

能作为特征的,都是有具有较强标识性的。比如一个人,性别可以作为TA的一个特征,但是过于宽泛。我们若是想进一步知道TA是哪一类人,就得再给他贴一些标识,或者标签。而且这些标签得是简短、概括性的。比如:长发、胸大、腰细等,这样,这个人就会在我们的脑海里更加的具象化(想太多的,自行面壁去)。

而对于一个只知道工商信息的企业来说,能用来判断是否是同类企业的最重要字段也就是经营范围了。但是经营范围都是一大段一大段的,所以我们得对它进行语义上的分析,用更简短的词语,去标识这个企业。

经营范围分词

将刚刚获取的样本企业的工商数据导出为csv文件(文件名:sample_enter.csv),用python对所有样本企业的经营范围进行分词

1.也可以用python连接数据库,执行sql语句获取结果。考虑到之后这部分数据可能会频繁使用,我就直接导出成文件了。

2.分词用的是百度的自然语言处理API接口,主要是想用它的词性分析功能。如果想简单点,可以用一些分词的在线工具,对每个企业的经营范围依次进行分词。但是如果样本企业过多,可能会比较费事

import timefrom aip import AipNlp
import pandas as pd''' 创建API的client '''APP_ID = '24037821'  # 替换成自己的
API_KEY = 'gSH3nPHazXwsjGtZHdqQxRaR'  # 替换成自己的
SECRET_KEY = '3SOC3G45LSXwmKeyZsdgQZ9uMySQrbHL'  # 替换成自己的client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
client.setConnectionTimeoutInMillis(3600)sample_enter 

这篇关于[SQL] 通过工商信息筛选潜在客户的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/753812

相关文章

MySQL zip安装包配置教程

《MySQLzip安装包配置教程》这篇文章详细介绍了如何使用zip安装包在Windows11上安装MySQL8.0,包括下载、解压、配置环境变量、初始化数据库、安装服务以及更改密码等步骤,感兴趣的朋... 目录mysql zip安装包配置教程1、下载zip安装包:2、安装2.1 解压zip包到安装目录2.2

MySQL安装时initializing database失败的问题解决

《MySQL安装时initializingdatabase失败的问题解决》本文主要介绍了MySQL安装时initializingdatabase失败的问题解决,文中通过图文介绍的非常详细,对大家的学... 目录问题页面:解决方法:问题页面:解决方法:1.勾选红框中的选项:2.将下图红框中全部改为英

MySQL 中的服务器配置和状态详解(MySQL Server Configuration and Status)

《MySQL中的服务器配置和状态详解(MySQLServerConfigurationandStatus)》MySQL服务器配置和状态设置包括服务器选项、系统变量和状态变量三个方面,可以通过... 目录mysql 之服务器配置和状态1 MySQL 架构和性能优化1.1 服务器配置和状态1.1.1 服务器选项

MySQL8.0设置redo缓存大小的实现

《MySQL8.0设置redo缓存大小的实现》本文主要在MySQL8.0.30及之后版本中使用innodb_redo_log_capacity参数在线更改redo缓存文件大小,下面就来介绍一下,具有一... mysql 8.0.30及之后版本可以使用innodb_redo_log_capacity参数来更改

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

oracle DBMS_SQL.PARSE的使用方法和示例

《oracleDBMS_SQL.PARSE的使用方法和示例》DBMS_SQL是Oracle数据库中的一个强大包,用于动态构建和执行SQL语句,DBMS_SQL.PARSE过程解析SQL语句或PL/S... 目录语法示例注意事项DBMS_SQL 是 oracle 数据库中的一个强大包,它允许动态地构建和执行

SQL 中多表查询的常见连接方式详解

《SQL中多表查询的常见连接方式详解》本文介绍SQL中多表查询的常见连接方式,包括内连接(INNERJOIN)、左连接(LEFTJOIN)、右连接(RIGHTJOIN)、全外连接(FULLOUTER... 目录一、连接类型图表(ASCII 形式)二、前置代码(创建示例表)三、连接方式代码示例1. 内连接(I

在MySQL执行UPDATE语句时遇到的错误1175的解决方案

《在MySQL执行UPDATE语句时遇到的错误1175的解决方案》MySQL安全更新模式(SafeUpdateMode)限制了UPDATE和DELETE操作,要求使用WHERE子句时必须基于主键或索引... mysql 中遇到的 Error Code: 1175 是由于启用了 安全更新模式(Safe Upd