本文主要是介绍达观知识图谱赋能智能投研,可实现金融数据结构化提取与分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
知识图谱(Knowledge Graph)本质上是一种大型语义网络,旨在迅速表示客观世界中概念实体间的相互关系。随着人工智能的迅猛发展,知识图谱技术已具备落地和商用的能力,越来越多的企业,引入知识图谱技术,解决企业内部数据分析和挖掘问题,并已得到非常可观的成效。
以金融行业为例,企业内部存有很多数据,从技术上可分为结构化数据、非结构化数据、半结构化数据。
目前企业用到最多的是结构化数据,也就是我们常说数据库存储的数据。在半结构化数据和非结构化数据(如各种办公文件、文本、图片、语音等),大多企业只是作为知识库存档,并没有利用起来,这部分数据蕴含着很多有价值的信息,如何利用这些数据提炼有价值的信息成为当前企业痛点。达观知识图谱解决方案采用前沿深度学习、光学字符识别、自然语言处理等技术,可快速挖掘非结构数据和半结构数据,并找出其存在的关联关系,提炼价值信息,稳定可靠地解决该行业所面临的问题。
达观知识图谱解决方案在金融领域的主要应用包括:智能风控、智能投顾、智能投研、智能客服、智能舆情、智能营销等应用。
⚫️银行风控主要包含信贷审批、额度授信、信用反欺诈、异常交易行为发现、客户关联分析、风险定价等业务场景。
⚫️智能客服主要包含对话机器人、智能问答、智能推荐等业务场景。
⚫️智能投研包含上市公司研报、公告数据分析挖掘,企业工商信息、财报信息、董监高、产品、产业链分析挖掘等业务场景。
据市场调研统计,以上金融领域的应用场景皆有在各大头部银行和金融机构落地,并已投入使用。
达观知识图谱由N多节点和边组成,节点代表实体(entity),边(edge)表示关系,将节点与边关联起来就形成了知识图谱。
智能投研场景下如何构建知识图谱?
首先,想要构建知识图谱,要先找到数据。众所周知,金融机构的投研业务要依赖很多数据来分析,包含企业财报、年报、企业资讯、产品、行业、产业链、公司股东等数据。
采集完这些数据之后,我们将从海量数据中提炼构建知识图谱的实体,这些实体包含企业、企业产品、企业所在行业、企业的股东/董监高、企业风险、竞品等。以上实体有些是结构化数据可以直接获取到的(如企业工商信息包含很多构建知识图谱的实体),有些需要通过NLP技术来挖掘分析获取(如企业风险等)。
获取这些实体之后,根据业务梳理各个实体间的关联关系,定义知识图谱的边,例如以企业(实体)为中心节点,向外发散,企业的股东有哪些,企业所属行业,企业有哪些产品/业务模式,企业竞品、竞争对手有哪些,这些都属于知识图谱中的实体关系。
通过以上步骤,我们找到了构建知识图谱所需的实体和关系,接下来就可以将企业与各个实体关联起来,形成投研领域的知识图谱。
知识图谱常常与搜索和推荐产品相结合,可解决精准搜索或精准推荐的业务场景。此外,图谱还可以与产业链、企业舆情等产品相结合。更多案例情况,请关注达观数据官网进行咨询。
这篇关于达观知识图谱赋能智能投研,可实现金融数据结构化提取与分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!