当前位置: 首页 > 创领中心 > 网络优化

从常识图谱到常识推理 能否会成为AI的一个热点

  • 网络优化
  • 2024-11-15

当天写一篇常识图谱方面的文章,算作是团体对常识图谱的一个初步学习和意识。关于常识图谱最近几年不时有人跟我谈到这个词,或许是自己在从事常识图谱技术上班,或许在大数据平台构建成功后要求构建常识图谱等。

实践在在10多年前,在企业常识治理和常识库构建中,相似Autonomy常识治理软件,过后就谈到了文本内容的语义识别和语义网构建,包括相似香农通常和贝叶斯算法的经常使用等,也有基于常识图谱的常识和学习路途规划等。起初Autonomy被HP收买了,反而是偃旗息鼓。

然而最近几年,随着大数据和AI人工智能的开展,常识图谱成为一个新的热点,并在相似风控和反欺诈,智能介绍引擎,智能常识问答等诸多的畛域施展作用。实践上也可以看到大数据和AI算法的开展都进一步推进常识图谱的运行和落地。

常识图谱要构建不能分开大数据,海量人造数据的常识采集和形象才干够构建一个完整的常识语义网络,然而只要网络还不行,基于语义网络你的常识推理逻辑和算法还得不时提供技术撑持。

因此 数据+算法两个方面的开展才是推进常识图谱细分畛域开展的关键

常识图谱概述

关于常识图谱,从基本概念到构建流程,方法工具,网上都有详细的文章可以参考,在这里仅仅对常识图谱的基础概念做一个论述。

常识图谱(Knowledge Graph)的概念由谷歌2012年正式提出,旨在成功更智能的搜查引擎,并且于2013年开局在学术界和业界遍及,并在智能问答、情报剖析、反欺诈等运行中施展关键作用。

常识图谱实质上是一种叫做 语义网络(semantic network)的常识库 ,即具有有向图结构的一个常识库,其中图的结点代表 实体(entity) 或许 概念(concept) ,而图的边代表实体/概念之间的各种 语义相关 ,比如说两个实体之间的相似相关。

当无了解常识图谱的时刻,实体和概念必定要区分分明,关于概念自身又拆分为了概念和属性两个独立的词。

假设从IT和软件开发来对比话, 实体就相似于畛域建模外面的实体对象,而概念相似于值对象 ,实体对象可以独立存在,具有独立生命周期,而概念或值对象则附丽于实体,没有实体独自谈概念对象或值没无心义。

咱们来举例说明下:

雷军意识林斌,是在2008年。过后林斌想推进Google和UCWEB之间的协作。雷军惊讶的发现,林斌有发自心坎对产品的热爱,林斌在Google所做的上班和产品都十分投入,“下功夫”。那个时刻,雷军开局经常去找林斌聊天,两个大男人经常在一同挑灯夜战,聊到清晨一、两点钟。聊着聊着,两人从协作同伴聊成了好好友。

从下面这段,咱们至少可以得悉。

雷军和林斌是好好友。

这个是典型的实体和实体间相关形容,可以用相似RDF三元组模型启动形象和建模,存储到相似图数据库中。外面的外围元数据就是实体对象和实体相关。

可以看到雷军和林斌两个是独立实体,具有独立的生命周期, 只管两者之间有相关,然而都可以独立存在 ,而不受对方影响。

而关于概念和概念属性呢?

则相似于进一步对雷军的团体属性形容,比如身高,性别,年龄,民族等。概念和属性最大的一个特点就是概念只是一个属性列表或许值汇合。这个值可以是延续的,如身高数值。也可以是不延续的,如56个民族。然而不论是哪种状况最终概念外面的都是一个最终的属性值。 似乎实体不存在了,这个概念和属性值自身没有业务意义。

当把这个了解分明后,咱们再来看。

雷军毕业于湖北仙桃中学,那么仙桃中学终究是概念还是实体?实践上仙桃中学应该作为实体独立钻研,由于关于仙桃中学的形容,不是经过一系列延续或不延续的值来定义的。同时仙桃中学可以独立存在,雷军能否存在过并不影响到仙桃中学这个学校。

那么仙桃中学就应该作为独立的实体。

基于这个思绪,整个相关图可以变动为如下图。

在这里我特地讲概念和属性值用了绿色方框启动形容。

繁难来说概念是一个不凡类型的实体,这类实体不会进一步开展,也不会间接和其它实体之间建设相关映射。

常识图谱的构建环节

关于常识图谱的构建环节,网上有很多详细的文章可以参考,在这类不再详细形容。仅仅谈下重点内容。

在前面的繁难举例曾经可以看到,一个常识图谱的构建外围还是实体对象的识别,实体相关的建设。也就是要求从一个非结构化的文本资料,乃至语音资料外面识别和形象出对应的实体,同时建设实体之间的相关。

人和物皆是关键的实体

在识别实体的时刻可以看到,人和物自身都是重点要识别的实体对象。人自身既附属于一个团队,地点或组织,同时也设计或发明事物。

因此再裁减的话,可以了解为东西,场合,人物,企业组织团队,区域地点是关键可以识别的关键实体。这些实体自身又是一种可以向上聚合,向下开展的档次化结构。

比如一个商场自身属于一个区域,同时商场开展自身又包括多个门店。

形象概念还是实例概念

当剖析实体的时刻还得留意实体普通是实例化和特指的,而不是一个形象的概念。比如当你谈到凄惨环球的时刻,凄惨环球既可以指雨果的书籍,也可以是电影的某个版本,还可以是10周年的音乐剧。

那咱们对实体的钻研最好特指到详细的实例层级,比如凄惨环球2012年电影版本。

当了解分明实体后,再来看相关的识别。

人或物附属于一个组织或区域

人发明发明或消费经常使用某个东西

人和人之间的相关,如家人,同窗,共事,合伙人等

实体自身表现的档次相关开展和聚合

也就是大部分实体的相关都体如今下面罗列的各个方面开展。

常识图谱的构建

常识图谱的构建环节实践上相当复杂,然而外围关键包括了常识的抽取,常识存储,实体对齐,常识建模和常识推理等几个关键步骤。

关于常识的形象,不论是结构化数据还是文本等非结构化数据,最终都要求转化为三元组数据结构,繁难构建常识图谱模型。在常识抽取成功后,就触及到常识的存储,干流依然是驳回相似Neo4j等图数据库来成功。在相关型数据库中一切的数据库形式都要求提早定义,后续改变代价高昂。而图模型中,只要要从新参与形式定义, 再部分调整数据,便可成功在原有的数据源上参与标签或参与属性。

最近我在检查和学习常识图谱的一些技术资料,发现一个大疑问,行将常识体系和常识图谱两个概念混杂,将常识体系误以为常识图谱,同时驳回思想导图来构建常识图谱,这是一个相当失误的做法。特地是思想导图自身就是单节点为中心开展的,齐全不可表白多实体之间的相关消息。

相似网上搜查到的这个图,就是一个齐全失误的做法。

常识推理环节

常识图谱在构建成功后,愈减轻要的是启动常识推理,而常识推理自身是基于构建的推理模型启动的,也就是是常识图谱表现的人工智能自身是基于算法和推理模型启动的,而非前面文章谈到的基于统计学思想的人工智能。

那常识推理终究是推理什么?

最经常出现的就是 基于实体网络曾经的实体相关来推理实体间的其它相关。 比如一个实体三角,当两个相关已知的时刻往往可以推理去未知的相关边。

在实体相关外面,假设已知:

那么则可以推理出雷军和林斌两个实体的相关,从好好友参与了合伙人相关。

其次经常出现的就是 意外危险检测

即经过常识抽取采集构成完整的常识图谱后,你会发如今整个语义网络外面实体之间的相关存在意外。在金融等反欺诈畛域,经常就会遇到相似的常识图谱推理逻辑去发现相关的疑问,比如常说的多点共享消息,如下图:

即李明,李飞和借款人三个实体共享多个实体消息,比如寓居地址,银行账号,毕业学校等齐全相反,那么就存在金融欺诈的或许性。

还有 串行逻辑推理,最经常出现的例子相似股权穿透

比如张三占A公司股权50%, 而A公司占B公司股权30%,那么股权穿透后张三实践占比A公司股权15%。当然张三或许还经过C公司来占有了B公司股权。经过这种企业和人构成的语义网络就很容易剖析计算出详细的公司实控人等消息。

就来看,常识图谱的推理自身曾经不是繁难基于语义网络的语义模型和规定解放启动推理,而是和深度学习启动联合。行将语义模型导入到深度学习模型中,强化深度学习的推理和预测才干。

咱们举个繁难的例子,比如介绍系统和介绍引擎,实践外围依然是基于采集的用户少量行为数据作为基础,然而同时假设导入了用户自身的好友相关语义模型,那么整个介绍模型或许会愈加准确。

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://clwxseo.com/wangluoyouhua/8172.html

猜你喜欢

热门资讯

关注我们

微信公众号