01 什么是常识图谱
咱们可以从不同的视角去扫视常识图谱的概念。
目前,学术界还没有给常识图谱一个一致的定义。在谷歌颁布的文档中有明白的形容,常识图谱是一种用图模型来形容常识和建模环球万物之间关联相关的技术方法。
常识图谱还是比拟通用的语义常识的方式化形容框架,它用节点表示语义符号,用边表示语义之间的相关,如图3-1所示。在常识图谱中,人、事、物通常被称作实体或本体。
▲图3-1 常识图谱示例
常识图谱的组成三要素包含:实体、相关和属性。
▲图3-2 常识图谱中的属性
常识图谱的构建触及常识建模、相关抽取、图存储、相关推理、实体融合等多方面技术。常识图谱的运行则体如今语义搜索、智能问答、言语了解、决策剖析等多个畛域。
02 常识图谱的价值
常识图谱最早运行于搜索引擎,一方面经过推理成功概念检索,另一方面以图形化方式向用户展现经过火类整顿的结构化常识,从而使人们从人工过滤网页寻觅答案的形式中摆脱进去,可运行到智能问答、人造言语了解、介绍等方面。
常识图谱的开展得益于Web技术的开展,受KR、NLP、Web以及AI等方面的影响。常识图谱的价值归根结底是为了让AI变得更智慧。
1. 助力搜索
搜索的目的是在万物互联的网络中,能够使人们繁难、极速地找到某一事物。目前,咱们的搜索习气和搜索行为依然是以关键词为搜索目的,常识图谱的发生可以彻底扭转这种搜索行为形式。
在常识图谱还没有运行到搜索引擎上时,搜索的流程是:从海量的URL中找出与查问婚配度最高的URL,依照查问结果把排序分值最高的一些结果前往给用户。在整个环节中,搜索引擎或许并不要求知道用户输入的是什么,由于系统不具有推理才干,在精准搜索方面也略显无余。
而基于常识图谱的搜索,除了能够间接回答用户的疑问外,还具有必定的语义推理才干,大大提高了搜索的准确度。图3-3所示是常识图谱助力搜索示用意。
▲图3-3 常识图谱助力搜索
2. 助力介绍
介绍技术和搜索技术十分相似,然而稍有区别。搜索技术驳回消息拉取的方式,而介绍技术驳回消息推送的方式,所以在介绍技术中有一些疑问,比如冷启动和数据稀疏疑问。
以电商介绍为例引见常识图谱在介绍上的运行。假定我买了手机,手机的强下位相关是手机壳,这样系统就可以给我介绍手机壳,同时也可以介绍相似或互补的实体。图3-4为常识图谱助力介绍示用意。
▲图3-4 常识图谱助力介绍
3. 助力问答
问答与对话系统不时是NLP在人工智能成功畛域的关键标记之一。常识图谱相当于是给问答与对话系统挂载了一个背景常识库。
关于问答与对话系统或许聊天机器人来说,其除了要求实体常识图谱和兴味常识图谱等放开畛域的稀疏大图外,还要求针对机器人和用户共性化的浓密小图。同时,常识图谱是要求灵活降级的。图3-5是常识图谱助力问答示用意。
▲图3-5 常识图谱助力问答
03 常识图谱的架构
常识图谱的架构触及常识表示、常识失掉、常识处置和常识应用等多个方面。
普通状况下,常识图谱构建流程如下:首先确定常识表示模型,而后依据不同的数据起源决定不同的常识失掉手腕并导入相关的常识,接着应用常识推理、常识融合、常识开掘等技术构建相应的常识图谱,最后依据不同运行场景设计常识图谱的体现方式,比如:语义搜索、智能介绍、智能问答等。
从逻辑上,咱们可以将常识图谱划分为两个档次:数据层和形式层。数据层可以是以理想为单位存储的数据库,可以决定的图数据库有RDF4j、Virtuoso、Neo4j等三元组。
<实体,相关,实体>或许<实体,属性,属性值>可以作为基本的表白方式,存储在图数据库中。形式层建设在数据层之上,是常识图谱的外围。通常,经过本体库来治理数据层,本体库的概念相当于对象中“类”的概念。借助本体库,咱们可以治理公理、规定和解放条件,规范实体、相关、属性这些详细对象间的相关。
常识图谱有自顶向下和自底向上两种构建方式。自顶向下构建是指借助百科类数据源,提取本体和形式消息,并添加常识库中。自底向上构建是指借助必定的技术手腕,从地下的数据中提取资源,决定其中置信度较高的消息,经人工查看后,添加常识库中。
在常识图谱开展初期,少数企业和机构驳回自顶向下的方式构建常识图谱,目前大多企业驳回自底向上的方式构建常识图谱。
常识图谱的架构如图3-6所示。
▲图3-6 常识图谱的架构
关于作者:刘宇,清华大学硕士,现到任于一家跨境电商公司,任技术总监,关键担任该公司搜索介绍业务以及广告的相关技术开发。目前上班的重点是落地算法在搜索系统、介绍系统、对话系统等详细业务场景下的运行。对机器学习、深度学习、大数据运行与开发等颇有钻研。合著有《聊天机器人:入门、进阶与实战》一书。
赵宏宇,本科毕业于西南大学;钻研生毕业于RIT,主修AI方向。现到任于猎聘网,关键担任猎聘网介绍排序相关的上班。
刘书斌,本科毕业于西南大学,现到任于美团,资深系统开发工程师。曾在唯品会任职,关键担任搜索工程的架构设计与成功等相关上班,在Elasticsearch方面有丰盛的工程通常阅历。
孙明珠,硕士毕业于南京航空航天大学,现到任于猎聘网,担任初级算法工程师,担任查问了解、解析、裁减等NLP相关的上班。
本文摘编自《智能搜索和介绍系统:原理、算法与运行》,经出版方授权颁布。
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://clwxseo.com/wangluoyouhua/8207.html