1.1常识图谱的开展历史 常识图谱始于20世纪50年代,至今大抵分为三个开展阶段:
• 第一阶段 (1955年—1977年)是常识图谱的来源阶段,在这一阶段中引文网络剖析 开局成为一种钻研当代迷信开展头绪的罕用方法;
• 第二阶段(1977年-2012 年)是常识图谱的开展阶段,语义网失掉极速开展,“常识本体”的钻研 开局成为计算机迷信的一个关键畛域,常识图谱排汇了语义网、本体在常识组织和表白方面的理念,使得悉识更易于在计算机之间和计算机与人之间替换、流通和加工;
• 第三阶段(2012年—至今)是常识图谱兴盛阶段,2012年谷歌提出Google Knowledge Graph,常识图谱正式得名,谷歌经过常识图谱技术改善了搜查引擎功能。在人工智能的蓬勃开展下,常识图谱触及到的常识抽取、示意、融合、推理、问答等关键疑问失掉必定水平的处置和打破,常识图谱成为常识服务畛域的一个新热点,遭到国际外学者和工业界宽泛关注。
常识图谱详细的开展历程如下图所示。
案例解说素材
近年来,随着语义Web的兴起,本体技术遭到了宽泛关注。很多大型跨国公司都开局钻研本体技术。 谷歌于2012年提出了常识图谱的名目,旨在应用本体技术来提高搜查的精度和更智能化的常识阅读 。国际的互联网公司,如百度、搜狗,也曾经展开这方面的名目。微软提出了Probase名目,旨在经过爬取网页中的消息来构建大规模的本体。IBM应用语义Web技术来处置异构医疗数据的整合以及更准确的查问回答。本体技术在IBM的驰名问答系统Watson中施展了关键的作用。Oracle成功了一个弱小的语义数据推理和索引系统。本体技术还遭到欧美政府的允许。英国政府动员了名目,把很多政府网站的消息都以本体的方式散布。而美国政府也有相似的名目。学术界对本体的钻研有很多成绩,特意是在计算机迷信畛域,有很多适用的技术被开发。欧盟在最近5年投入少量科研经费(累积超越数亿欧元)用于本体相关的钻研。
1.2 常识图谱的关键性 哲学家柏拉图把常识定义为“Justified True Belief”,即常识须要 满足三个外围因素:正当性(Justified)、实在性(True)、被置信 (Believed)。便捷而言,常识是人类经过观察、学习和思索无关主观环球的各种现象而取得和总结出的一切理想(Facts)、概念(Concepts)、规定或准则(Rules & Principles)的汇合。人类发明了各种手腕来形容、示意和传承常识,如人造言语、绘画、音乐、数学言语、物理模型、化学 公式等,可见关于主观环球法令的常识化形容关于人类社会开展的关键性。具备失掉、示意和处置常识的才干是人类心智区别于其它物种心智的关键特色,常识图谱已成为推进机器基于人类常识失掉认知才干的关键途 径,并将逐渐成为未来智能社会的关键消费资料。
n 常识图谱是人工智能的关键基石。
n 常识图谱推进智能开展。
n 常识图谱是强者工智能开展的外围驱动力之一。
常识图谱是Google在2012年5月17日提出的,其初衷是为了提高搜查引擎的才干,改善用户的搜查品质以及搜查体验。的人工智能技术其实可以便捷地划分为感知智能(关键是图像、视频、语音、文字等识别)和认知智能(触及常识推理、因果剖析等),常识图谱技术就是认知智能畛域中的关键技术,是人工智能技术的组成局部,其弱小的语义处置和互联组织才干,为智能化消息运行提供了基础。
一个常识图谱旨在形容理想环球中存在的实体以及实体之间的相关。随着人工智能技术的开展和运行,常识图谱作为关键技术之一,已被宽泛运行于智能搜查、智能问答、共性化介绍、内容散发等畛域。
从经常使用范围来说,常识图谱分为通用常识图谱和畛域常识图谱,通用常识图谱强调的是广度,数据多来自于互联网,而畛域常识图谱运行于垂直畛域,成为了基础数据服务。
1.3 常识图谱的定义 常识图谱(Knowledge Graph)以结构化的方式形容主观环球中概念、实体及其相关,将互联网的消息表白成更凑近人类认知环球的方式,提供了一种更好地组织、治理和了解互联网海量消息的才干。常识图谱 给互联网语义搜查带来了生机,同时也在智能问答中显示出弱小威力,已 经成为互联网常识驱动的智能运行的基础设备。常识图谱与大数据和深度 学习一同,成为推进互联网和人工智能开展的外围驱动力之一。
技术规范化钻研院 常识图谱不是一种新的常识示意方法,而是常识示意在工业界的大 规模常识运行,它将互联网上可以识别的主观对象启动关联,以构成主观环球实体和实体相关的常识库,其实质上是一种语义网络,其中的节点代表实体(entity)或许概念(concept),边代表实体/概念之间的各种语义相关。常识图谱的架构,包括常识图谱自身的逻辑结构以及构建常识图谱所驳回的技术(体系)架构。常识图谱的逻辑结构可分为形式层与数据层,形式层在数据层之上,是常识图谱的外围,形式层存储的是经过提炼的常识,通常驳回本体库来治理常识图谱的形式层,借助本体库对公理、规定和解放条件的允许才干来规范实体、相关以及实体的类型和属性等对象之间的咨询。数据层关键是由一系列的理想组成,而常识将以理想为单位启动存储。在常识图谱的数据层,常识以理想(fact)为单位存储在图数据库。 假设以“实体-相关-实体”或许“实体-属性-性值”三元组作为理想的基本表白方式,则存储在图数据库中的一切数据将构成庞大的实体相关网络,构成“常识图谱”。
常识图谱旨在形容实在环球中存在的各种实体或概念及其相关,其构成一张渺小的语义网络图,节点示意实体或概念,边则由属性或相关构成。如今的常识图谱已被用来泛指各种大规模的常识库。
如上图所示,常识图谱中蕴含三种节点,其基本方式为(实体1-相关-实体2)、(实体-属性-属性值)。
实体:指的是有可区别性且独立存在的事物。如某个国度:中国、英国等;某个市区:北京、伦敦等。
语义类:具备某种特性的实体构成的汇合,如国度、市区、民族等。
属性值:实体指向的属性的值。例如中国(实体)面积(属性)960万平方公里(属性值)。
相关:在常识图谱上,相关是把kk个图节点(实体、语义类、属性值)映射到布尔值的函数。
基于上述的语义图概念,咱们可以构建一个国度的常识图谱作为例子,如下图所示:
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://clwxseo.com/wangluoyouhua/8194.html