2012年,Google推出了一款名叫Knowledge Graph(知识图谱)的产品,该产品从Metaweb衍生而来,关键用于提高搜查引擎品质,改善用户搜查体验。
2020年,知识图谱从一个分支产品成为树立大规模知识的杀手锏运行,在搜查、人造言语处置、智能助手、电子商务等畛域施展着关键作用。
8年时期,随着大数据时代的来到和人工智能技术的飞速提高,知识图谱越发透出其基础性和关键性。
那么,究竟什么是知识图谱呢?
知识图谱 ,是显示知识开展进程与结构相关的一系列各种不同的图形,用可视化技术形容知识资源及其载体,开掘、剖析、构建、绘制和显示知识及它们之间的相互咨询。
知识图谱可以将互联网的消息表白成更凑近人类认知全球的方式,同时提供了一种更好的组织、控制和了解互联网海量消息的才干。知识图谱给互联网语义搜查带来了生机,同时也在智能问答中显示出弱小威力,
曾经成为互联网知识驱动的智能运行的基础设备。知识图谱与大数据和深度学习一同,成为推进互联网和人工智能开展的外围驱动力之一。【1】
文字表述看似深奥,实则咱们在日常生存中经常感遭到知识图谱技术带来的便利。
比如在百度中搜查刘德华的团体消息,会发生图1和图2两种展现方式,从内容上看,两者展现的消息差异不大,但图2看起来就愈加直观。尤其是随着文本内容的参与,图2的体现方式的长处就会愈加突出。放到大数据的互联网平台,图2的表白形式显然更便于处置加工,然而互联网等数据平台所收集的消息多为如图1所示的碎片式消息,所以把图1内的文字内容转换成图2的环节,就触及到上方提及的知识图谱技术。
再比如图3,咱们经常会看到针对某团体或许某件事关键词的出现,理想上这种出现方式也是机器应用知识图谱技术把网友的评估等碎片化的消息启动整顿加工后构成的。
2020年的知识图谱技术开展现状
据《2020人工智能中国专利技术剖析报告》统计,知识图谱技术专利放开量全体出现稳中回升的趋向。自2012年起,我国知识图谱技术畛域内专利放开增长速度清楚放慢,从图4可以看到,2019年放开量到达巅峰,全年共放开4966件相关专利。据不齐全数据统计,2020起始截止到2020年10月底,该畛域的专利放开量已到达1942件,知识图谱技术正成为各权益主体失掉人工智能产业竞争力的有力武器。【2】
为了更好的了解知识图谱畛域专利放开人(或企业)的状况,笔者经过北京市知识产权公共消息服务平台对知识图谱畛域的专利放开状况启动了检索,检索结果如图5所示,经过检索发现,在知识图谱畛域,腾讯科技(深圳)有限公司 、北京百度网讯科技有限公司、安康科技(深圳)有限公司、北京明略软件系统有限公司以及百度在线网络技术(北京)有限公司区分排名前五。其中,腾讯科技以550件专利量排名第一,百度网讯以346件专利量排名第二,安康科技以182件专利量排名第三,北京明略以110件专利量排名第四,百度以92件专利量排名第五。
同时,笔者也在国度知识产权局专利检索及剖析网站检索了知识图谱畛域的相关专利,检索结果如图6所示,与经常使用北京消息服务平台检索的结果相比,前五名的专利放开人的出入不大,区分为百度网讯、安康科技、腾讯科技、海南大学、北京明略。不过在专利放开量上有些区别,百度网讯以237件专利放开量排名第一,安康科技以136件专利放开量排名第二,腾讯科技以116件专利放开量排名第三,海南大学以64件专利放开量排名第四,北京明略以59件专利放开量排名第五。
从图7中可以看出,2020年知识图谱畛域专利放开量国际各省市排名中,北京、广东是关键放开区域,其中,北京以占比31%的专利放开量排名第一,广东以占比24%的专利放开量排名第二,浙江则以占比11%的专利放开量排名第三。
从图8中可以看出,2020年放开的知识图谱畛域的专利的IPC关键集中在G06、H04,其中G06F16以占比21%排名第一,G06K9以占比17%排名第二;G06N3以占比14%排名第三。
从图9中可以发现,人工智能、知识图谱、特征向量、机器学习、深度学习等关键词成为2020年知识图谱畛域放开专利中的翻新词云。
据中国软件网不齐全统计,我国知识图谱产品或处置打算干流企业约有38家,在这其中,规划在金融畛域的企业约占65%,公共服务与政务畛域约占26%,动力与工业畛域约占26%,是企业入局最高的三大畛域。
从图10可以发现,许多公司应用知识图谱技术涉足金融、公共服务与政务、医疗医药、动力与工业和商业畛域等多个畛域,比如腾讯云应用知识图谱技术开展物联网,并将其运行于医疗仪器、运输业车辆GPS等,阿里云应用知识图谱技术允许电力畛域的操作规程等上班,华为云更是应用知识图谱技术助力油气的勘探开发,明略科技应用知识图谱技术在金融、公共服务与政务、动力与工业和商业畛域等均有涉足,北京海致网聚消息技术有限公司应用知识图谱技术实如今公安畛域的落地通常。
那么知识图谱在实践上班中是如何在不同畛域施展其功用呢?笔者咨询了明略科技团体知识工程试验室主任张杰博士,张杰博士曾率领团队以“知识图谱智能构建及行业运行”为题取得了2020年度第十届吴文俊人工智能迷信技术一等奖。张杰博士示意:
过去几年,明略科技经过自主研发的知识图谱平台和预构建的行业处置打算服务于政府、公安、银行、保险、证券、轨交、电力、制作、融媒体、食品安保等畛域的200多个行业客户。
在社交媒体舆情剖析场景中,基于知识图谱,可以把用户发生的评论,与后盾的产品知识库相对应,便于运营人员对产品更细粒度的特性做用户舆情走势剖析,随后把这些结果整合到BI系统,从而成功用户需求洞察,辅佐消费创意内容,成功千人千面的共性化广告。
在线下批发场景中,首先开售人员经过佩戴明略的电子工牌,将开售环节数字化,而后经过语音识别技术将开售对话转为文字,再经过人造言语处置技术启动话题分类,计算出话题之间转移的概率,构成一个话题转移的知识图谱,最后经过与金牌开售员的话题图谱做比对,可以协助开售人员做复盘,剖析流单的关键环节,改善话术并提高成单率。咱们研发的HAO图谱系统是目前国际上第一个语音实时生成图谱的企业级知识图谱开发工具包。
在金融风控场景中,团体信贷客户可以经过亲友、共事、担保等相关组成图谱,对公客户可以经过股权、担保、资金相关组成图谱,咱们经常使用图示意学习算法将客户做向量化示意,向量中包括了图谱的结构消息,这个向量可以用于反欺诈模型和信誉评分模型。
在工业设备维保场景中,咱们可以从传感器收回的缺点信号的时期序列数据中开掘出缺点的主伴生相关,可以从培修工单的非结构化文本中开掘出因果相关,而后逐渐拼接出检修知识图谱,为培修工人提供检修最佳通常,运行这套系统后车辆缺点率降落约50%,逐渐从每日检修变成每8日检修,大幅度降落运营缺点、缩小了人上班业、提高了检修效率。
知识图谱前路坦荡,未来已来
依据统计的数据显示,目前知识图谱曾经在技术上有了必定开展,并逐渐在电子商务、公安、医疗等畛域开局落地,那么目前知识图谱畛域的开展状况终究如何,曾经具有了哪些长处?未来知识图谱技术开展又将会面对哪些技术应战呢?针对这些疑问,张杰博士回复说:
知识图谱的开展得益于技术的逐渐成熟和数字化转型的历史趋向。最近几年在大数据和人工智能技术飞速开展的背景下,很多传统行业展开了新一轮的数字化转型,2020年两会时期,数字化转型被写入政府。智能化是企业数字化转型的新方向、新阶段。在智能化的环节中,业内普遍以为可以分为三个阶段:算力智能、感知智能和认知智能。知识图谱被以为是从感知智能迈向认知智能的关键环节,因此失掉了宽泛关注,越来越多的企业和组织展开知识图谱的树立并结合业务场景展开运行:一种是较为通用的技术型运行,如可视化洞察、消息检索、介绍系统、义务型问答;另一种是具有行业特征的处置打算型运行,如金融反欺诈、快消品营销、工业维保等。
知识图谱的长处关键体如今以下几个方面:1)衔接企业外部数据和外部的海量数据。知识图谱对数据类型的定义灵敏,并能高效的允许深档次的关联查问,拓展企业数据总量的同时优化数据应用效率,监禁出大数据红利;2)衔接大数据技术和人工智能技术。它可以从网络结构、时期序列、行为对话等新型数据中加工出高阶特征,提供应下游的算法工程师,使其更专一在详细的业务模型上;3)衔接畛域知识和知识知识。它可以对已有的知识体系做融合、补全、推理,提高知识体系的完备性,为流程优化、辅佐决策、预测剖析等下游运行提供基础服务。
只管知识图谱技术具有宽广的运行前景,但现阶段仍面临很多技术应战:1)构建老本疑问。关于结构化数据须要复杂的数据控制上班,关于非结构数据,消息抽取环节须要少量的标注上班;2)推理准确度疑问。知识图谱可以为搜查引擎、介绍引擎带来准确度优化,但其共同的运行价值在推理问答,须要处置在畛域知识不完备、且数据总量大的状况下启动极速准确的推理;3)方式化示意疑问。知识图谱的价值在运行,运行的难点在于知识推理,知识推理的难点在于知识示意。已有技术成绩多集中无理想知识(know-what)上,原理知识(know-why)和技艺知识(know-how)的钻研不足数学基础和最佳通常参考。
有些行业的数字化进程启动较晚,须要先处置数据在线和数据积攒的疑问,并且文明上注重数字化树立和数字化控制才或许使知识图谱技术得以运行。未来的扭转或许会有以下几方面:1)随着5G、物联网和感知技术的逐级成熟,企业非结构化数据的占比会越来越高,从语音、图像、视频的多模态数据中联结抽取知识的需求会越来越多;2)行业know-how类知识与know-what类知识可以相结合,从而推进人机协同下的智能决策;3)知识密集型行业中的企业越来越注重知识资产,基于知识图谱技术树立知识中台,而不只是控制文档、控制数据,并以专家阅历加数据驱动的方式做因果相关发现和因果推断,辅佐业务做出决策。
从蒸汽时代到电气时代,再到21世纪的消息时代,科技的开展推进着时代的提高,而人工智能正成为推进人类进入智能时代的选择性力气。咱们等候知识图谱这一被以为是从感知智能迈向认知智能的关键环节的技术在未来有更大、更宽广的运行与开展空间。
注:
【1】:《产业专利剖析报告-人工智能关键技术(第68册)》
【2】:工信部电子知识产权中心群众号文章《知识图谱专利规划放慢 优化AI产业竞争力》
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://clwxseo.com/wangluoyouhua/8178.html