,越来越多的短视频用户不只宿愿应用碎片化的期间来休闲文娱,也开局宿愿能够在短视频平台中失掉更多常识。2021年,快手泛常识内容播放量同比增长58.11%,平台全年有超越3300万场泛常识直播 [1]。为了更好地理解和组织泛常识视频,快手MMU联结哈尔滨工业大学等提出业界首个多模态短视频百科——“快知(Kuaipedia)”:经过多模态和常识图谱技术从海量短视频中 开掘大规模高品质的常识视频,并将其结构化,构成体系化的短视频百科常识库 ,为用户提供更好的常识失掉体验,同时激起创作者发明优质常识内容,构建良性的常识分享生态。
团队从快手海量短视频中开掘出亿级别常识类视频,并对其启动了却构化,构建了千万级词条和常识点视频百科体系。“快知(Kuaipedia)”的提出有助于学界推进AI经过多模态消息了解环球常识,且在产业界落地有较大构想空间。
百科全书(Encyclopedia),可以追溯到希腊和罗马,也是17-18世纪法国启蒙静止的一个卓越的成绩。常识百科通常是指一个是概要引见人类所有常识或某一特定畛域或学科的工具书或纲要,在互联网急速开展的当下,网络百科成为常识新的载体,如维基百科、百度百科等。但这些百科通常以图文、表格为载体,比拟难以表白一些须要活泼演示的常识,比如教程(How-to)类常识。图一展现了经常使用图文讲述 “柴犬”-“怎样画” 这一常识的困境。而经过短视频,咱们能够很好地对这些常识启动一个阐释和学习。
图一:图文在how-to类常识上常识传递的困境,图文来自短视频的帧截图
随着内容行业和媒体外形的始终迭代,短视频曾经越来越成为常识流传者的重要媒介,尤其是在一些技艺和专长类的常识流传,自然就有它的一些长处。而在当下,虽然有地下的网络百科中有视频的内容,但通常是偏简介方式(如秒懂百科),没有将短视频最大水平的启动应用,因此短视频在常识百科中的表白才干被重大低估。比如当人们讲到“柴犬”,人们除了“简介” 以外,还关注“怎样挑”、“怎样梳毛”、“怎样纠正护食”等。因此咱们以为将常识类的短视频结构化,构成结构化的短视频百科是一条了解环球常识、协助人类以更高效率流传常识的有效路径。
科普常识 教程常识 ,在快手海量的视频中开掘出高质的常识视频。此外,咱们将短视频中抽取的常识主体以 词条 方式出现(如柴犬),并抽取视频中解说的该词条详细的 常识点 (如柴犬-筛选、柴犬-护食纠正等),最终构成了一个短视频的百科常识体系,如图二所示。
图二:快知——多模态短视频百科概览
“快知(Kuaipedia)”的提出有以下几个奉献:
“快知”的定义 :咱们开创性地定义了一个全新的多模态常识百科库,以词条、常识点、常识类短视频以及它们间的相关独特构成。这是业界首个结构化的多模态短视频百科。
构建大规模短视频百科的方法 :咱们提出经常使用常识视频识别、词条常识点开掘、多模态常识链接的组合来构建大规模的短视频百科。并开创性提出“多模态常识链接”义务,作为传统实体链接的一个外延和裁减。
富裕后劲和构想空间的运行 :在学术上,“快知”以崭新的常识点短视频化组织方式,能够打破目前机器仅靠图文常识图谱(KG)了解环球常识的下限,在KG的一些下游义务照实体链接、实体分类,或许NLP、CV等外容了解下游义务上,有十分大的后劲。在产业界,“快知”这样的方式能够助力短视频平台启动高效地运营、组织内容,优化用户对常识的了解与生产效率。
为了成功上述的短视频百科结构化,外围技术包含以下三个重要步骤,如图三所示。
常识视频识别: 经过多模态视频预训练模型,了解并识别海量视频中常识类视频;
词条和常识点开掘: 经过多源常识库融合“自顶向下”构建词条体系,再经过对用户搜查query开掘“自底向上”构建词条与常识点相关,构成词条常识点树
多模态常识链接 :翻新性地裁减传统“实体链接”义务,提出经过多模态内容了解技术将视频链接到词条(如柴犬)的某一个常识点(如护食纠正)上的“多模态常识链接”义务。
图三:快知构建技术链路
经过少量详实的人工评测,快知所开掘的常识点与视频已具有较高的准确率和品质。更详细的算法和试验数据详细参见论文或许咱们的Github主页(见文章扫尾)。
首先,“快知(Kuaipedia)”这样的多模态短视频百科体系,在学术界关于推进AI了解环球常识的技术开展有极大的后劲。一方面,“快知”打破图文和表格的局限,经过更丰盛的常识点和短视频来形容某一个实体或许概念,这种方式能够推进多模态常识图谱技术的开展。另一方面,这些常识点和短视频有助于AI更好地理解环球常识,尤其是一些图文难表述的 How-to 类常识,这种多模态常识能够增强AI对环球的了解,对KG、NLP、CV等畛域的下游运行都很有协助。咱们在CCKS实体链指的义务上,证实“快知”多模态常识的便捷引入就能有效优化BERT在实体链接和在实体分类上的性能。
此外,“快知”在产业落地极具构想力,在短视频生态向“泛常识”拓展的环节中,现有的方式解放了其流传方式,“快知”经过结构化的内容,能优化平台的运营和散发效率,更好地满足用户的求知诉求。咱们将该项技术首先在肥壮垂类启动了落地尝试,快手肥壮团队此前以病种为组织维度,纯人工开掘了一批优质PUGC内容,但是存在疾病常识体系不完善、威望性常识视频量级小等痛点,难以高效率构建完整、大规模、结构化的疾病视频体系。应用“快知”的技术后,智能化地开掘出了一批高品质、有快手特征的常识点和常识视频,丰盛了疾病类内容,比纯人工构建提效 几十倍 。目前这批内容曾经在快手App精选页上线:点击精选视频流中某个疾病类视频的「底部通栏」,唤起「快手肥壮」半屏页,用户可以生产该视频所属词条下的相关常识点和相关常识视频,如图四所示。
图四:快知在肥壮场景落地
除肥壮外,“快知”还笼罩了教育、美食、三农、亲子、法律、科技、金融等泛滥畛域的常识内容,有着较大的运行后劲。
面对泛常识类内容在短视频行业的开展前景,咱们提出了“快知(Kuaipedia)”多模态短视频百科体系,从存量的海量短视频内容入手,经过多模态常识图谱构建技术开掘出亿级别高品质的常识视频,并将常识内容结构化,构建业界首个大规模体系化的短视频百科常识库,其在学术界和产业界有较大的后劲和构想空间。
第一作者:潘浩杰
快手MMU常识图谱中心成员,快出名目担任人,本硕毕业于浙大和港科大,曾在阿里云PAI担任大规模NLP算法与框架,在ACL、EMNLP、KDD、AIJ等顶会顶刊中宣布10余篇论文,多项国际和美国专利,详见知乎。2021年参放慢手。
通信作者:付瑞吉
快手MMU常识图谱中心担任人,本硕博毕业于哈工大,中科大博士后。曾担任科大讯飞AI钻研院副院长,获吴文俊人工智能科技提高奖一等奖。在ACL、EMNLP、Coling、IJCAI、TASLP等国际会议和期刊上宣布学术论文多篇,放开(取得)国度发明专利四十余项。2021年参放慢手。
协作教员:刘铭
传授/博士生生导师,哈尔滨工业大学计算学部。先后掌管国度重点研发方案名目课题、国度自然迷信基金、中国博士后迷信基金特意资助、中国博士后迷信基金面上资助一等资助、黑龙江省面上基金等多项基金名目。获黑龙江省迷信技术一等奖,哈尔滨市科技成绩,第六届全国青年人工智能翻新守业大会一等奖。 近年来以第一作者或通信作者宣布CCFA/B类论文20余篇,参编教材一部,英文译著一部。担任NLPCC2020、CCKS2020、COLING2022常识图谱畛域主席,CCKS2019出版主席、CCKS2021评测主席、CCKS2022讲习班主席。
参考文献
[1] 快手,2022快手泛常识内容生态报告.
[2] 国度规范委:常识治理框架,GB/T 23703.
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://clwxseo.com/wangluoyouhua/8185.html