电商信息资讯,更全更新信息实报!
主页 > 知识 > > 正文

大数据杂志2021年第03期大规模知识图谱预训练模型及电商应用

来源:网络整理 发布时间:2021-08-09 01:02 标签:实体关系图三元组上下文
浏览:

Largescalepre-trainedknowledgegraphmodelande-commerceapplicationCHENHuajun1,2,ZHANGWen3,WONGChi-Man4,YEGanqiang1,WENBo1,ZHANGWei2,41.CollegeofComputerScienceandTechnology,ZhejiangUniversity,Hangzhou310007,China2.Alibaba-ZhejiangUniversityJointResearchInstituteofFrontierTechnologies,Hangzhou311121,China3.SchoolofSoftwareTechnology,ZhejiangUniversity,Hangzhou310007,China4.AlibabaGroup,Hangzhou311121,ChinaAbstractInrecentyears,knowledgegraphhasbeenwidelyappliedtoorganizedatainauniformwayandenhancemanytasksthatrequireknowledge.Forexample,ithasbeenwidelyusedinthefieldofe-commerce.However,suchknowledgeservicesusuallyincludetediousdataselectionandmodeldesignforknowledgeinfusion,whichmightbringinappropriateresults.Thus,tosolvethisproblem,themethodoffirstpre-trainingthenprovidingknowledgevectorservicewasputforward,andapre-trainedknowledgegraphmodel(PKGM)wasproposedforourbillion-2021028-19798BIGDATARESEARCH大数据scalee-commerceproductknowledgegraph,providingitemknowledgeservicesinauniformwayforembeddingbasedmodelswithoutaccessingtripledataintheknowledgegraph.PKGMwastestedinthreeknowledge-relatedtasksincludingitemclassification,sameitemidentification,andrecommendation.ExperimentalresultsshowPKGMsuccessfullyimprovestheperformanceofeachtask.Keywordsknowledgegraph,pre-training,e-commerce大量重复性工作;②下游任务需要针对自己的任务重新设计知识图谱算法,从头训1引言练模型,由于图谱规模庞大,业务应用迭代周期过长电商 知识图谱,导致效率低下;③商品知识图知识广泛存在于文本、结构化及多种谱本身的不完整性风险会导致误差传导;模态的数据中。

除了通过抽取技术将知④直接提供原始三元组存在数据公平性风识从原始数据中萃取出来以支持搜索、问险和隐私风险。[1]答、推理、分析等应用,另外一种思路是为了避免这个问题,使商品知识图利用数据中本身存在的基本信号对隐藏谱更方便、更有效地为下游任务提供服的知识进行预训练(pre-training)。随务,笔者提出了“预训练+知识向量服务”着GPT、BERT、XLNet等预训练语的模式,并设计了知识图谱预训练模型言模型在多项自然语言处理领域任务上刷(pre-trainedknowledgegraphmodel,新了之前的最好效果,预训练受到了各界PKGM),在不直接访问商品知识图谱中的广泛关注。预训练的核心思想是预训练三元组数据的情况下,以知识向量的方式和微调,例如文本预训练一般包含两个步为下游任务提供知识图谱服务。在商品分骤:首先利用大量的自然语言数据训练一类、同款商品对齐以及商品推荐等多个下个语言模型,获取文本中包含的通用知识游任务上,验证了PKGM的有效性,其中信息;然后在下游任务微调阶段,针对不同在推荐任务上达到了平均6%的提升,同时的下游任务设计相应的目标函数,基于相还证明了在困难数据尤其是样本较少的数对较少的监督数据进行微调,即可得到不据上提升效果更明显。

发表评论
验证码: 点击我更换图片

注:网友评论仅供其表达个人看法,并不代表本站立场。

热门文章

  • 为电商而生的知识图谱,如何感应用户需
    为电商而生的知识图谱,如何感应用户需

    为电商而生的知识图谱,如何感应用户需

    如何建设一个比较通用的面向应用的概念体系,支持根据业务需求提供查询服务,已经迫在眉睫。mining流程后持续扩大挖掘覆盖),目前数据已经作为类目预...

  • 2020年国内十大生鲜电商平台排名!
    2020年国内十大生鲜电商平台排名!

    2020年国内十大生鲜电商平台排名!

    目前除了我们熟知的天猫生鲜、京东生鲜等生鲜平台,还有哪些生鲜电商o2o平台呢?接下来我们就一起来看看2020年十大生鲜电商平台有哪些!每日一淘是一个...

  • 阿里知识图谱首次曝光:每天千万级拦截
    阿里知识图谱首次曝光:每天千万级拦截

    阿里知识图谱首次曝光:每天千万级拦截

    阿里妹导读:借助阿里知识图谱的建设,阿里电商平台管控从过去的“巡检”模式升级为发布端实时逐一检查。在海量的商品发布量的挑战下,最大可能地...

  • 互联网+生鲜电商解决方案 生鲜电商O2O解
    互联网+生鲜电商解决方案 生鲜电商O2O解

    互联网+生鲜电商解决方案 生鲜电商O2O解

    生鲜电商O2O解决方案(38页珍藏版)》请在人人文库网上搜索。度上限制了生鲜电商的发展。方的农业生鲜交易平台存在小、弱格局。、配送企业、线下门...

  • 电商平台的知识图谱构建方法、装置、设
    电商平台的知识图谱构建方法、装置、设

    电商平台的知识图谱构建方法、装置、设

    2019.05.2019.01.低的问题。字段对应的类目网络组成电商平台的知识图谱。电商平台的知识图谱构建方法、装置、设备及存储介质的权利要求说明书内容是.电...

人物

更多 >
人物马云:区块链不是泡沫
人物李彦宏:百度有自己的价值观 未来“AI战
人物吴欣鸿:美图秀秀下一个十年发力图片社
人物最贵的离职:陆奇带走了百度900亿市值
人物刘强东代言上瘾,这次为核桃代言

专题

更多 >
广告位