电商信息资讯,更全更新信息实报!
主页 > 知识 > > 正文

读书笔记:知识图谱白皮书2019版

来源:网络整理 发布时间:2021-09-08 09:07 标签:大数据
浏览:

今天开始学习由电子信息标准化研究院联合众多科技公司、高校、科研院所出品的,

句子太长换个行:《知识图谱白皮书》。

下载地址:cesi.ac.cn/201909/5589.html

这位同学硕士刚要入学,已经做过一波阅读了,赞一个:

我由于工作需要,有必要认真学习一波中央下发的文件精神,以便后面吓唬小朋友或者出去吹逼时,有足够的素材可以讲。

知识图谱,knowledge graph。

维基百科定义在此:

第一章:背景介绍知识图谱和AI一样,都是几十年前就发明的概念,后来进过语义网、本体、知识库之类的名词演变,现在又叫回来了。之所以知识图谱一直没有一个成体系的教材,因为大家对于知识表示这件事实在是莫衷一是。(你问问给他们打工的大数据研发就知道了。)不管图论、三元组、RDF电商 知识图谱,都是探索路上的产物,各有各的适用场景。目前来看还是图数据库最能博采众长。说到知识图谱的重要性,我觉得在于它是理解层的AI任务。相比CV、Robotics这些感知层的任务而言,理解层更难做,也更接近于强人工智能的目标。对我来说吸引力在这儿。这本白皮书并不是红头文件,是一次比较大范围的官宣,“宣”是宣传,不是宣布。有这么个东西作为一个阶段性的总结和指导,总归是件大好事。AI是个框,啥都往里装。我看过的水货甚至垃圾科技公司不少,其中拿KG说事的也不在少数。行业标准的指定,有利于识稂莠、辨真假。第二章:知识图谱需求本章主要讲知识图谱的需求场景,如果你没有toB行业的从业经验,可能读这章会觉得他们在扯淡,而且想怎么扯就怎么扯。toB行业本质是机构之间的合作、相互服务,发展壮大后的toB企业能形成庞大的生态圈,大家都有饭吃。但一个行业兴起的初期,做toB的需要扶持,因此给政府打工的toG企业显然是最合理的切入点。

所以你看国内的安防市场是政府和toB科技企业的主赛道之一。数字化转型是AI+大数据背景下的一个覆盖全国方方面面的大工程,可以理解为城镇化建设之后的又一次全国性“基建”。如果你觉得这也是吹逼,那说明你对科技进步习以为常,熟视无睹了。不是每个国家都能有这种基建速度的。所谓数字经济,不止是电商一样。支付、金科、物流、运输,各方面都有AI和大数据的用武之地。文中提到的从“数据中心”到“知识中心”过渡的过程,就是知识图谱的实战场景了。至于优化目标,就是更多知识、更高效率。读这种务虚为主的篇章,一目十行就行了。上世纪的市场经济转型可以理解为一次根本的制度创新、模式创新。那种翻天覆地的事不要指望每几十年就能有一次。这次的金融科技创新主要是一次科技创新,金融则是需求方和应用场景。做知识图谱,如果只了解一些NLP、推荐算法,读读paper,跑跑模型,是不可能有所作为的。个人的领域知识和行业背景可以作为寻找切入点的依据。比如做保险、信贷业务,你的金融、财会、经济学知识能帮上忙。又比如做量化交易,你的数学、统计、计算机系统知识能帮上忙,这些则会成为你进行产品落地的战斗力保证。所以你在反欺诈、大数据风控等领域碰到的牛人,基本不会是纯粹的技术/学术牛人或者背景深厚的社会人,而是两者的平衡。

我在学习“数据湖”概念时,听说个概念叫“数据井”,意思和数据孤岛差不多。不同场景的数据由于存储、表示差异,以及政策、利益等非技术因素而无法打通,导致各自能发挥的价值远小于打通之后的总价值。所谓知识融合,就是操心这块儿的。传统的反欺诈审核从业者,不跟债权人、债务人聊聊,不去走访下董监高,恐怕很难让自己放心。如今基于大数据和机器学习的用户画像、风控等等业务,依赖的主要就是数字资产的品质和体量。如果数据能描绘的,本身就和物理世界相去甚远呢?那就崴了呗。所以,不要迷信技术手段和黑科技。做知识图谱的人对“长尾需求”会倍感亲切,因为小数据、异构、规则繁杂的问题无处不在。越细碎就会越长尾,虽然长尾你又不能撂挑子。所以,讲知识图谱是高大上的,搞知识图谱是脏乱差的。“资源优化”这部分有点强行KG的意思。这部分其实主要发力点在于数据治理、审计数字化、供应链优化,其中主要涉及大数据、运筹优化两块儿电商 知识图谱,和图谱的关系没那么大。本章出现了“第四范式”,谜之出镜。戴神当初给公司起名估计就琢磨的这个吧,毕竟他是做知识工程、数据挖掘相关方向起家的。“科学研究”这章里,说用图谱技术来帮助发现前沿方向,我看了之后的感受就是没发现与传统的数据挖掘、信息检索、聚类分析等技术有什么区别。

标签:大数据
发表评论
验证码: 点击我更换图片

注:网友评论仅供其表达个人看法,并不代表本站立场。

近期活动

更多 >

热门文章

  • 为电商而生的知识图谱,如何感应用户需
    为电商而生的知识图谱,如何感应用户需

    为电商而生的知识图谱,如何感应用户需

    如何建设一个比较通用的面向应用的概念体系,支持根据业务需求提供查询服务,已经迫在眉睫。mining流程后持续扩大挖掘覆盖),目前数据已经作为类目预...

  • 2020年国内十大生鲜电商平台排名!
    2020年国内十大生鲜电商平台排名!

    2020年国内十大生鲜电商平台排名!

    目前除了我们熟知的天猫生鲜、京东生鲜等生鲜平台,还有哪些生鲜电商o2o平台呢?接下来我们就一起来看看2020年十大生鲜电商平台有哪些!每日一淘是一个...

  • 阿里知识图谱首次曝光:每天千万级拦截
    阿里知识图谱首次曝光:每天千万级拦截

    阿里知识图谱首次曝光:每天千万级拦截

    阿里妹导读:借助阿里知识图谱的建设,阿里电商平台管控从过去的“巡检”模式升级为发布端实时逐一检查。在海量的商品发布量的挑战下,最大可能地...

  • 互联网+生鲜电商解决方案 生鲜电商O2O解
    互联网+生鲜电商解决方案 生鲜电商O2O解

    互联网+生鲜电商解决方案 生鲜电商O2O解

    生鲜电商O2O解决方案(38页珍藏版)》请在人人文库网上搜索。度上限制了生鲜电商的发展。方的农业生鲜交易平台存在小、弱格局。、配送企业、线下门...

  • 详细解读知识图谱的这一人工智能技术分
    详细解读知识图谱的这一人工智能技术分

    详细解读知识图谱的这一人工智能技术分

    相比于传统人工智能,知识图谱时代基于向量的知识表示方法不仅能够以三元组为基础的较为简单实用的知识表示方法满足规模化扩展的要求,还能够作为...

人物

更多 >
人物马云:区块链不是泡沫
人物李彦宏:百度有自己的价值观 未来“AI战
人物吴欣鸿:美图秀秀下一个十年发力图片社
人物最贵的离职:陆奇带走了百度900亿市值
人物刘强东代言上瘾,这次为核桃代言

专题

更多 >
广告位