咨询热线:4008-6044-55 | OA | E-mail
赵鹏大院士作序引荐《地质大数据 : 非结构化数据的存储与发掘
日期:2022-08-08 04:12:20 | 作者:华体会最新地址

  本书理论结合实践,概括运用大数据、数据发掘、自然言语处理、人工智能等技能,就地质大数据中非结构化数据的存储、发掘两大关键问题打开论说,形成了非结构化地质数据内容提取、安排存储、剖析发掘及运用服务等较为完善的技能办法体系。

  大数据是信息技能开展的必定产品,更是信息化进程的新阶段。大数据的合理开发与运用,为人类拓荒了新的认知空间。大数据为地质作业的开展和革新带来新技能、新形式与新动力,支撑引领地质作业的数字化、网络化和智能化。地质作业,现已迈入大数据年代。

  《地质大数据:非结构化数据的存储与发掘》一书,概括运用大数据、自然言语处理、数据发掘等技能,就地质大数据中非结构化数据的存储与发掘两大关键问题打开论说,构建了非结构化地质数据内容提取、安排存储、剖析发掘、运用服务的较为完善的技能办法体系,树立了一条数据—信息—常识—服务—再数据的大数据链,为信息技能与地质查询范畴的交融、技能落地及运用奠定了根底。书中提出的非结构化地质数据的大数据模型具有较强的理论立异性和实用性,以此为根底完成的内容存储库,面向典型的数据密集型问题实践,从底层的数据拜访形式开端,遵从接近数据核算的理念,构建大数据技能与非结构化地质数据信息剖析发掘的桥梁,为地质大数据的深度剖析和常识发现奠定了根底。全书重视理论与实践相结合,在充沛研讨经典数据发掘和深度学习技能办法的根底上,针对非结构化地质数据的特色及地质范畴运用问题,在向读者论说相关数据发掘算法的根底理论常识的一起,从地质查询范畴的实践问题动身,选取多个方向的详细运用典范,直观地展现各种数据发掘技能在哪用、怎么用,便于读者依据详细问题,选用相应的数据发掘办法,然后到达有用运用各类数据发掘办法的意图。本书介绍的地质大数据内容服务体系是一个实践运转中的体系,经过它可以直观了解地质大数据内容存储与发掘系列技能是怎么彼此集成、怎么供给实用化的服务,使该书的操作性、实用性更强。

  本书作者具有地质信息化、数据发掘等科研作业的多年从业阅历,本书是他们相关效果的总结、凝练,可供从事地质查询信息化、地质大数据研讨运用的专业技能人员和相关专业高校师生阅览。

  地质学是研讨地球的科学,地质数据是对各种地质问题及定论的多样性记载。我国地质查询近百年的作业积累了丰厚的数据资源,这些数据具有明显的大数据特征,其间蕴藏的潜在价值不可估量。跟着大数据浪潮的到来,地质查询职业也迎来了从小数据年代向大数据年代的变迁,数据密集型科学研讨形式应运而生。在地球科学范畴,数据密集型的特色便是直接从地质大数据中发现科学规则,以地质数据为起点,经过深化数据内部的内容剖析和大数据发掘发现规则、发现常识。地球是一个现已存在了近45.5 亿年、半径约6370 千米的岩石星球,迄今人类对它的了解连千分之一都不到。正是由于地球这个研讨方针巨大的时空跨度和当时研讨手法相对缺少,造成了地球科学问题的杂乱性,使得地质数据中描述性数据较多而量化数据较少。从数据类型上看,地质数据由非结构化数据与结构化数据一起组成,而非结构化数据占地近80%。假如这些海量的非结构化数据可以被有用地运用,则相关的地球科学研讨就更或许取得打破,而处理地质问题的技能办法也将变得更具适应性和专特点。因而,非结构化地质数据是大数据年代地质数据的新内涵。

  大数据年代的到来,为发掘地质数据内涵信息,充沛发挥数据自身的价值带来了杰出关键。可是,数据的安排存储和数据剖析、发掘面临一系列应战。这些应战贯穿于数据获取、存储、运用等各个环节傍边。本书就地质大数据(非结构化地质数据)的安排存储和发掘两项关键技能打开论说。

  数据的安排存储,需求数据模型。本书评论的“大数据”概念不仅指当时数据集的规划,还包含更为重要的对数据个别更为细粒度的内容拆解和重构。但这个方针概念不能和现有的“形式优先”的联系数据模型匹配,超出了传统数据库体系的存储、索引、查询的范畴。数据模型需求重视更为杂乱的信息整理提炼和概括,其最终方针需求将数据转化为常识,而常识往往是经过内容实体及它们之间的联系来表达的,但它不是数据自身,而是要运用模型来“解说”数据。本书第二至第五章,从理论到实践,详细论说了数据模型树立的思路和详细办法。

  数据的发掘,与数据的安排存储严密交错。面临地质大数据,地质作业者们需求接近数据的核算,需求建立原生地质数据通向先进核算办法的桥梁,需求在很多已有的数据发掘办法中找到处理地质范畴特定问题的详细算法。本书第六至第九章,经过实例论说文本数据及图画数据的发掘办法,其间既包含比如朴素贝叶斯、支撑向量机、K- 均值聚类等经典的分类聚类算法运用,也包含卷积神经网络、循环神经网络等深度学习算法运用。

  本书理论与实践相结合,示例完好,包括数学根底、编程言语、算法原理、程序运用,一起融入实在的运用场景。咱们期望经过这种方法,协助读者把握在地质大数据通用表达、安排存储、非结构化数据发掘算法等方面的技能,了解体系架构、运用服务等方面的详细作业办法。

  本书编写分工:前语,魏东琦;第1 章,李磊;第2 章,魏东琦;第3 章,魏东琦、李磊;第4 章,魏东琦;第5 章,魏东琦;第6 章,魏东琦;第7 章,魏东琦;第8 章,赛琳伟;第9 章,魏东琦;第10 章,魏东琦、李磊、郭明强。全书由魏东琦统稿。

  特别感谢赵鹏大院士在百忙中为本书作序!感谢中国地质查询局开展研讨中心李超岭研讨员热忱的协助,感谢中国地质查询局西安地质查询中心杨军录教授、王占昌教授,中国地质大学(武汉)地舆与信息工程学院谢忠教授,西北工业大学核算机学院谷建华教授,河南省地质查询院朱学立教授等,为本书的编写提出的名贵的主张;感谢项目组成员李丰丹、吕霞、高婷、邱德明等的大力支撑;感谢地质出版社刘亚军编审的辅导与协助。


在线留言

在线客服