咨询热线:4008-6044-55 | OA | E-mail
传统文明、大数据与出书
日期:2022-06-13 04:44:12 | 作者:华体会最新地址

  谭跃,全国政协委员,我国出书集团有限公司原董事长、党组书记。曾获国家新闻出书总署“新我国60年百名优异出书人物”称谓、“2009我国书业年度评选”(《出书人》杂志主办)最高奖年度出书人奖、《中华读书报》2009年“年度出书人”奖等多个奖项;中选2009CCTV我国经济年度人物,是新闻出书界初次获此荣誉的人。

  本年是我国建立100周年。100年来,在我国的领导下,咱们国家的相貌发生了史无前例的改动。跟着科技飞速开展,以互联网为中心的新一轮科技和产业革命昌盛鼓起,不断给人们的出产办法和生活办法带来革命性改动。出书,凝聚着人类的思维和才智,集聚了人类的创造创造和社会实践活动的经历与作用,反映了社会生活的各个旁边面。出书的前史便是人类文明的前史。正确看待大数据与传统出书的联络,活跃变革立异,以推进出书业的昌盛开展。本期讲坛约请谭跃委员从大数据的视点,叙述出书业在新年代的开展。

  我曾读到这样一个观念,数据化将使国际全部皆可量化。全部,当然也包括出书。这个观念指出,曩昔年代的重点是在技能;而现在,人们聚集在信息,也便是数据(Data)。Data的拉丁文原意是已知,是存在过的实际。

  那么,数据化与数字化是什么样联络呢?学术上有许多表述。我以为,在二进制的数字条件下,数据又做了进一步开辟,让它愈加有用,愈加能够运用到社会范畴的方方面面。美国许多专家以为,数据无处不在。

  美国专家以为,人类现在正进入一个新的年代,这个年代的“数据”事实证明,国际的实质不是原子,而是信息。也便是说,国际是由万物组成的,曩昔咱们对国际的认知是根据万物由原子构成,当今专家们以为万物的根底不是原子而是信息。这让我想到了老子在《道德经》中所讲:“大路汜兮,其可左右。万物恃之以生而不辞,功成而不有。衣养万物而不为主,常无欲,可名于小。”不管是原子,仍是数据,都是从不同视点答复什么是道的问题。其实,咱们的祖先早在许多年前就现已阐释了它。道,便是原子办法的物质,数据办法的信息,不同范畴的道体现不同,所以它无处不在。

  任何事物都不是突如其来的,都有一个前史演化进程,都能找到它的根。在我国,这个根便是我国陈旧的思维文明。咱们知道,释教上有一桩公案,讲的是释迦牟尼在一次佛众大会上,拈起了一枝花,高高举起,什么都不说,注视着全场。咱们都不了解他的意思,面面相觑,只需他的大弟子迦叶破颜一笑。正是这一拈一笑,互相心照不宣,后来释迦牟尼就把衣钵传给了迦叶。

  这也是“拈花一笑”的出处。对此阐释的学者许多,最有名的是南怀瑾先生。他与孔子的“一以贯之”联络了起来。孔子跟曾子说:“曾参啊,我的道是什么呢?吾道一以贯之。”曩昔人们的了解是,讲道的人做任何事情都要一以贯之。而南先生的了解是,道是一,因而要一以贯之。老子《道德经》讲:“道生一,终身二,二生三,三生万物。”这与咱们前面讲的“数据”是有联络的,仅仅咱们的先贤在其时的条件下现已以本身独特的领悟作出了阐释。随后,孔子讲完,曾子就说:“是,我知道了。”比及孔子一走,曾子的同门就问,“一以贯之”到底是什么意思呢?曾子说,“夫子之道,忠恕罢了矣!”教师的道,只需忠恕罢了矣。

  孔子讲的是“一以贯之”,而不是“二以贯之”,怎样用“忠恕”二字解呢?南怀瑾先生以为,这便是阴阳,一便是二,二便是三,三便是万物。这便是我国陈旧哲学中的大数据。一是全部的一,一是一的全部。还有什么大数据比“一”还大吗?这便是古代哲学观与现代大数据的联络。

  不只如此。《易经》的三大原则——变易、简易、不易,三则——象、数、理,也跟大数据的问题相关。象是现象,八卦便是8个现象挂在墙上,然后又演化成16卦、32卦和64卦,这些都是天然和社会的现象。大数据所描绘的东西便是各个范畴的现象。数,是数据。理,也叫辞,是目标和数的理性认识。象靠看,靠眼睛调查。数靠算,也便是运算。理讲判别,也便是理性思维。象、数、理,终究是判别。因而,有人提出的理论不存在的观念是不建立的,仅仅理论建立在什么根底上很重要;假如建立在象、数的根底上,理仍是有必要、有道理的。所以,在《易经》64卦的根底上,孔子才写了《十翼》,作了10篇论文,在“理”的层面把《周易》讲清楚了。

  了解这一文明内容,咱们心中便有了数。俗话说“掐指一算”,“算”的背面是数,心中有数,算到心中有数的层面就定了。就像现在的出书业,假如对大数据背面的道理不了解就会发生害怕,数字化还没了解,又来大数据了?

  我国人的思维中,什么事情发生了,咱们会说“早有定数”,这是普通老百姓都会讲的。但这些思维是哪里来的呢?比方,先天八卦、后天八卦,这些是数字。《易经》在汉朝时的研讨被称为“京房十六卦变”,也离不开数字。黄道十二宫,仍是数字。当然,“十二宫”里边的数字就更杂乱了。六十花甲,60年一个花甲,也离不开数字。十二生肖,仍是离不开数字。前一段,我又翻出《洛书》来看,之前只留意它的图画,这次带着问题看,发现图画的上面满是数字,还有一句话:“戴九履一、左三右七、二四为肩、六八为足。”《易经》中有“六爻之动”,讲的是八卦的每一卦里有六个爻,“六爻之动,三极之道也”,它告知咱们的榜首层意思是,六合之间尽管数字许多,可是实在有用的不会超越“六”。我国文明博学多才,我国先贤也是极具才智。对此后来的科学家做过研讨,除了很少的现象,万事万物的物理现象,基本上都是六个阶段。它讲的第二层意思是,“六爻”都在动,动的实质是什么呢?它告知咱们是“三极之道”,“三极”指的是天、地、人,也便是说,“六爻”是三极改动的规则。

  这些都是古代人们的一种表达办法,现代人或许会以为这是非理性的,乃至是一种迷信说法。其实,这便是古人对科学研讨的一种数据表达,只不过现在咱们不运用、不研讨了。

  因而,从我国古代文明中能够看出,我国祖先有很强的数字概念,而现在所讲的数字、数据、大数据等,其实古已有之。

  对大数据的了解,咱们要正确去掌握。数据原本便是有的,古人早就认识到了,并做了高度笼统的概括。只不过到了新的条件下,特别是到了大数据年代、云核算的条件下,它的作用和潜能被释放了出来,仅仅和古代数据观已不可同日而语了。这是榜首个观念。

  第二个观念是,哲学上讲量变到突变,大数据其实也相同。当数据大到必定程度的时分,事物的形状就发生改动了。大数据的含义就在于此,它现已不是本来的姿态了,或许说它是、也不是了。

  举个比方,法国拉斯科洞窟岩画中有许多是马的造型。毕加索参观后恶作剧说,人类自这今后就没有再创造了,画来画去,都是马。可是,现在的科学家又从量变到突变的视点从头解说,尽管一幅马的图画迥然不同、十分相似,可是把它分红24幅,变成电影今后,性质就发生改动了。这便是数字带来的改动。停止“1”的时分它是一幅画,到了动态“24”的时分它成为一部电影,性质发生了改动。

  还有一个比方,是关于纳米技能。纳米技能告知咱们,把东西变小,变到分子量级的程度,物质形状、实质就会发生改动。比方铜,铜是能够导电的,分子等级的铜就不导电了。还有陶土,分子等级的陶土,就成了柔软、带有弹性的物质。再说金属,金属是硬的,分子等级的金属是软的,能够恣意耍弄它。

  这些比方都在阐明“大数据”的概念早已存在,仅仅到了现代技能条件下,较为集中地体现了出来,但体现并提醒的仍然是哲学上的规则,量变到突变。这也便是大数据的含义地点。

  第三个观念,作为企业,曩昔最为着重的是有形资产,当然现在还作为一个重要的判别规范,也便是企业规模。咱们知道,与有形资产相同重要的,还有无形资产。对出书业来说,那便是版权、商标、商号等。到了大数据年代,它又告知人们,比这些还重要的是数据资源。一个企业做得好,数据也是投入,也是潜在的竞争力。比方美国苹果手机公司,假如用有形资产去点评它,那它就没什么了不得,假如用大数据的思维去点评它,那就不得了。由于像这样的公司,他们具有巨量的数据,而且每天还在添加。

  第四个观念,是主因。咱们剖析得知,大数据古已有之,仅仅现在集中体现了出来,那么主因是什么?我以为,是处理数据的才干在敏捷提高。

  大数据首要来源于哪里呢?一是来源于天文学,由于天文学的信息量巨大。二是来自生物学中对基因的研讨。一个是微观,一个是微观,这南北极的数据都是巨量的,以至于大到现在的核算才干都无法完结。因而,到了大数据年代,这就倒逼着科学家们处理数据的才干敏捷提高。

  再举几个比方。有材料显现,2000年在美国新墨西哥州发动的斯隆数字巡天项目发动,用望远镜几周之内搜集的数据,比自人类有史以来搜集的一切数据还要多。但到了2010年,智利运用巡天望远镜5天的时刻就完结了它一切的运算,打破了新墨西哥州的记载。2013年,我国的“银河二号”超级核算机,现已又把核算速度提高了几倍,成为其时全球最快超级核算机。2020年,我国的威风·太湖之光超级核算机现已完结千万中心并行榜首性原理核算模仿,排名于国际前列。

  10多年前,全球科学家联手用10年的时刻完结了31.6亿个基因碱基对的排序。当今,这样的工作量只需十几分钟完结。谷歌公司每天要处理超越24拍字节的数据,这意味着其每天的数据处理量是美国国家图书馆一切纸质出书物所含数据量的上千倍。Facebook每天更新的相片量超越1000万张,每天的点击量或许写谈论大约有30亿次,点击一次,就有许多的数据保存下来。当然,这些数据还在不断增加。

  那么,问题就来了:榜首,大数据的中心是什么?第二,大数据的特色是什么?第三,要害在哪里?经过不断学习,思路就渐渐明晰了。

  首要,大数据的中心在于猜测。关于出书业来说,早在几年前,亚马逊公司就现已开始运用大数据猜测,猜测商场需求、商场反应。这样的猜测,能够清晰某一个人的阅览范畴是什么、最近的阅览热门在哪里,等等。不管是手机端、电脑端,只需运用一次就能留下数据,公司后台经过数学形式核算工作,效果就出来了。

  其次,有人提出,大数据的特色有三个:一是数据更多,二是数据更杂,三是数据更好。这有必定道理。

  数据更多,不是随机样本,而是整体数据。便是对一件事用全数据——即这件事的简直一切数据来猜测,准确率将会大大提高。比方人口普查,与抽样是相反的理念,抽样最大的特色是用尽量少的数据反映更多更实在的信息,而大数据猜测则与之相反。

  数据更杂,不是精确性,而是稠浊性。说的是越杂乱、越纷乱的数据,猜测将更有用、更挨近实在。这种猜测不是在寻求每个数据的精确性,当一件事物的数据到达临界点的时分,它的形状性质等或许就发生了改动。这与抽样又不相同,抽样着重的是随机性,不能带入片面志愿,献身的是数据的量。而大数据寻求的是量,抛弃的是精确性。

  数据更好,不是因果联络,而是相关联络。比方沃尔玛的前史数据标明,一旦有飓风的时分,蛋挞的销量就大增,不问为什么,不问因果联络,只问相关联络,便是一旦A出现了,B必定出现。所以沃尔玛就把蛋挞和雨伞、手电筒等飓风用品放在一同,销量大增。这便是相关联络,也便是让数据说话,只说现象,不问原因。

  终究,要害在哪里?我概括有这样几条:一是整体性,便是关于某个事物数据的整体性,而不是随机、抽样、代表。二是已然有了大数据,就必定呼喊云核算处理才干。三是容错,如谷歌公司为了做翻译渠道,它建立了上万亿的语料库。这些数据都是互联网上现已发生过的数据,其间大多是废旧数据,所以会犯错,那么容错才干挨近真理。四是相关性。它的中心是量化两个数据值之间的数理联络。简略说,便是此长彼长或此消彼长的联络,A状况出现时B状况必定出现的联络,便是相关联络。

  联络实际,我有这样的领会:一方面,传统出书人要正视这一问题,有必要清楚大数据的由来、迸发的主因,及其间心、特色和要害地点,这是大势所趋,也是开展方向;但另一方面,要充沛估算到互联网、数字化、大数据、云核算等对出书的影响,以及又是怎样影响的,还要对此进行总结。

  15世纪印刷机被创造出来今后,它带动了一次国际性的信息爆破。印刷机问世今后,大约出书了1.3亿册图书。到2010年,也便是谷歌的数字化图书方案实施7年之后,大约有2000万图书被扫描成了数字图书,这简直相当于人类一切书写文明的15%;也便是说500多年发生的信息量,它只用了7年就完结了。这还仅仅一家公司,还没有彻底展开来做。

  咱们知道亚马逊,它的优势是Kindle(电子书阅览器)。在Kindle上阅览的重复率、符号次数以及画线次数会有数据留存,这都是读者的重要信息。可是亚马逊都把它藏在那儿,不愿意跟出书商同享,由于出书商也不愿意把版权跟它共享。前面咱们也讲了数据无处不在,现在大数据现已运用到各个职业,从未来的眼光看,它必定会继续深入的、长时间的影响社会生活的各个方面。

  榜首,终究改动的是什么呢?数字化现已并将继续改动咱们图书出产和办理流程,并部分改动出现办法、阅览办法和营销办法。我仍是比较保存的,不太信任推翻论。由于效果往往不是专家猜测的,而是顾客来决议的。我的简略判别是,像我这样的人,正常状况阅览还有30年,咱们的挑选倾向首要仍是纸质书。可是改动是必定的,实际现已改动了,而且还将更大地改动。

  第二,凸显的问题是什么呢?是内容的海量,以至于龙蛇混杂,难以挑选。咱们翻开各种数字化的端口,只需翻开就会感觉到什么都有,但困惑的是不知道怎样挑选。现在有了监管,作用是好了许多。

  第三,终究稀缺的是什么呢?稀缺的是有用内容的查找,以及严重思维作用的挑选和取得。这一方面体现了不管是互联网,仍是大数据,都在不断生长中,另一方面也阐明传统出书的尽力仍然有着巨大空间。

  第四,比较棘手的是什么呢?棘手的是内容主体的孤岛化。方才提到亚马逊,各大书商和亚马逊之间,尽管各有资源优势,但之间却是屏蔽的。这尽管是几年前的数据,但主体的孤岛化以及内容数据化的商业形式仍是有待探究与开发。

  第五,数字化和数据化,改动着关于内容出产的商场猜测、加工办法、办理进程、出现款式、买卖办法,可是没有改动内容本身的价值。没有改动传统出书人本来所具有的立点,便是内容这个立点没有改动;也没有改动内容立异的主体位置,特别是不会改动精力产品出产的规则,便是说规则是不会改动的。

  前些年,美国人在喝彩、崇拜大数据的一起,也发现了问题。比方,有人问乔布斯,苹果公司运营得这么好,商场是怎样调研的?乔布斯说没有调研,并接着说,顾客没有责任去了解自己想要什么,这是出产者的事。这是一个反向的比方,不必大数据猜测却成功的比方。还有一个,500多年前哥伦布发现新大陆,没人做过猜测,没人有数据概念,更没有大数据概念,可是一个前史性的严重发现诞生了。还有,福特年代没有数据显现,轿车能够替代马车,可是轿车这个严重创造也诞生了。这些都阐明,大数据是管用的,可是更大的数据,比大数据更大的数据是什么呢?是源于人本身,是人的创造力、直觉和天分。咱们的先贤哲人,那个时分都不具有大数据的运算才干,依托的便是他们的才智,给咱们留下了丰盛的文明遗产,这种才智源于直觉,靠的是人本身的领悟,对事物规则的掌握。

  因而,咱们要看到,数字化、大数据对传统出书带来了常识的集成、需求的判别、趋势的掌握、查找的快捷以及跨界的链接。这不仅是应战,更重要的是商机,是开展空间,是文明的传承。科学再怎样开展,它不会改动出书的实质——挑选。比方,孔子年代占卜书不少,闻名的、上了《左传》的、和《周易》相同位置的就有两本。可是孔子终究列入“六艺”的只需《周易》。没有这方面内容的挑选,就不会有后来《周易》的位置。《诗经》也是相同,也是孔子挑选的效果。看上去一个简略的、详细的编辑工作,带来的是持久的社会影响和巨大的思维作用。

  归根到底,咱们应活跃认真地对待并研讨数字化、大数据等科技手法给出书带来的影响,应跟从年代脚步、习惯年代要求,为传统出书在新的技能条件下寻觅出路,昌盛开展出书业。


在线留言

在线客服