加菲猫是公还是母,为何连维基百科都回答不了这个问题?
每一次知识计算技术的飞跃,都伴随着拓扑结构的一个变化。
造就第285位讲者 曹晓钢
芝麻问答创始人
数字货币及区块链早期投资者
区块链中文维基计划发起人
我想问大家一个问题,加菲猫的性别是公的还是母的呢?
一直以来,维基百科上面关于加菲猫的性别标的都是“公”。有一天有一个编辑呢,他发现加菲猫的作者曾经在一个访谈上说:“加菲猫,我塑造这个角色,它是一个没有性别,不分种族,没有年龄的,大家都喜爱的动漫作品。”于是他就把这个维基百科上加菲猫这个条目里的性别改成了“无”。
但很快另外一个志愿者说:“不对,在这部作品里,其它动物称呼加菲猫的时候用的都是‘he’,所以它是公的。我要把它改回来。”于是,加菲猫又被改成了“公”。又有些人认为说,即使你列了五十条证据证明ta是公的,但是有由加菲猫自己亲口说出来的吗?没有。所以这个条目又被改成了“无”……
因为在维基百科上,所有人都可以编辑同一个词条,很多时候会发生大量的冲突。短时间内,这个页面被改了几百次,产生了很大的争议,管理员一看不行,事态控制不住了,只好把这个页面锁掉。
再后来加菲猫的作者出来澄清,说加菲猫是公的。那最开始把加菲猫性别改成“无”的这个人就愤愤不平,他觉得你怎么说话前后矛盾呢?现在加菲猫的维基百科页面,性别这一行已经被删掉了,没有了。
维基百科通过超链接的形态,让知识能统一地以大百科全书的形式展现,像这种用信息技术来生产知识、传播知识的过程,我们把它叫做知识计算。它让知识变得可生长,也让普通人能够以更加便捷的方式获取知识。
知识计算拓扑结构的变迁
从早期的论坛,到百科,再到问答等等,知识计算的产品越来越多,它们都是利用不同的拓扑结构组成庞大网络,实现不同信息之间的连通。
BBS的拓扑结构通过版面和话题,把所有的事情都整理进来,但是因为它容纳的东西太多,内容庞杂,这就导致知识分享的效率其实是很低下的。像Quora、知乎这样的一种形态,它的拓扑结构是利用了社交网络,利用了用户之间相互关注的关系,而信息流式的APP,用的是又是精准计算的方式……
每一次知识计算技术的飞跃,都伴随着拓扑结构的一个变化。但我们不可避免地也会遇到一些问题,刚才举的加菲猫的例子,只是最小的一个,还有各种各样更大的冲突,例如身份验证难题。
程序员霍炬是一个非常高产的有质量的作者,有一次他在微信公众号上写了一篇很火的文章,后来被另外一个公众号给洗稿了。霍炬很较真,他就把对方告到法庭。
在法庭上,对方就提出了一个问题说:你怎么证明原来那一篇文章就是你写的呢?OK,这是一个问题,对吧?怎么解决呢?当场找了一台计算机,输入用户名密码,登陆进了微信公众号后台。法官说,好,这可以证明这是你的。但这是一个非常不严谨的证明,对吧?
我们有没有办法通过拓扑结构的变化,来解决这些问题呢?
2009年,我们获得了一个新的技术叫区块链,大家可能最近都已经被种种关于区块链的信息轰炸过一轮了。区块链能够在虚拟世界中间建造起不需要人类参与的信用,并且还能形成一个影响巨大的一个激励系统。
区块链的拓扑结构是什么样的呢?
这是一个简化的区块链,在这里面,通过不断产生“块”,能够把所有内容,通过一个固定的时间频率,比如说10分钟或者5秒钟,形成像蛇一样不断增长的这么一个块。
另外一种结构,这种结构叫DAG,这张图截的IOTA的项目,叫Tangle(缠结)这样的一个结构,它叫做有向无环图,每一个新的交易,都是通过它的上一级交易和它的子交易,一起来共同构成的。
好,这种新的拓扑结构,能不能用在我们前面说的知识计算这件事情上呢?
NO,它不行,为什么呢?我们现在所有的公有链,设计都很成问题。大家知道比特币全世界所有的节点,只在干一件事情——做了一份统一账本,也就是说它是一个高度冗余的结构,冗余到全世界所有节点只干一件事情。
以太坊也是,所有的计算机,几万台,最后只完成了一台计算机的功能,而且这台计算机还得照顾网络最差的那一台,所以它天然不可能实现非常高的效率,所以我们现在这个公有链不能用,太差了。
开源点亮的曙光
但是我们仔细再分析一下,所有的公有区块链,有一个共同的特质:都是开源的。
开源运动是指程序员把自己写的代码向全世界公开,所有人都可以共同使用,这个运动非常深入人心。这位叫Linus Torvalds,他是鼎鼎大名的开源运动的旗手,他是Linux的创始人,他做了一个非常牛的东西叫做Git。
发明Git之前,Linux的所有代码,都是存储在一些其它的中心化管理软件里面,曾经用过的一个管理软件叫做BitKeeper,后来因为一些原因,BitKeeper拒绝Linux再使用它的这个技术来存储代码。Linus花了差不多两个月的时间在斡旋,最后没成功。于是Torvalds就想,算了,不如我自己写一个吧,他花了10天写出了Git。
Git是怎么样的一个拓扑结构呢?
在Git里面所有的计算机都是平等的,每一台计算机,可能是这个Git库的主人,也可能是从另外一台计算机里面,去获得克隆出来的代码,但是你克隆到你本地之后,这就跟你的这个主人的代码,没有任何区别。
换句话说,所有的这些网络是一个对等结构,它还有另外一个特性:人们可以互相交换自己做过的修改,比如著名的开源软件phpBB 。
Git的工作方式非常直接,非常轻便,它非常符合人的直觉,效率也非常高,Git出来之后,迅速把以前的所有工具都秒杀了。
那么Git是不是可以对知识计算进行区块链改造呢?
我们能不能把Git变成一个跟数字货币相结合的生产力工具呢?
前面我们说到大家争着去修改加菲猫的页面,是因为大家只能看到一个版本的关于加菲猫的信息,但实际上一百个人会看到一百个哈姆雷特,每个人心目中对于某个事的解释是不一样的,你可能需要看到不同人的看法,但是我们现在的维基是做不到的。
有没有可能把维基本身也像Git这样分散化,变成对等的网络呢?
我们的问答是不是也是可以这样呢?
在这样的一个多中心或者去中心的结构里面,信息能产生更多的激荡和交汇,现在公有链的这些存证和激励的理念,可以加入进来,让知识计算,像一个有节奏律动的生命体一样,蓬勃生长?
这些问题都是下一代知识计算要解决的问题。