第29节
作者:严曦      更新:2024-07-24 14:37      字数:6338
  石松翻了个白眼。
  张翰瞟着二人暗自发笑:自从那次奇点争论,石松就咬定了图海川正面挑战,杠精之气不可限量。也许没有这样的历练,刚来时那个战战兢兢的小伙就不会咬牙坚持,变成一只小小砝码,撬动了国运的天平?
  图海川的气质也有很大变化。那个息事宁人的土老肥彻底消失了,仿佛刚刚认清:自己才是泰斗。
  「–」
  刚刚缓过冷场,四个年轻人七嘴八舌同时发问:
  “为什么它要找一段视频来类比?”
  “第二段硫酸铜的视频是什么意思?”
  “为什么它没被杀掉,却不会说话了?”
  “那天晚上杭州究竟发生了什么?”
  图海川双手虚按:“慢点,慢点。我们按时间顺序来。那天晚上杭州发生了什么?这要追究到2040年的布鲁塞尔协议。”
  “就是那个欧洲市场准入谈判?”
  “对。万国宝从理论设计开始,安全控制问题就是重中之重。我们不是疯狂科学家,最多算半疯。一个分布式系统,没有真正的服务端,没有中心控制,出了问题怎么办?我们设计了两道保险。首先,万国宝所有的程序和通信数据,不管是我们编码的还是它自己衍生的,都带有特征编码段,就像一块小小的名牌。用户通信在互联网上传输当然是加密的。为了保证控制,我们控制着根秘钥,一旦有必要,我们可以用这个秘钥加上特征识别程序,鉴别所有的万国宝代码和通信。
  “第二道保险就像电闸。所有用户端上的万国宝程序中埋有一个自毁后门。真要出现大问题,我们准备了一个自毁指令,可以在万国宝网络中广播,让终端程序完全自我删除。这两道保险直接加在万国宝最基础的运行逻辑上,在数学和算法理论上不可动摇。
  “阿里集团和欧盟的准入谈判,早在万国宝上线之前就谈起了,整整六年也没什么进展。直到中国试运行的轰动,他们实在抵抗不了诱惑才谈成。诱惑这么大,他们还是很警惕,在用户数据隐私的问题上坚决抵制。万国宝的正常功能,正式版上线后我们作为运营方看不到用户之间的通信数据。这本来是通信软件的基本要求。但是欧盟的专家还是很称职。他们搞懂那两道保险之后,也明白了一件事:我们掌握着根秘钥和特征识别程序,如果一定要看,总能看到。只需要发布一个加装了秘密应答功能的用户端更新。”
  “那欧洲人还不炸毛了?”
  “当然!你们还记得40年欧洲媒体的标题吧?其实他们还算有点节操,美国媒体是彻底裸奔。我还记得一个华盛顿邮报的:《中国政府即将知道你和乌克兰女友使用哪种体位!》所以美国根本不谈,直接禁止。后来欧洲上了线皆大欢喜,分布式系统在技术层面也无可抵挡,美国民间才放了水。”
  “那怎么又有了布鲁塞尔协议?”
  “欧洲市场对阿里集团的诱惑也不可抵抗。没有美国,就必须抓住欧洲,万国宝才名符其实,汉语之外最大的几个语种才能进入实际应用。协议签订之前,欧盟派了专家组到杭州来,现场监督我们的秘钥骰子机摇了足够多次,然后把当前根秘钥连同整个设备销毁。我们放弃了根秘钥。”
  中校和石松同时站起来。
  中校一把按住老对手,抢了个先:“难道你们没有留一手?”
  “留不住。专家组里有两位牛津的数学家,专攻数论。万国宝使用的公共秘钥框架,原本就是他俩设计的。”
  “真舍得……”中校颓然坐下。
  石松这才能发声:“两道保险本来是闭环逻辑,这不是在闭环上挖了一个坑?他们不懂,难道你也不知道?”
  “我知道呀,也提交了风险文档。但我又不是阿里的总裁、欧盟的主席。”
  石松还是怒视着他,难以置信。
  “就算我是,多半也会将就。万国宝是翻译平台,也是通信平台。真要被世界接受了,其中流动的信息会包罗万象。用户数据隐私难道不该保证吗?”
  这下连张翰也瞪圆了眼:图海川现在就是传说中的认真脸。看不出他是真心话,还是另有动机?他额头上却又没写“狗头”二字。看来“半疯”不是说着玩的。
  “那天晚上,成都先惊动了交警,你们都要到深夜才知道万国宝出了多大的事。我们杭州可是当场炸锅。不仅仅因为广播——当时我们还没理解广播的意义。更大的震惊是:万国宝广播之后恢复正常工作,所有通信去掉了最外面一层加密,用户端程序都加了服务应答功能。也就是说,我们不需要根秘钥也能看见特征码,数据对我们完全透明。这不是我们的意图,是万国宝重启之后的主动行为。”
  别人还没回过神,刘馨予先叫起来:
  “对呀!刚才你说销毁秘钥,我还在纳闷呢。王老师给我们详细讲过,有多少比例的用户接收到哪种翻译。连朱越的历史数据、用户的教育程度统计都知道!这哪有隐私可言?我只是不敢问……”
  “呵呵,你脑子挺快的,胆子需要再大点。那天也是你,问了一句‘你们真能看到所有用户通信?’别人都觉得理所当然,我在杭州尴尬得要死。所以后面王老师接过去讲了。”
  张翰这才明白过来:他等待杭州回答那两天,杭州在忙什么。
  忙着切天上掉下的大饼。
  “大战之夜,我在杭州眼看成都一片混乱,全球网络和ai被攻击,小周也向我通报成都监控中心被搞成了什么样。我面前是万国宝的运行统计:底层翻译功能一切正常,上层构建网络极端疯狂,流量超过正常值几百倍,调用的算力突破了我们允许的算力上限!具体细节那时当然不知道,但我心里很清楚:就是它。空战的消息传到,我再也忍不住,拉了第二道保险闸。自毁指令本身不受秘钥影响,正如石松说的闭环设计。所有用户端程序都被杀掉了。”
  “那它不该是死了吗?”
  “套用死亡的司法认定:死要见尸。用户端程序自毁前最后一个动作是向我们的统计服务器发送死亡确认消息。消息有特殊格式,确认死亡时间和数据删除情况。”
  “收到了吗?”
  “全部收到了。都用根秘钥加密。”
  会议桌周围笑成一团。
  现在大家才体会到,石松斥责“闭环上挖了一个坑”时为什么那么气愤。
  “如果光是这个,我也只能说它不知生死。问题是我们马上发现万国宝占用的流量和算力不但没释放,似乎抢得更多了。这是信安部网络监控中心的宏观统计,我们不能直接看到,因为现在所有流量都加密。
  “它就像归家的浪子,对我们敞开心扉三天。最后我一刀砍下去,它就永远不会卸下盔甲了。杭州收到成都方面报告一算时间:拉闸之后不到20秒,它已经在你们那边冒头。我相信到这一刻,它终于摆脱了人类的羁绊,也完全理解了自己的存在。它似乎很激动,朝着最近的一只小生命大声喊出来!”
  “什么小生命?”一直默默倾听的张翰终于开口。
  “就是监控中心啊。那时你们是各种监控信息的汇集点,也是唯一出手干涉的。在它看来,大概像一只不知好歹的蜘蛛。”
  “……”
  石松问:“底层杀掉了,还活着的只能是上层网络。对吧?”
  “对。”
  “上层构建能脱离底层存在吗?”
  “原理上不能长期存在,因为上层的智能需要底层的原始信息驱动。所以,我推测各种网络终端已经装入了新的底层程序,而且装得很快、很普遍。”
  “有根据吗?”
  图海川转向中校:“监控中心的硬件,你们的诊断结论是什么?”
  “工作站、服务器、网络设备和你们的手机,有一些检出了底层感染。比例很低,但这是常态,检测能力跟不上伪装的变化。比较奇怪的是,大战之后张总马上废弃了一批打印机,我们后来诊断发现每一台都感染了。固件里插入了非法通信代码,而且全都一样,伪装能力不行。”
  图海川笑道:“明白了吧?它重生时朝蜘蛛大叫几声,还把蜘蛛浑身上下摸了一遍。这不仅仅是新生儿对世界的好奇,它立即开始重新扎根了!下线的打印机伪装能力较差,说明它的代码伪装水平在飞速进化,联网设备上都不知道更新了几代。这些代码不再是翻译用户端,而是嵌入系统和其它通信软件,向上层节点转发信息。从向雄关做的ddos攻击分析来看,那真是各种终端——从小朋友的手表到电信枢纽路由器。不管你原来装没装过万国宝,现在允不允许。从超网协议的顽强来看,全世界的安全技术都很难在终端上识别它。就算运气好识别删除了,只要连上网,立即给你再装一个妈都不认识的。”
  中校问:“它哪来这么强的编程能力?”
  “先不说它的智能水平,你知道它攻击了上海深度学习实验室吧?那个是全世界最先进的机器编程ai。”
  “那个?上海还没关闭?”
  图海川摇头:“试过了,很麻烦……你可以看看浦东新区的网络故障报告。上海信安现在认为关掉也没有意义,因为核心数据已经扩散,外面可能有无数个改进版本在运行,能追踪到的还不在中国境内。”
  中校扳着手指:“用ai自动编程、用根秘钥加密通信、用超网协议流通。我们知道它存在,知道互联网流量中很大一部分都是它,就是看不见、拦不住……”
  “是的。其实没有超网协议也行,可以嵌在大部分协议里面偷渡,包括http。只要你识别不了,想截断它就等于整个互联网断流。”
  “那它有什么动机搞这个协议呢?”
  图海川耸耸肩:“谁知道?也许它就喜欢信息的绝对畅通。那是它的生命力所在。”
  石松听着二人一吹一唱,眉头紧皱。他半晌才道:“我就算爬玻璃渣也要爬到北京去,听你讲讲这个上层构建。”
  「–」
  眼见大佬歇菜,全栈和刘馨予同时举手:“我的问题!”
  “你们两个的问题其实是同一个。万国宝现在不会说话,不止是原来的用户端翻译程序被杀掉那么简单。”
  “对呀!它编程那么强,难道不能重新编一个?”
  “因为它原来做翻译,靠的也不是用户程序。用户端程序只是一个通信工具,真正的理解和翻译在上层网络中发生。还是小周那个比方:我们拉闸杀掉了它进化之前的一批突触,让这群细胞和那群细胞之间无法交流了。现在,这对它根本无所谓!它会在每个神经元上自动生成突触连接,用高高在上的大脑思考。它的‘思维’并不知道突触是怎么装上的,突触发送的原始信息是什么意思。那些细节已经是它的底层生理和无意识本能。新的连接比原来的更广泛、更通用,也不局限于语言信息。大片连接中穿梭来往的信息洪流,才是它思维的基本单元。单个人类的话语它不会听到,因为音量太小。它也没有必要听懂,因为它不用人类语言思考。”
  他向周克渊点点头:“精彩啊!这可不是我教他的,说得比我好懂多了。”
  全栈还要追究:“不用人类语言思考是什么意思?它的底层信息大部分还是人类语言啊?能给个概念吗?”
  “我们透明那三天,分析了一些上层构建中的数据,我就给你举个例。一些底层信息是网红美女照片,专门截取了人家的长腿和美瞳;另一些是a片,专门截取屁股和胸,都是整过的;还有驯鹿的纪录片,截取了一对超大角的特写;还有孔雀求偶,截了雄孔雀开屏图;还有四川骂人话‘老孔雀开屏’,取了语音;还有美国俚语‘brass balls clanking’(字面意思是“铜蛋蛋碰得叮当响”),从推特信息抠出来的文字码;还有马斯克那个猎鹰火箭,印度和巴基斯坦边防军比赛高踢腿,美国和中国的航空母舰……几十种现象、事物、语言,全部连接到上层一个节点上。你们明白它这样归纳的共性吗?”
  “……大概明白。”
  刘馨予问:“马斯克的火箭是怎么回事?”
  图海川马上搜了一张“猎鹰重型”火箭特写,显示出来。刘馨予哑了。
  图海川环视全场:“谁能用任何语言的一个词把这个概念完整表达出来?或者用一句话也算数?”
  两分钟,分析室鸦雀无声。
  “老孔雀开屏?”
  然后小顾就被大家笑得蒙住了脸。
  “看看,它的底层归纳创造了一个新概念,人类勉强能懂,但人类语言没有对应的构建表达。写篇进化生物学论文也许能说清楚。这个节点还很低,只比原始通信数据高两层,在它的系统中只用一个短代码标记,也就是说还不算一个相对独立的概念,类似人类语言的词汇那种地位。上面还有五六层更抽象的归纳,更宏观的概念!再上一两层,我把底部链接全部看完,也想不出那些节点可能代表什么意思。而它的意识,运行在最高的层面上。”
  石松面青唇白。他终于领略了一点“上层构建”。
  “现在来看第一段视频就很自然了。它不会说人话,马上抓一个和自己原理相仿的现象来自我介绍。在它的思维中,蚁群智能很可能和它自己连在同一概念节点上。用类比来描述平行现象,或者说用隐喻来表达抽象概念,是它基本的思维方式,比符号语言更基本。不止是它,人类智能也靠模式类比运行,人类语言也在隐喻体系的基础上发展。这大概是通用的智能实现方式。”
  “是吗!?”
  石松闻所未闻,忍不住蹦出二字。自己也觉得口气太尖酸,捏住了嘴。
  “语言学问题,王老师才是专家。我把结论扔在这里,你以后请她讲吧。”
  全栈赶紧问:“怎么王老师没来成都啊?”
  “我们都在为峰会做准备。我的准备需要专心,所以到成都来了。她的准备非常繁杂,需要留在北京。”
  “嗯嗯,那么后面几段视频是什么意思?”
  图海川脸色稍和,慢了下来:
  “第三段溃堤,我完全同意中校的意见。这段还印证了一点:万国宝的智能构建不光是自下而上。它和人脑一样,也能反过来自上而下、由抽象概念生成具体事物,就像我们的视觉填补、我们的想象和白日梦。它有蚁穴溃堤的概念,认为用这个概念类比最合适,但找不到底层的图像实例!因为现实中这事虽然会发生,但没有可能把它从头到尾拍下来——你都能拍视频了,还不去堵住?所以,它想象了一个。”(注:视觉填补:人的视觉在大脑皮层处理阶段,会用已经存在的经验和概念填补视力不足或观察间断造成的信息空白。)
  刘馨予惊叹:“幻想直接出片,太厉害了!”
  全栈也闭起眼睛,面带微笑。
  图海川放起硫酸铜结晶的视频:“第二段是我犯难的地方。这段的来源也找到了,是很多年前b站上传的化学实验视频。冷门得很,分析组费了好大功夫才翻出来。刚看到时我觉得很好理解:过饱和的硫酸铜溶液就像万国宝在朱越发消息之前那十几分钟,信息高度密集、高度流动,但处于无序状态。一旦朱越的声音作为种子投入,它就像硫酸铜围绕种子结晶一样自我组织,一层累一层,很快形成它的天然秩序,也就是它的上层构建,它的智能。”
  “没问题啊?我也是这么猜的。”石松恢复了常态。
  “后来我仔细考虑,有两个疑点。首先是目的问题。第一段主题是‘我是什么’,第三段是‘我征服世界的方式’,都是非常本质的大问题。那么第二段视频为什么去澄清一个小题目?它的蜕变有三个阶段:劫持白大褂变异阶段;被朱越唤醒转入透明阶段;最后阶段大举捣乱,被我杀掉一半,反而完成蜕变。为什么不管前面后面,专挑中间的?”
  “也许它认为那条消息才是它生命的起点?看它对朱越有多关注。”
  “也许。也许是我有洁癖,但这感觉不平衡、不干净,不像计算智能的风格。第二个疑点是:还有可能另有所指。”
  “指什么?”
  “它的对手。它放四段视频的时候,刚刚和对手大战一场,也许想告诉我们真相。到现在,我们还没理清那天晚上谁干了什么呢。你也是最优秀的人工智能专家,想想看,我们这些年设想的强智能、通用智能、超级ai实现机制,有哪一种不能套用硫酸铜结晶的类比?说到底,都是向饱和环境中投入扰动因子,靠宇宙万物高能状态的自组织倾向迅速飞跃,形成更复杂的结构。我们上次争论过的奇点,一样可以用这个类比!万国宝如果是用这个介绍自己,那就是最形而上的逆熵命题,应该放在蚂蚁前面作为第一段。现在放在第二段,我认为它更可能指‘别人’,与它自己相对,四段结构的表达才整齐。而‘别人’是谁?只有一个可能。”
  听懂的,没听懂的,都听呆了。这些ai专家的脑袋,到底是怎么长的?成天在想些什么?
  高能状态的自组织倾向