造神年代(出书版) 第38节
检查圆满结束。图尔西在现场报告上签了字,终于回过气来:“轮到我了。还是那个问题:你为什么在这里?”
这次张翰很诚实,但字斟句酌:“是我自己申请来的。从指挥部调职,是因为我失败了。看到你过来负责检查,知道你以前是干什么的,我认为可能需要你的帮助。”
“什么失败?我能帮什么忙?”
“现在不能说。”
“你这叫回答?”
“我很想跟你摊开了讨论。但是必须等到峰会开完之后,老板们谈妥了才行。要是我们先谈了,他们却谈不拢,我们两个都会因为泄密完蛋。”
“做梦。我不会泄密。”
“要是都不泄密,那有什么好谈的?”
图尔西大吃一惊:从没见过如此胆大包天的中国官员,在双方安全人员环伺之下大谈‘泄密’。这算投诚还是招募?官方指使还是私人兴趣?
她不置可否。然而张翰已经看出了她的兴趣:“那我们预祝峰会成功吧。”
两个人相识四年,一起工作三小时,终于勉勉强强握了一下手。
※※※
走出大礼堂拱门,二人立即分开,回到各自的先导团队中。大草坪对面,一群群会场工作人员已经在撤除路障、指挥交通,各国代表团的座车开始入场了。车队从二校门进入,在清华日晷前分流,停在周围建筑区指定位置。
艳阳高照,天气和九月入学季一模一样。张翰还记得大草坪上满是一年级新生,躺在圣殿中心,闭上眼睛品味梦的气息,享受短暂的蜜月。靠近礼堂这头是无数自豪的家长,拖着儿女拍照留念,一张又一张……
今天大草坪上空空荡荡,只有下车等待入场的代表团,在草坪边上聚成一个个小堆。会场工作人员都穿着便装,两千名武警保卫部队分布在看不见的外围,媒体记者都被堵在二校门之外。而清华师生占了大便宜,全体放假一周。
张翰望着草坪出神:想出这主意的人真他妈是个天才。整个北京也找不到另一处会场,比这里学术气息更浓、对抗压力更小,触目尽是东西方文化交汇的象征。
寇局长凑过来,小心翼翼推他一把:“你没事吧?”
“没事。我在数各国代表中有多少同行。”
“刚才怎样?”
“不好说。至少没有把我直接踢开。我觉得,以她的身份履历跑到会场来混,应该是听到一点风声。跟她说好了,峰会结束再谈。”
寇局长皱眉道:“你真没必要这样。出了国界我们就管不着了。就算到了他们那边,让他们自己头痛去。”
“对我来说,这已经不完全是公事了。你信得过我的分寸吧?”
寇局长点点头:“正要跟你说:我派去重新调查百方陆安娜事件的人,刚才报告了。”
“哦?”
“你猜得对。陆安娜是做企划文案的,参加了集团合并的公开征名项目。她确实向同事打听过,中选的征名方案是不是来自内部。她小学和中学在香港读书,本科和研究生在加州大学圣迭戈分校。你小子真的记得每一句口供?审讯分析ai都没发现联系!”
“我哪有那么好记性,只是会读很多遍。我们那个ai太原始。真正的ai不但记得每件事、每句话,马上就采取行动了。”
二人都在想象年轻女子高高兴兴走进公司大楼,被电梯砸在头上的场面,不寒而栗。
“下一步联系找到了吗?”
“还没有。她一个人住,死后两天家里被盗了,少了很多东西。相册、学校纪念册、礼品卡片之类一件都找不到。数字的更不用说,从手机到电脑到社交媒体账户,全部被抹掉。还做了假数据填充,不仔细分析根本看不出来。”
“那个偷听的律师呢?他在美国见过真人。”
“跳槽到阅文集团了。这段时间在马来西亚出差,已经失联。”
“嘿嘿。这种力度,我们也不用指望百方、北美谷歌和圣迭戈分校的数字记录。那是它自己名下的地盘,还不给你清得一干二净?”
“那怎么搞?”
张翰想了片刻:“‘同学’这玩意有个好处:肯定不止一个。圣迭戈分校的中国学生很多,回国的也应该不少。会不会有谁认识陆安娜,也认识她某个朋友,学生物的,后来去了谷歌?只有麻烦你大撒网了。”
“好。我尽量低调点,纯人工。谷歌不至于把他们全干掉吧?”
张翰望了一眼对面人丛中的图尔西。她一直盯着这边看,似乎也认识寇局长是谁。
“这方面,美国情报社团的数据肯定比我们多得多。”
寇局长马上摇头:“不行。他们要真的让你去美国,证明了合作诚意,你就款到发货。也别发完,下飞机才能透露那对狗男女的事。在中国一个字都不能提。”
“收到……”
※※※
各国代表已经开始进入礼堂。
按照各国协商的章程,三个正式代表中必须有一位政府代表和一位信息技术领袖,第三个名额自便。中国代表团作为东道主最先上来,在礼堂门口迎接。
领队的是外交部长,图海川走在第二位。他上台阶的时候看见张翰,向他点点头。张翰忽然想起周克渊吹的大牛,便仔细看图海川的“弹震综合症”好没有。看上去一点也不紧张。而且他不负张翰所托,把成都分析组那帮人全弄进随员名单了。
各国技术领袖精英尽出。政府代表一般是外交部长,或是掌握实权的政府二当家。大国之中没有任何一位政府首脑出席。级别和安全问题怎么平衡,看来大家都有默契。
张翰细看第三人的选择。同行并不多。很多国家干脆派两位网络或智能专家,似乎真的相信这是个技术研讨会。发达国家大都把名额留给媒体或互联网巨头,比如英国的第三人是嘉德女士,天空-邮报新闻集团总裁。只有四个国家名单上的第三人是现役军官。
衮衮诸公,扈从如云。大多数脸色都很严峻,只有技术领袖们比较放松,都跟图海川打招呼。有的上来就说“原来你还活着”;有的嘻嘻哈哈黑他几句,大致是“你丫牛逼”的意思。
代表们差不多都进去了,庞大的美国代表团才在台阶下现身,引得很多人又出来看。
领衔的是国务卿朗·瓦拉。导弹事件之前,他是坚决反对美国参加北京峰会的。他身边是参谋长联席会议的一员:网络军参谋长兰道中将。(注:美国参谋长联席会议由各军种指挥官组成,是实质上的美国最高军事策略机关。军队的最高指挥权归于总统,通过文职国防部下达命令。但参谋长联席会议直接充当总统军事顾问,提供策略选择和建议。)
协商阶段美国提供的名单上,技术代表本来是北美谷歌ai开发总监帕特尔。帕特尔才上任两年,与其说是专家,不如说是技术官僚。各国都怀疑美国根本不想交底。
然而出发之前,爆出了企业号航母战斗群大量无人战机失控的消息。机群飞越中南半岛,在中越边境上不知搞什么鬼,险些引发三个国家的混战。于是技术代表在最后关头换了人。还是谷歌系的,分量差别就大了。
纪迪恩·戈德曼,模式识别大师,执掌谷歌“全力ai”战略十五年,谷歌透镜就是他的亲儿子。十五年间他两进两出,亲手操办了谷歌拆分之后ai技术的重新布局。现在他又不在谷歌任职了,创建了一个基金会,主要投资智库。
他还有个外号叫“达沃斯第一公民”。
戈德曼走在后面,还没上台阶,风头已经盖过了门口的图海川。各国代表都在跟他寒暄,政府代表比技术代表还热情。
张翰背后有人小声嘀咕:“奇怪。”
寇局长转身笑道:“王老师,怎么还没入座?接客这种事有我们就行了。图老师那是躲不掉。”
“我出来看看人。我坐第六排,等会儿就看不见前排的脸了。”
张翰直愣愣问她:“哪里奇怪?”
“美国代表团这三个人,分布有点奇怪。”
寇局长道:“左中右,很平衡啊?我还以为柯顿会派三只超级鹰派过来。现在这个兰道是职业军人,出名的不问政治。戈德曼虽然不是民主党,他在右派中名声比当年的盖茨还恶劣,都说他是全球化余孽、疯狂的加速派。柯顿肯派他出山,理智得出乎意料。”
“我不是说派系,是三个人走路的分布。”
“啊?”
“戈德曼和兰道是几十年的老交情,大学时代就在一起玩音乐。都混成人物之后,关系也非常不简单。原先国防部把100亿美元的‘战争云’赏给微软。2028年兰道去了网络军,就帮戈德曼把微软搞了的项目活生生抢过去,成了谷歌的地盘。这种交情,带队的又是国务卿,他们两个副职难道不该一起走后面?现在你看兰道,离戈德曼远远的,眼睛都不转过去一下。国务卿的态度都比他好。”(注:战争云:war cloud,又称“绝地计划”(jedi),是美军重点建设的军事ai云计算项目。ai巨头之间为合同激烈竞争。2018年多名微软员工发表公开信呼吁公司放弃竞标,声称自己制造的东西潜力可怕,不应被用于军事。2019年国防部将“战争云”巨额合同授予微软。)
寇局长心道“女人的视角真特别”,嘴上赞道:“王老师,你应该到信安部来工作!这种灰历史、黑材料,我的分析师守着那么大数据库都拿不出来。他们只知道这次美国军方反对戈德曼出席,但议会和情报社团支持,完全倒过来了。这也很奇怪。”
“我知道的其实都是公开信息,鸡零狗碎泡在媒体里面。我每天至少读三个小时西方媒体。职业病,对心理健康很不好。”
张翰看了几眼大人物们,忽然在王招弟耳边道:“等下我换到第六排来,坐你旁边。行不行?”
「–」
国务卿和兰道中将目不斜视穿过了拱门。戈德曼停在图海川面前。四周的人群都静下来,竖起耳朵。
“你第一个讲,我第二个讲。对吗?”
图海川点头:“是的。现在我们就别废话了。”
戈德曼眼中放光,拍拍图海川的肩膀,昂首进门。
第24章 造物
图海川独坐讲台,当真一句话都不肯浪费。
「–」
“2025年,我受命为阿里集团正在运作的国际网购平台开发一款多语言翻译系统。当时我还不是项目负责人,只是技术方面的总设计师。设计目标有两个:一是自动翻译所有的网页界面文字,二是为作为阿里旺旺的内嵌翻译支持,让使用各种语言的人可以直接交谈,同时处理语音和文字翻译。你们有些人可能没听说过旺旺,因为它已经被这个内嵌反过来吞并了。网购平台也是这样——本来它定了个名字叫‘世界宝’。现在,这些都通称‘万国宝’。所以先澄清一点:现在我谈到的万国宝,不是指网购平台也不是从前的旺旺,专指我设计的人工智能翻译系统。到这个定义需要改变的时候,我会提醒你们。
“这个项目本来不应该存在。因为在2025年,谷歌的人工智能翻译技术已经很成熟。集团内部开预研会,我的第一反应是:为什么还要自己发明轮子?把谷歌翻译嵌进去不就行了吗?当时谷歌的自然语言翻译产品除了谷歌翻译,还有谷歌数字助理、谷歌duplex。三个内核揉在一起再进行二次开发,恰好能满足我们的需求。这些产品的接口也非常友好。
“开完会我就明白为什么了。万国宝能够出生,还得感谢您。”他向国务卿点了点头,“那时美国商务部由您主持,认定谷歌的自然语言人工智能是战略技术。可以让我们当用户,但不能嫁接在与美国企业竞争的阿里平台上。那个合作才谈了个意向,就被你砍掉了。我们只能另起炉灶。”
美国代表团的译员非常出色,几乎同时说完。国务卿毫不介意,也笑着点头。
“怎么做呢?还得用谷歌的东西。因为那时候谷歌的tensorflow平台几乎统一了机器学习开发模式,已经为自然语言ai提供两种架构。我们用它搭好架子,搞自己的局部算法就行了。2027年我们的系统已经上线试运行。水平还真的不错,比谷歌翻译公开版的正确率和拟人度还高一点。当时,我和谷歌的朋友霍桑聊天,在背后笑话你。我说你砍了商务项目,但没法砍谷歌的开放ai标准,这等于强行给我灌输美国技术思想的精华。霍桑说你不但让谷歌少挣了钱,又逼着中国ai产业补短板,将来还不受限制,都是‘开枪射自己的脚’。他已经过世了,我不妨告诉你。”
这次国务卿面无表情。张翰相当吃惊:什么时候图海川说话这么嚣张过?他现在脑浆温度是有多高?
“2027年的事你们应该还记得。阿里低估了关税问题和跨国物流的复杂。加上那时候世界很乱,各大市场的准入标准也被人为收紧了。整整一年,各国先争吵,再谈判,越谈越糊涂。‘世界宝’上不了线,一拖就是十年,直到把自己的名字都拖没了。万国宝项目组倒是闲了下来。原先赶进度,有很多功夫没有做到位。从2028年开始可以坐下来慢慢改进、反复琢磨。但是,到年底我就撞上了墙。
“那时的万国宝翻译网购平台文字界面,几乎做到了完美。不仅是标准文字,一张商品图片上的中文它都可以立即识别、翻译、改图嵌入。麻烦出在真人交流,尤其是语音会话。当时困扰我的有三个大问题:第一,它搞不懂讽刺。第二,它无法处理很多种修辞,特别是隐喻和指代。第三,遇到语境决定语意的情况就犯蒙。
“前两个问题我用一个真实的内测例子说明。测试员作为中国卖家挂出了恐龙蛋化石商品,一个美国买家向他询问来源和真伪。中国卖家一番解释之后,美国买家说:‘yeah right! i too have an ocean front in nevada to sell you.’万国宝的翻译:‘真不错!我在内华达州有一套海景房,也可以卖给你。’中国卖家听了非常兴奋,催他下单,说下单之后大家可以聊房地产。”
听众已经笑倒了一片,译员们笑得尤其厉害。
图海川一本正经继续:“后来的万国宝是这样翻译的:‘老板实在!我有块地皮在中南海,你买不买?’在座的人类很容易理解,这才是美国买家的本意。那么我们和后来的万国宝有什么共同点?和以前的万国宝又有什么不同?我们知道内华达不靠海。我们起码经历过几百次别人说yeah right的场合。后来的万国宝会把英语隐喻置换成类似的汉语隐喻,甚至使用类似的土鳖语气,就像各位译员刚才脑子里转的弯。
“当时我设想的解决方法是:把yeah right之类的常用短语,以及后面那个土味浓厚的美国俗语,分别归入‘讽刺’和‘俗语’类型,各自用一个深度学习网络层处理。但这也不能完全解决问题——你架不住随时有人发明新俗语、新黑话。更架不住真的有人说yeah right,表示同意。这就是我刚才说的第三个问题:语境决定语意。这才是最广泛、最无解的问题。汉语中尤其严重,‘大胜’等于‘大败’之类,例子太多我就不啰嗦了。
“折腾几个月之后,我终于确认了一件事:要想彻底解决这些问题,万国宝必须理解这个话题、理解说话和听话的人、理解这个世界。理解越多翻译越准确。
“当时我还没弄明白想要的是什么。项目组认为这是ai技术中的两个经典课题:知识系统和行为认知。我在文献堆里碰了一鼻子灰,最后还是霍桑一语惊醒梦中人。他告诉我,我想要的是通用人工智能。‘你要是真解决了所有自然语言的翻译,你就有了一个可以自己学习一切的智能。也就是解决所有智能问题的智能。也就是比人类大脑更像大脑的大脑。’这是他的原话。他劝我适可而止,因为谷歌内部最前沿的自然语言项目也暂时不敢有这种野心。网购平台并不需要这种级别的自动翻译,人和ai总是互相适应的。真实的人在使用智能翻译时知道局限,不会那么贫嘴。他还吐槽,说那个美国买家设定是我的‘红脖子偏见’在作怪。
“霍桑点醒了我,也刺激了我。万国宝的诞生,第二个应该感谢的人是他。一位伟大的工程师,伟大的朋友。2029年春节,我坐在家中从头开始考虑。不仅是手上的工作,还考虑自己整个事业的开头。
“我们这一代搞ai的,很多人都有共同的‘召唤时刻’:2016年阿尔法狗击败围棋世界冠军,夺走了人类智慧的荣耀。阿尔法狗赢下第五盘棋那天,我就选定了专业。也是从那天开始,ai圈子里有个争议最大的问题:阿尔法狗到底会不会下围棋?看完网络直播之后,我不吃不睡思考这个问题,后来的十二年却从没想过。因为从那天起,我不下围棋了。
“这问题听起来很白痴。它把围棋大天才李世石和柯洁都灭了,还能不会下棋?但是学术界对这个问题很严肃。我们换个问法:它‘脑子’里面理解围棋吗?
“我们先来看它是怎么下棋的。我给个最直白的描述:阿尔法狗先记下几百万盘人类对局,用概率工具统计人类棋手在各种局面下的落子选择,用来模仿。然后用另外两个概率工具统计某种局面有多大概率胜利,以及某一手有多大概率导致这种局面。然后它就开始用这三个工具自己跟自己下,不断推演计算下一步。我们知道,围棋可能的局面数量比宇宙中的原子还多。阿尔法狗那么强大的计算硬件也不可能暴力穷尽所有局面。所以还要有第四个工具,作为框架支撑前三个:含有随机猜测的搜索算法,用有限的计算量倒推搜索,搜出获胜概率最高的下一手。
“完了。就这么简单。搞ai的人给这些工具取了各种酷炫的名字,深度学习卷积网络、估值策略函数、蒙特卡洛树,等等。不是我们想蒙人。这些概率学工具,你没有相关专业博士学位就没法理解它们的道理和窍门。总得有个名字吧——但它们的实质就是这么简单粗暴。
“所以当时那些又懂点ai、又会下棋的人就不高兴了,比如说我。这不是下围棋,我们下棋时想的不是这些。我们脑子里是定式、外势、实地、死活、棋型、轻重、缓急等等,一座逻辑和直觉交织而成的宫殿,无限复杂,无限美丽。这个最精妙的游戏被阿尔法狗变成了反复掷骰子,只因为它的记忆力和计算力超过我们亿万倍。
“2029年春节,我坐下想了十分钟,就抽了自己一巴掌。十二年前太无知了!阿尔法狗当然会下棋!实际上,我们每个人开始学棋的时候下法都跟它相同。我们先看别人下棋。然后有样学样,把第一子下在角上,并不知道为什么。然后学‘金角银边草肚皮’。这就是最简单的估值函数。然后学定式。这是统计优化之后的模仿,概率已经被定式书预先计算过了。然后学死活,这是带分支树的自我应对推演。阿尔法狗用什么工具,我们就用什么工具。这就是围棋最本源的下法。
“那么,为什么我们后来就整出那么多花样,跟阿尔法狗完全不同呢?”
中华田园估值函数:金角银边草肚皮
听众的嗡嗡声变大了。技术代表们非常专注,政府代表们一脸茫然,日本和韩国代表团全体兴奋,译员们被一连串围棋术语整得死去活来。
这次张翰很诚实,但字斟句酌:“是我自己申请来的。从指挥部调职,是因为我失败了。看到你过来负责检查,知道你以前是干什么的,我认为可能需要你的帮助。”
“什么失败?我能帮什么忙?”
“现在不能说。”
“你这叫回答?”
“我很想跟你摊开了讨论。但是必须等到峰会开完之后,老板们谈妥了才行。要是我们先谈了,他们却谈不拢,我们两个都会因为泄密完蛋。”
“做梦。我不会泄密。”
“要是都不泄密,那有什么好谈的?”
图尔西大吃一惊:从没见过如此胆大包天的中国官员,在双方安全人员环伺之下大谈‘泄密’。这算投诚还是招募?官方指使还是私人兴趣?
她不置可否。然而张翰已经看出了她的兴趣:“那我们预祝峰会成功吧。”
两个人相识四年,一起工作三小时,终于勉勉强强握了一下手。
※※※
走出大礼堂拱门,二人立即分开,回到各自的先导团队中。大草坪对面,一群群会场工作人员已经在撤除路障、指挥交通,各国代表团的座车开始入场了。车队从二校门进入,在清华日晷前分流,停在周围建筑区指定位置。
艳阳高照,天气和九月入学季一模一样。张翰还记得大草坪上满是一年级新生,躺在圣殿中心,闭上眼睛品味梦的气息,享受短暂的蜜月。靠近礼堂这头是无数自豪的家长,拖着儿女拍照留念,一张又一张……
今天大草坪上空空荡荡,只有下车等待入场的代表团,在草坪边上聚成一个个小堆。会场工作人员都穿着便装,两千名武警保卫部队分布在看不见的外围,媒体记者都被堵在二校门之外。而清华师生占了大便宜,全体放假一周。
张翰望着草坪出神:想出这主意的人真他妈是个天才。整个北京也找不到另一处会场,比这里学术气息更浓、对抗压力更小,触目尽是东西方文化交汇的象征。
寇局长凑过来,小心翼翼推他一把:“你没事吧?”
“没事。我在数各国代表中有多少同行。”
“刚才怎样?”
“不好说。至少没有把我直接踢开。我觉得,以她的身份履历跑到会场来混,应该是听到一点风声。跟她说好了,峰会结束再谈。”
寇局长皱眉道:“你真没必要这样。出了国界我们就管不着了。就算到了他们那边,让他们自己头痛去。”
“对我来说,这已经不完全是公事了。你信得过我的分寸吧?”
寇局长点点头:“正要跟你说:我派去重新调查百方陆安娜事件的人,刚才报告了。”
“哦?”
“你猜得对。陆安娜是做企划文案的,参加了集团合并的公开征名项目。她确实向同事打听过,中选的征名方案是不是来自内部。她小学和中学在香港读书,本科和研究生在加州大学圣迭戈分校。你小子真的记得每一句口供?审讯分析ai都没发现联系!”
“我哪有那么好记性,只是会读很多遍。我们那个ai太原始。真正的ai不但记得每件事、每句话,马上就采取行动了。”
二人都在想象年轻女子高高兴兴走进公司大楼,被电梯砸在头上的场面,不寒而栗。
“下一步联系找到了吗?”
“还没有。她一个人住,死后两天家里被盗了,少了很多东西。相册、学校纪念册、礼品卡片之类一件都找不到。数字的更不用说,从手机到电脑到社交媒体账户,全部被抹掉。还做了假数据填充,不仔细分析根本看不出来。”
“那个偷听的律师呢?他在美国见过真人。”
“跳槽到阅文集团了。这段时间在马来西亚出差,已经失联。”
“嘿嘿。这种力度,我们也不用指望百方、北美谷歌和圣迭戈分校的数字记录。那是它自己名下的地盘,还不给你清得一干二净?”
“那怎么搞?”
张翰想了片刻:“‘同学’这玩意有个好处:肯定不止一个。圣迭戈分校的中国学生很多,回国的也应该不少。会不会有谁认识陆安娜,也认识她某个朋友,学生物的,后来去了谷歌?只有麻烦你大撒网了。”
“好。我尽量低调点,纯人工。谷歌不至于把他们全干掉吧?”
张翰望了一眼对面人丛中的图尔西。她一直盯着这边看,似乎也认识寇局长是谁。
“这方面,美国情报社团的数据肯定比我们多得多。”
寇局长马上摇头:“不行。他们要真的让你去美国,证明了合作诚意,你就款到发货。也别发完,下飞机才能透露那对狗男女的事。在中国一个字都不能提。”
“收到……”
※※※
各国代表已经开始进入礼堂。
按照各国协商的章程,三个正式代表中必须有一位政府代表和一位信息技术领袖,第三个名额自便。中国代表团作为东道主最先上来,在礼堂门口迎接。
领队的是外交部长,图海川走在第二位。他上台阶的时候看见张翰,向他点点头。张翰忽然想起周克渊吹的大牛,便仔细看图海川的“弹震综合症”好没有。看上去一点也不紧张。而且他不负张翰所托,把成都分析组那帮人全弄进随员名单了。
各国技术领袖精英尽出。政府代表一般是外交部长,或是掌握实权的政府二当家。大国之中没有任何一位政府首脑出席。级别和安全问题怎么平衡,看来大家都有默契。
张翰细看第三人的选择。同行并不多。很多国家干脆派两位网络或智能专家,似乎真的相信这是个技术研讨会。发达国家大都把名额留给媒体或互联网巨头,比如英国的第三人是嘉德女士,天空-邮报新闻集团总裁。只有四个国家名单上的第三人是现役军官。
衮衮诸公,扈从如云。大多数脸色都很严峻,只有技术领袖们比较放松,都跟图海川打招呼。有的上来就说“原来你还活着”;有的嘻嘻哈哈黑他几句,大致是“你丫牛逼”的意思。
代表们差不多都进去了,庞大的美国代表团才在台阶下现身,引得很多人又出来看。
领衔的是国务卿朗·瓦拉。导弹事件之前,他是坚决反对美国参加北京峰会的。他身边是参谋长联席会议的一员:网络军参谋长兰道中将。(注:美国参谋长联席会议由各军种指挥官组成,是实质上的美国最高军事策略机关。军队的最高指挥权归于总统,通过文职国防部下达命令。但参谋长联席会议直接充当总统军事顾问,提供策略选择和建议。)
协商阶段美国提供的名单上,技术代表本来是北美谷歌ai开发总监帕特尔。帕特尔才上任两年,与其说是专家,不如说是技术官僚。各国都怀疑美国根本不想交底。
然而出发之前,爆出了企业号航母战斗群大量无人战机失控的消息。机群飞越中南半岛,在中越边境上不知搞什么鬼,险些引发三个国家的混战。于是技术代表在最后关头换了人。还是谷歌系的,分量差别就大了。
纪迪恩·戈德曼,模式识别大师,执掌谷歌“全力ai”战略十五年,谷歌透镜就是他的亲儿子。十五年间他两进两出,亲手操办了谷歌拆分之后ai技术的重新布局。现在他又不在谷歌任职了,创建了一个基金会,主要投资智库。
他还有个外号叫“达沃斯第一公民”。
戈德曼走在后面,还没上台阶,风头已经盖过了门口的图海川。各国代表都在跟他寒暄,政府代表比技术代表还热情。
张翰背后有人小声嘀咕:“奇怪。”
寇局长转身笑道:“王老师,怎么还没入座?接客这种事有我们就行了。图老师那是躲不掉。”
“我出来看看人。我坐第六排,等会儿就看不见前排的脸了。”
张翰直愣愣问她:“哪里奇怪?”
“美国代表团这三个人,分布有点奇怪。”
寇局长道:“左中右,很平衡啊?我还以为柯顿会派三只超级鹰派过来。现在这个兰道是职业军人,出名的不问政治。戈德曼虽然不是民主党,他在右派中名声比当年的盖茨还恶劣,都说他是全球化余孽、疯狂的加速派。柯顿肯派他出山,理智得出乎意料。”
“我不是说派系,是三个人走路的分布。”
“啊?”
“戈德曼和兰道是几十年的老交情,大学时代就在一起玩音乐。都混成人物之后,关系也非常不简单。原先国防部把100亿美元的‘战争云’赏给微软。2028年兰道去了网络军,就帮戈德曼把微软搞了的项目活生生抢过去,成了谷歌的地盘。这种交情,带队的又是国务卿,他们两个副职难道不该一起走后面?现在你看兰道,离戈德曼远远的,眼睛都不转过去一下。国务卿的态度都比他好。”(注:战争云:war cloud,又称“绝地计划”(jedi),是美军重点建设的军事ai云计算项目。ai巨头之间为合同激烈竞争。2018年多名微软员工发表公开信呼吁公司放弃竞标,声称自己制造的东西潜力可怕,不应被用于军事。2019年国防部将“战争云”巨额合同授予微软。)
寇局长心道“女人的视角真特别”,嘴上赞道:“王老师,你应该到信安部来工作!这种灰历史、黑材料,我的分析师守着那么大数据库都拿不出来。他们只知道这次美国军方反对戈德曼出席,但议会和情报社团支持,完全倒过来了。这也很奇怪。”
“我知道的其实都是公开信息,鸡零狗碎泡在媒体里面。我每天至少读三个小时西方媒体。职业病,对心理健康很不好。”
张翰看了几眼大人物们,忽然在王招弟耳边道:“等下我换到第六排来,坐你旁边。行不行?”
「–」
国务卿和兰道中将目不斜视穿过了拱门。戈德曼停在图海川面前。四周的人群都静下来,竖起耳朵。
“你第一个讲,我第二个讲。对吗?”
图海川点头:“是的。现在我们就别废话了。”
戈德曼眼中放光,拍拍图海川的肩膀,昂首进门。
第24章 造物
图海川独坐讲台,当真一句话都不肯浪费。
「–」
“2025年,我受命为阿里集团正在运作的国际网购平台开发一款多语言翻译系统。当时我还不是项目负责人,只是技术方面的总设计师。设计目标有两个:一是自动翻译所有的网页界面文字,二是为作为阿里旺旺的内嵌翻译支持,让使用各种语言的人可以直接交谈,同时处理语音和文字翻译。你们有些人可能没听说过旺旺,因为它已经被这个内嵌反过来吞并了。网购平台也是这样——本来它定了个名字叫‘世界宝’。现在,这些都通称‘万国宝’。所以先澄清一点:现在我谈到的万国宝,不是指网购平台也不是从前的旺旺,专指我设计的人工智能翻译系统。到这个定义需要改变的时候,我会提醒你们。
“这个项目本来不应该存在。因为在2025年,谷歌的人工智能翻译技术已经很成熟。集团内部开预研会,我的第一反应是:为什么还要自己发明轮子?把谷歌翻译嵌进去不就行了吗?当时谷歌的自然语言翻译产品除了谷歌翻译,还有谷歌数字助理、谷歌duplex。三个内核揉在一起再进行二次开发,恰好能满足我们的需求。这些产品的接口也非常友好。
“开完会我就明白为什么了。万国宝能够出生,还得感谢您。”他向国务卿点了点头,“那时美国商务部由您主持,认定谷歌的自然语言人工智能是战略技术。可以让我们当用户,但不能嫁接在与美国企业竞争的阿里平台上。那个合作才谈了个意向,就被你砍掉了。我们只能另起炉灶。”
美国代表团的译员非常出色,几乎同时说完。国务卿毫不介意,也笑着点头。
“怎么做呢?还得用谷歌的东西。因为那时候谷歌的tensorflow平台几乎统一了机器学习开发模式,已经为自然语言ai提供两种架构。我们用它搭好架子,搞自己的局部算法就行了。2027年我们的系统已经上线试运行。水平还真的不错,比谷歌翻译公开版的正确率和拟人度还高一点。当时,我和谷歌的朋友霍桑聊天,在背后笑话你。我说你砍了商务项目,但没法砍谷歌的开放ai标准,这等于强行给我灌输美国技术思想的精华。霍桑说你不但让谷歌少挣了钱,又逼着中国ai产业补短板,将来还不受限制,都是‘开枪射自己的脚’。他已经过世了,我不妨告诉你。”
这次国务卿面无表情。张翰相当吃惊:什么时候图海川说话这么嚣张过?他现在脑浆温度是有多高?
“2027年的事你们应该还记得。阿里低估了关税问题和跨国物流的复杂。加上那时候世界很乱,各大市场的准入标准也被人为收紧了。整整一年,各国先争吵,再谈判,越谈越糊涂。‘世界宝’上不了线,一拖就是十年,直到把自己的名字都拖没了。万国宝项目组倒是闲了下来。原先赶进度,有很多功夫没有做到位。从2028年开始可以坐下来慢慢改进、反复琢磨。但是,到年底我就撞上了墙。
“那时的万国宝翻译网购平台文字界面,几乎做到了完美。不仅是标准文字,一张商品图片上的中文它都可以立即识别、翻译、改图嵌入。麻烦出在真人交流,尤其是语音会话。当时困扰我的有三个大问题:第一,它搞不懂讽刺。第二,它无法处理很多种修辞,特别是隐喻和指代。第三,遇到语境决定语意的情况就犯蒙。
“前两个问题我用一个真实的内测例子说明。测试员作为中国卖家挂出了恐龙蛋化石商品,一个美国买家向他询问来源和真伪。中国卖家一番解释之后,美国买家说:‘yeah right! i too have an ocean front in nevada to sell you.’万国宝的翻译:‘真不错!我在内华达州有一套海景房,也可以卖给你。’中国卖家听了非常兴奋,催他下单,说下单之后大家可以聊房地产。”
听众已经笑倒了一片,译员们笑得尤其厉害。
图海川一本正经继续:“后来的万国宝是这样翻译的:‘老板实在!我有块地皮在中南海,你买不买?’在座的人类很容易理解,这才是美国买家的本意。那么我们和后来的万国宝有什么共同点?和以前的万国宝又有什么不同?我们知道内华达不靠海。我们起码经历过几百次别人说yeah right的场合。后来的万国宝会把英语隐喻置换成类似的汉语隐喻,甚至使用类似的土鳖语气,就像各位译员刚才脑子里转的弯。
“当时我设想的解决方法是:把yeah right之类的常用短语,以及后面那个土味浓厚的美国俗语,分别归入‘讽刺’和‘俗语’类型,各自用一个深度学习网络层处理。但这也不能完全解决问题——你架不住随时有人发明新俗语、新黑话。更架不住真的有人说yeah right,表示同意。这就是我刚才说的第三个问题:语境决定语意。这才是最广泛、最无解的问题。汉语中尤其严重,‘大胜’等于‘大败’之类,例子太多我就不啰嗦了。
“折腾几个月之后,我终于确认了一件事:要想彻底解决这些问题,万国宝必须理解这个话题、理解说话和听话的人、理解这个世界。理解越多翻译越准确。
“当时我还没弄明白想要的是什么。项目组认为这是ai技术中的两个经典课题:知识系统和行为认知。我在文献堆里碰了一鼻子灰,最后还是霍桑一语惊醒梦中人。他告诉我,我想要的是通用人工智能。‘你要是真解决了所有自然语言的翻译,你就有了一个可以自己学习一切的智能。也就是解决所有智能问题的智能。也就是比人类大脑更像大脑的大脑。’这是他的原话。他劝我适可而止,因为谷歌内部最前沿的自然语言项目也暂时不敢有这种野心。网购平台并不需要这种级别的自动翻译,人和ai总是互相适应的。真实的人在使用智能翻译时知道局限,不会那么贫嘴。他还吐槽,说那个美国买家设定是我的‘红脖子偏见’在作怪。
“霍桑点醒了我,也刺激了我。万国宝的诞生,第二个应该感谢的人是他。一位伟大的工程师,伟大的朋友。2029年春节,我坐在家中从头开始考虑。不仅是手上的工作,还考虑自己整个事业的开头。
“我们这一代搞ai的,很多人都有共同的‘召唤时刻’:2016年阿尔法狗击败围棋世界冠军,夺走了人类智慧的荣耀。阿尔法狗赢下第五盘棋那天,我就选定了专业。也是从那天开始,ai圈子里有个争议最大的问题:阿尔法狗到底会不会下围棋?看完网络直播之后,我不吃不睡思考这个问题,后来的十二年却从没想过。因为从那天起,我不下围棋了。
“这问题听起来很白痴。它把围棋大天才李世石和柯洁都灭了,还能不会下棋?但是学术界对这个问题很严肃。我们换个问法:它‘脑子’里面理解围棋吗?
“我们先来看它是怎么下棋的。我给个最直白的描述:阿尔法狗先记下几百万盘人类对局,用概率工具统计人类棋手在各种局面下的落子选择,用来模仿。然后用另外两个概率工具统计某种局面有多大概率胜利,以及某一手有多大概率导致这种局面。然后它就开始用这三个工具自己跟自己下,不断推演计算下一步。我们知道,围棋可能的局面数量比宇宙中的原子还多。阿尔法狗那么强大的计算硬件也不可能暴力穷尽所有局面。所以还要有第四个工具,作为框架支撑前三个:含有随机猜测的搜索算法,用有限的计算量倒推搜索,搜出获胜概率最高的下一手。
“完了。就这么简单。搞ai的人给这些工具取了各种酷炫的名字,深度学习卷积网络、估值策略函数、蒙特卡洛树,等等。不是我们想蒙人。这些概率学工具,你没有相关专业博士学位就没法理解它们的道理和窍门。总得有个名字吧——但它们的实质就是这么简单粗暴。
“所以当时那些又懂点ai、又会下棋的人就不高兴了,比如说我。这不是下围棋,我们下棋时想的不是这些。我们脑子里是定式、外势、实地、死活、棋型、轻重、缓急等等,一座逻辑和直觉交织而成的宫殿,无限复杂,无限美丽。这个最精妙的游戏被阿尔法狗变成了反复掷骰子,只因为它的记忆力和计算力超过我们亿万倍。
“2029年春节,我坐下想了十分钟,就抽了自己一巴掌。十二年前太无知了!阿尔法狗当然会下棋!实际上,我们每个人开始学棋的时候下法都跟它相同。我们先看别人下棋。然后有样学样,把第一子下在角上,并不知道为什么。然后学‘金角银边草肚皮’。这就是最简单的估值函数。然后学定式。这是统计优化之后的模仿,概率已经被定式书预先计算过了。然后学死活,这是带分支树的自我应对推演。阿尔法狗用什么工具,我们就用什么工具。这就是围棋最本源的下法。
“那么,为什么我们后来就整出那么多花样,跟阿尔法狗完全不同呢?”
中华田园估值函数:金角银边草肚皮
听众的嗡嗡声变大了。技术代表们非常专注,政府代表们一脸茫然,日本和韩国代表团全体兴奋,译员们被一连串围棋术语整得死去活来。