透明思考


Transparent Thoughts


  1. 云时代的研发环境:实施路径

    前文讲到,在云计算的时代大背景下,我们推荐采用研发技术栈管理平台来集中管理组织中的技术栈,允许基于一个技术栈创建开发测试PaaS和生产PaaS两个PaaS服务,从而支撑开发、测试、生产三种运行时环境。通过三种运行时环境的区分,技术栈管理平台实质上设置了一条标准的精益软件生产流水线,为软件研发生命周期中的三个核心工种——开发、测试、运维——布置了标准的“工位”。在实施技术栈管理平台时,从这三个核心工种之中的任何一个切入,都可以优先建设该工种对应的工位,从而拉动整条云化生产流水线的实施。

    从开发切入,打造规范的软件开发底座

    在数字化的大背景下,众多IT组织都面临技术能力短缺的境况。尤其是传统企业的IT部门,需要用有限的研发专业技能交付越来越多、变化越来越频繁的IT系统,还需要管理外包合作方的团队,对于开发底座规范化的要求日益显著。这些开发团队常见的一些挑战包括:

    • 技术实践能力有限,不能保证每个项目采用业界最佳的框架与工具组合。
    • 开发流程不规范,代码质量关注不够,技术债累积严重。
    • 外包团队管理乏力,对外包团队的开发实践缺乏约束。

    实施技术栈管理平台以后,整个组织可以识别并聚焦几种具有普遍代表性的软件形态(例如“Java微服务”、“Java Web应用”、“安卓移动应用”等),集中技术骨干力量,搭建项目基础架构,以技术栈的形式固化下来。开发团队要启动一个项目时,只需要从技术栈管理的PaaS平台上选择自己需要的技术栈,就可以立即生成自己的构建运行时,其中包括代码仓库、应用基础框架、依赖软件、自动化构建工具等。基于这个构建运行时,开发团队可以基于已经搭好的脚手架立即开始编写代码,并在PaaS云上进行基本的验证,然后提交到团队代码仓库。团队的技术领导者不需要考虑开发环境应该如何配置,开发人员也不需要在自己的电脑上做任何环境准备工作,从而极大地降低了项目启动的技术门槛。

    作为对开发工位的规范要求,技术栈中会规定“提交门”的质量标准,达不到质量标准的代码将无法提交到团队代码库中。这个实践与持续集成一样,都是源自丰田生产方式的“安灯”实践:如果出现质量隐患,应该立即停线修复,而不是让带着质量隐患的生产线继续运转。在一般的开发团队中,提交门的质量标准至少包括(1)代码能通过编译;(2)代码能通过静态质量检查。通过引入代码复杂度、代码规范性检查等基本质量标准,能促使开发团队关注代码质量,避免基本的技术债不断累积。水平较高的团队会在提交门中包含单元测试,单元测试不通过、或单元测试覆盖率达不到标准的代码将无法提交。

    如果需要引入外包团队来协助开发,外包团队可以直接从技术栈管理PaaS服务商获得自己的构建运行时,绝大部分的开发规范可以用提交门验证的形式来承载,从而将组织的质量要求固化到开发环境中,降低规范化管理外包团队的难度和成本。

    在开发工位实施技术栈管理后,随着开发规范化底座的建立和开发阶段质量要求的逐渐提升,开发团队将具备逐步缩短交付周期的能力。随着开发交付周期缩短,待测试、待发布的版本会累积起来,对后续的测试和运维工位形成压力。此时研发管理者应该密切留意测试工位的累积情况。如果测试团队抱怨转测版本太多、人手不足,都反映出工位之间产能失衡的问题。当这一问题出现时,就应该抓住契机,提升测试工位的标准化和自动化程度,使测试工位能跟上开发的交付周期。

    从测试切入,建立云测试平台

    在数字化、互联网化的IT大背景下,软件系统上线的周期不断缩短,两周一迭代已经成为众多团队的标准配置,一些创新型业务已经要求将上线周期缩短到一周、几天、甚至一天几次。不断缩短的上线周期,使很多IT组织在测试方面的问题暴露出来:

    • 测试自动化程度低,手工回归测试跟不上频繁上线的节奏。
    • 测试环境争用,环境管理工作量大。
    • 性能、安全等非功能性需求的测试投入不足,到项目晚期才开始测试。

    如果这些问题是一个组织当前最大的痛点,技术栈管理平台的实施也可以从测试工位开始入手,为整个组织打下坚实的质量保障基础。测试和开发的技术骨干可以一同选择适宜的自动化测试工具,将其连接配置好,准备好自动化测试的脚手架,打包到技术栈的验证运行时中。测试人员只需按照业务需求编写自动化测试例,并放在技术栈中规定的“验证门”环节自动执行。当系统最重要的功能都能被自动化测试覆盖,测试人员就能从繁重的手工回归测试中解脱。

    自动化测试需要可靠且可复制的测试环境来执行,这正是云计算的优势所在。在技术栈管理PaaS中定义了测试运行时环境后,每当测试人员或自动化的验证门要执行自动化测试例时,就会从云中取出一个测试运行时,其中除了被测系统的依赖软件外,还包含了配置好的各种测试工具。被测系统会被加载到测试运行时环境中,执行自动化测试例,收集测试报告,然后测试运行时环境就会被销毁回收。整个过程中不需要测试人员手工管理测试环境,也不需要与其他测试或开发人员共用一套环境。

    一旦测试人员不用“人肉回归”大部分软件功能,他们就可以把更多的精力投入非功能性测试。性能测试、安全性测试等非功能性测试所需的工具集同样可以被内建在技术栈中,方便测试人员日常工作。同时,测试人员还可以把非功能性测试编写成自动化的测试例,将其加入验证门的测试集,从而使非功能性需求也持续得到保障,以免在项目晚期才发现重大性能或安全问题。

    当云测试平台建立起来,有了基本的自动化测试覆盖,测试人员就可以起到质量监督和建议的作用,而不是跟在开发后面做简单重复的手工验证。由于软件产品必须在验证运行时上通过测试,研发管理者就可以借此拉动开发团队使用云测试平台进行自验证,在习惯养成后再逐步在开发过程中推广使用构建运行时,从而用一个技术栈拉通开发和测试的工作环境。

    从运维切入,构建高响应运维能力

    同样,数字化、互联网化的大背景也对运维团队提出了新的挑战。从业务客户的角度,他们不仅希望自己的需求能尽快上线被用户使用,而且还希望及时获得来自用户的反馈,帮助他们做出调整。在一些领先的企业,运维更是能支持业务客户针对真实用户进行快速的受控实验,从而验证自己的业务假设。在这些新的要求下,很多IT组织的运维团队暴露出了能力上的不足:

    • 运维自动化程度低,需要大量手工操作,工作量大,可靠性低,容易出错。
    • 系统监控不完备,出现故障时不能及时发现和快速排错。
    • 生产系统的信息不能快速转换成业务洞见,无法支持频繁的线上受控实验。

    技术栈管理平台的实施同样可以从运维工位入手,以打造高效的DevOps体系为优先目标。

    你说的是哪种DevOps?

    由于历史原因,如今大家在谈起“DevOps”这个词时,其中包含的可能是三重相关但不同的含义:

    1. 如何借助基础设施即服务、运维自动化等手段,加快代码部署到生产环境的速度。
    2. 如何借助日志和监控手段,及时把生产环境的情况反馈到开发团队。
    3. 如何借助端到端的埋点、数据采集、分析和可视化,把用户行为反馈到业务。

    以运维视角优先切入时,技术栈的建设就自然地偏向运维工具。在支持计算资源弹性分配的IaaS层(例如基于ScaleWorks的私有云)之上,将自动化配置管理工具(例如Chef、Puppet、Ansible)及其他常用的运维工具打包在应用运行时中,运维人员可以随时从技术栈管理的PaaS服务中获得完整且配置好的应用运行时,再从通过了测试验证(可能是手工验证)的发布候选版本中选择一个放入应用运行时,即可快速完成应用的部署上线。生产环境的配置以代码形式记录,可以由技术能力较强的DevOps团队专门维护,从而省去了大多数运维人员手动管理运行时环境的工作量与风险。

    在应用运行时环境中,可以根据软件系统的特征预先配置好日志工具(例如ELK、Splunk)和服务指标监控工具(例如Collectd),使开发团队无需额外工作就能获得丰富有用的生产环境信息。一些水平更高的团队会在应用运行时环境中设置更智能化的运维功能(例如基于Hystrix的服务熔断机制),使运维更具响应力。

    应用运行时环境中还可以植入端到端综合语义监控所需的工具设置,从而支持对业务场景埋点和分析,甚至是结合流量路由技术进行受控实验,用数据为业务决策提供支撑。业务有了缩短反馈周期的诉求,运维有了快速响应变化的能力,两端夹击可以倒逼研发环节提升响应力、缩短交付周期,这也是研发组织变革的一个套路。

    运维工位采用技术栈管理平台以后,研发管理者可以从交付物入手倒逼开发和测试环节,要求通过测试的发布候选版本以容器镜像的形式交付,以保证上线效率和可靠性;同时提供基于技术栈管理PaaS的构建和镜像版本管理基础设施,方便开发和测试团队构建符合要求的交付物。等开发和测试团队养成基于云和容器环境的交付方式,就可以逐步实施云测试平台和基于技术栈的开发底座。

    小结

    技术栈管理平台的目标是为现代IT组织创造云环境下的精益软件生产流水线。但对于很多组织而言,这条流水线并非一步到位,而是一个分阶段建设的过程。在这条流水线上,开发-测试-运维三个核心工位都可以成为实施技术栈管理的切入点。从组织当前最显著的痛点出发,选择一个工位开始实施云化的技术栈管理平台,并依循瓶颈理论拉动其他工位的逐步改进,这对于众多不以IT能力见长的组织而言,是一条可行的云化、数字化道路。


  2. 沃尔玛的数字化平台分析

    尽管2009年就已上线了电商平台Marketplace,但直到2011年,沃尔玛在数字化领域也不能算成功者。当时他们的电商网站只有相当基本的功能,用户体验不算方便,搜索不太好用,也不能与店面或供应链无缝对接。之前的几年,沃尔玛的电商收入跟其他零售商(例如西尔斯、梅西)一样缓慢线性增长。正因为如此,当沃尔玛的电商收入在2011年至2014年的三年间增长150%、从年销量49亿美元增长到122亿美元、超过史泰博(Staples)成为亚马逊和苹果之后美国第三大在线零售商时,这一变化才更令人好奇。

    数字化之旅

    沃尔玛的全球电商部门主要有三方面的责任与行动:

    1. 运营沃尔玛全球10个网站,在线提供超过700万种SKU,无缝连接门店与仓库,给顾客提供多种购物选择。
    2. 通过@WalmartLabs这个创新孵化器,不断更新网站和移动应用,利用顾客数据和社交网络洞察预测顾客行为,给顾客提供更好的在线和在店购物体验。
    3. 对内打造沃尔玛的电商能力,在全美国建设线上业务服务中心,建设新的电商操作系统Pangaea。

    为了达到这些目标,沃尔玛在几年中收购了多家IT企业,光是作为创新引擎的@WalmartLabs就收购了14支科技团队,为整个企业的数字化转型提供了能力上和文化上的支撑。2013年,沃尔玛收购了提供云计算解决方案的OneOps公司。该公司拥有成熟的PaaS和私有云IaaS能力,支持多种公有和私有云平台,包括Azure、Rackspace、AWS、OpenStack等,与沃尔玛的云化、服务化趋势相符。到2016年,沃尔玛全公司有超过3000名工程师基于OneOps平台开发和管理IT系统。

    在电商销量猛增的过程中,沃尔玛的IT系统遭遇了性能瓶颈,这也是他们开始将IT系统服务化的重要出发点。他们希望“系统拥有足够的弹性去处理峰值,同时不产生负面的用户体验”。事实证明,微服务架构带来的效果是明显的:

    • 销售提升:转化率在一夜之间提升了20%,移动端的订单立即增长了98%;
    • 可靠性提升:黑色星期五或节礼日等大型购物节期间,再没有出现过宕机;
    • 运维成本降低:将昂贵的硬件换成了便宜的X86服务器,节省了40%的计算资源,总成本下降了20-50%。

    沃尔玛还把自己的数字化能力提供给自己的供应商。2014年,他们上线了自己的广告平台Walmart Exchange(WMX),用自己门店和线上电商的数据帮助供应商更有效地投放广告(包括沃尔玛网站、第三方网站和邮件广告)。

    数字平台战略视角分析

    数字平台战略的角度分析,沃尔玛在构建自己的数字平台能力支柱方面已经取得了令人瞩目的成绩,这也是其电商销量能大幅提升的重要原因。

    交付基础设施

    • 通过将业务系统改造为大量、小规模、无状态的服务,使系统可以部署到廉价服务器的集群上。同时弹性基础设施也允许随需增减计算节点。
    • 没有应用服务器。所有服务以standalone的形式通过docker部署。
    • 全面的监控机制(使用ConductR),当服务失败时能自动响应,并提供排错所需的信息。在集群层面汇集日志,避免需要分别查看每个节点的日志。
    • Akka可以把一个交易建模为一个有穷状态机,可以在中途持久化状态,可以取回状态,提供了一种错误恢复的机制。
    • Akka的监控(supervisor)机制类似于Erlang:“let-it-crash”,不需要假设虚拟机或计算节点可靠。

    API和架构治理

    • 用Play实现API Gateway,以RESTful API的形式为其背后的系统提供统一的入口。
    • 原来的大块系统按照业务领域划分为小块,团队也随之划分,例如搜索团队、商品团队等等。每个bounded context有它自己的词汇表、拥有自己的数据。
    • 服务切分不仅仅是IT系统的事,而是组织、代码、数据库三个层面的重构。一开始不先直接做“硬”的切分,而是先从逻辑上做划分(例如数据库的schema命名规则、代码的包),然后检查是否有循环依赖;等依赖关系逐渐理清了,再分解成独立的服务、独立的数据库、甚至NoSQL数据库。
    • 解决性能问题的主要方式是通过异步操作(使用Akka):把数据库写操作异步化,从而减少对JVM线程的占用,并且使能并行处理,极大地提升系统的性能和可扩展性。

    数据自服务

    • 因为数据量太大,必须改变ETL、数据预处理的思路,对数据做真正意义上的实时处理(使用Akka Streams)。
    • 用Spark对数据进行单件流处理,数据处理的延迟由6小时(ETL过程)缩短到10秒。

    数据方面的架构如图:

    创新实验基础设施

    • 组织层面上,@WalmartLabs是一个创新的孵化器机制。
    • 技术层面上,OneOps提供了路由技术和监控能力,使在线的快速实验成为可能。
    • WMX能统一收集和利用各种渠道(门店和电商)的用户数据。

    客户触点技术

    • @WalmartLabs对整个组织输出全渠道、移动、响应式设计等能力。
    • 沃尔玛的电商平台支持多种客户触点(电脑、移动)。Walmart.com在美国的流量超过一半来自移动设备,Walmart Pay应用部署到4600多家门店。
    • 使用大数据(购买行为、搜索历史等)个性化顾客的交互体验。个性化搜索引擎Polaris提升了20%在线销售转化率。
    • WMX支持单一顾客视图,形成对顾客的全面理解。

    参考材料


  3. 技术栈管理:云时代的研发环境

    前文介绍了云计算大背景对研发环境的影响。我们已经指出,现代IT组织应该把研发技术栈以PaaS的形式提供给开发人员,其中的要点是:

    • 将标准的研发环境封装为虚拟化、云化的技术栈,由技术专家管理维护;
    • 核心业务价值与技术支撑解耦,工程师专注于业务系统的开发;
    • 自动化研发流程,降低研发管理成本。

    如何实现这样一个研发技术栈管理的平台?我们的观点是,这样一个平台应该集中管理组织中的技术栈,允许基于一个技术栈创建开发测试PaaS和生产PaaS两个PaaS服务,从而支撑开发、测试、生产三种运行时环境

    一个平台

    在一个典型的敏捷软件开发场景(例如更具体的“用Java开发微服务”的场景)中,开发者需要频繁地用到下列工具:

    • 编程框架,提供基础的结构与功能来支撑业务逻辑代码,例如Spring Boot和Jersey。
    • 版本控制工具,例如git。
    • 依赖软件,例如PostgreSQL数据库。
    • 自动测试工具,包括单元测试工具(TestNG)和功能测试工具(Concordion、Selenium)。
    • 自动构建工具,Maven或Gradle。
    • 持续集成工具,Jenkins或GoCD。

    所有这些工具以及它们适当的组合与配置,我们把它称为一个技术栈。我们上面的例子就是“Java微服务开发技术栈”,类似的,一个组织中还可以有“Java Web应用开发技术栈”、“H5前端开发技术栈”、“ReactNative移动应用开发技术栈”等等若干个技术栈。对于一般的IT组织而言,有限的几种技术栈就可以覆盖大部分软件项目的形态。体量大如有数万研发员工的某IT巨头,提出的主要技术栈也只有十余种。

    在传统的软件开发团队中,技术栈的组合与配置是由团队的技术领导者负责的。在云计算的大背景下,将基础设施作为源代码的思想再往前推一步,我们就会很自然地得出技术栈作为源代码的想法:使用Docker和Ansible等技术,将技术栈的结构以源代码的形式描述。在“基础设施作为源代码”的阶段我们已经知道,以源代码形式管理环境会带来很多好处,例如更高的自动化程度、允许版本控制等。把技术栈作为源代码以后,会带来几个重要的收益:

    1. 技术栈可以很容易地复用,因此可以把搭建技术栈的工作收拢到较少数技术领导者手中,研发团队则只需在技术栈基础上开发业务功能,降低了研发团队的技能门槛。
    2. 最佳实践可以被内嵌到技术栈中,并通过持续集成的形式对研发团队形成约束,从而使研发改进举措更容易推行。
    3. 缩短研发实践的实验和创新周期,可以对多个研发团队开展受控对比实验,团队中自发产生的优秀实践可以被快速抽取并固化到技术栈中。

    技术栈管理平台作为组织级的研发管理载体,承载的是组织对研发团队的引领和治理形式。在这个平台上,技术领导者会创建并维护技术栈,项目团队则可以根据自己的需要选择适合的技术栈,跳过大部分迭代0的技术准备工作,直接进入功能开发,并在整个产品生命周期中享受云化开发环境带来的收益。

    两个PaaS

    基于已经定义好的技术栈,当项目团队开始研发工作时,技术栈管理平台可以为他们创建两个PaaS服务:一个是研发过程中使用的开发测试PaaS,另一个是真实上线用的生产PaaS。两个PaaS的协作关系如下:

    • 开发人员从开发测试PaaS中获得一个开发环境,在这个环境中编写代码;
    • 新编写的代码被提交到代码库中,后台的服务自动运行“提交门”测试,测试通过后,把代码构建成可运行应用;
    • 后台服务针对可运行应用自动运行“验证门”测试,测试通过后,这个版本的可运行应用即被标记为可发布应用,并被存入构建产物仓库;
    • 测试人员针对通过了“验证门”测试的可发布应用进行必要的手工验证;
    • 生产环境与开发/测试环境基于同一个技术栈(运行时环境上有具体的差别),开发测试PaaS中构建出的可运行应用可以直接部署到生产环境;
    • 随不同组织的发布流程不同,构建产物仓库中的可发布应用可能直接(自动或手动)发布到生产环境,也可能被同步到生产PaaS的产品仓库,以后再手动发布到生产环境。

    可以注意到,这个流程、尤其是在开发测试PaaS中发生的流程,与Dave Farley在《一键发布》文中介绍的持续集成流水线非常相似。我们相信:持续集成对于现代软件开发是如此重要,以至于它不应该以独立的工具形式存在(因为这样人们就有可能不用或者误用)。持续集成应该被内建在软件开发的工具和过程中,使它不被开发者注意、同时又不能被绕开——正如Spring内建了面向接口编程、IntelliJ IDEA内建了编译和代码格式检查。

    三个运行时环境

    前面介绍的流水线已经暗示,在整个软件交付周期中,存在三个不同的运行时环境。这三个运行时环境都有同样的基础,例如操作系统、依赖软件等。同时它们也有一些重要的差异:

    1. 构建运行时:包含开发工具、构建工具和(可能是部分)测试工具,这是开发人员编写代码的主要环境——需要注意,“编写代码”在敏捷软件开发的上下文中意味着“编写代码并频繁进行提交门测试”,这是为什么这个运行时环境中必须包含(至少部分)测试工具。
    2. 验证运行时:包含全部测试工具及其他质量保障工具,这是对软件质量进行全面验证的主要环境。
    3. 应用运行时:包含运维工具,这是软件真正运行的环境。这个运行时可能被应用于生产环境,也可能仅用在组织内部(例如UAT测试环境、培训环境、demo环境等)。这个运行时中的依赖软件(尤其是数据库)也有可能被替换为环境之外独立运行的软件。

    尽管为了支持不同环节的工作要求而有这些差异的存在,底线是:构建运行时构建出来的可运行应用,可以在验证运行时中接受完整的验证,也可以被部署到应用运行时正常运行。这与持续交付中“制成件流过整个流水线”(而非在各个构建步骤中分别生成制成件)的理念是一致的。

    制成件的形式

    前文中我们已经提到:软件包是一种对云环境不友好的交付形式,理想的研发交付物应该是容器镜像(很可能是一组彼此连接的容器镜像),可以在云上直接运行。Docker等容器技术使我们可以把所有软件(不论背后使用什么编程语言、实现什么功能)都抽象为“IP地址+端口”的服务;再加上例如Docker Swarm或Kubernetes之类集群工具的支持,更可以把服务进一步简化为一个端口。于是,技术栈管理的基础设施可以得到更大程度的复用:不同的技术栈(不管编程平台是Java、NodeJS还是Python)构建出的应用都是一个(或一组)Docker镜像,从而将“产物的形态”与“生产流程的结构”解耦。

    小结

    针对前文提出的云计算大背景下对软件研发提出的挑战,本文提议了一种解决方案:技术栈管理平台。通过实施技术栈管理平台,为研发团队提供开发测试PaaS和生产PaaS两个PaaS服务、构建/验证/应用三个运行时环境,研发组织能够将技术栈的搭建和管理与业务系统的研发解耦,从而降低研发团队技能门槛、快速有效地推广研发最佳实践、使研发过程中的技术与流程实验和创新成为可能。


  4. 云时代的研发环境长什么样?

    云计算正在毫无疑问地成为企业IT的主流。据麦肯锡调查,六成以上的企业计划在两年内将某种形式的云作为主要IT平台。在国内银行业,中国银行业信息科技“十三五”发展规划监管指导意见中明确提出:到2020年,国内银行业面向互联网场景的重要信息系统应全部迁移至云计算架构平台,其他系统迁移比例不低于60%。其他行业也有同样的趋势。信息系统云化的大背景给软件系统的研发流程带来了什么挑战,作为软件研发组织的领导者应该如何应对这些挑战?这是本文试图回答的问题。

    首先,有必要回顾云计算给企业IT带来的收益。IBM认为云计算有三大优势:

    1. 更灵活。用户可以根据需要,“弹性地”获得IT服务。
    2. 更高效。减少IT团队管理和维护底层基础设施的工作量,IT服务可以更快推向市场。
    3. 战略价值。通过灵活组合现有IT资产与新兴数字渠道,支撑企业业务创新。

    云计算与虚拟化的区别

    有很多企业已经采用了虚拟化技术:将企业的计算资源(服务器、存储等)集中管理,以虚拟机的形式分配给使用者。虚拟化与云计算的区别在于:虚拟化是指“用软件管理硬件资源”,而云计算是指以虚拟化方式管理硬件资源之后能够对外提供的服务。

    除去这个概念上的差异,我们注意到一些企业在谈论“虚拟化”的时候,背后隐含着一个自动化程度不高的、需要人工参与的虚拟机申请和开通的流程。在这样的流程下,获得一台虚拟主机需要的时间通常以天计。因此,虚拟机的使用者倾向于预先申请虚拟主机并长期占用。在这种情况下,“虚拟化”往往意味着缺乏弹性(elasticity)的计算资源分配——尽管虚拟化技术本身并不妨碍弹性。

    可以看出,为了兑现云计算的三大优势,企业IT系统必须云化:软件的形态由从前需要在本地安装的软件包,转变为透过网络在线使用的服务,让使用者随时能够获得;原来体型巨大的单体(monolithic)应用,需要转变为细粒度的服务,从而支持灵活的组合与复用。

    原来习惯了开发本地安装的软件包和/或巨大的单体应用的研发团队,现在要转为开发云化的软件服务,这个转变并非总是无痛的。首先,研发交付物的形态应该是对云环境友好的。从前研发交付物通常是以软件包的形式提供给用户或是运维团队,例如平台特定的JAR、WAR、EGG等软件包,或是RPM、DEB、MSI等操作系统特定的软件包。软件包是一种对云环境不友好的交付形式,因为它没有包含软件运行的环境。例如一个软件需要用到PostgreSQL数据库和monit作为监控工具,平台特定的软件包无法确保这些软件依赖的存在;某些操作系统特定的软件包可以描述软件依赖,但也无法确保依赖软件被正确地配置。过去一段时间里,自动化的配置工具(例如Chef/Puppet/Ansible)被用于解决运行时环境的问题。而在今天的技术背景下,理想的研发交付物应该是容器镜像(很可能是一组彼此连接的容器镜像),可以在云上直接运行。

    对研发交付物的要求随即会影响到研发过程。为了在研发流程的出口得到服务化友好的交付物,最好是在整个开发过程中一直使用与生产环境近似的环境。例如开发人员应该使用全套环境随时验证,自动化测试和手工测试都基于全套环境开展。在这种情况下,环境的设置、管理、更新不可能由每个开发人员和测试人员自己进行,所以环境的管理更新必定是集中进行的,环境的设置必定是自动化的。而且,如果环境固定分配、长期使用,对计算资源的占用可能很大,所以环境应该是云化的、弹性的、按需获得的。

    云计算的大背景还会影响研发实践。为了降低搭建研发环境的技术难度,云化的研发环境应该内建研发工具链(包含开发工具、质量保障工具、持续集成/持续交付工具、DevOps工具、项目管理工具等)。为了规范团队研发质量水平,良好的研发实践(例如代码静态检查、自动化测试等)和流程要求应该固化在工具的日常操作中。理想的情况下,研发团队应该只聚焦关注业务功能开发。开发工具的组合、生产环境的配置、持续集成和持续交付流水线的搭建等工作都应该被标准化和自动化。

    综上所述,在云计算的大背景下,IT组织需要将更多的软件应用部署在云上。云化的IT系统对软件研发的交付物、研发过程、研发实践都提出了新的要求。我们认为:现代IT组织应该从研发环节开始,以原生支持云计算的方式提供、管理和维护研发环境,从而在研发过程中利用云环境的弹性,确保研发交付物对云环境友好,并把优秀的研发实践和流程要求内嵌到研发环境之中。IT组织可以通过以下方式管理其研发环境:

    • 将标准的研发环境封装为虚拟化、云化的技术栈,由技术专家管理维护;
    • 核心业务价值与技术支撑解耦,工程师专注于业务系统的开发;
    • 自动化研发流程,降低研发管理成本。

    在下一篇文章里,我将介绍如何具体实现技术栈的云化管理,把研发技术栈以PaaS的形式提供给开发人员。


  5. Cybersyn的系统架构

    前文《半个世纪前的大数据时代》讲到,1970年代初,英国的控制论学者斯塔福·比尔应阿连德总统之邀,远赴智利去开发一套用于管理国有经济的大数据IT系统。本文将介绍这套远远超前于时代的系统是如何在当时的技术条件下架构和建设起来的。

    生产大战中的控制论

    在阿连德执政的第⼀年,智利政府开始将国内最重要的⼀些⼯业收归国有。到1971年底,政府已经把所有主要矿业公司和68家最重要的⼯⼚由私有转为公有。智利正在打⼀场“⽣产⼤战”,提⾼⼯业⽣产⽔平被视为智利社会主义成功的关键。管理已经成为国有化进程的⼀个核⼼问题,政府计划把⼯业管理作为第⼆年的⼯作重⼼。国有经济的⾼速发展创造了⼀个笨重的、智利政府从未⻅过的怪兽,这是问题的根本所在。

    在这样的大背景下,斯塔福·⽐尔于1971年11⽉4⽇星期⼆抵达智利,邀请他的是智利国家开发公司(CORFO)的技术主管费尔南多·弗洛雷斯。经过弗洛雷斯的介绍,比尔对智利面临的挑战有了一个大体的理解。控制论思考帮他识别出如何改进智利政府管理经济的⽅式。例如,⽐尔发现政府可以建⽴新的通信渠道,促进数据交换,提升政府决策速度。同时他也认识到⾃⼰⾯临的约束。成⽴新的政府部⻔或是对现有政府机关进⾏根本性重组可能可以极⼤提升管理能⼒,但当前的关键是要快速⻅效,政府没有时间来成⽴新的调控部⻔,也⽆法⼤规模修正和重建现有的机构。

    在⽐尔和弗洛雷斯的构想中,控制论科学扮演着双重⾓⾊。控制论的管理视⾓,尤其是可⽣存系统模型,能够指导CORFO所需的组织变⾰、避免实施⻓远来看低效甚⾄有害的权宜之计。同时,控制论中关于反馈与掌控的思想能够指导开发⼀套新的科技系统来改善国有经济的管理,从⻋间直到CORFO办公室。发源于⽐尔的“⾃由机器”思想,这样⼀个系统将会搭建起实时信息交换的网络,其中会⽤到⼤型主机技术。管理者和政府官员将能够基于实时数据来做决策,并能够快速调整⾏动⽽不被政府官僚体系束缚。管理控制论还能改善政府从国营企业获取信息的⽅式。当这些数据流得到改善,弗洛雷斯和⽐尔相信政府能加强对智利⼯业的管控,并最终赢得⽣产⼤战。

    基于这一构想,比尔提议建设Cyberstride项目,后来这个项目改名为“Cybersyn”。Cybersyn系统结合了比尔早期著作中的思想,包括他的文章《自由机器》中提到过的控制室。这个系统将依赖于每天从国有产业采集来的数据,用大型主机对未来经济行为进行统计学预测。随着智利的计算机操作员输入更多来自企业的最新数据,系统每天都会对预测做出更新。

    只有一台计算机的网络

    Cybersyn的骨干是一个支持实时数据交换的通信网络。将国家开发公司(CORFO)与工厂车间连接起来,就能建立“向上滚动”式管理所需的条件,使政府能够快速处理诸如原材料短缺等紧急状况,并及时调整政策。最新的生产数据还让经验丰富的管理者(通常位于行业委员会或更高的级别)能帮助缺乏经验的干预者识别他们工厂里的问题,并在必要时调整生产行为以达到国家的目标。按照比尔的构想,这种信息交换会以很快的速度持续发生,并且总是以指导行动为目标。通信、适应和行动,这些都是管理控制论的核心要素,它们就是比尔在组织与生物有机体之间发现的共性:两者都需要快速适应,才能在变动的环境中生存。弗洛雷斯与比尔一样重视时间,两人都认为:数据如果不能指导行动,那就是被浪费了。

    除了通信网络和用于生成经济预测的软件,Cybersyn项目还需要一个计算机程序来模拟智利经济。另外,CORFO成员会把生产数据汇总,并以直观的形式显示在指挥室里,以便政府的决策者理解。这些数据显示会帮助决策者看清国家经济形势,并基于智利工业的现状制定政策。

    按照比尔的提议,Cybersyn项目的设计考虑到了智利科技的局限。国家计算机公司(ECOM)的主管雷蒙多·贝卡只给比尔提供了一台大型主机的处理时间,这是一台IBM 360/50,ECOM当时性能最强的主机。鉴于计算机公司只有4台主机,全都非常繁忙,贝卡只能提供一台机器是完全能理解的。但这就意味着比尔的团队必须用一台计算机来建设一个计算机网络。

    对这个看似不可能的要求,比尔给出了设计方案:他为Cybersyn项目设计了一个通信网络,整个网络都连接到这一台大型主机。为了实现这个非传统的网络架构,比尔和团队需要找到一种便宜的方式来实时、长距离传输数字数据和文本。他们找到的办法是电传机(电传打字机),这些机器已经通过现有的电话线、卫星或微波通道联网。在1970年代初,电传机已经在全世界广泛使用,不是什么高新科技。每台电传机都有一个身份识别号,就跟电话号码类似,用户拨打这个号码,就可以在两台机器间建立连接。然后用户可以用电传机的键盘输入信息;信息会被翻译成纸带上的打孔,再通过网络把打孔纸带的信息传输出去;另一端的电传机则读取纸带,翻译出原来的信息,从而完成信息的传播。用户往往会预先准备好纸带,以便尽量减少连接网络的成本,不过电传机也允许两端的用户通过打字来回交谈。一旦收到信息,接收方的电传机就会在一串嘈杂的咔嗒声中打出一行行文字,听起来不像是传真机,倒更像是电子打字机。在1970年代初的智利,电话尚属稀缺资源,电话网络也不够可靠。电传机提供了另一种国内乃至国际通信的方式。所以,比尔提议在电传机网络的基础上建设Cybersyn项目,于是整个通信网络就只需要一台IBM大型主机。

    比尔提议的系统工作方式如下:干预者用电传机从各自的企业将生产数据发送给国家计算机公司的电传机,计算机专家们再把数据以打孔卡片的形式输入到主机系统中;计算机会运行统计软件,将新的数据与过往采集的数据对比,寻找显著的差异;如果发现重大差异,系统会向计算机操作员告警,后者则通过电传网络把数据发送给CORFO和相关的干预者,随后CORFO会联络这些干预者,以便更好地了解现状并帮助解决问题。

    统计软件

    在部署电传网络的同时,比尔向安达信请求帮助,希望他们参与到后台软件的开发中。安达信的评估结果是,他们可以在1972年3月中旬之前编写并安装一个“临时套件”。这个临时的软件只能接受限定范围内的输入值,但至少能在原定的期限之前给智利人一套软件先用起来。为了在3月的交付期限前完成这个临时套件,他们需要砍掉很多边角。同时安达信会负责设计功能完备、长期使用的软件套件,但长期套件的开发和实施由智利团队负责。在此过程中,三名安达信咨询师会出差到圣地亚哥提供支持:一人负责安装临时套件,一人帮助智利程序员编写长期套件,另一名高级合伙人会为团队提供指导、并在项目结束时签字代表咨询公司正式签字。

    Cybersyn的软件系统是控制论管理领域的新突破。它是比尔的可生存系统模型的第一个软件实现。这个程序还实现了一个新的、从未实验过的贝叶斯统计预测方法,这个名为哈里森-史蒂文斯方法的统计预测方法1971年12月才首次发表在《运筹学季刊》上。安达信的咨询师阿兰·邓斯缪尔在为项目做文献综述时偶然发现了这个新方法。他说服比尔这个方法可以识别生产数据中的显著变量,并根据初始数据点预测未来的趋势:是线性趋势、指数趋势、还是步进函数、或者只是暂时的异常数据。用这个方法,软件就不止能记录和汇总历史数据,还能对未来作出预测。而且一旦计算机操作员输入新的生产数据,软件就能自动调整其预测。

    哈里森-史蒂文斯方法的提出者之一杰夫·哈里森是华威大学统计学系的创始人和首任系主任。在大学给他的讣告中说“他远远超前于他的时代”,这话绝非溢美之词。如果你看Wikipedia的“统计学历史”词条,其中有这样一段话:“1965年……林德利把贝叶斯方法介绍给更广泛的听众;1980年代,贝叶斯方法的应用大幅增加。”似乎贝叶斯方法在1970年代没有取得重要的进展。然而哈里森于1971年发表的文章《一种用于短期预测的贝叶斯方法》可能是首次将贝叶斯函数用于统计预测,Cybersyn则可能是第一个实现贝叶斯预测方法的计算机程序。然而在他的年代,因为计算能力的局限,贝叶斯方法不被学界主流认可;等到1980年代计算能力提升、尤其是马尔科夫链蒙特卡洛方法的发现解决了大量计算问题使得贝叶斯方法受到重视,哈里森就直接被历史跳过了。考虑到现在贝叶斯预测方法在机器学习领域的热门程度,哈里森近乎默默无闻的一生不禁令人唏嘘。

    【杰夫·哈里森可能仅有的一次出现在学术领域之外的出版物上是在一本叫做《难以置信的巧合》的伪科学著作上。这本书收录了很多奇妙的偶然事件,其中一个故事讲到哈里森在给某一届学生上第一堂概率课的时候抛了一个硬币,本打算借此讲解概率的基本概念例如硬币正反面落地的概率各为1/2,没想到硬币落下以后不偏不倚地立在了桌上。】

    经济模拟器

    统计软件运行的结果会进入一个经济模拟器,用于模拟智利经济状况并预测未来走势。比尔希望经济模拟器成为“政府的实验室”。一旦完成,这个模拟器能帮助政府决策者跳出日常事务进行全局决策,并实验多种不同的长期经济政策。所以这个模拟器需要反映不断变化的经济行为,尤其考虑到智利经济正处于转型期,这一点就愈发困难:它不仅要接受不断变化的输入值,还要不断调整变量之间的关系,并引入新的考虑因素。在真实世界中,这些变化不断在发生,因此模拟器的模型也需要能处理动态的变化。

    比尔决定采用一种不太常见的建模方式。当时大多数经济模拟都采用“输入-输出”方法,用庞大的数据集来计算不同生产过程之间的相关性。这种分析方法可能需要几年时间来采集数据,然后用固定的方程式计算系统行为。比尔批评这种方法“死板得无可救药”。如果“目标是重组经济”,比尔写道,那么这种刻板的方法就是“糟糕的工具”。为了寻找不同的方法,比尔把眼光投向了著名的MIT工程师杰·福瑞斯特的研究。

    在计算史上,福瑞斯特最广为人知的成就是发明了磁芯存储器,以及领导了“贤者”陆基防空系统的计算机设计团队。从1950年代后期开始,福瑞斯特的研究重心已经转移到工业管理领域。他对建模随时间变化的复杂系统尤为感兴趣,并把这个这个领域称作“系统动力学”。福瑞斯特鼓励政策制定者借助模型来识别出为数不多的一些关键参数,通过调节这些参数就能获得期望的结果。随后政策制定者就可以集中精力在这些领域。为了编程实现他的动态系统模型,福瑞斯特发明了DYNAMO编程语言,比尔发现这种语言很适合用来编写新的经济模拟器。

    比尔找到了罗恩·安德顿,一位系统工程师、运筹学家、以及英国首屈一指的DYNAMO专家,请他投入到经济模拟项目中。到1972年3月,安德顿已经实现了经济模拟器的最初版本,这个软件被命名为CHECO(“智利经济模拟器”的英文缩写)。最终,安德顿写道,这个模拟器将使CORFO“对包含10到100个变量的系统逐步获得动态的理解,作为对比,缺乏系统指导的大脑只能理解5到10个变量。”同时,邓斯缪尔带着完成的临时软件套件从伦敦来到了圣地亚哥。3月中旬,第一批结果数据从工厂车间传到了CORFO。Cybersyn系统的流程走通了。


  6. 印度儿童诗雅拉尔之死

    来自里格瓦尔村、6岁大的诗雅拉尔·雅达夫已经发烧和头疼三天了。当他的皮肤开始浮现病态的黄色,他的父母找了一个巫医来进行“jhar-phook”(把魔鬼的灵魂赶出孩童的身体)。然后他们又带着孩子去看了一个村里的无证医生,他给孩子打了一针,退烧效果维持了一天。第二天,诗雅拉尔的父亲阿南德从农田里回家,发现孩子发着高烧、呼吸困难。恐慌的父亲想带孩子去拉坦浦尔镇的基层卫生中心去,但拉坦浦尔镇远在25公里外,当天最后一班去镇上的大巴早已发车。村长热心地给他们找了摩托车。基层卫生中心的值班医生做了简单的检查,叫阿南德赶快带孩子去比拉斯浦尔县上的医院——又是30公里路程。阿南德身上只有200卢比(约合20元人民币),于是他恳请医生照顾孩子一夜,他自己回去筹钱,但医生拒绝了他。阿南德只好带着诗雅拉尔赶最后一趟大巴回到村里,此时孩子的意识已经模糊。孤注一掷的阿南德用家里的一亩地和地里的所有庄稼做抵押,借到了8000卢比(约合800元人民币)。一家人紧握着钞票,与轻声喘息的男孩一起等待太阳升起。凌晨4点,诗雅拉尔说想喝水。当母亲端来水,孩子已经离世了。

    在包括中国在内的很多国家,疟疾几乎已经绝迹。但在印度中部的恰蒂斯加尔邦,它仍在投下死亡的阴影。2010年10月到12月之间,恰蒂斯加尔邦爆发了恶性疟疾流行。据邦政府的统计,两个月中全邦共有32人因疟疾死亡。然而,仅比拉斯浦尔县的加尼亚黎村一地就有7例死亡病例。“人民健康扶助团”(Jan Swasthya Sahyog,简称“JSS”)在这个村里设有医院。在附近的科塔乡,JSS的社区医疗团队进行了250例口述验尸,其中200人被证实死于疟疾。如果一个县一个乡就有这么多人死亡,整个邦的数字恐怕只有天知道。

    根据政府的官方数字,印度全国每年有200万人患上疟疾,约700人因此丧生。然而据世界卫生组织的估计,印度每年有1500万病例,其中2万人死亡。由加拿大一家机构发起的“百万死亡研究”的估计是每年有15万到22.5万人死于疟疾——印度传染病控制部门则对这个研究项目表达了强烈的抗议。大多数疟疾死亡发生在家里,因此不会被计入正式的统计数据。正式的数据来源仅限于公立卫生机构,并且要求疟原虫阳性涂片作为证据,然而大部分病人根本没有进行这项化验。

    在缺乏正确信息的情况下,公共卫生政策必然是错误和低效的。而且越是偏远贫困的人群,遭受的损害就越是严重。政府的官方数据显示,50%的恶性疟疾病例和90%的死亡病例发生在被称为“阿迪瓦西”的部落民当中,而他们仅占全国人口的8%。缺乏公共卫生基础设施使得偏远贫困地区大部分病痛与死亡无人知晓,而统计数据的缺失又使得政府疏于投资基础设施建设。这成了一个难解的死结。

    * * *

    黄昏的阳光穿过柚木和娑罗的树叶,在车窗前洒下斑驳的光影。越野车二档通过安查纳克玛老虎保护区泥泞的道路。JSS的医院位于恰蒂斯加尔邦西北部的加尼亚黎村,离比拉斯浦尔县城23公里。进村的道路需要穿过玛尼亚黎河,当季风带来大量雨水,这条道路就会被河流阻断。在降雨稀少的旱季,越野车能够平稳地驶过河水,在日落前进入村庄。

    村边的几栋水泥房屋本来是为一个灌溉项目而建的。这个政府投资的灌溉项目无疾而终,于是JSS把这几栋房屋改造成了转诊医院,包括门诊部、70张床位的住院病房、一个功能齐全的化验室和两个手术室。现在这家医院每天接诊400名病人,并在三个偏远地区设立分中心,向居住在森林边缘的人群提供基本医疗服务。

    现代科技与这里的环境显得有些格格不入。基础设施的薄弱当然是原因之一:这里没有3G信号,2G信号时断时续,停电也是家常便饭;另一方面,村里人识字的不多,医院的医生、护士和工作人员也几乎从未接触过智能手机。病人拿到的药品用塑料袋装好,药盒上贴着一张纸,上面画着代表服药时间的太阳/月亮图标和代表剂量的药片图标。一个房间里纸质病历堆积如山,接诊时护士就要去这个房间里翻找病人的病历交给医生。这是JSS医院的日常。

    Bahmni(读作“巴姆尼”)的目标是让JSS医院、以及其它成千上万类似的医院实现信息化。ThoughtWorks印度公司从2013年开始的这个产品,其核心是一个开源的电子病历(Electronic Medical Record)系统OpenMRS。这个软件内建了一套标准的医疗信息记录数据体系,在北美和南美的一些医院里的实施收到了很好的反馈,并且有一个活跃的社区(包括医学专家、公共卫生专家和IT专家)在不断完善它。但OpenMRS缺省的用户体验不是为JSS这样的医院设计的:它假设了IT水平较高的用户,界面是针对电脑屏幕设计,而且使用过程中需要一直连接网络。于是ThoughtWorks的团队与JSS的医生们协作,在OpenMRS的基础上开发了适合低资源环境的前端用户体验:在平板电脑上使用,界面操作简洁易懂,断网情况下照常工作,等连上网再同步数据。这就是Bahmni的雏形。

    随后,为了让医院信息化端到端拉通,Bahmni产品又整合了几个其它的开源软件。Odoo(曾经叫OpenERP)提供了药房库存管理、账目管理、财务会计的功能;dcm4chee实现了放射影像的信息化集成;OpenELIS打通了化验流程。今天的Bahmni已经是一个完整的一站式医院信息化系统,覆盖挂号、门诊、化验、影像、住院、诊断、手术、处方、取药、预后跟踪的整个医疗服务流程。有了及时准确的信息在手边,医生的诊疗能够更加精准、更加高效。

    一家区级转诊医院的信息化能够积累一个区、几个乡、几十个村的电子病历。如果一个邦的几十个区都有这样一家医院,把它们的电子病历信息汇总起来,政府卫生部门就能得到完整真实的公共卫生数据。如果全国的几十个邦能做到医疗信息联网,国家的公共卫生政策和基础设施投资就能有的放矢。在雅鲁藏布江下游和喜马拉雅山南麓,孟加拉和尼泊尔的政府都有着这样的愿景。他们与ThoughtWorks的咨询师一起,规划为期数年的IT项目,目标是建设全国联网的医疗信息交换(Health Information Exchange,简称“HIE”)体系。

    HIE是一个世界级的难题。医疗信息的联网需要打破卫生、财政、人力资源、社会保障等多个领域的壁垒,需要解决可用性、可靠性、可维护性、信息安全等技术挑战。美国政府每年投入到HIE的投资平均到每个临床医生身上达1.7万美元,至今也未能实现全国联网的目标。孟加拉和尼泊尔这两个位列世界银行中低收入列表的国家希望达成这个梦想,Bahmni是他们选择的武器之一。这个开源、易于配置、易于管理的软件系统,使两国国内的软件团队也能掌握实施和维护能力,从而极大地降低了实施成本,而且——更重要的是——最大程度地避免了对外国高科技企业的依赖。Bahmni采用国际通行的医疗信息交换开放协议HL7 FHIR(读作“fire”),所有主流电子病历系统都能与之集成交换信息。ThoughtWorks的团队与世界各国的HIE实践者紧密协作,将Bahmni融入了OpenHIE信息架构,使国家的HIE建设成为了一个开放的产业生态,政府、企业、研究机构、非营利组织、国际发展机构都能参与和贡献。

    * * *

    诗雅拉尔死后3天,他的小表弟,1岁大的提拉克兰也出现了同样的症状。提拉克兰的父母已经提前找人借了钱,他们立即租了一辆轿车把孩子从卡吉路的社区卫生中心送去比拉斯浦尔。但社区卫生中心没有空闲的氧气瓶给这个呼吸困难的婴儿。提拉克兰没有挺过去比拉斯浦尔的这段路程,给他的父母留下了1万卢比(约合1000元人民币)债务,和无尽的悲伤。

    JSS医院的医生们和Bahmni的开发者们希望,在不远的将来,政府卫生部门能从及时准确的公共卫生数据中窥见恶性疟疾爆发的前兆,及早把青蒿素等药品和预防、诊断、治疗疟疾的知识送到每个村庄,让诗雅拉尔和提拉克兰这样的孩子不再因为疟疾而夭折。

    我们在为这个梦想奋斗。


  7. 2016年,读过的那些好故事

    2016年是忙碌的一年。为了MBA毕业论文,大半年里所有的业余时间都被耗尽。好在总算功不唐捐,战胜了各种拖延症,写出一篇还算对得起自己的论文,同一个主题在QCon做了一次演讲。而且托东野大神的福,竟然还读了64本书,其中颇有不少打得出5星的好故事。

    中国的故事

    • 大唐李白(少年游、凤凰台、将进酒) - 既有精彩的故事,又有旖丽的文字,典故又多,读起来觉得身轻如燕。我唐啊,真是繁华瑰丽,美不胜收!
    • 叫魂 - 重要的不在于那个事本身是什么,而在于当时的人是怎么看那个事,并从这个“怎么看”折射出当时的制度环境。方法真好!
    • 天国之秋 - “这个故事说明了我们认为跨越文化与距离的联结有时其实我们虚构的东西。当我们庆幸终于看透将我们与另一个文明隔开的那扇阴暗的窗户,心喜于在另一边的阴影之间发现隐藏其中的类似形体时,有时我们不晓得自己只是在凝视我们自己的倒影。”
    • 乱世潜流 - 罗大师一贯的风格,从时人眼光看当时事。讲辛亥到北洋一段时人的思想变迁,与《大波》放一起看,正是相映成趣。

    外国的故事

    • 巨人的陨落 - 好像以前没有这种全球视野的演义小说吧?细节很靠谱。要是笔锋再好一点就能写成一战背景的冰与火之歌了。
    • 古拉格群岛 - 本来只想给四星,但是当看到作者说“并不是什么人都宽恕,我只宽恕倒下的人”,就决定给他五星了。真实的信息有最大的力量。
    • 周期表 - 漂亮的小故事,没有特别着意写奥斯维辛,可是那种深远的影响随处可见。
    • 新自由主义简史 - 知道它的历史,才知道所谓“市场主导”、“自由至上”等观念是多么新鲜、多么人为。
    • 生命如歌 - 震撼人心。强烈推荐所有对国际发展和全球医疗感兴趣的人看。
    • 底特律 - 我们太习惯于经济的高速增长,以至于我们忘记了盛衰有时。一座曾经拥有上千万人口的城市如何衰落成不到70万人口,这是当代人几乎无法想象的幻景。
    • 资本的终结 - 简洁的理论,清晰的数据,有力地阐释今天世界的种种现状。要多么努力地自我欺骗才能死守住自由主义经济学观点而不信这么明显的道理?正如齐泽克所说,freedom hurts。

    虚构的故事

    • 没有女人的男人们 - 虽说都是小故事,可是写得很真挚,而且致敬变形记那篇相当妙。
    • 银河帝国(8~12卷) - 什么机器人三定律,其实只是写好玩的本格推理可以用到的一组预设条件而已。幻想的前提条件用好了以后,写出来的本格推理小说果然严密又精彩,连悬疑感都写出来了。但是仍然不怎么喜欢“人类整体”这个概念…而且心理史学必须建立在心灵控制的基础上,这样合适吗?
    • 解忧杂货店 - 很感人的小故事,而且结构很周密
    • 恶意 - 写作手法真漂亮,不但推理层层推进,叙述的视角也不断切换,佳作。
    • 歪笑小说 - 不剧透,不过最后一页的大反转可真是令人感动啊,满满的都是温情啊。

    科技的故事

    • 凤凰项目 - 很棒的故事。可惜的是,最后那段介绍的持续交付,需要相当高的技术能力。所以,雇不起优秀的技术人才、玩不转docker的企业,就只能眼睁睁看着比自己强且敏捷的对手屠杀自己,毫无反抗可能性。
    • 精益企业 - 套路非常清晰,材料非常齐全,Jez桑的集大成之作,IT驱动组织转型的必读
    • Cybernetic Revolutionaries - 尝试用政治与技术的合力建设一个更公正的社会,这样的努力会打开很多新的可能性:技术的、知识的、政治的、等等。Cybersyn是重要的技术和历史遗产,即使它的宏大愿景从未实现。
    • 控制论 - “预测一个消息的未来,就是用某种算符去运算这个消息的过去……最优预测问题的解决仅仅取决于要加以预测的时间序列的统计性质”——写于1948年,跪了。


  8. 科技想要的 vs. 人民想要的

    2016年12月14日晚,我就《半个世纪前的大数据时代》一文与读者进行了一场主题交流。以下是对交流现场的记录。

    问:你如何看待控制论和信息论的关系,以及控制论对互联网公司决策的影响?

    答:值得注意的,控制论在最近十来年已经不怎么被提及了。不是因为它过时。恰恰相反,是因为它渗入了各个学科、尤其是科技和商业领域的各个方面。控制论与“前控制论”管理思路的关键区别就一个词:反馈。“瀑布式”的管理理念认为,我只要提前做好设计,一步一步走下去,最后就能达成目标。然而控制论——用人体震颤这一例子——精辟地指出:别说管理什么大项目了,如果只有预先设计没有反馈和调整,你连杯水都拿不起来。

    迟至2000年前后,IT行业对反馈还不是那么重视的,大家看重的仍然是计划和执行。证据是2001年《程序员》杂志仍然在用大篇幅报道CMM。我都做过……当时一个CMM认证国家补贴80万。好多骗钱的。对反馈的重视,随着商业-科技环境的日益不稳定,终于得到了普遍的认同。现在大家谈的是敏捷、精益,包括在传统上最保守的财务领域也开始谈Beyond Budgeting——本质上就是以滚动预算的方式获得较短周期的投资反馈。我2005年在中国软件行业大会上讲敏捷,台下都听得一愣一愣的。不是反对也不是赞同,是完全不知道讲的啥——一个项目怎么可能做20%就上线给用户用呢?现在这种观念、这种对反馈的重视大家都认同了。本质上这些都是控制论的影响。

    大家已经不再提控制论,因为到处都是控制论。

    问:我们的世界会变成像《黑客帝国》那部电影一样吗?为什么?

    答:要回答这个问题,我们首先得问:黑客帝国描绘的是一个什么样的世界?也许你马上就会说:是人类被机器操纵、只能看到幻象的世界。对,也不对。这个问题不能只从“世界”这边看,同时要从“人”这边看。尼奥能看到真实的世界,不仅仅因为真实的世界存在,而且还因为他选择了红色药丸。换句话说,除了尼奥之外的很多人(尽管不是所有人),之所以看不见真实世界的样子,是因为他们选择了不去看。有一种假象在蒙蔽所有人、并且有很多人主动——有意识或者无意识地——地选择了看到这个假象而非真相,这才是黑客帝国描绘的世界。

    从这个意义上来说,我们的世界真的和这个世界很像。比如我随便举个例子好了。你知道年收入10万元在中国是什么收入水平吗?请大家来猜一猜。猜一猜?前3%。

    你能相信你公司刚入职每天背个破电脑包挤地铁吃煎饼的那个毕业生是中国前3%的高收入者吗?你能相信你自己是中国前1%甚至前0.1%的高收入者吗?当你看到街上流落的无家可归者、农村背井离乡的打工者,你是否意识到,你自己是造成他们苦难生活的系统中的一部分、甚至是系统的既得利益者?你不需要回答这个问题。因为这种事情就像尼奥的红药丸蓝药丸一样,当你选择了蓝药丸,你就不会看到某些被称为“真相”的事情。

    我们这些中产阶级城市知识分子,互联网在我们周围造起了一座回音壁,让我们以为整个世界都是跟我们一样的人,因为我们每天听到的都是跟我们一样的(或者更强的)人发出的声音。然而只要稍微动动脑筋你就会意识到这件事情有多可笑。能在互联网上发出声音的,都是受过良好教育、有着良好经济基础的人。中国90%以上的人在互联网是无声的。你去看看知乎就知道了,你应该能感受到这个回音壁有多牢固。

    赵然:全年全国居民人均可支配收入21966元,比上年增长8.9%,扣除价格因素,实际增长7.4%。数据来源:国家统计局2015年的公报

    答:多谢赵然,正想找这个。所以,是的,我的答案非常简单:我们这个世界不需要“变成”,它现在就跟黑客帝国里的世界一样。众多像你一样的人看不见这个世界的真相。真正有意义的问题是,你是否选择看到,以及,当你看到了之后,你会怎么办。

    靓汤:我们的思维是建立在这种壁垒之内,我们怎么选择一种积极的,正能量的活法?

    答:首先要看到!列宁说的,学习学习再学习!

    谢工:我记得熊节好象去非州国家做过项目,是不是有类似的感受经历,因此思考和看书看的很多。

    答:对啊。你看到这些人是怎么生活的,然后你以前相信的系统就崩塌了。你就开始想:一个让人去死的系统,不管它多么有道理,终归是不对的吧。

    余晟:资本主义和市场经济就是这样。你可能觉得岁月静好,现世安稳。结果远在天边跟你八竿子打不着的某个家伙吃得苦耐得烦,凑巧干了跟你一样的活,也可能他有天赋也可能他要求低,然后你忽然就没活可干了,然后一群人冲上来说:呸,懒鬼,谁让你不努力。

    谢工:我们Chat当时和熊节讨论策划一系列的话题,名字叫寻找IT技术史,后来我们找到第一个半个世纪前的大数据时代。

    答:谢工这个背景介绍,正好引出下一个问题。

    问:数据量没有那么大时通过什么方式提高结果的准确度呢?

    答:实际上比尔在设计Cybersyn的时候,有两个原因故意不采集所有巨细靡遗的生产数据。第一,计算资源不足。因为美国的禁运,智利当时只有4台主机,Cybersyn系统只能使用其中的1台。如果采集所有数据,算不过来。IBM 360哟~第二,这是比尔主动的设计。因为如果中央掌握并处理所有数据,那么中央就会对工厂进行微观管理(micro management),那么真正在做事的人就会被跳过、被架空、被剥夺主观能动性。那将是一个机器取代人的系统。Cybersyn从设计的第一天起,在比尔和阿连德的心中,它就是一个为人民服务的系统。

    它是一个赋权的系统,不是一个剥夺的系统。话题扯开一点……我认为冷战的终结对人类是一个巨大的损失。因为人类社会从此失去了一个坐标系,只剩下了唯一的坐标系、唯一的维度(历史的终结)。那么在单一坐标系上,人和人、国家和国家,就只有“发达”与“落后”之分,失去了多样性,失去了多角度思考的可能性。

    回到大数据和预测系统这里。当我们谈到“准确度”(以及,与它类似的,效率)这个概念,我们不应该把它看做仅有的维度。准确度是多个可能的维度中的一个。其它的维度还包括,比如说,激励人,帮助人。Cybersyn的准确度不高,不仅是条件局限的结果,更是主动权衡、选择了其它维度的结果。我们应该看到设计者选择了什么,而不仅仅看他们放弃了什么。当准确度/效率成为唯一的维度,机器取代人的时机也就到来了。因为准确度/效率不是人的度量,是机器的度量。

    问:有关公平创新,包括国家推动全民创业,青少年创业热潮,用本篇文章观点,能否解释一下目的和意义?

    答:从一个非常抽象的意义上,可以看到这个问题与本文有一个牵强的关联:科技发展与社会、尤其是与跟不上科技发展的普通劳动者之间的关系。“全民创业”本身的目的非常清晰,一望即知。这就是甩包袱。结构性失业就摆在面前,国家管不了,企业不想管,所以就拿出这么一个招数来甩包袱,让结构性失业的受害者自己承担。当然国家管不了这本身就是1992年深化国有经济改革所追求的结果。说回来。那么这个结构性失业是从何而来?原因有很多,其中一个重要的原因,是机器取代人。机器100年前就取代了人的体力劳动,现在机器开始取代人的脑力劳动和服务性劳动。

    机器取代人对谁有利?用创业、创新制造新的增长点,促就业效率又高,成本又低,对资本家有利。机器取代人对谁有害?对那些被取代、被失业却无力再就业的劳动者有害。所以这一波技术发展的趋势,是对掌握资源的极少数强者有利、对不掌握资源的大多数弱者有害。你觉得这种现象、这种行为叫什么?这就叫剥削。这就叫掠夺。你看到的“全民创业”,就是掠夺者吃完肉以后吐骨头的那个动作。

    想论证这个观点是否合理,看你身边的“全民创业者”有几个成功——不用多成功,挣钱能赶上房价——就知道了。

    georgesuperman:吴军老师说2%的人掌握人工智能。剩下的就会被剥削。

    答:然后那2%的掠夺者擦干净嘴唇,对被掠夺的98%说:我也很无奈呀,然而这就是技术发展的必然趋势呀,你说我又能怎么办呢?要不我给你们捐款吧,我做慈善吧?

    所以啊。幸亏有像智利的Cybersyn这样的历史在前面,我们才有机会看到:原来科技的发展不一定是以取代人为目的的;原来科技的发展不一定是有利于极少数强者而有害于大多数弱者的;原来科技的发展是可以为人民服务的。

    所以,对“全民创业”这种口号(以及强者的慈善捐款),唯一正确的姿态就是对他竖起一根中指说“fuck you”。科技应该属于人民、为人民服务。如果它不是,就革它的命!

    魏犇:但是科技是一种工具,请问如何革科技的命?

    答:所以我们要研究像Cybersyn这样的历史。历史上是有像阿连德这样的人,想过这样的问题,想得非常深入的。虽然最终被美帝国主义给扼杀了,但是留下了经验和教训给我们。(并向卡斯特罗同志致敬)。

    问:控制论下将引导社会向什么样的结构进行演化,会有什么样新的分工,又会有哪些阶层会消逝?

    答:这个问题问到了点子上。社会朝哪里演化,不是一个技术的问题。有些未来学者认为科技本身有要求,去研究“科技要什么”,这是很幼稚的。幼稚的地方在于:他假设了政治的缺位。然而政治从不缺位。过去三十年中如果我们看不到政治的存在,仅仅是因为一种政治(美国的政治)占据了垄断地位。现在我们看到了。十几年前有本书很畅销,叫《世界是平的》。现在怎么样?世界是不是平的?打脸打得piapia响。所以(在科技的影响下)社会朝哪里演化,这从来都是一个政治问题。我随便举个身边的例子。

    科技可以让出租车司机收入越来越低,工作时间越来越长,越来越无力与公司抗争。但是科技也可以让出租车司机获得体面的收入,与乘客形成良好的互助合作关系,关心环保问题。(感兴趣的同学可以看Green Taxi的案例 )那么为什么我们感觉,科技好像只能朝一个方向去发展人类社会呢?因为那个方向是对资本家有利的。资本家用他们控制的媒体来宣传那个方向,压制别的方向,使我们无法知道有别的方向存在。所以回到这个问题本身:不知道,人类社会发展的可能性有很多很多,我们需要去了解这些可能性,然后主动选择一个对人类有利的可能性,而不是茫茫然地发展到对资本家有利的方向上,然后还以为这是“科技想要的”。

    问:如果面对完全透明的同一组大数据,不同的人会得出不同的结论。那么,如何才能假设,只有国家的分析决策,才是正确的呢?换句话说,是不是将数据完全提供给每一个人,交由市场博弈,会更加合理呢?

    答:这个问题可以很快速。跟前面问题一样:“正确”是一个政治决策,而不是数学计算。数据可以给每一个人,然而决策不可能给每一个人。还不要说每一个人。乌克兰选个总统,永远都是得票率略高于50%,永远都有另一半人反对他。所谓“市场博弈”这也是个很幼稚的想法。我们看到的从来都是赤裸裸血淋淋的阶级斗争。

    庄表伟:还是讨论下吧,别快速过。

    答:卡斯特罗去世不是就有一帮住在美国的古巴人弹冠相庆么。

    庄表伟:我理解的计划经济,就是由政府,做出一些决策。而那些决策,在市场经济下,应该是由经营者来做的。

    答:米塞斯说的所谓“企业家”嘛。然而马云已经意识到这个问题了。马云作为一个企业家,他计划、管控的规模已经超过了世界上很多国家。那么我们有什么理由认为企业家和政府有本质的区别?在管控的效率这个意义上。这正是为什么马云自己在浙商大会上说,我们可能已经摸到计划经济成功的门把手了。

    庄表伟:也许不是政府与企业家的区别,而是:作为利益相关方,他是否有权力,为了自己的利益做决策。还是,他被人决策了。或者说,无论是政府,还是马云,他的决策,如果影响了我的利益,我有没有办法?

    答:罗纳德高斯的企业理论讲的恰恰就是这么回事:为了追求效率降低交易成本,人们主动度让自己的决策权,这就是企业。

    庄表伟:如果,我不但没有办法,还需要拍手称快。还要欢喜赞叹。那就不正常。

    王渊命:政府和企业家的本质的区别在于是否掌握暴力机关啊。

    答:说得对,但是。未来你对阿里和腾讯不满意的时候,你有选择吗?其实是一回事。统治不一定需要暴力的,也可以通过大数据。

    庄表伟:是啊,我可以让渡,也意味着我可以收回。假设,让渡是合理的,收回却不行。那就麻烦了。

    Pegasus:企业对员工和国家对公民是有很大区别的。

    答:但是,仍然,你说得对。归根结底这是一个政治问题,不是技术问题。解决人民如何当家作主的问题,靠的是政治运动。没有政治运动,那么美国人民一样当不了家做不来主。

    王渊命:企业,乃至政府计划的存在是为了降低交易成本,但技术的增长,同时也在降低交易成本。有没有可能技术的发展最终其实是消灭了企业和政府的存在呢?

    Pegasus:企业和员工相对更平等。

    答:你觉得平等嘛。你觉得你可以选择不跟腾讯和阿里玩嘛。就跟美国人民曾经觉得他们可以选举一样。

    问:有关经济预测尤其是宏观经济预测,我在五道口的教授说相信因果逻辑大于相信概率。先因果再以概率。请问老师如何看得宏观经济预测的方法论?

    答:这个我一点也不专业,还是避免多说的好。如果说“先因果再概率”是指宏观经济需要预先设计,我完全赞同。中国今天的成就已经充分证明了这一点,如果没有当年的4万亿,哪有今天的顺丰即日达。

    问:Cybersyn 这种系统实现的机制有两种,一种是最后完全中心化的,由中心化的一个系统来进行调度和分配,一种是完全去中心化的,因为技术的发展也为完全去中心化带来了可能。熊节老师认为哪种的可能性更大?

    答:Cybersyn这个系统,我们要避免用孤立的IT视角去看它。 实际上Beer当时一直把IT系统和人看作整个系统。他提到“Cybersyn”的时候,大部分时候他指的是机器和人的一个整体。从这个意义上来说,Cybersyn是一个结合了中心化和去中心化的系统。

    被机器赋权的劳动者分散在各地,做出去中心化的决策。这个视角是我们现在的IT业者非常需要注意的。缺少了对人的重视、没有赋权的出发点,我们做的IT系统就注定是剥夺的系统。

    谢工:在寻找IT技术史系列中,熊节目前在这个话题里,是有个系列讲智利的大数据,70年代的互联网变革。挖掘书背后的故事,就是我们讨论的一个方向。虽然现在这类书国内尚未引进,但至少我们可以通过熊节的思考来认识一些本质上发生过的事。


  9. 半个世纪前的大数据时代

    马云在最近的一次公开演讲中谈到市场经济与计划经济的比较:“我们过去的一百多年来一直觉得市场经济非常之好,我个人看法未来三十年会发生很大的变化,计划经济将会越来越大。为什么?因为数据的获取,我们对一个国家市场这只无形的手有可能被我们发现。”这听起来是一个相当大胆、甚至有科幻感的设想:如果能用深入基层的信息终端采集生产和消费数据,用全国连通的网络汇总经济数据,用数据分析软件识别和预测经济异常波动,在国家经济尺度上实时统筹和调整计划,那么近百年来计划经济面临的最大挑战“经济计算问题”有可能得到彻底解决,从而使计划经济有可能成为一种可行的、甚至更优于市场经济的方案。然而更显科幻的是,早在近半个世纪前的1970年代初期,在南美的智利,这样一个意在掌控全国经济的“大数据”系统已经被设计并实现出来了。

    * * *

    故事从1970年开始。在这一年的智利大选中,萨尔瓦多·阿连德被选为总统,并立即开始推行被称为“智利社会主义之路”的规划。在一系列的改革政策中,最为重要的是对大型企业(包括智利经济支柱的铜矿业)的国有化。这一改革进程很快遭遇了困难,原因不是企业主抗拒国有化,而是国有化进行得太顺利,政府很快发现自己没有足够的人才来对新生的国有企业进行整体调控。面对挑战,阿连德产生了一个大胆的构想:如果仅靠人不足以有效管理国家尺度的经济,再加上技术的支持如何?

    阿连德看中的技术是控制论。1948年,控制论这门学科的创始人诺伯特·维纳将其定义为“关于动物和机器中控制和通信的科学”。在二战中,控制论的理论与技术被用于研发防空火控系统——人手操作的高射炮很难准确命中敌方战机,而维纳设计的计算机系统则可以采集敌机飞行的数据、并实时预测敌机的飞行路线、进而自动操作高射炮击中敌机。维纳事后总结,这项研究的核心在于“预测未来”:“预测一个消息的未来,就是用某种算符去运算这个消息的过去……最优预测问题的解决仅仅取决于要加以预测的时间序列的统计性质”。这门新兴学科让阿连德看到了希望:如果控制论可以用于实现防空火控系统这样实时的、复杂的、涉及大量人为因素(驾驶战机的都是由经验丰富且绝对不想被击落的飞行员)的自动化系统,它是否能被用于其他实时的、复杂的、涉及大量人为因素的领域——比如说,经济计划?

    在寻找合适的技术领导者的过程中,阿连德的政治乌托邦愿景也吸引了英国控制论学者斯塔福·比尔的兴趣。尽管美国政府对“社会主义”这个字眼极度紧张,不惜以各种政治、经济手段扼杀阿连德的改革政策,阿连德所构想的其实是介于美苏两个超级大国、两种意识形态之间的“第三条路线”,一种既能全面提升智利经济和人民生活水平、又不损害智利保持四十年的民主自由氛围的两全方案。1971年,比尔和阿连德政府开始了合作,在这个政治乌托邦愿景之上又加上了一个科技乌托邦的愿景:构建一个计算机系统来实施调控国家经济——在互联网普及之前二十年。

    以维纳为代表的控制论学者经常用人体作为类比。例如维纳这样谈论一个基本的控制论系统:“为了能对外界产生有效的动作,重要的不仅是我们必须具有良好的效应器,而且必须把效应器的动作情况恰当地回报给中枢神经系统,而这些报告的内容必须适当地和其他来自感官的信息组合起来,以便对效应器产生一个适当的调节输出。”比尔则对这一结构进一步深化,提出了“可生存系统模型”的概念。在这一模型中,组成一个系统的各个部件被分为5级子系统:系统1到系统3分别负责感知、信息传导、以及监控和协作的功能,系统4和系统5则负责常规运作层面之上的、有目的的管理和治理职能。比尔用生理学的类比来解释这个模型(如下图),并认为同样的模型也适用于企业和国家经济。

    比尔的另一个理论基础是他在1970年的一次主题演讲中提出的“自由机器”理论。所谓自由机器,是这样一种社会-科技系统:它以网络的形式运行,而非层级结构;其中作为行动基础的是信息,而非权力;各个领域的专家知识和实时的信息反馈驱动决策,从而消除官僚体制存在的必要性。比尔甚至构想了在政府机构中这样的自由机器如何实现:它应该是一系列的指挥室,每个指挥室中实时接收和呈现来自各个子系统的信息,指挥室中的各领域专家则基于这些信息提出猜想、并运行模拟程序来验证这些猜想,由猜想汇集而成的决策再从指挥室实时传递到国民经济第一线。

    基于可生存系统模型和自由机器理论,比尔的团队向阿连德政府提出了一个系统设计的方案。在他们建议的系统中,国有企业和政府之间会新建起数字化通信的渠道,用于传输实时的生产数据;这些数据随后被送进统计软件程序,用于预测工厂的生产效能,从而使政府能够提前识别和应对异常情况;系统中还包含一个计算机实现的经济模拟器,让政策制订者能够在真正实施他们的经济措施前先在模型中测试;最后,他们还提议建设一个充满未来感的指挥室,让政策制订者们能够聚集在其中,快速掌握国民经济运行的状态,并在数据的支持下快速做出决策。

    只有当我们从资料图片中看到这个指挥室,我们才能直观地感受到比尔所说的“未来感”是什么意思。这个建成于1972年的指挥室看上去就像《星际迷航》里“企业号”的舰桥,其中大量塑料与玻璃纤维材质的使用、环绕四周的显示屏、座椅扶手上简洁的操作按钮,都与这个项目的愿景一样,充满了不真实感,就像一部科幻电影。

    只是,这不是科幻电影,而是历史上真实存在过的一个IT系统。新生的社会主义智利政府和来自英国的科学家冀望基于这个系统平衡个体自由与自上而下的控制:既保持个人的主观能动性,又使个体为组织(企业或国家)的整体利益共同奋斗、乃至作出必要的牺牲。在智利之外,很多进步人士相信智利能通过经济上的改革探索出一条政治上和意识形态上的“第三条路”,甚至成为冷战的一条出路。阿连德和比尔的IT系统会走向何方,历史在静静注视。

    * * *

    站在近半个世纪之后回望这段尘封的历史,我会感到一阵莫名的激动。今天IT技术飞速发展,然而我们看见的却是技术日益被掌握在极少数人手里、并被用于为这部分人牟利。技术发展越是日新月异,这道鸿沟就越是触目惊心。难道IT技术的发展就注定伴随着不平等的加剧?难道程序员统治的黑暗世界是无可避免的唯一未来?这一前景让作为技术工作者的我感到灰心。而阿连德与比尔、一个智利人与一个英国人、一个政治家与一个科学家、一个政治乌托邦梦想与一个科技乌托邦梦想的交汇处,这段几乎已被遗忘的历史让我们重新看到希望:为技术赋予政治和社会的正面意义、用技术创造更公正的世界,思考这个问题的不是只有我们。

    如果今天的一位IT架构师来设计这个名为“Cybersyn”的系统,也许他会参考IBM的商业技术趋势研究提出一个方案,其中个人移动设备和物联网设备被用于在工厂采集实时的生产数据,数据通过互联网汇集到位于云端的数据库,用大数据和机器学习技术对数据进行加工、分析和预测,并借助社交网络创造政府、企业与工人和谐共处的社会与经济环境。

    尽管互联网和手机的时代还有几十年才会到来,比尔提出的方案却与现代的架构方案如出一辙。于是我们不禁要好奇:他所领导的这支团队会如何构建连接厂矿与中央政府的网络,又会用什么技术来实现数据分析与预测功能?当比尔宣称Cybersyn会同时兼顾国家经济运行效率与个人的民主和自由,什么技术能让他掌握全国民众的情绪涨落?在下一篇文章中,我将深入探索Cybersyn系统的设计与实现,敬请期待。


  10. 喧闹的资本盛宴与无力的慈善

    (本文是作者于去年9月应破土网之邀而作的时评。一年时间过去,破土网已不知所踪,腾讯公益日照样红红火火,故此旧文重发,以资记念。)

    胜利日的假期还没结束,一位做公益的老友就把我拖进微信群里,要我帮助募捐。仔细一问,原来是腾讯发起了“99公益日”的活动,9月7号到9号的三天时间里,在腾讯公益平台上募捐的项目,捐赠人捐多少,腾讯就对应配捐多少。难怪这位从不直接找我募捐的老友也按捺不住,把我也动员成了“梦想召集人”,给我设定了三天募捐1500元的任务。照他的计划,由他动员的100名梦想召集人每人募集1500元,加上腾讯的一比一配捐,三天内就可以募集到30万元善款。

    可世事难预料。9月6号半夜,当我想要开始我这一份募捐时,发现腾讯的乐捐平台慢得打不开。群里一看,大家也都在反映同样的问题。等到一觉醒来,募捐页面倒是可以设置了,当我自己先捐上一百元,却没看到传说中的配捐出现。“99公益日”最大的亮点,就这么爽约了。

    正当微信群里大家都在奇怪为什么没有收到配捐,腾讯的官方解释出来了:由于捐款来得太多、太过集中,主办方腾讯不得不临时修改游戏规则,配捐总额9999万,平均分到7、8、9三天,每天3333万。几个小时后,腾讯又召开新闻发布会,继续修改规则:9点开始,单人单日配捐上限999元,项目配捐上限999万元。从这个规则修改不难推测,就在第一天的短短几个小时里,捐款额已经超过了三千万,且已经有机构得到了上千万配捐额度。

    随着各路消息在朋友圈里逐渐发酵,一幅完整的图景开始浮现。据某NGO发起人透露,自“腾讯公益99公益日三天1:1配捐乐捐平台上的项目”消息传播开始,很多公益机构摩拳擦掌组建各种战团,准备“冲击99高地”。操作指南出现各种版本,“打劫马化腾”的声音多群可见。别人看阅兵时,很多公益人在加班指导捐助人绑卡。7日凌晨起,第一个5分钟完成配捐超500万,15分钟配捐1000万。有章法的基金会和项目事先确定的战术显著见效,某些知名机构几个小时就入手几百万配捐。集中的捐赠,竟然在午夜时分冲垮了腾讯的IT平台,逼得腾讯临时修改规则。

    围观群众有一句点评可谓入木三分:不要高估中国公益人抢钱时的吃相。

    在笔者看来,腾讯掀起的这场公益圈的资本盛宴,虽然怀揣着美好的愿景,却也恰好暴露出中国公益行业普遍存在的一个痼疾:众多机构缺乏自己的战略规划和实施计划,一切行动以募款为最大驱动。在腾讯“1:1配捐”的“优惠”政策刺激下,很多人的朋友圈突然间被慈善募捐的信息刷屏。本应言益而非言利的公益机构,却跟着资本的指挥棒一窝蜂团团转,这番情景多少让人有些不忍直视。让这些原本就欠缺高效运营能力的公益机构又多增一次折腾,想来也不是腾讯发起“公益日”活动的初衷。

    突然刷屏的募捐广告,更是刷出了慈善捐款这种形式根深蒂固的问题:只有慈善,没有团结。面对铺天盖地的募捐信息,很多中产阶级城市白领不禁要问:难道让他们发善心去帮助弱势群体的动力竟然是“打折”吗?齐泽克将星巴克“买一杯咖啡捐一美元”的慈善计划辛辣地称作“消费主义的最高形态”,因为它通过(更多的)消费来消解中产阶级在消费时的负罪感。而“99公益日”堪称更胜一筹:如果中产阶级(暂时还)没有消费,那么就用打折来创造消费的欲望,并且直接用慈善来消解消费的负罪感。这种集中优惠售卖赎罪券的做法,恰好让我们有机会看清没有共情与团结的慈善还剩下什么——中产阶级需要购买赎罪券来抵消自己卷入和积极参与资本主义体系的负罪感,至于捐赠是用于失学儿童、罕见病患者还是流浪猫狗,又于我何有哉?

    在“99公益日”的新闻报道中,腾讯宣称自己的目标是“打造公开透明的公益平台”。仅从这场围抢来看,腾讯在后续需要做的项目监控与信息公布的工作还很多。尤其是精心布置、抢到了上千万配捐额度的机构,这些显然不在其年度计划中的意外收入是否得到有效使用,会是一个引人关注的问题。同时,这场热闹的资本盛宴更让我们看到缺乏共情与团结的慈善是何其无力。公益行业不仅需要募捐平台,更需要一个能以募捐作为桥梁在城市中产阶级与弱势群体之间建立共情与团结的平台。惟有当公益能引领中产阶级走出玻璃办公室,走进被剥削、被压迫、被噤声的弱势群体,体会他们的苦楚,与他们建立团结而非居高临下地施舍,公益才有可能真正创造一个更美好的世界。