透明思考


Transparent Thoughts


  1. 喧闹的资本盛宴与无力的慈善

    (本文是作者于去年9月应破土网之邀而作的时评。一年时间过去,破土网已不知所踪,腾讯公益日照样红红火火,故此旧文重发,以资记念。)

    胜利日的假期还没结束,一位做公益的老友就把我拖进微信群里,要我帮助募捐。仔细一问,原来是腾讯发起了“99公益日”的活动,9月7号到9号的三天时间里,在腾讯公益平台上募捐的项目,捐赠人捐多少,腾讯就对应配捐多少。难怪这位从不直接找我募捐的老友也按捺不住,把我也动员成了“梦想召集人”,给我设定了三天募捐1500元的任务。照他的计划,由他动员的100名梦想召集人每人募集1500元,加上腾讯的一比一配捐,三天内就可以募集到30万元善款。

    可世事难预料。9月6号半夜,当我想要开始我这一份募捐时,发现腾讯的乐捐平台慢得打不开。群里一看,大家也都在反映同样的问题。等到一觉醒来,募捐页面倒是可以设置了,当我自己先捐上一百元,却没看到传说中的配捐出现。“99公益日”最大的亮点,就这么爽约了。

    正当微信群里大家都在奇怪为什么没有收到配捐,腾讯的官方解释出来了:由于捐款来得太多、太过集中,主办方腾讯不得不临时修改游戏规则,配捐总额9999万,平均分到7、8、9三天,每天3333万。几个小时后,腾讯又召开新闻发布会,继续修改规则:9点开始,单人单日配捐上限999元,项目配捐上限999万元。从这个规则修改不难推测,就在第一天的短短几个小时里,捐款额已经超过了三千万,且已经有机构得到了上千万配捐额度。

    随着各路消息在朋友圈里逐渐发酵,一幅完整的图景开始浮现。据某NGO发起人透露,自“腾讯公益99公益日三天1:1配捐乐捐平台上的项目”消息传播开始,很多公益机构摩拳擦掌组建各种战团,准备“冲击99高地”。操作指南出现各种版本,“打劫马化腾”的声音多群可见。别人看阅兵时,很多公益人在加班指导捐助人绑卡。7日凌晨起,第一个5分钟完成配捐超500万,15分钟配捐1000万。有章法的基金会和项目事先确定的战术显著见效,某些知名机构几个小时就入手几百万配捐。集中的捐赠,竟然在午夜时分冲垮了腾讯的IT平台,逼得腾讯临时修改规则。

    围观群众有一句点评可谓入木三分:不要高估中国公益人抢钱时的吃相。

    在笔者看来,腾讯掀起的这场公益圈的资本盛宴,虽然怀揣着美好的愿景,却也恰好暴露出中国公益行业普遍存在的一个痼疾:众多机构缺乏自己的战略规划和实施计划,一切行动以募款为最大驱动。在腾讯“1:1配捐”的“优惠”政策刺激下,很多人的朋友圈突然间被慈善募捐的信息刷屏。本应言益而非言利的公益机构,却跟着资本的指挥棒一窝蜂团团转,这番情景多少让人有些不忍直视。让这些原本就欠缺高效运营能力的公益机构又多增一次折腾,想来也不是腾讯发起“公益日”活动的初衷。

    突然刷屏的募捐广告,更是刷出了慈善捐款这种形式根深蒂固的问题:只有慈善,没有团结。面对铺天盖地的募捐信息,很多中产阶级城市白领不禁要问:难道让他们发善心去帮助弱势群体的动力竟然是“打折”吗?齐泽克将星巴克“买一杯咖啡捐一美元”的慈善计划辛辣地称作“消费主义的最高形态”,因为它通过(更多的)消费来消解中产阶级在消费时的负罪感。而“99公益日”堪称更胜一筹:如果中产阶级(暂时还)没有消费,那么就用打折来创造消费的欲望,并且直接用慈善来消解消费的负罪感。这种集中优惠售卖赎罪券的做法,恰好让我们有机会看清没有共情与团结的慈善还剩下什么——中产阶级需要购买赎罪券来抵消自己卷入和积极参与资本主义体系的负罪感,至于捐赠是用于失学儿童、罕见病患者还是流浪猫狗,又于我何有哉?

    在“99公益日”的新闻报道中,腾讯宣称自己的目标是“打造公开透明的公益平台”。仅从这场围抢来看,腾讯在后续需要做的项目监控与信息公布的工作还很多。尤其是精心布置、抢到了上千万配捐额度的机构,这些显然不在其年度计划中的意外收入是否得到有效使用,会是一个引人关注的问题。同时,这场热闹的资本盛宴更让我们看到缺乏共情与团结的慈善是何其无力。公益行业不仅需要募捐平台,更需要一个能以募捐作为桥梁在城市中产阶级与弱势群体之间建立共情与团结的平台。惟有当公益能引领中产阶级走出玻璃办公室,走进被剥削、被压迫、被噤声的弱势群体,体会他们的苦楚,与他们建立团结而非居高临下地施舍,公益才有可能真正创造一个更美好的世界。


  2. 用技术治病救人,你来不来?

    太长不读

    如果你想见识非洲、亚洲和拉丁美洲众多发展中国家的丰富与苦难,如果你痛恨这个世界有太多不公,如果你希望用IT技术挽救贫苦人民的生命,如果你有兴趣成为开源软件社区的领导者,如果你想做一个有影响力的软件产品,也许你应该考虑加入Bahmni产品团队,与我们一起用技术治病救人。

    你可以在线投递简历,或直接与我联系:JXiong at ThoughtWorks dot com

    背景

    ThoughtWorks是一家跨国软件设计与定制领袖企业,下属的ThoughtWorks Global Health部门一直致力于推进全球医疗发展。我们积极投身于改善低资源地区的医疗质量,提高医疗服务覆盖率。通过提供技术解决方案、工具、咨询及开源软件的专业知识,我们为亚洲、非洲及拉丁美洲贫穷国家的医疗工作者提供支持,帮助他们为最贫困的人群提供高质量的医疗服务,并帮助这些国家的政府进行医疗体系的全局优化。

    Bahmni是ThoughtWorks Global Health的拳头产品。这个开源的医院信息化系统(HIS)可以部署在全世界最贫困地区的医院,帮助那里的医生提高工作效率、减少诊疗错误、优化医疗决策、完善数据汇报。迄今为止,Bahmni已经在印度、孟加拉、尼泊尔、塞拉利昂等国的多家乡村医院实施,获得了极佳的反响。

    作为ThoughtWorks全球医疗战略布局的重要环节,我们计划在中国建立一支Bahmni产品研发团队。这支团队将与分布在世界各地的全球医疗团队紧密协作,为Bahmni的实施和产品演进做出关键贡献。我们的目标是十年内在全球5000家最贫困地区的医院实施Bahmni系统,提升全世界最贫困人群的医疗服务水平。

    为此,我们将招聘Bahmni产品研发团队的三个核心角色:产品经理,软件架构师和实施经理。

    产品经理

    职位要求

    • 具备医疗信息化行业工作经验,有较丰富的行业知识积累
    • 熟悉医疗行业主流业务流程及相关IT系统
    • 有从事EMR/CIS/HIS相关工作经验者优先
    • 良好的产品分析总结归纳能力,熟悉产品运营;
    • 具有较强的语言表达沟通能力,具备良好客户沟通和管理能力
    • 具有团队精神,较强的组织协调能力,性格稳重扎实
    • 习惯分布式团队协作,英语书面及口头沟通能力佳者优先
    • 熟悉敏捷需求管理及项目管理流程者优先

    工作内容

    • 理解并分析贫穷地区医院需求,协调客户关系,保障医疗信息化项目实施
    • 综合分析客户需求,把控医疗信息化产品规划方向
    • 与分布在全球多个国家的医疗信息化产品团队协作,共同保障产品研发及演进
    • 协调位于中国的产品交付和实施团队,负责需求传递及成果验收
    • 代表公司参加国内及国际各类行业相关会议,发表演讲及文章

    软件架构师

    职位要求

    • 4年以上开发经验,2年以上团队技术主导者经验
    • 有设计、规划、实现复杂业务系统的工作经验
    • Java基础扎实,精通常用主流基础框架
    • 熟悉Web系统的设计和部署
    • 有较强的分析设计能力、方案整合能力和解决问题能力
    • 良好的团队合作精神,自我驱动,勤奋好学
    • 具有医疗信息化行业工作经验者优先
    • 习惯分布式团队协作,英语书面及口头沟通能力佳者优先
    • 具有开源项目工作经历者优先
    • 熟悉敏捷软件开发流程和实践者优先

    工作内容

    • 理解贫穷地区医院需求,制订技术方案,保障医疗信息化项目实施
    • 与产品经理紧密协作,把控医疗信息化产品技术架构方向
    • 与分布在全球多个国家的医疗信息化产品团队协作,共同保障产品研发及演进
    • 领导位于中国的产品交付和实施团队,形成高效、高质量交付
    • 与世界各地的开源社区领袖协作,共同构建全球医疗IT生态系统
    • 代表公司参加国内及国际各类行业相关会议,发表演讲及文章

    实施经理

    职位要求

    • 4年以上实施经验,2年以上领导实施团队经验
    • 熟悉LINUX操作系统及相关的服务和排错方法
    • 熟悉网络相关的基础知识
    • Java基础扎实,了解常用主流基础框架
    • 具有较好的软件理解和应用能力,能够清晰的向客户传达软件使用方法,进行用户使用培训和指导
    • 有较强的责任心和自我驱动能力,良好的团队合作精神,勤奋好学
    • 习惯分布式团队协作,英语书面及口头沟通能力佳者优先
    • 具有EMR、HIS实施经验者或具有医疗信息化行业工作经验者优先

    工作内容

    • 管理和发展产品实施团队;
    • 负责客户项目的软件产品和相关设备的配置、部署及相关技术实施工作;
    • 实施过程中用户培训、需求调研、系统测试等工作;
    • 负责项目实施技术文档、运维资料的编写与归档;
    • 配合销售人员进行必要的业务交流、客户资源调研、售前方案编写等售前工作;
    • 与世界各地的开源社区领袖协作,共同构建全球医疗IT生态系统


  3. 微服务与康威定律

    (本文是对《Building Microservices》一书第10章的摘录)

    康威定律

    Melvin Conway于1968年发表的论文《How Do Committees Invent》指出:系统设计的结构必定复制设计该系统的组织的沟通结构。这一论断被称为“康威定律”。在《Exploring the Duality Between Product and Organizational Architectures》一文中,作者发现紧密耦合的组织(例如典型的商业产品公司,所有员工在同一地点工作,具有高度一致的愿景与目标)开发的软件倾向于较少模块化,而松散耦合的组织(例如分布式的开源社区)开发的软件则倾向于更加模块化、耦合较少。

    当一支小型团队负责整个系统的设计与实现时,团队内部可以具有频繁的、细粒度的沟通。而随着团队变大、分布在不同地点甚至时区,协调变更成本急剧增加,紧跟着就有两种可能性:人们要么找到降低协作/沟通成本的办法,或是停止做变更。后者就会导致庞大、难以维护的代码库。最终,各个地点不得不选择各自专门处理的一部分工作,拥有一部分代码,并在团队之间形成更粗粒度的沟通机制。组织结构中的沟通路径会造就与之对应的粗粒度API,形成代码库各个大块之间的边界。

    服务的边界应该围绕着约束上下文(bounded context)来画,正如我们希望团队结构与约束上下文保持一致。这样做有几方面的好处。首先,团队在一个约束上下文内更容易抓住领域概念;其次,一个约束上下文内的多个服务更可能彼此交互,因此系统设计和发布协作都得以简化;最后,交付团队与业务代表沟通时,团队只需与各自约束上下文中的一两个专家建立良好关系即可。

    服务所有权

    一般而言,每个服务属于一个团队,拥有这个服务的团队负责其所有修改。这个团队可以任意调整代码结构,只要这些修改不对服务的消费者造成破坏即可。在很多团队中,“所有权”延伸到了服务的各个方面,从需求来源直到软件的构建、部署和维护。由同一个团队负责开发、部署和维护会促使他们简化部署环节,而不是“写完代码扔过墙”。

    有很多团队采用“共享服务所有权”的模式。这种模式并不理想,但有必要了解团队为什么做此选择。常见的理由包括:

    • 难以拆分。《Building Microservices》一书的第5章提供了一些关于如何拆分服务的建议。也可以考虑把团队合并,从而使组织结构与软件架构匹配。
    • 特性团队。比起传统的“按技术/职能划分团队”的IT组织结构,“一个团队端到端负责一个特性开发”的结构是一个进步。然而微服务环境下的团队结构可以再向前一步:如果业务领域、服务边界、团队结构三者能保持对齐,一个团队就能聚焦一组客户,以整体视角为这组客户提供服务。横切多个业务领域的修改固然会发生,但可能性会降低很多。
    • 交付瓶颈。有几个办法可以应对交付瓶颈而不必共享服务所有权。第一个办法就是等待,各个服务不一定要以同样的节奏发布,遇到交付瓶颈的服务可以稍后再发布。另外,也可以直接向有交付困难的团队中加人。横跨整个组织的技术栈越标准,临时加人的效果就会越好。当然,另一方面,标准化的技术栈也可能给团队造成束缚。

    内部开源

    通常的开源项目组织方式可以用在企业内部:一个代码库由一组受信任的提交者(核心团队)管理,并接受未获信任的提交者(外围团队)提交的修改。开源项目以这种方式来保障代码质量和一致性。大多数开源项目在第一个核心版本成型之前倾向于不接受外来的提交。当服务变得成熟且稳定,便可以更放心地开放接受贡献。

    分布式版本控制工具允许任何人提交pull request,这是很重要的能力。取决于组织的规模,内部开源体系可能需要考虑借助代码评审工具来讨论和评估是否接受pull request。同时,类似于github提供的pull request评论功能也很有用。最后,需要让提交者很容易构建和部署整个软件,通常这需要定义良好的构建和部署流水线,以及集中管理的构建产物仓库。

    案例:REA

    REA的服务由“小队”(squad)拥有,小队负责服务的整个生命周期,包括构建、测试、发布、支持、直到下线。一支交付服务团队给这些小队提供建议和指导,以及必要的工具支持。REA有着强烈的自动化文化,并大量使用AWS使团队更具自主性。

    不仅交付团队与业务经营对齐,软件架构也是一样。以服务集成为例:在一条业务线内部,所有服务可以用任何方式自由交流,小队自己可以做决定;然而在业务线之间,所有交流必须以异步批处理的形式发生,这是中央架构团队规定的很少几条“铁律”之一。粗粒度的系统集成与业务线之间已有的粗粒度交流相匹配。

    为了对齐业务经营,组织结构和软件架构都需要改变。变革的阻力真实存在:从大一统的系统转到微服务,对于习惯了单一编程语言、不用考虑运维问题的开发者而言是一次痛苦的觉醒;习惯了把软件“丢过墙”的程序员突然发现没有别人可以推诿责任,可能会很不习惯自己对所有工作负责;如果要让开发者承担7*24在线支持工作,甚至可能有劳动合同上的阻碍。变革推动者需要理解员工的喜恶,顺势而为,不能急于求成。


  4. 机器学习:概述

    本文摘录了一组关于机器学习的介绍文章,帮助非技术性的读者快速了解机器学习的目的、原理和用途。

    为什么要机器学习?

    机器学习有望解决传统企业软件解决方案的很多问题。首先,在传统企业软件中,数据的质量受限于人类的输入。然而现实是,大部分销售不喜欢更新CRM系统中的数据,真正的销售数据只存在于若干电话会议与数字表格中。同时,传统的企业系统大多构建于关系型数据库上,而关系型数据库并不善于表现信息的时间轴视图,因此大多数企业需要依赖于庞大的数据仓库来不断接收来自企业系统的数据转储。使用这种方法,业务人员必须等待几周甚至几个月才能从数据团队得到有用的洞见。最后,传统的企业系统依赖于成千上万人定的规则,而这些规则是静态的,在业务发展的过程中会逐渐失效。

    (来源:Crunch Network | The Next Wave Of Enterprise Software Powered By Machine Learning

    机器学习的发展可以分作三个阶段:机器学习1.0是“描述”(description),2.0是“预测”(prediction),3.0是“对策”(prescription)。今天的CxO们大约不用太操心“描述”阶段,大多数企业已经拥有对应的IT系统。眼下他们迫切需要拥抱“预测”阶段。今天的科技不仅能让业务人员查看历史数据,而且能预测未来的行为和结果。

    (来源:McKinsey | An executive’s guide to machine learning)

    机器学习如何工作?

    简单说,机器学习是一类自我改进的算法。计算机从一个模型开始,用试错法反复训练这个模型,然后就可以做出预测,例如预测某一笔金融交易有多大风险。以侦测信用卡欺诈的机器学习算法为例,首先要用大量真实持卡人的交易记录来训练这个模型,并根据历史记录对模型调优。接下来,信用卡交易就会实时地流过这个算法模型,算法模型则对每条交易记录生成一个概率数据,代表该笔交易涉及欺诈的可能性(例如97%)。如果欺诈侦测系统被配置为阻止欺诈概率95%以上的交易,那么这个评估值就会引发POS机拒收这张信用卡。

    在判断交易是否欺诈时,机器学习算法会考虑很多因素:商家的可信度、持卡人的购买行为、时间、地点、IP地址等等。数据点越多,预测就会越准确。人类不可能在几分之一秒内评估几千个数据点,只有自动化的算法能让实时的欺诈侦测成为可能。

    (来源:The Conversation | Machine learning and big data know it wasn’t you who just swiped your credit card

    机器学习与传统的数据统计有一个重要的区别:使用机器学习时,我们并不关心因果性(causality)。我们可能并不关心什么变化造成什么结果,而是聚焦于预测:只要有一个模型能在当前环境下给出准确的判断就行。可以参考我们如何使用天气预报:天气预报并不告诉我们降雨的原理,只告诉我们下雨的概率,我们参照这个概率判断是否应该带伞出门。机器学习也是一样:个性化推荐就是对人们偏好的预测,尽管并不知道人们为什么喜欢这些东西,但这种预测是有用的。习惯了这个思维方式以后,机器学习的价值就会显而易见。

    (来源:HBR | What Every Manager Should Know About Machine Learning

    机器学习用来干嘛?


    (来源:Tata Consultancy Services | Using Big Data for Machine Learning Analytics in Manufacturing

    在银行里应用机器学习技术提供个性化服务:

    • 基于顾客的信用卡/银行卡使用模式给出推荐;
    • 基于顾客在特定产品/网站上的行为给出推荐;
    • 预测顾客下一步可能的消费行为;
    • 如果顾客错过了航班,预测他们立即的需要;
    • 向顾客推荐有折扣的商品、餐馆、酒吧等;
    • 根据顾客的还款周期及时推送时尚信息

    (来源:Kathiravan Manoharan | Applications of Machine Learning Algorithms in Banking

    应用在金融服务领域,机器学习算法可以揭示新的消费模式、识别未知的交互方式、发现新的顾客群体、获得新的洞见,从而助力银行的全渠道建设。

    (来源:Strands Finance | Transparent technology: How machine learning brings magic to next-generation PFM

    我们调查了168家年收入5亿美元以上企业的执行官,76%表示机器学习可以通过从大数据中持续学习和优化给销售人员的实时推荐而带来销售增长。超过4成的企业已经开始在销售与市场领域实施机器学习。我们的研究显示,大企业在销售流程中应用机器学习有三个维度:首先是提供数据和流程的可见性,使销售过程更加科学;另外是在销售与市场环境中开展更多数据驱动的实验;第三是通过自动化事务性流程来最大化实际销售活动的时间占比。

    在采用机器学习之前,决策的主要依据是静态的数据库、针对历史数据的分析、经验和直觉。机器学习可以用实时数据来驱动决策,并且持续改进预测质量。假说可以快速被提出、测试、调整、并最终用于改进工作流程。在我们的调查中,接近80%的企业认为机器学习显著提升了销售关键绩效指标。

    (来源:Sloan Review | Sales Gets a Machine-Learning Makeover


    (来源:Yandex Data Factory

    麦肯锡使用机器学习算法扫描超过1万份应聘者简历,预测出来的招聘结果与真实结果高度相关。有趣的是,机器学习算法接受了比真实招聘略多的女性应聘者,也许将来技术可以有效地消除人类面试官隐藏的偏见。

    (来源:McKinsey | An executive’s guide to machine learning)


  5. 深蓝与AlphaGo的对比

    20年前,深蓝与卡斯帕罗夫的对弈使人工智能进入大众视野;20年后,AlphaGo对李世乭的压倒性胜利再次使人工智能成为热议焦点。同样是战胜了棋类世界冠军,两代人工智能最重要的差别在于:深蓝仍然是专注于国际象棋的、以暴力穷举为基础的特定用途人工智能,而AlphaGo是几乎没有特定领域知识的、基于机器学习的、高度通用的人工智能。这一区别决定了深蓝只是一个象征性的里程碑,而AlphaGo则更具实用意义。

    深蓝的算法

    整体而言,深蓝是一套专用于国际象棋的硬件,大部分逻辑是以“象棋芯片”(Chess Chip)的形式用电路实现的。在象棋芯片之上,有较少量的软件负责调度与一些高阶功能。

    深蓝算法的核心是基于暴力穷举:生成所有可能的走法,然后执行尽可能深的搜索,并不断对局面进行评估,尝试找出最佳走法。深蓝的象棋芯片包含三个主要的组件:走棋模块(Move Generator),评估模块(Evaluation Function),以及搜索控制器(Search Controller)。各个组件的设计都服务于“优化搜索速度”这一目标。

    走棋模块负责生成可能的走法。走棋模块的核心是一个8*8的组合逻辑电路阵列,代表棋盘的64个格子。国际象棋的走棋规则以硬件电路的方式嵌入到阵列之中,因此走棋模块可以给出合法的走法。在核心之外还有附加的逻辑电路用于探测和生成特殊走法(例如“吃过路兵”和“王车易位”)。

    评估模块是整个芯片中最主体的部分,占据了芯片上2/3的面积、超过半数的逻辑三极管和80%以上的存储三极管。评估模块又分为三个部分:棋子位置评估;残局评估;以及慢速评估。棋子位置评估对盘面上所有棋子当前所处的位置计分,不同棋子处于不同位置的分值由软件预先计算好后写入硬件。芯片中输入了大约8000种不同的“模式”,并针对每种模式赋予了一定的分值。残局评估也预存了一系列专门针对残局的估值规则,例如“王在棋盘中央有利”(King centralization bonus)的规则。残局评估子模块还以8*8组合逻辑电路阵列的形式跟踪所有兵所处的位置,并计算兵是否越过了对方的王、是否能一路冲到对方底线晋级。由于逻辑嵌入在硬件中,棋子位置评估和残局评估都只需要一个时钟周期就可以完成计算。

    慢速评估子模块是整个芯片上最复杂的元素,占据芯片上约一半的面积,并且完成计算需要10个时钟周期。大量国际象棋特有的逻辑都在慢速评估的过程中计算,包括:

    square control, pins, xrays, king safety, pawn structure, passed pawns, ray control, outposts, pawn majority, rook on the 7th, blockade, restraint, color complex, trapped pieces, development and so on

    搜索控制器实现了一个最小窗口alpha-beta搜索算法(minimum-window alpha-beta search algorithm),也称为alpha-beta剪枝算法,能快速削减搜索的规模。

    深蓝的软件也是专门设计用于与硬件协同工作的。软件部分负责调度最多32个象棋芯片并行搜索,并负责对大范围规划的局面进行软件评估。深蓝的软件还连接了“仅剩5子”的残局数据库,一旦出现仅剩5子的残局,就会直接从这个数据库中搜索最佳走法。软件中还包含了从30万局棋中抽取出来的开局书,并且工程师还不断优化其中记录的开局走法。

    AlphaGo的算法

    AlphaGo是一个能够运行在通用硬件之上的纯软件程序。据称其中部分程序使用了TensorFlow

    AlphaGo的核心算法基于机器学习。在训练的第一阶段,AlphaGo仅仅根据彼此无关的盘面信息模仿专家棋手的走法。通过3000万个盘面数据训练一个13层的监督式策略网络,这个神经网络随后就能以超过50%的精度预测人类专家的落子。值得注意的是,在这一阶段,AlphaGo对于围棋规则一无所知,只是毫无目的地模仿而已。尽管如此,由于违反规则的走法(例如“自杀”)专家棋手不会走出,所以AlphaGo也相当于学会了遵守围棋规则。

    在训练的第二阶段,AlphaGo开始与自己下棋:将过往训练迭代中的策略网络与当前的策略网络对弈,并将对弈过程用于自我强化训练。在这一阶段,引入了唯一的围棋规则:对获胜的棋局加以奖励。经过这一阶段的训练,AlphaGo已经超过所有围棋软件,对弈当时最强的开源围棋软件Pachi可以达到85%胜率。

    在训练的第三阶段,AlphaGo在自我对弈中,从不同棋局中采样不同位置生成3000万个新的训练数据,用以训练局面评估函数。经过三阶段训练的策略网络被混和进蒙特卡洛树搜索算法,从而在比赛进行过程中预测棋局未来可能的发展方式、并对各种可能的未来局面进行评估。

    在整个算法中,只有“获胜”这个概念作为围棋规则被输入训练过程,除此之外AlphaGo对于围棋规则一无所知,更没有高级围棋专门概念(例如“定式”)。尤其是第一阶段的训练,完全基于简单的盘面信息训练达到相当可观的预测效果,这一过程在很多需要“预测”这一功能的领域具有显著的意义。

    规模与复用

    深蓝的一枚象棋芯片包含大约1百万个三极管,其中逻辑三极管45万个、存储三极管55万个。该芯片采用0.6微米CMOS技术,主频30~40兆赫。1997年与卡斯帕罗夫对弈并获胜的深蓝II是一台30个节点的RS/6000超级计算机,每个节点上部署16枚象棋芯片,共计480枚象棋芯片并发。由于内嵌大量国际象棋专用逻辑、且采用硬件方式实现,深蓝对于IBM后续的人工智能(例如Watson)并无太多可复用性。

    AlphaGo使用的硬件则要强大得多。与李世乭对弈的分布式版本使用了1920颗CPU和280颗GPU,并且据称该版本的AlphaGo已经使用了Google自制的“张量处理单元”(TPU)。Google宣称这种芯片专门针对TensorFlow优化,其计算效率比GPU高出一个数量级。由于几乎不包含领域特定知识、且运行于通用硬件基础上,AlphaGo的软件据信非常简单(一个开源项目仅用约1200行代码就实现了AlphaGo的核心算法),且其中大部分算法可以解决用于其它领域的机器学习问题。

    参考资料

    • Campbell, M., Hoane Jr., a. J., & Hsu, F. (2002). Deep Blue. Artificial Intelligence, 134(1-2), 57–83.
    • Ferrucci, D., Brown, E., Chu-Carroll, J., Fan, J., Gondek, D., Kalyanpur, A. a., … Welty, C. (2010). Building Watson: An Overview of the DeepQA Project. AI Magazine, 31(3), 59–79.
    • Hsu, F., Campbell, M., & Hoane, J. (1995). Deep Blue system overview. In ICS ’95: Proceedings of the 9th international conference on Supercomputing (pp. 240–244).
    • Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., van den Driessche, G., … Hassabis, D. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484–489.


  6. 程序员统治的黑暗世界

    (本文系笔者在2016年TEDxTencent的演讲稿。同名文章首发于破土网。)

    当我第一次学编程的时候,那个十四岁的少年曾经有一个梦想:未来有一天,我能用我编写的软件统治世界。现在,随着IT技术、尤其是互联网技术的飞速发展,“软件统治世界”已经由不着边际的幻想变成了触手可及的未来可能性。对于这个软件与网络构建的新世界,人类曾经充满美好的构想。John Perry Barlow在1996年的EFF论坛发布的《网络社会独立宣言》中这样说道:“我们正在创造一个世界:在那里,所有的人都可加入,不存在因种族、经济实力、武力或出生地点造成的特权或偏见。”我们曾经满心希望,数字化技术将消泯物理世界的隔阂与不公,给我们带来一个天下大同的美好未来。

    然而20年后,互联网似乎并没有循着我们的期望发展。《与机器赛跑》一书引用美国劳工统计局的数据指出,自1999年以来,尽管GDP有明显增长,家庭收入中位数却停滞不前。换句话说,以互联网为代表的科技发展带来的利益,并没有惠及普罗大众。相反,我们在全球范围看到了机器取代劳动者、并造成结构性失业的趋势。以美国为例,美国的人口在21世纪第一个十年增加了3000万,但就业机会几乎没有增加,于是就业率从2000年的64%跌至不到58%。这是人类历史上第一次,普通人的就业不随GDP上升,而这正是IT科技发展的直接结果。

    与此同时,掌握科技的少数人、少数企业很可能凭借自己对技术的垄断作恶,把这个数字化、网络化的未来变成一个邪恶黑暗的世界。尤其以下几种科技作恶的方式,值得引起警惕。

    逃避社会责任

    层出不穷的互联网分享经济业态不仅让我们见识了花样百出的促销,也让我们见识了一种新奇的逻辑:好像只要把生意搬到互联网上去销售,企业就可以不必为之纳税。2013年,纽约市政府对AirBnb的用户Nigel Warren处以总计约7千美元罚款,从而认定AirBnb根本的业务模式——短期租房——为非法。甚至在AirBnb大本营的旧金山市,短期出租公寓在很长时间内也属于非法行为。究其原因,就在于AirBnb运营的短租房业务实质上提供了酒店的服务,也收取了相当于酒店的费用,却没有承担酒店行业本应承担的社会责任。仅就酒店税一项,AirBnb拖欠旧金山市的税款据估计一度高达2500万美元

    互联网企业频频以“去中介化”的方式颠覆传统行业。然而在颠覆了低效、低质量的传统中介之后,互联网企业立即建立垄断力更强的“赛博中介”,在快速占领市场、形成实际上的垄断之后,就开始单方面修改与司机之间的协议。例如一位西雅图的司机透露,优步最初以每小时25美元收入吸引他加盟,最后他的收入却一路降低到了每小时2.64美元。

    在攫取收益的同时,这些互联网企业常常拒绝对为他们工作的劳动者承担责任。举例来说,尽管出租车司机比从事其他职业的劳动者被谋杀的几率高20倍以上。然而Uber和Lyft等提供分享租车服务的公司却拒绝为司机提供任何保障。另一方面,当司机对乘客施以暴力、甚至当街开枪杀人,优步只是坚称其针对司机的背景调查“非常可靠”,同样拒不承担任何责任。对于肆无忌惮猥亵女乘客的司机,滴滴只是“承诺对司机永久封号,并给了这位女乘客10元顺风车优惠券作为赔偿”。劳动者社会保障的缺失同样严重。在国内,我们看到一些分享经济“平台”以“解放手艺人”、“实现财务、时间、心灵三大自由”等口号吸引劳动者,却并不提供国家明文规定的劳动保障。

    这些企业有一个常见的逻辑:他们提供的只是“平台”,在平台上提供服务的劳动者并非企业的雇员,因此平台也无需对服务提供过程中出现的问题负责。然而随着平台垄断程度的提高,越来越多的劳动者实际上已经在为某个或一两个平台全职工作。例如一个针对美国网租车司机的调查显示,超过90%的司机服务于Uber和Lyft两家平台。当劳动者实际上全职为一家公司服务,再用“平台”的说辞拒绝承认劳动雇佣关系,就纯粹是企业转移风险的手段:将收入不稳定、不可逆转的资本投入、潜在的犯罪、突发事件的风险都转嫁到了个人身上

    屏蔽大众的声音

    为了刺激城市白领消费,我们的网络信息空间着力塑造城市白领“中产阶级”的理想生活状态,从而营造了一种城市白领专业人士的生活水平属于社会中等、与大多数人相当的错觉。实际上,据国家统计局数据,2015年全国居民人均可支配收入中位数为19281元。据某不具名税务工作者的非官方估计,个人月可支配收入5000元以上就属于前10%的高收入者,个人月可支配收入10000元以上可能属于前1%的高收入者。从这个意义上,网络信息空间营造的“中产阶级”形象实际上是不折不扣的高收入人群。据Schradie的数据,美国网民中只有不到30%参与网络内容生产,其中大部分(21%)又是以社交网络的形式,以博客等形式产出较为严肃的内容的人数仅占8%。不难想象,这个真正生产内容的精英人群,正是这个高教育程度、高收入的人群。内容产生者的集中,也加强了这个人群“大多数”的错觉。

    当这些高教育水平、高收入人群自认为是社会的“大多数”,这种印象就会影响公众议题的设置。例如雾霾问题近几年成了万众瞩目的环境议题,似乎雾霾就是中国最严重、最急切的环境问题。然而正如评论者指出的:

    作为众多环境污染问题之一,雾霾之所以会被大家如此重视,作为优先级被选中、被讨论,完全是因为雾霾触犯到了生活在城市中、掌握舆论话语主权的中产阶级的利益。虽然,雾霾的危害并不仅面向中产阶级,但它却是身在城市空间中的中产阶级最看得见且关切的污染。而对于身处农村空间中的底层穷苦百姓而言,土壤和水是直接的生产和生活资料,相比于蓝天,干净的土壤和水更有用处。

    作为人口主体的工人、农民,他们的诉求无法被提出,只能作为城市白领诉求的附属。当城市白领的诉求与工农的诉求相冲突时,我们就会看到一种怪象:打着“大众”的名义提出的诉求与大众的利益根本违背。教育改革就是这样的一个例子。当重点大学里的农村学生比例自1990年代不断滑落,当农村学生考上任何高等教育机构的几率只有城市学生的1/8、考上顶尖大学的几率只有1/21,在教育领域年年被提出的议题却是“全面推进素质教育”。当作为高收入阶层的知识分子、城市白领占据“中产”的地位,真正的“大众”就在信息技术的飞速发展中被噤声了。

    斯皮瓦克问“底层人能说话吗”,而我们看到的是,作为大多数的工农阶层都不能说话。这个现状与信息技术在中国的发展历程不无关系。正如邱林川指出的,从寻呼机,到小灵通,到功能机,到短信……中国信息技术的升级换代从来不是为了用户的便利,而是为了创造更大的利润。为了兑现利润,信息技术的提供者不仅尽快下线旧技术,而且通过“中产阶级”的传播空间制造对新技术的渴望。在这个过程中,大多数人仅仅被视为消费的主体而存在。网吧的发展历程很能折射这样一个状况:当年的天宇网吧还承担了社区网络接入和信息技术教育的作用,而自从蓝极速网吧大火以后,网吧就完全成了吸引消费、令人成瘾的一种工具。

    制造i奴

    网游、页游吸引着众多年轻的农民和工人。据新浪游戏调查,不少富士康工人把大半休息时间花在游戏上,因为这是他们“所能找到的最省钱的娱乐方式”。他们“日复一日地玩着游戏并不是因为它多有趣,而是单纯的‘不知道还能干嘛’”。以富士康为代表的现代工厂在每天超过十小时的工作时间中占有工人的劳动与自由,随后互联网带来的成瘾性消费来榨干这些年轻人剩下的时间和仅有的余钱。整个体系严丝合缝,把这些工人变成了推动信息产业发展的奴工。

    被这些奴工生产出来的信息产品(例如iPhone)则以一种更隐蔽的方式将更多的人变成奴隶——邱林川把这种“信息时代的奴隶”称为“i奴”。17世纪的奴隶制有两个根本支柱:一端是对奴隶的人身控制从而获得廉价劳动,另一端则是制造成瘾性消费从而创造持续大量的需求。例如蔗糖、咖啡、烟草、可可、鸦片,都是这种成瘾性消费的例子。在信息时代,对“i奴”的人身控制是通过富士康的“半军事化管理”来实现的,成瘾性消费则是通过无孔不入的意识形态灌输塑造的。和90年代不同,现代越来越多的软件应用打着“社交”、“休闲”之类的旗号,实质上就是起到令使用者成瘾的效果。当我们后退两步审视这些信息工具是否真的让我们的生活变得更美好,得到的答案可能很不确定;可以确定的是,在体验设计、大数据等技术的帮助下,信息产品越来越有效地使用户成瘾,并不断消费。不仅富士康的工人成为信息时代的奴隶,信息产品的消费者也成了全年无休的“i奴”,就连节日也被变成了消费的诱因

    这个趋势在未来的发展可能相当可怕。我们已经可以预见一些技术例如无人驾驶汽车的发展能带来什么影响。当深度学习和各种智能设备得到充分发展,人类有可能陷入一种完全被奴役而失去自由的悲惨状态:人们起床、吃饭、上班,却完全不知道做这些事的意义,沦为被机器控制的奴隶。这种可能的前景,要求IT的从业者对未来、对自己创造的技术工具充满警惕。

    程序员应有的责任

    面对科技可能被用来作恶的现实与未来,IT专业人士不能再用“科技中立论”为借口回避社会责任问题。科技可以没有价值判断,但使用科技的人有。如果做搜索引擎的人在自己家人生病时不用自己做的搜索引擎寻医问药,如果做视频网站的人不会让自己的女儿看自己做的视频网站上的内容,如果做社交网络的人劝告自己的父母不要相信自己做的社交网络上传播的信息,那就说明这些人知道自己是在作恶。IT专业人士有责任用“是否愿意让自己家人使用”这个标准来要求自己的工作,对使用科技可能造成的后果充满警惕,这样才有可能避免技术给我们带来一个黑暗的未来。


  7. 领导力发展方法:行动学习

    Ericsson等人在那篇著名的论文中介绍了刻意练习在专家技能的获取过程中的重要性。他们这样谈到在受试者提升绩效的过程中起作用的因素:

    最重要的因素是受试者的动机及投入的努力。除此之外,任务的设计必须考虑到学习者既有的知识,以学习者能在接受简单的指示之后能正确理解为宜。学习者需要得到及时的、有信息量的反馈,以便了解他们的表现。学习者需要不断重复相同或相似的任务。

    科尔文在《哪来的天才》中指出了刻意练习的几个特征:第一,它是为了提高绩效而被设计出来的;第二,它可以重复很多次;第三,对结果的反馈是可持续得到的。(以及,第四,它是非常费神的;第五,它并没有多少乐趣。)由这几个特征可以看到尝试用刻意练习方法发展领导力的困难。因为需要使用领导力的场景是罕见的,甚至在领导者的日常工作中也并不常见;并且使用领导力往往带来较大的影响和风险。所以,在发展高潜力领导者时,一个挑战就是难以给他们创造适于他们提升绩效的、可以重复进行的练习。很多组织会采用工匠体系中“师父带徒弟”的方式来培养领导者,这种方式解决了“快速得到反馈”的要求,但仍然不能解决“缺乏练习机会”的困难。

    为了给高潜力领导者创造更多练习使用领导力的机会,我们引入了行动学习这个方法。在一轮行动学习的6个月中,一组学员会被分配一个重要、关键、且复杂的真实问题,然后把自己放在企业领导者的视角上来分析这个问题,提出解决方案,并推动解决方案落地实施。通过这个过程,学员会有三重收获:解决问题,个人领导力发展,以及团队领导力发展。我们的导师把它称为“一鱼三吃”。

    对于现代企业中的领导者而言,有几种基本的品质至关重要。首先是Vulnerability:敢于暴露自己的弱点,反而会使自己成为更强大的领导者。其次是Resilience:重要的不是避免挫折,而是如何从挫折中反弹。以及,Learning Agility:如何保持灵活性、从错误中获得成长、并面对各种不同的挑战。通过行动学习中反复的练习和高密度的反馈,学员们得以有针对性地提高自己的领导品质、以及具体的关键领导力。

    在未来6个月的行动学习中,学习小组会遇到各种各样的挑战。行动学习小组的导师、sponsor(由公司的资深领导者担任)和整个公司的管理团队都是这些未来领导者可以调用的资源。在压力与挑战面前,他们会走得多远,我们拭目以待。


  8. 警惕分享经济的暗面

    (本文精简版以“发展分享经济 需防范潜在风险”为题发表于《经济日报》,全文以“不谈“分担“的分享经济是耍流氓”为题首发于破土网。)

    分享经济(Sharing Economy)是时下方兴未艾的新经济形态。据国家信息中心信息化研究部和中国互联网协会分享经济工作委员会发布的报告,2015年我国分享经济市场规模约1.95万亿元,分享经济提供服务者约5000万,保守估计参与分享经济的活动总人数超5亿。而且预计未来五年我国分享经济增长年均速度将在40%左右,到2020年市场规模或将占我国GDP的10%以上。通过去除市场中介、将服务提供者与消费者直接联结,分享经济使消费者享受到更便宜、更便捷的服务,从而创造巨大的市场空间。除了经济效益以外,分享经济还能通过提升资源利用率而创造显著的社会效益,例如分享租车公司Liftshare就称其服务每年能减排二氧化碳11万吨

    在鼓励企业发展分享经济的同时,政府监管部门也需要同时注意到分享经济存在的一些潜在问题。本文将结合其他国家、尤其是欧美发达国家的经验,讨论分享经济在这些国家已经暴露出来的一些比较严重的问题。针对这些潜在风险,政府需要早做准备,对企业和行业加以合理的监管与引导。

    全球分享经济业态首当其冲面临的问题是公共责任的缺失。2013年,纽约市政府对AirBnb的用户Nigel Warren处以总计约7千美元罚款,从而认定AirBnb根本的业务模式——短期租房——为非法。甚至在AirBnb大本营的旧金山市,短期出租公寓在很长时间内也属于非法行为。究其原因,就在于AirBnb运营的短租房业务实质上提供了酒店的服务,也收取了相当于酒店的费用,却没有承担酒店行业本应承担的社会责任。仅就酒店税一项,AirBnb拖欠旧金山市的税款据估计一度高达2500万美元。在政府的持续施压下,AirBnb已经开始在一些地区开始缴纳酒店税

    AirBnb的例子对于各种业态的分享经济都是一个很好的警示。具体而言,在基于互联网的新业态面前,原来的税收与监管无法生效,从而使分享经济成了逃避税收及其他社会责任的灰色地带。仍以AirBnb为例:由于大量公寓短期出租,原本的居民社区实际上变成了游客社区,公共设施、安全等方面都需要承担更大的压力,然而AirBnb却并不负担对应的税收成本,等于是侵占公共权益为企业营利。正如《卫报》的一位专栏作家所说,不应该仅仅因为一些公司通过互联网提供服务就豁免他们接受管制和纳税的义务。政府以税赋的方式为各行各业设定了参与社会整体建设的机制,而一些新兴企业打着“分享经济”的旗号,享受社会整体建设的成果、却逃避其应有的责任,这显然不是应该得到鼓励的分享经济形态。

    在逃避社会责任的同时,对应的超额利润却并非总是——像这些企业宣传的那样——被“分享”给真正提供服务的劳动者。以互联网租车的领导者优步为例,尽管优步一直宣称其业务模式能提高劳动者的收入水平,然而真实的数据却并不乐观。有研究者指出,尽管优步司机得到的收入普遍高于出租车司机,但一旦算进用车养车成本,优步司机的实际收入很可能还不如出租车司机,且安全条件更差。更甚一步,优步在快速占领市场、形成实际上的垄断之后,就开始单方面修改与司机之间的协议。例如一位西雅图的司机透露,优步最初以每小时25美元收入吸引他加盟,最后他的收入却一路降低到了每小时2.64美元。正如一位来自伯克利的研究者所说,临时性、非全职的工作、通过中介雇佣或根本没有雇佣关系,这些工作形式会严重损害劳动者在企业面前的议价权,从而导致劳动环境恶化:收入被压低,劳动者不得不工作更长的时间。

    垄断企业拒绝分享的不仅是利润,还有保护劳动者及消费者安全的责任。据美国职业安全与健康管理局的统计,出租车司机比从事其他职业的劳动者被谋杀的几率高20倍以上。然而Uber和Lyft等提供分享租车服务的公司却拒绝为司机提供任何保障。另一方面,当司机对乘客施以暴力、甚至当街开枪杀人,优步只是坚称其针对司机的背景调查“非常可靠”,同样拒不承担任何责任。当越来越多的声音开始质疑优步宣称的安全性,优步的反应只是去掉了诸如“最安全的乘车方式”等宣传词,并将每次乘车时收取的1美元“安全乘车费”改为“叫车费”。风险仍然全在司机与乘客身上。

    以优步为代表的分享经济企业有一个常见的逻辑:他们提供的只是“平台”,在平台上提供服务的劳动者并非企业的雇员,因此平台也无需对服务提供过程中出现的问题负责。然而随着平台垄断程度的提高,越来越多的劳动者实际上已经在为某个或一两个平台全职工作。例如一个针对美国网租车司机的调查显示,超过90%的司机服务于Uber和Lyft两家平台。当劳动者实际上全职为一家公司服务,再用“平台”的说辞拒绝承认劳动雇佣关系,就纯粹是企业转移风险的手段:将收入不稳定、不可逆转的资本投入、潜在的犯罪、突发事件的风险都转嫁到了个人身上。在国内,我们也看到一些分享经济“平台”以“解放手艺人”、“实现财务、时间、心灵三大自由”等口号吸引劳动者,却并不提供国家明文规定的劳动保障。这种损害劳动者权益的做法,反过来又会增加安全风险,而且对社会安定和谐带来隐患。

    作为新生事物,分享经济对传统的法律和监管体系带来冲击是情理之中的事。各个领域对应的政府监管部门需要保持对分享经济形态的关注,尤其关注其中是否存在侵占公共利益、损害劳动者权益、推卸企业社会责任的情况,并及时予以干预。同时,正如麦肯锡的一篇文章所说,新环境下的企业应当主动寻求与政府合作,共同订立适合新技术和商业环境的监管框架,从而使科技创新的力量健康发挥。例如滴滴出行与政府部门和行业专家积极合作,升级安全审核标准,主动承担交通事故时的赔偿责任,就是一个行业自律、政企协作、共同探索分享经济健康发展路径的好例子。

    针对分享经济发展的现状和潜在风险,笔者向政府监管部门提出三点建议。第一, 政府监管部门需要建设与移动互联网时代相匹配的技术手段,改变各地监管各自为政的局面,对基于互联网经营的分享经济企业全国统一管理,直接从企业总部获取第一手营运数据,根据数据依法、如实收取税费,并基于大数据分析对行业进行统筹管理。第二,要将安全、用户隐私、乃至环境保护等社会责任落实在企业主体身上,杜绝企业以“分享”为由推卸社会责任。第三,要着力维护分享经济形态中劳动者的权益,约束企业随意操纵定价、榨取劳动者利益的行为,确保劳动者在自由参与分享经济的同时享有“五险一金”等社会保障。唯有政府监管部门负起责任,做好上述三方面监管工作,方能确保分享经济以对企业、消费者、劳动者、社会几方都有益的轨道上健康发展。


  9. 关于人工智能的三个误解

    (本文首发于破土网)

    刚刚过去的一个星期,围棋受到了前所未有的关注。韩国棋手李世乭与Google的人工智能AlphaGo的五番棋进展到了第四局,广大棋迷乃至全人类经历了由妄自尊大、到灰心丧气、到正视自我、再到重燃希望的大起大落。夸张一点,甚至可以说有了人工智能这面镜子才让人类照出了完整的自我。

    不过,站在这个(可能是)历史的拐点上,很多人还未理解到底像AlphaGo这样的人工智能到底是什么东西。有人担心人工智能马上就要开始像“天网”一样统治人类,也有人认为人工智能无非是榔头钉锤一样的工具。笔者虽然不是专家,希望凭多年在IT行业里工作的积累,澄清一些对于人工智能的常见误解,帮助读者更好地理解人工智能。

    误解1:人工智能已经有智慧

    围棋能下赢九段高手,这还不叫有智慧吗?

    然而并不……AlphaGo使用的技术在过去一段时间已经被广泛讨论了,它最核心的技术叫做“深度学习”,Wikipedia这样解释这个词:

    深度学习(英语:deep learning)是机器学习的一个分支,它基于试图使用包含复杂 结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

    听起来非常高冷,过度简化地说,这就是一种基于历史数据进行模式匹配、从而预测未来的技术。“学习”这个词很容易让人觉得人工智能可以像小动物甚至小孩一样,看见什么就学什么。其实人工智能的“学习”,准确说应该叫“训练”。可以举个简单的例子:如果你拿一大堆北京的城市风景图片输入给一个程序,并且把对比度低于某个值的图片标记为“雾霾”,经过比较大量(可能几十张图片)的训练之后,这个程序就能比较准确地判断今天是不是又一个雾霾天。

    AlphaGo当然比这个“雾霾人工智能”复杂得多,但根本的原理是相似的。能训练哪个领域、能看什么历史数据、期望达成什么结果,这都是程序员编程指定的。比如今天的AlphaGo就只能下围棋,你要是把它连上五子棋盘,星小目开局在五子棋规则下就是找死……

    在不远的将来,我们很可能会看到AlphaGo(或者它的更高级版本)被用于处理各种各样不同的问题。但就像今天IBM的Watson被用在医学、法律、零售等很多领域一样,即使是同一个人工智能程序,它的每个实例仍然只会被用于处理一种问题。只会处理一种特定问题的人工智能,当然不能被认为“有智慧”。

    误解2:人工智能一定受控于人类

    既然人工智能没有智慧,它就不会有自己的想法,它做的一举一动都应该是受控于人类的对吧?在AlphaGo与李世乭开战前,一位“人工智能学家”就提出了这样的意见,要求Google公开AlphaGo总结出的“围棋规律”。既然是人造出来的工具,又没有自己的智慧,没道理它会掌握人理解不了的知识,对吧?

    可惜,又要让大家失望了。机器学习本质上可以看作一种优胜劣汰的达尔文主义:计算机只管筛选有效的判断、淘汰无效的判断,逐渐提高统计意义上预测的成功率。至于这个预测为什么“正确”,计算机既没有意愿、也没有能力回答。机器学习解决的是“相关性”(correlation)的问题,而不是“因果性”(causality)的问题。这也就是说,像AlphaGo这样的人工智能可能有一大堆知识使它能下九段水平的围棋,但这些知识背后并没有一个(或者多个)理论体系能把它们串起来,所以人类不一定能理解为什么这些知识有效。

    在赢了李世乭第二盘棋以后,棋迷们开始认真思考一个问题: AlphaGo的棋力究竟有多强?是否已经接近(甚至达到)了“围棋上帝”的水平?而在赢了第三盘之后,一些棋迷开始细思恐极:先不说AlphaGo的水平有多高,如果从此以后人类再也无法接近它的水平,我们是否还能理解AlphaGo下出的棋?AlphaGo朝着围棋上帝一路狂奔,而人类连它的脚印都找不到,这才是最可怕的情况。

    幸好,今天李世乭用一场胜利向我们证明:AlphaGo的水平虽高,也还是人类能理解、能达到的高水平。然而人工智能绝尘而去这种风险仍然存在。当人工智能可以针对某一领域的问题做出人类不可替代的决策,而人类又完全无法理解这个决策背后的理由,我们如何能说人类“控制”了人工智能?这个工具,可不一定是永远受控于人类的。

    误解3:人工智能不会害人

    既然人工智能没有智慧,它自然就是跟榔头钉锤一样的工具。工具从来都是为人服务的,就算人工智能有了人类理解不了的某种知识,那也就跟人类无法跟火车头比力气一样,正常。归根到底,人工智能有机器人三定律管着呢,不可能像天网或者Matrix那样来统治人类,更不可能害人类,对吧?

    首先,咱们来聊聊机器人三定律。这三条定律是这么说的:

    一 机器人不得伤害人类,或因不作为使人类受到伤害。
    二 除非违背第一定律,机器人必须服从人类的命令。
    三 除非违背第一及第二定律,机器人必须保护自己。

    然后呢,亮点在于……这三条定律从!来!没!有!实!施!过!

    机器人三定律是且仅是科幻小说中的设定。现实世界里的所有机器人(以及人工智能)从来没有被“植入”过三定律。实际上,严肃的人工智能研究者认为三定律根本行不通。在真实的世界里,机器人(以及人工智能)只会忠实其设计者设定的指令。跟李世乭下一盘围棋,还是操作无人机杀死阿富汗的无辜平民,对于计算机来说根本没有任何区别,有区别的只是背后下达指令的人。

    所以,即使从一个非常实用的意义上,是的,人工智能当然有可能害人,因为控制这些人工智能的人可能有动机害人。富士康可以用机器人取代工人,在不远的将来机器学习技术也可能取代众多白领的工作。如果这些失业的人没有基本的社会保障,是的,他们就是机器的受害者。人工智能可以害人,正如刀子可以杀人一样。

    在一个哲学的意义上,人工智能甚至有可能对整个人类造成危害。布林约尔松在《与机器赛跑》中讲到,如果使用得当,计算机器可以扩展人类的思维边界、帮助人类达到前所未有的思想高度。试想一下,如果下一次的围棋比赛是李世乭和柯洁分别与人工智能组队竞赛,那将把围棋推到何种高度?但如果使用不当,计算机器也可以使人类中的一大部分失去一切竞争力、甚至失去生而为人的尊严。正如笔者在另一篇文章中所说,掌握必要知识与技能的人与机器协作如鱼得水,不具备这些知识与技能的人则连出卖劳动力的机会都被剥夺。教育的不均衡与不平等加上人工智能的普遍使用,会无可逆转地加剧阶级分裂和阶级固化。这种或许听来耸人听闻的未来图景,需要我们所有人提起足够的重视。


  10. IT的战略重要性及人才挑战

    IT在过去数十年中一直在企业扮演重要角色。Porter和Heppelmann将过去半个世纪里IT的发展总结为“三次浪潮”,这三次技术的浪潮重塑了企业的战略以及企业之间的竞争。经过这三次浪潮的洗礼,IT在组织战略的核心扎根越来越深。本文尝试以文献综述的形式,勾画出IT技术的战略重要性、以及数字化浪潮带来的人才挑战。

    三次浪潮

    第一次IT浪潮(从1960年代开始)关注如何将价值链中的各项活动自动化。Porter和Millar在1985年的文章里把价值链中的活动分为9类,其中5类是主价值链活动:输入物流、操作、输出物流、市场/销售、服务,另外4类是支撑活动:公司基础设施、人力资源管理、技术开发、采购。这9项活动各自都有涉及信息处理的部分,利用IT可以显著提升每项活动中信息处理环节的效能。

    第二次IT浪潮(开始于1980及1990年代)关注价值链各项活动之间的协作与整合。正如Porter在2001年的文章里所说,当互联网连接越来越便宜、越来越可达,企业就能借助互联网更加精确地接收和响应市场信号。互联网会对行业中5项竞争因素同时产生影响,尤其是会提升买家的议价能力、降低行业进入门槛,从而使竞争变得更为激烈。

    前两次IT浪潮创造了巨大的生产力提升,但这种提升只是现有价值链的改善,而产品/服务本身并未受到很大影响。最近才开始的第三次浪潮则把IT嵌入了产品/服务本身。对现有产品和服务的数字化将从根本上改变竞争的地平线。像中国的“互联网+”这样的国家战略更进一步地推动了这次浪潮。从银行出租车,IT正在渗入并颠覆各个行业。

    技术内核

    数字化浪潮的核心有几项重要的技术。IBM的研究列出了4项最重要的技术发展趋势:大数据及分析云计算移动社交。这份研究显示,这些技术的早期采用者在加速创新、提升消费者体验、优化决策过程、增进员工效能等方面达成业务目标的可能性比尚未采用这些技术的企业高一个数量级。

    根据Shaw的文章,人类社会如今每年制造以ZB为单位的数据量。Manyika等人研究了大数据技术在5个不同领域(医疗、公共事务、零售、制造、个人位置信息)的应用,发现愈发频繁和精确的过程数据使得更准确的产品/服务定制成为可能,并改善组织的决策过程。例如在零售业中应用大数据可以将利润率提升60%以上。获得和使用大量过程数据的能力已经成为众多企业竞争与成长的基础。

    Bughin、Chui和Manyika的文章指出,社交媒体可以创造万亿美元级别的价值,并通过改善协作与沟通将工作人员之间交互的效能提升20%到25%。社交媒体的价值往往通过移动技术得以体现。Manyika、Chui和Bughin的另一篇文章估计,到2025年,移动互联网将影响43亿人的生活,对全球经济的影响达到十万亿规模。Sheng、Nah和Siau的研究提到,移动技术能消除关键信息访问中的时间和空间限制,增强通信、协调、合作及知识交换的能力,从而提升劳动者的灵活性。

    最后但绝非最不重要的,云计算是IT灵活性的基础。Manyika、Chui和Bughin估计,到2025年,云计算的总体经济影响可达数万亿美元。云计算创造价值的主要方式是以云的方式提供服务和应用,以及提升企业IT的效能。

    人才挑战

    上述促成数字化浪潮的4项最重要的技术发展趋势——大数据及分析、云计算、移动、社交——都需要高级别的IT技能。技术型人才的短缺是全球现象。

    根据Davenport和Patil的文章,大数据分析所需的人才——他们称之为“数据科学家”——是“数据黑客、分析师、沟通者和建议者的混合体”。这些数据科学家需要掌握统计知识,对业务有深入理解,而且还必须编程,经常还会用到一些相当新的技术(例如Hadoop、Python和D3.js)。SAS和Accenture的研究显示,大多数美国企业计划在短期内升级其数据分析技能,途径可能是提升现有员工的分析技能,或招聘新的分析人才。Gartner预测从2012年到2015年会有440万个与大数据相关的新工作岗位。Barth和Bean的调查数据显示,在如此强烈的需求环境下,66%的企业认为找到和聘用数据科学家“非常困难或不可能”,没有任何受访企业认为“找到所需的技能毫无问题”。

    移动(和社交)应用开发者同样有很高的需求。据信从2010年至2020年间,移动应用开发的岗位总数会增加32%,创造约29万个新工作岗位。开发移动应用需要丰富多样的技术能力,例如面向对象编程语言、Web开发、移动平台特有的API、跨平台移动套装、数据库管理、网络集成、安全等等。OmojolaHalf等人的文章能折射业内普遍的意见:找到具备合适技能的移动开发者并不容易。

    云计算也是一个边缘学科,同时需要IT运维和编程的技能。据Lombardi引用WANTED Analytics的数据,近几年来,对云计算技能的需求每年都在翻番。根据Khan和Sikes的调查,高科技及专业服务业内40%以上的组织感到,在未来12个月里找到所需的云计算及分布式计算技能“很有压力”。

    要言之,上述4项重要的技术趋势都要求坚实的编程技能作为基础,同时还需要适应快速变化的商业和技术环境,要求技术专家同时具备快速学习、顺畅沟通等能力。这种复合技能的要求,使得组织更加难以获得所需的人才。