透明思考


Transparent Thoughts


  1. 警惕分享经济的暗面

    (本文精简版以“发展分享经济 需防范潜在风险”为题发表于《经济日报》,全文以“不谈“分担“的分享经济是耍流氓”为题首发于破土网。)

    分享经济(Sharing Economy)是时下方兴未艾的新经济形态。据国家信息中心信息化研究部和中国互联网协会分享经济工作委员会发布的报告,2015年我国分享经济市场规模约1.95万亿元,分享经济提供服务者约5000万,保守估计参与分享经济的活动总人数超5亿。而且预计未来五年我国分享经济增长年均速度将在40%左右,到2020年市场规模或将占我国GDP的10%以上。通过去除市场中介、将服务提供者与消费者直接联结,分享经济使消费者享受到更便宜、更便捷的服务,从而创造巨大的市场空间。除了经济效益以外,分享经济还能通过提升资源利用率而创造显著的社会效益,例如分享租车公司Liftshare就称其服务每年能减排二氧化碳11万吨

    在鼓励企业发展分享经济的同时,政府监管部门也需要同时注意到分享经济存在的一些潜在问题。本文将结合其他国家、尤其是欧美发达国家的经验,讨论分享经济在这些国家已经暴露出来的一些比较严重的问题。针对这些潜在风险,政府需要早做准备,对企业和行业加以合理的监管与引导。

    全球分享经济业态首当其冲面临的问题是公共责任的缺失。2013年,纽约市政府对AirBnb的用户Nigel Warren处以总计约7千美元罚款,从而认定AirBnb根本的业务模式——短期租房——为非法。甚至在AirBnb大本营的旧金山市,短期出租公寓在很长时间内也属于非法行为。究其原因,就在于AirBnb运营的短租房业务实质上提供了酒店的服务,也收取了相当于酒店的费用,却没有承担酒店行业本应承担的社会责任。仅就酒店税一项,AirBnb拖欠旧金山市的税款据估计一度高达2500万美元。在政府的持续施压下,AirBnb已经开始在一些地区开始缴纳酒店税

    AirBnb的例子对于各种业态的分享经济都是一个很好的警示。具体而言,在基于互联网的新业态面前,原来的税收与监管无法生效,从而使分享经济成了逃避税收及其他社会责任的灰色地带。仍以AirBnb为例:由于大量公寓短期出租,原本的居民社区实际上变成了游客社区,公共设施、安全等方面都需要承担更大的压力,然而AirBnb却并不负担对应的税收成本,等于是侵占公共权益为企业营利。正如《卫报》的一位专栏作家所说,不应该仅仅因为一些公司通过互联网提供服务就豁免他们接受管制和纳税的义务。政府以税赋的方式为各行各业设定了参与社会整体建设的机制,而一些新兴企业打着“分享经济”的旗号,享受社会整体建设的成果、却逃避其应有的责任,这显然不是应该得到鼓励的分享经济形态。

    在逃避社会责任的同时,对应的超额利润却并非总是——像这些企业宣传的那样——被“分享”给真正提供服务的劳动者。以互联网租车的领导者优步为例,尽管优步一直宣称其业务模式能提高劳动者的收入水平,然而真实的数据却并不乐观。有研究者指出,尽管优步司机得到的收入普遍高于出租车司机,但一旦算进用车养车成本,优步司机的实际收入很可能还不如出租车司机,且安全条件更差。更甚一步,优步在快速占领市场、形成实际上的垄断之后,就开始单方面修改与司机之间的协议。例如一位西雅图的司机透露,优步最初以每小时25美元收入吸引他加盟,最后他的收入却一路降低到了每小时2.64美元。正如一位来自伯克利的研究者所说,临时性、非全职的工作、通过中介雇佣或根本没有雇佣关系,这些工作形式会严重损害劳动者在企业面前的议价权,从而导致劳动环境恶化:收入被压低,劳动者不得不工作更长的时间。

    垄断企业拒绝分享的不仅是利润,还有保护劳动者及消费者安全的责任。据美国职业安全与健康管理局的统计,出租车司机比从事其他职业的劳动者被谋杀的几率高20倍以上。然而Uber和Lyft等提供分享租车服务的公司却拒绝为司机提供任何保障。另一方面,当司机对乘客施以暴力、甚至当街开枪杀人,优步只是坚称其针对司机的背景调查“非常可靠”,同样拒不承担任何责任。当越来越多的声音开始质疑优步宣称的安全性,优步的反应只是去掉了诸如“最安全的乘车方式”等宣传词,并将每次乘车时收取的1美元“安全乘车费”改为“叫车费”。风险仍然全在司机与乘客身上。

    以优步为代表的分享经济企业有一个常见的逻辑:他们提供的只是“平台”,在平台上提供服务的劳动者并非企业的雇员,因此平台也无需对服务提供过程中出现的问题负责。然而随着平台垄断程度的提高,越来越多的劳动者实际上已经在为某个或一两个平台全职工作。例如一个针对美国网租车司机的调查显示,超过90%的司机服务于Uber和Lyft两家平台。当劳动者实际上全职为一家公司服务,再用“平台”的说辞拒绝承认劳动雇佣关系,就纯粹是企业转移风险的手段:将收入不稳定、不可逆转的资本投入、潜在的犯罪、突发事件的风险都转嫁到了个人身上。在国内,我们也看到一些分享经济“平台”以“解放手艺人”、“实现财务、时间、心灵三大自由”等口号吸引劳动者,却并不提供国家明文规定的劳动保障。这种损害劳动者权益的做法,反过来又会增加安全风险,而且对社会安定和谐带来隐患。

    作为新生事物,分享经济对传统的法律和监管体系带来冲击是情理之中的事。各个领域对应的政府监管部门需要保持对分享经济形态的关注,尤其关注其中是否存在侵占公共利益、损害劳动者权益、推卸企业社会责任的情况,并及时予以干预。同时,正如麦肯锡的一篇文章所说,新环境下的企业应当主动寻求与政府合作,共同订立适合新技术和商业环境的监管框架,从而使科技创新的力量健康发挥。例如滴滴出行与政府部门和行业专家积极合作,升级安全审核标准,主动承担交通事故时的赔偿责任,就是一个行业自律、政企协作、共同探索分享经济健康发展路径的好例子。

    针对分享经济发展的现状和潜在风险,笔者向政府监管部门提出三点建议。第一, 政府监管部门需要建设与移动互联网时代相匹配的技术手段,改变各地监管各自为政的局面,对基于互联网经营的分享经济企业全国统一管理,直接从企业总部获取第一手营运数据,根据数据依法、如实收取税费,并基于大数据分析对行业进行统筹管理。第二,要将安全、用户隐私、乃至环境保护等社会责任落实在企业主体身上,杜绝企业以“分享”为由推卸社会责任。第三,要着力维护分享经济形态中劳动者的权益,约束企业随意操纵定价、榨取劳动者利益的行为,确保劳动者在自由参与分享经济的同时享有“五险一金”等社会保障。唯有政府监管部门负起责任,做好上述三方面监管工作,方能确保分享经济以对企业、消费者、劳动者、社会几方都有益的轨道上健康发展。


  2. 关于人工智能的三个误解

    (本文首发于破土网)

    刚刚过去的一个星期,围棋受到了前所未有的关注。韩国棋手李世乭与Google的人工智能AlphaGo的五番棋进展到了第四局,广大棋迷乃至全人类经历了由妄自尊大、到灰心丧气、到正视自我、再到重燃希望的大起大落。夸张一点,甚至可以说有了人工智能这面镜子才让人类照出了完整的自我。

    不过,站在这个(可能是)历史的拐点上,很多人还未理解到底像AlphaGo这样的人工智能到底是什么东西。有人担心人工智能马上就要开始像“天网”一样统治人类,也有人认为人工智能无非是榔头钉锤一样的工具。笔者虽然不是专家,希望凭多年在IT行业里工作的积累,澄清一些对于人工智能的常见误解,帮助读者更好地理解人工智能。

    误解1:人工智能已经有智慧

    围棋能下赢九段高手,这还不叫有智慧吗?

    然而并不……AlphaGo使用的技术在过去一段时间已经被广泛讨论了,它最核心的技术叫做“深度学习”,Wikipedia这样解释这个词:

    深度学习(英语:deep learning)是机器学习的一个分支,它基于试图使用包含复杂 结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

    听起来非常高冷,过度简化地说,这就是一种基于历史数据进行模式匹配、从而预测未来的技术。“学习”这个词很容易让人觉得人工智能可以像小动物甚至小孩一样,看见什么就学什么。其实人工智能的“学习”,准确说应该叫“训练”。可以举个简单的例子:如果你拿一大堆北京的城市风景图片输入给一个程序,并且把对比度低于某个值的图片标记为“雾霾”,经过比较大量(可能几十张图片)的训练之后,这个程序就能比较准确地判断今天是不是又一个雾霾天。

    AlphaGo当然比这个“雾霾人工智能”复杂得多,但根本的原理是相似的。能训练哪个领域、能看什么历史数据、期望达成什么结果,这都是程序员编程指定的。比如今天的AlphaGo就只能下围棋,你要是把它连上五子棋盘,星小目开局在五子棋规则下就是找死……

    在不远的将来,我们很可能会看到AlphaGo(或者它的更高级版本)被用于处理各种各样不同的问题。但就像今天IBM的Watson被用在医学、法律、零售等很多领域一样,即使是同一个人工智能程序,它的每个实例仍然只会被用于处理一种问题。只会处理一种特定问题的人工智能,当然不能被认为“有智慧”。

    误解2:人工智能一定受控于人类

    既然人工智能没有智慧,它就不会有自己的想法,它做的一举一动都应该是受控于人类的对吧?在AlphaGo与李世乭开战前,一位“人工智能学家”就提出了这样的意见,要求Google公开AlphaGo总结出的“围棋规律”。既然是人造出来的工具,又没有自己的智慧,没道理它会掌握人理解不了的知识,对吧?

    可惜,又要让大家失望了。机器学习本质上可以看作一种优胜劣汰的达尔文主义:计算机只管筛选有效的判断、淘汰无效的判断,逐渐提高统计意义上预测的成功率。至于这个预测为什么“正确”,计算机既没有意愿、也没有能力回答。机器学习解决的是“相关性”(correlation)的问题,而不是“因果性”(causality)的问题。这也就是说,像AlphaGo这样的人工智能可能有一大堆知识使它能下九段水平的围棋,但这些知识背后并没有一个(或者多个)理论体系能把它们串起来,所以人类不一定能理解为什么这些知识有效。

    在赢了李世乭第二盘棋以后,棋迷们开始认真思考一个问题: AlphaGo的棋力究竟有多强?是否已经接近(甚至达到)了“围棋上帝”的水平?而在赢了第三盘之后,一些棋迷开始细思恐极:先不说AlphaGo的水平有多高,如果从此以后人类再也无法接近它的水平,我们是否还能理解AlphaGo下出的棋?AlphaGo朝着围棋上帝一路狂奔,而人类连它的脚印都找不到,这才是最可怕的情况。

    幸好,今天李世乭用一场胜利向我们证明:AlphaGo的水平虽高,也还是人类能理解、能达到的高水平。然而人工智能绝尘而去这种风险仍然存在。当人工智能可以针对某一领域的问题做出人类不可替代的决策,而人类又完全无法理解这个决策背后的理由,我们如何能说人类“控制”了人工智能?这个工具,可不一定是永远受控于人类的。

    误解3:人工智能不会害人

    既然人工智能没有智慧,它自然就是跟榔头钉锤一样的工具。工具从来都是为人服务的,就算人工智能有了人类理解不了的某种知识,那也就跟人类无法跟火车头比力气一样,正常。归根到底,人工智能有机器人三定律管着呢,不可能像天网或者Matrix那样来统治人类,更不可能害人类,对吧?

    首先,咱们来聊聊机器人三定律。这三条定律是这么说的:

    一 机器人不得伤害人类,或因不作为使人类受到伤害。
    二 除非违背第一定律,机器人必须服从人类的命令。
    三 除非违背第一及第二定律,机器人必须保护自己。

    然后呢,亮点在于……这三条定律从!来!没!有!实!施!过!

    机器人三定律是且仅是科幻小说中的设定。现实世界里的所有机器人(以及人工智能)从来没有被“植入”过三定律。实际上,严肃的人工智能研究者认为三定律根本行不通。在真实的世界里,机器人(以及人工智能)只会忠实其设计者设定的指令。跟李世乭下一盘围棋,还是操作无人机杀死阿富汗的无辜平民,对于计算机来说根本没有任何区别,有区别的只是背后下达指令的人。

    所以,即使从一个非常实用的意义上,是的,人工智能当然有可能害人,因为控制这些人工智能的人可能有动机害人。富士康可以用机器人取代工人,在不远的将来机器学习技术也可能取代众多白领的工作。如果这些失业的人没有基本的社会保障,是的,他们就是机器的受害者。人工智能可以害人,正如刀子可以杀人一样。

    在一个哲学的意义上,人工智能甚至有可能对整个人类造成危害。布林约尔松在《与机器赛跑》中讲到,如果使用得当,计算机器可以扩展人类的思维边界、帮助人类达到前所未有的思想高度。试想一下,如果下一次的围棋比赛是李世乭和柯洁分别与人工智能组队竞赛,那将把围棋推到何种高度?但如果使用不当,计算机器也可以使人类中的一大部分失去一切竞争力、甚至失去生而为人的尊严。正如笔者在另一篇文章中所说,掌握必要知识与技能的人与机器协作如鱼得水,不具备这些知识与技能的人则连出卖劳动力的机会都被剥夺。教育的不均衡与不平等加上人工智能的普遍使用,会无可逆转地加剧阶级分裂和阶级固化。这种或许听来耸人听闻的未来图景,需要我们所有人提起足够的重视。


  3. IT的战略重要性及人才挑战

    IT在过去数十年中一直在企业扮演重要角色。Porter和Heppelmann将过去半个世纪里IT的发展总结为“三次浪潮”,这三次技术的浪潮重塑了企业的战略以及企业之间的竞争。经过这三次浪潮的洗礼,IT在组织战略的核心扎根越来越深。本文尝试以文献综述的形式,勾画出IT技术的战略重要性、以及数字化浪潮带来的人才挑战。

    三次浪潮

    第一次IT浪潮(从1960年代开始)关注如何将价值链中的各项活动自动化。Porter和Millar在1985年的文章里把价值链中的活动分为9类,其中5类是主价值链活动:输入物流、操作、输出物流、市场/销售、服务,另外4类是支撑活动:公司基础设施、人力资源管理、技术开发、采购。这9项活动各自都有涉及信息处理的部分,利用IT可以显著提升每项活动中信息处理环节的效能。

    第二次IT浪潮(开始于1980及1990年代)关注价值链各项活动之间的协作与整合。正如Porter在2001年的文章里所说,当互联网连接越来越便宜、越来越可达,企业就能借助互联网更加精确地接收和响应市场信号。互联网会对行业中5项竞争因素同时产生影响,尤其是会提升买家的议价能力、降低行业进入门槛,从而使竞争变得更为激烈。

    前两次IT浪潮创造了巨大的生产力提升,但这种提升只是现有价值链的改善,而产品/服务本身并未受到很大影响。最近才开始的第三次浪潮则把IT嵌入了产品/服务本身。对现有产品和服务的数字化将从根本上改变竞争的地平线。像中国的“互联网+”这样的国家战略更进一步地推动了这次浪潮。从银行出租车,IT正在渗入并颠覆各个行业。

    技术内核

    数字化浪潮的核心有几项重要的技术。IBM的研究列出了4项最重要的技术发展趋势:大数据及分析云计算移动社交。这份研究显示,这些技术的早期采用者在加速创新、提升消费者体验、优化决策过程、增进员工效能等方面达成业务目标的可能性比尚未采用这些技术的企业高一个数量级。

    根据Shaw的文章,人类社会如今每年制造以ZB为单位的数据量。Manyika等人研究了大数据技术在5个不同领域(医疗、公共事务、零售、制造、个人位置信息)的应用,发现愈发频繁和精确的过程数据使得更准确的产品/服务定制成为可能,并改善组织的决策过程。例如在零售业中应用大数据可以将利润率提升60%以上。获得和使用大量过程数据的能力已经成为众多企业竞争与成长的基础。

    Bughin、Chui和Manyika的文章指出,社交媒体可以创造万亿美元级别的价值,并通过改善协作与沟通将工作人员之间交互的效能提升20%到25%。社交媒体的价值往往通过移动技术得以体现。Manyika、Chui和Bughin的另一篇文章估计,到2025年,移动互联网将影响43亿人的生活,对全球经济的影响达到十万亿规模。Sheng、Nah和Siau的研究提到,移动技术能消除关键信息访问中的时间和空间限制,增强通信、协调、合作及知识交换的能力,从而提升劳动者的灵活性。

    最后但绝非最不重要的,云计算是IT灵活性的基础。Manyika、Chui和Bughin估计,到2025年,云计算的总体经济影响可达数万亿美元。云计算创造价值的主要方式是以云的方式提供服务和应用,以及提升企业IT的效能。

    人才挑战

    上述促成数字化浪潮的4项最重要的技术发展趋势——大数据及分析、云计算、移动、社交——都需要高级别的IT技能。技术型人才的短缺是全球现象。

    根据Davenport和Patil的文章,大数据分析所需的人才——他们称之为“数据科学家”——是“数据黑客、分析师、沟通者和建议者的混合体”。这些数据科学家需要掌握统计知识,对业务有深入理解,而且还必须编程,经常还会用到一些相当新的技术(例如Hadoop、Python和D3.js)。SAS和Accenture的研究显示,大多数美国企业计划在短期内升级其数据分析技能,途径可能是提升现有员工的分析技能,或招聘新的分析人才。Gartner预测从2012年到2015年会有440万个与大数据相关的新工作岗位。Barth和Bean的调查数据显示,在如此强烈的需求环境下,66%的企业认为找到和聘用数据科学家“非常困难或不可能”,没有任何受访企业认为“找到所需的技能毫无问题”。

    移动(和社交)应用开发者同样有很高的需求。据信从2010年至2020年间,移动应用开发的岗位总数会增加32%,创造约29万个新工作岗位。开发移动应用需要丰富多样的技术能力,例如面向对象编程语言、Web开发、移动平台特有的API、跨平台移动套装、数据库管理、网络集成、安全等等。OmojolaHalf等人的文章能折射业内普遍的意见:找到具备合适技能的移动开发者并不容易。

    云计算也是一个边缘学科,同时需要IT运维和编程的技能。据Lombardi引用WANTED Analytics的数据,近几年来,对云计算技能的需求每年都在翻番。根据Khan和Sikes的调查,高科技及专业服务业内40%以上的组织感到,在未来12个月里找到所需的云计算及分布式计算技能“很有压力”。

    要言之,上述4项重要的技术趋势都要求坚实的编程技能作为基础,同时还需要适应快速变化的商业和技术环境,要求技术专家同时具备快速学习、顺畅沟通等能力。这种复合技能的要求,使得组织更加难以获得所需的人才。


  4. 互联网创业的幻梦

    (本文同时发表于破土网

    越来越冷的市场环境终于全面波及了互联网创业者们。汽车类O2O一片哀鸿遍野,P2P网贷集体关门跑路,手机游戏倒闭状况惨烈。但即便在这样的行情世道,笔者的一位朋友仍然满腔热情地准备开始互联网创业。“万一做成了呢?”可能每个创业者都怀抱着这样一个——即便渺茫的——希望。可是,这个“万一”,这个即便渺茫的有朝一日大富大贵甚至开创出下一个互联网商业帝国的可能性,它真的存在吗?

    精益创业》把创业的过程总结为“构建-度量-学习”的循环:从一个点子(idea)开始,创业者快速构建(build)出一个产品(product),其目的是在真实用户和市场身上做实验,通过度量(measure)得到数据(data),然后从数据中学习(learn)产生更多的点子,深化或调整创业方向。一般认为,没有大把资源和用户基础的初创企业,优势是“船小好调头”,靠着灵活性快速试错和调整,从而发现尚未被大企业占领的蓝海市场。

    然而麦肯锡的研究报告指出,规模小的企业未必自动成为灵活的创业者(start-up),倒是有可能陷入(trapped)“既小又慢”的状态无法自拔;而规模大的企业也未必总是缓慢的官僚机构(bureaucracy),也有可能是“大且灵活”的敏捷(agile)组织。这对于创业者来说可不算好消息:本来承担风险的能力就已不强,如果再没有敏捷性,“试错”岂不直接就成了“犯错”?那么,进入互联网世界,企业的敏捷性究竟从何而来,普通的创业者能得到这种敏捷性吗?

    敏捷性的第一来源是持续交付(Continuous Delivery)。为了快速、频繁地在真实用户身上做实验,软件开发就不可能是一锤子买卖。一个敏捷的互联网企业必须能快速地修改自己的软件,频繁而无痛地发布新的版本到最终用户。一些著名的互联网产品甚至能做到每天发布上百次。持续交付这事说起来容易,要想真正做到,需要管理、设计、开发、测试、运维等各个环节具备相当高的能力水平。仅仅举个基本的例子:如果没有高度自动化的测试能力、软件功能靠人来测试,每天把功能测上十几遍都不可能,何谈持续交付?而自动化测试的能力,就已经不是轻松能得到的了。

    敏捷性的第二来源是大数据(Big Data)。实验是为了得到数据、并从数据中学习。一个敏捷的互联网企业不仅要随时掌握用户的一举一动,而且要及时分析出用户行为数据背后暗含的意味,从数据中推导出支撑决策的洞见。这整个过程涉及到数据的采集、存储、分析与呈现,不仅对技术要求高,而且需要统计、分析的知识。有大数据技术与方法支撑的商业决策,比起几个带头人拍脑袋出主意,质量自然不可同日而语。

    而为持续交付和大数据提供保障的,则是强大的开发-运维(DevOps)体系。现代互联网企业的运维(Ops)角色早已不是传统观念中的“网管”,而是掌握部署、集群、监控、安全、数据、云等多种技能的高技术复合型人才。为了支持快速、频繁的实验和调整,运维工作中大量操作都被自动化,因此运维人员同时也需要具备相当程度的软件开发(Dev)技能。这样一个人才,身价之高自然也是可想而知。

    由于持续交付、大数据、开发-运维这三项能力对技术要求如此之高,初创企业很难找得到、雇得起、留得住具备这些能力的人,因此无法频繁实验、无法用数据支撑决策,缺乏敏捷性也就在所难免。缺乏敏捷性的初创企业,不仅失败几率更高,而且即使幸运地做到了一定规模,实际上除了等待被收购之外并无继续扩展的可能性。从金字塔上段来看,国内的“独角兽”企业近半已被BAT三家巨头控制,剩下的独立企业也早已成BAT们虎视眈眈的对象。达到独角兽规模的企业尚且如此,更何况白手起家的小企业呢。

    既然已经知道初创企业颠覆不了市场,高高在上的巨头们也就有了压价的底气。在经济规律的作用下,小鱼和虾米们被吃掉时的回报,越来越像是给创业者们开了一份合理的工资;至于创业中的风险,那就由创业者们自己去承担了。于是互联网巨头们既收获到了“万众创新”的好处,又不用承担创新的风险成本和社会成本(比如创业者的五险一金),自然是何乐而不为。当然,有套路的创业者也不会自己去承担创业的风险,而是用一笔又一笔天使投资把自己变成“连续创业者”——说白了,换个办公室打工而已,还要自己付房租水电。

    说回笔者这位满腔热情要去创业的朋友。笔者问她想做什么生意,她踌躇满志地说:想做个互联网上定制服装设计的平台,现在就缺一个搞互联网的和一个搞服装的……我诚恳地祝她生意兴隆。


  5. 2015年五星好书推荐

    2015年又结束了。这个年末有件特别让人沮丧的事:阅读DNA竟然关站了。于是我的年度读书回顾帖只好完全靠自己写。略能令我不那么沮丧的是,今年总共读了63本书,其中五星好书17本。两年前读的书是为了理解,今年所读的书,仍然是在尝试理解几个不同的世界。

    真实的世界

    • 普通媒介学教程 - 媒介学感兴趣的不是意识形态本身,而是让这些意识形态成为可能的东西:一个历史的生态系统,即由人、传递工具和机构组成的集合。
    • 中国女工 - 真实而有力量。女工是国家、资本、父权三重威权塑造的群体,非深入其中无法理解中国社会变迁对劳动者的影响。
    • 21世纪资本论 - 一针见血抓住了经济不平等的本质。提出的解决办法也很有想象力。虽然困难,方向是对的。
    • 暴力 - 对系统暴力的分析鞭辟入里,各种小段子更是令人拍案叫绝。

    历史中的世界

    • 想象的共同体 - 语言和殖民者是形成民族主义的源动力。一开始的民族观念,恰恰来自于殖民者渴望从自己原本的民族中脱离。想到这里,再想到齐泽克说的民族主义如何被用作意识形态的“大他者”,就觉得对国家和民族的迷恋真是可笑。
    • 大波 - 以时人眼光写当时事,再加以对四川市井的深刻了解,又不被后来的意识形态束缚,果真精彩十足。
    • 暴风雨前 - 这人情世故写得才叫委婉、又才叫透彻呢。

    似真似幻的世界

    • 失明症漫记 - 最喜欢他用若无其事的淡然笔触写惊心动魄的人性挑战。
    • 复明症漫记 - 这是对“民主”和“自由”这两个漂亮大词的尖锐讽刺,堪比《美丽新世界》。极右的、放任自由的政治经济体系,背后的一定不是传说中无作为的小政府,而是强大而独裁的法西斯集权。
    • 午夜之子 - 好高级的故事,一下子就把印度建国后的历史给讲出个形状来了。

    幻想的世界

    • 永恒的终结 - 大师讲故事就是高级,既有深度又严密。
    • 海伯利安(全四卷) - 第一卷展开故事的方式太有文字功夫也太抓人了。想象力丰富而宏大。是一个关于剥削、压迫、意识形态蒙蔽、以及革命的故事。
    • M代表魔法 - 尼尔盖曼讲故事真高级,又可爱,又有想象力,还透着一点黑暗。
    • 玩家1号 - 了不起的八十年代总在提醒我们,互联网有自由与分享的部分,也有唯利是图的资本家垄断与剥削的部分。尽管后者总会标榜自己与前者一样,却无时无刻不在想着怎么弄死前者。

    以及,工作还得做下去……

    • 程序员必读之软件架构 - 实用,不啰嗦,恰到好处。特别适合已经有经验的架构师梳理思路。
    • Human Resource Management - 深入又全面,把人力资源管理的各个方面讲述得很清晰。
    • Agile IT Organization Design - 以约束理论(ToC)的套路将敏捷软件开发的理念推而广之,涵盖了敏捷组织的方方面面。尤其是其中关于IT项目组织、人员安排和财务预算的部分(第8~10章)可谓一针见血。


  6. 小数据:环节和接口

    (续前文:小数据:理论和架构

    从前文的架构图中可以看到,针对“小数据”的OLAP应用可以分为三个环节:

    1. Cube建模。将数据从OLTP数据库中抽取到OLAP Cube中。
    2. 分析。针对OLAP Cube进行切片、钻取等操作,获得需要的结果集。
    3. 呈现。将结果集呈现为直观的报表形式。

    在建模Cube的时候,需要用户提供的信息是Cube本身星型结构的描述,以及星型结构中各项信息与OLTP数据库中表和字段的映射关系。具体而言,这里必需的信息包括:

    • Cube的标识符
    • Cube对哪些数据项量值(measure)
      • 如果涉及聚合值(aggregate),采用何种算法聚合
    • Cube有哪些维度(dimension)
      • 其中某些维度可能有层级(hierarchy)关系
    • Cube的量值项和维度项如何与OLTP数据库中的表和字段映射(mapping)
      • 其中通常会涉及多表的关联(join)

    由于分析操作仅以RESTful API的形式提供服务,因此用户在进行分析操作时需要提供的信息就是一个URL,在其中描述分析操作的详情,包括下列信息:

    • 对哪个Cube进行分析
    • 呈现所有事实(fact)还是聚合(aggregate)结果
    • 对哪些维度进行切片(cut)
    • 对哪些维度进行下钻(drilldown)

    从分析环节得到的数据应该是一张平面的二维表(flat table)或与之等价的其它形式(例如JSON)。在报表呈现环节,用户就只需要描述如何将二维表渲染成报表。必需的信息大致包括:

    • 采用何种报表形式(折线图、柱状图、饼图……)
    • 如何使用二维表中的各列数据,以柱状图为例:
      • 使用哪一列作为横坐标的取值
      • 使用哪一列作为纵坐标的取值
      • 使用哪一列分组或堆叠
      • 如果允许下钻,使用哪一列(或几列)下钻

    以上列表未必完备,但已经能覆盖大多数小数据场景的OLAP需求。不论采用何种技术实现,小数据分析系统应该尽力约束用户(不论开发者还是最终用户)需要输入的信息量,尽量使其只需输入(不论通过编程还是图形界面操作)上述列表中的必需信息项,从而降低系统建设和使用的难度。


  7. 小数据:理论和架构

    大数据是当下最热门的IT主题之一。据麦肯锡的分析,大数据能使信息更透明、能让决策者获得更精确翔实的绩效信息、能针对客户群体提供更准确的定制、能提升组织决策能力、能帮助开发下一代产品和服务。新时代里与互联网联结的组织不论大小,都需要这些能力。

    然而与此同时,大数据的“大”并非适用于所有组织。Gartner认为,大数据具有“3V”的特征:多样性(Variety),数据来自多种不同来源、具有多种不同形态;速度(Velocity),数据形态和呈现形式的变化快且频繁;量级(Volume),数据量非常巨大。然而对于众多的中小型企业及非营利组织而言,这三个特征有两个未必适用。很多中小型组织只有为数不多的几个IT系统,数据都保存在为数不多的几个关系型数据库中,数据量不超过数百万条记录。只有变化速度快这一特征,对于中小型组织仍然适用。从这个意义上,这些中小型组织需要的是一个“小数据”解决方案:

    小数据:聚焦中小型组织和新兴业务,在数据量较小、数据来源较简单的情况下,提供非常灵活、非常简便易用、使用过程中对IT技能要求非常低的数据分析和商业智能,为应对多变且未知的外部环境提供决策支持。

    传统上,很多小数据场景的分析和商业智能需求以“报表”的形式呈现在IT项目中:在开发OLTP系统的项目中列出一组报表需求,由交付OLTP系统的团队以直接SQL查询的形式实现报表。这种做法贴合了数据量小、数据来源简单的特征,但损失了灵活性,报表的定制和修改需要技术人员介入,因此又无法满足对速度的要求。为了赢得灵活性,小数据分析也同样需要首先建模OLAP Cube,然后通过不同维度的切片和钻取进行分析。

    什么是Cube?按照维度建模方法,数据可以分为“事实”和“维度”两类。事实数据代表“发生了什么事”,维度数据则从各个角度描述这件事。如果以电商为例,事实数据是“销售记录”(卖了一个东西),常见的维度数据可能包括“产品”(卖的是什么)、“门店”(在哪里卖的)、“时间”(什么时候卖的)、“售货员”(谁卖的)、“顾客”(卖给了谁)等等。不难想象,事实数据表将只有一个主键、一个值、以及一大堆外键指向各个维度表;维度表也可能有外键再指向更多的描述性的子维度表(例如“产品”有外键指向“类别”)。于是我们就会得到一个星型表结构(或叫雪花型表结构)。

    星型表结构的优势在于,分析操作会变得非常简单:你关心哪些信息,就直接用JOIN子句把这些维度表关联进来;只要在JOIN子句里指定WHERE条件,就可以快速缩减结果集。在星型表结构里,一个事实会被若干个维度修饰,因此可以把整个数据集想象成一个立方体(或超立方体,当维度多于三个时)。例如当只考虑“产品”、“城市”、“时间”这三个维度时,“销售记录”的数据集就可以被建模为一个立方体。

    随后就可以在这个立方体上对数据进行各种分析。例如你可以锁定“城市”这一维度,从而得到“某城市各种产品历史销售报表”——“锁定某一维度取值”这一操作也叫“切片”(slice),因为它在这个例子中产生的效果就是从三维的立方体中切出一个二维的数据平面。同样的,我们也可以从“产品”维度切片,从而得到“某产品各市历史销售报表”。当维度具有“分级汇聚”的特性时,我们还可以进行“钻取”(drill)操作,例如当“地区”维度分为“市”和“省”两级时,我们就可以在“地区”维度上进行钻取:首先从产品维度切片得到“某产品各省历史销售报表”,然后选择一个省下钻得到“某产品在某省内各市历史销售报表”。

    小数据系统设计原则1:建模一个Cube,就可以快速实现一系列分析操作(及对应的报表)。小数据系统应该支持简便且易于修改的Cube建模。

    基于这个设计原则,我们可以大概推知小数据系统的架构:首先,根据指定的Cube描述信息,把业务数据建模成Cube;然后,通过RESTful API对Cube进行切片、钻取和聚合等操作,并取回二维平面表或透视表形式的结果集;最后,根据指定的报表定义信息,把结果集渲染成报表。

    从上图不难看出,在这个架构中,必须由用户(不论是开发者或最终用户)提供的信息只有三项:(1)Cube的描述;(2)数据分析操作对应的URL;(3)呈现分析结果的报表定义。并且第三项信息(即报表定义)与具体业务是完全解耦的,因此理应可以用分别的开源软件组合形成轻量级的小数据解决方案。在下一篇文章中,我将具体介绍一个基于开源软件的小数据解决方案实现。


  8. 共享经济到底是个什么鬼?

    (本文同时发表于破土网

    据互联网创业专家的分析,“互联网+”把各行各业生意都开上了互联网,O2O(Online to Offline)把线上和线下整合起来。这两件事打通了业务上网的渠道,而在这个渠道上要挣钱,就要靠共享经济了。专家说,共享经济能优化资源配置,把原本闲置的资源出租利用,从而创造出一块新的市场。比如汽车,原来一辆家用轿车就上班下班通勤用,利用率不到20%;如果能借助互联网之力把白白放在停车场里的私家车共享利用起来,岂不是好事一件?

    可偏偏就是这共享经济的急先锋、共享租车业务的鼻祖Uber,在世界各地背了上百桩诉案,在德国、西班牙、法国、英国等多个国家遭到抗议,两名高官还曾于今年6月在法国被捕。另一家共享经济的楷模、专事共享租房业务的Airbnb也曾在纽约旧金山遭遇法律挑战。于是我们不禁要好奇:这共享经济到底是个什么鬼?为何明明听起来很美,却会遭到如此多的反对?

    其实借助互联网把分散的资源集中起来提供服务,这想法并不新鲜。近的有长尾理论,说技术可以把大量分散的需求和供给匹配成可行的生意;再回想得远一点,比尔盖茨早在1995年的《未来之路》中就提到了“去中介化”的概念:互联网可以把“中间人”(分销渠道)去掉,让生产者和消费者直接联结,降低总体成本,从而使生产者的收益有可能增加、消费者的支出有可能减少。

    Wikipedia的文字中,这两个“有可能”(“may”)颇可玩味。互联网的确能消解传统“中间人”的市场控制力,然而这被消解的力量是否就会让利给生产者和消费者,那又是另一回事。仍以租车为例,Uber模式一方面引入大量兼职司机压低全职司机的收入,另一方面把自己变成了比以前的出租车公司更具垄断力的平台——Uber(以及其他模仿者)要求司机只能使用自己的网络平台,这时他们倒是不把“共享”挂在嘴边了。司机一方议价力削弱,而公司一方垄断力日增,那么司机又怎会得到那只是“有可能”的收益增加呢?

    事实也确是如此:据笔者在美国几个大城市的观察,Uber司机大部分是非洲裔,有少许亚裔和阿拉伯裔,从未见过像Uber广告中的白人中产阶级司机,司机的收入也只堪温饱,比起传统的出租车司机尚自不如。国内的情况也相去不远,随着各家叫车平台补贴逐月减少,滴滴快车的服务水平已经向从前的黑车看齐,神州专车的司机也开始抱怨收入不佳。资本逐利的本性决定了,互联网公司“去中介化”的目的是为了建立垄断力更强的“赛博中介”。想着互联网公司消解了传统行业的“中间人”就会让利给消费者和劳动者?这也未免想得太乐观了一点。

    照资本的本性,一旦有了更强力的垄断地位,何止不会让利,还要寻求更多的利润呢。我们回头来看看Airbnb和Uber的诉案,究竟告的是什么缘由。纽约市政府起诉Airbnb,因为他们的房源有相当部分来自于不按照规定缴纳税费的非法酒店;旧金山市政府也立法要求Airbnb缴纳酒店税。Uber最近在加州被起诉的主要争论点则在于“司机是不是Uber的雇员”。Uber宣称自己只是“平台”,司机则是平台上的“合作伙伴”;而司机一方则认为Uber无疑是司机的雇主,该公司将从事工作所必须的开销都转嫁给了司机——这个“从事工作所必须的开销”,当然不仅是养车、加油和买新衣服,更重要的是医疗、教育、养老等社会保障。这些“共享经济”互联网企业都有一个共同的卖点:“轻资产”。确实,做着跟别人一样的生意,却不用像别人一样承担对员工、对社会的责任,这岂能不盈利、岂能不受全球资本青睐呢?至于谁应该来为市政建设、人民福利买单,不好意思,那可就不是注册在避税天堂的互联网公司们要考虑的啦。

    创造赛博垄断-压榨劳动者-逃避社会责任。这套赚钱逻辑,中国的互联网创业者们看国外大鳄们玩过了以后,才发现是如此好用。于是转眼之间,外卖O2O开始“全民开店”了,美容O2O开始“解放天下手艺人”了——至于这些据说不再依靠组织、不用阿谀上司、不必忍受压榨,实现了财务、时间、心灵三大自由的手艺人,他们的五险一金该由谁来交,互联网公司当然会说自己只是个平台而不是雇主啦。

    所以,现在各位看官能搞明白“共享经济”到底是个什么鬼了吧?说简单也简单,无非就是资本借助互联网掀翻原来的中间渠道,建立互联网上的强大垄断,让劳动者更加没有选择、没有组织,从而施行更残酷的剥削。如果政府要来监管盘问这家企业本应承担的社会责任去了哪里,共享经济先锋们便会一边拿出“自由”的大旗抵挡,一边趁监管法规尚未成型捞个时间差。看明白了这个关节,笔者不禁暗想:这不是80年代刚改革开放那会儿的“倒爷”们早就玩儿得熟透的把戏么,又何须这么多高科技的幌子呢?


  9. 胜任力挑战及应对:现有研究

    为了充分理解当今普遍存在的技术胜任力紧缺的问题并为之找到解决办法,需要关注三个方面已有的研究。首先,技术尤其是IT技术造成对高技术劳动者的大量需求,是造成全球技术胜任力紧缺的根本原因。随后,传统的人力资源职能无力于管理高技能工作所需的无形的胜任力,因此人力资源管理的理论与实践需要围绕新型胜任力做出改变。最后,刻意练习理论可以系统地改善专业技能的获得,从而使“建设无形胜任力”的过程变得有形、可控。

    针对这三个方向,笔者选取了几篇有代表性的论文,对已有的相关研究做一导览。

    对高技能劳动者的需求

    Bresnahan、Brynjolfsson和Hitt的研究指出,早在1999年之前,已经有众多研究者注意到“技术偏向的技术变革”(SBTC)这个趋势:这类技术变革“把对劳动者的需求移向技能较高的一端”。从前的技术进步大多能创造更多低技能的就业机会,而IT发展的趋势却是在取代低技能劳动者,同时增加对高技能劳动者的需求。这个趋势会加剧全球范围的经济不平等,并导致技术型人才的普遍稀缺。

    IT技术有一个重要的特征:作为支持心智(而非物质)行为的工具,IT不是只要花钱采购实施就能产生效果的。为了充分发挥IT的效力,组织的工作方式需要做出调整;通过加速和自动化原来手工的工作流程,IT又会改变组织提供的产品和服务。当计算性能的成本随着摩尔定律不断走低,IT对工作空间及工作产物的影响也愈发深远,使之朝向一个偏向于高技能知识工作者的方向发展。

    Bresnahan、Brynjolfsson和Hitt使用大量历史数据验证了上述猜想。他们发现,IT的使用程度与员工的技能水平有显著的正相关。另一个对管理者的调查也显示出同样的倾向:IT使用越多,管理者越需要高技能胜任力。

    这个十多年前的研究很具前瞻性。在后来的两本畅销书《与机器赛跑》和《第二次机器革命》中,Brynjolfsson指出:IT的指数性发展已经进入“棋盘的后半”,机器将全面且无可逆转地取代低技能劳动者,人类劳动者必须发展机器尚无法取代的胜任力:想象力、大规模模式匹配、复杂的沟通。这一观点从高层面上为胜任力模型的定义划定了框架。

    基于胜任力的人力资源管理

    Dubois和Rothwell的研究有一个基调:由于技术导致工作内容及结果快速改变,传统的基于职位分析的人力资源管理方法变得过时。不仅因为难以保持职位分析随工作本身的变化而随时更新,更是因为无形胜任力在工作中的比重日益提升,使得清晰定义职位的要求变得愈发困难、甚至不可能。因此Dubois和Rothwell建议,所有的人力资源职能都需要以基于胜任力的方式重新审视。这两位作者在《Competency-Based Human Resource Management》一书中介绍了一个全面的基于胜任力的人力资源管理架构。在这篇论文里,他们聚焦审视了员工培训这一具体职能。

    传统的员工培训常建立在指导系统设计(ISD)模型的基础上。ISD模型常被批评过于强调预先设计,忽视来自学习者的反馈,使学习者在培训过程中感到缺乏主动性。然而尽管有这个问题,ISD模型实际上能很好地交付预期的内容,尤其是与e-learning等技术结合时。

    ISD模型真正的问题在于它尝试“开展彻底的培训需求评估”,即从职位分析出发设计培训。然而高技能的知识工作越来越无法被泰勒式地彻底分析。无形的、个人的特质在知识工作者的胜任力中扮演越来越重要的角色。传统的培训套路仍然能高效地传递内容,但职位分析无法得出与胜任力相关的有效的培训内容,这才是基于ISD模型的员工培训面临的最大挑战。

    因此,Dubois和Rothwell建议将注意力从“职位需要什么行为”上移开,转而关注“组织需要什么胜任力”,并鼓励自我导向的、基于团队的员工发展。这两位作者对传统的和基于胜任力的两种人力资源管理方法做了对比,结论很明显:基于胜任力的人力资源管理方法更适用于高技能的工作环境。

    刻意练习

    人们普遍认为顶级的专家技能无法习得,只能靠神秘的天赋。这个论断如果是真的,对于今天的雇主来说则格外糟糕,因为他们比历史上任何时候都更需要专家技能。幸好,Ericsson、Krampe和Tesch-Römer的研究打破了“才华天赋”的神话。通过审视之前的研究,他们发现对于大多数专业技能而言,专家技能的获得与基因遗传几乎没有关系。与此同时,他们也发现:仅靠练习与经验并不能保证高水平。换言之,高水平(甚至世界级水平)的专家技能大多数人都可以达到,如果他们有足够的动力并且练习得法的话。

    这几位研究者审视了来自多个不同领域的数据:国际象棋、作曲、科学、写作、医疗等等。他们发现各个领域都有一个共通点:最高水平的专家级表现都出现在大约十年的从业时间之后。细致的考察表明,这些世界级的水平来源于大约一万小时的刻意练习。更重要的是,他们识别出了刻意练习的核心要素:这些练习应该基于练习者当前的水平设计、目标是提升其能力水平;练习应该与即时的反馈相结合;练习应该重复很多很多次。有些“神童”在很年轻时就展现出了世界级的水平,仅仅因为他们很早就开始密集的刻意练习。后来的畅销书《哪来的天才》阐释了这篇文章的观点。

    刻意练习理论与精益/敏捷理论有内在的相通之处,尤其是对短反馈周期的重视。有理由相信精益/敏捷与刻意练习能够彼此增益,成为现代组织有系统地提升员工个人胜任力、并最终提升组织胜任力的重要环节。


  10. 无人驾驶汽车意味着什么

    把车载GPS、定速巡航、自动泊车防碰撞主动刹车车道偏离报警这几样技术放在一起,实际上一辆可以无人驾驶的汽车在技术上就已经成熟了。几个月前纽约市已经与Google达成一个协议,从2016年起引入无人驾驶的出租车。然而技术的成熟与投入实用远不是变革的终点,恰恰相反,这只是一场更为深远的变革的起点。

    首先,我们必须清楚地意识到,无人驾驶汽车一旦开始普及,人们自己开车的日子就一去不复返了。和很多人的想象不同,你将无法再选择自己开车。还不用说你是否能以时速100公里与前车保持50公分距离跟车,能从层层叠叠密不透风的自动控制的地下车库里把车开出来就是个巨大的挑战。车险条款也会变得对人为驾驶非常苛刻。驾驶汽车将成为一种专门的、只有少数人在少数特殊情况下使用的职业技能。

    当所有人不用在通勤路上驾驶汽车,全球每年可以省出十亿小时时间,两倍于建造埃及吉萨金字塔所耗用的工作量。这个时间和空间将成为一片全新的市场。由于车辆全局统筹共享,利用率大幅提升,车辆小型化将成为趋势,只能搭载一到两个人的小型车辆将成为主流。既然不需要人为驾驶(以及支持人为驾驶的一整套装置),即使小型车辆也可以有非常宽松的乘坐空间。而且对外视野不再是必须品,因此车辆内部可以做成360度全景屏幕,乘客可以根据自己的需要来设定车内环境。通勤路上的时间既可以用于个人娱乐,也可以用于远程会议,坐进车内就跟坐进自己的工作室没有区别。

    统筹共享会让车辆保有量大幅下降。由于车辆不需要整天整天地停在车位上,城市车辆保有量只需要现在的20%。今天的大城市(尤其在中国)规划设计很大程度上以车辆为中心,首先关注道路的通畅。这种城市设计的理念将变得不合时宜。当数量仅为今天20%的车辆更加快速且安全地自动行驶,城市的道路便不需要如此宽阔,居民区和商业区也不需要如此多的停车位,更多的空间可以被用在市民身上。

    车辆保有量的大幅下降和车辆的小型化,将降低用于交通运输的能源消耗。美国能源消耗的28%用于交通运输,因此这个项目上的节省意义重大。同时,由于“驾驶体验”变得毫无意义,且车辆在全局统筹共享,电动汽车的劣势将不复存在,电动汽车的比例将大幅增加。大量的电动汽车将成为一个巨大的、移动的蓄电池,使风电、光电、潮汐电等有明显峰谷因此无法成为骨干电网主力的绿色能源得到充分利用。

    城市区块的优劣将被重新评估,居民区/商业区与周边环境的互动更少,贫富人群生活更加割裂。城市的安全程度将大幅提升。不仅因为没有了交通事故,而且因为所有人在所有时间进行的所有距离稍长的位移都受到监控,控制犯罪将变得容易。同时个人隐私也受到更严重的侵犯。

    中产阶级将失去一种用于身份定位和自我表达的重要的文化载体。众多受过良好教育的中产阶级将迫切需要一种明显可见的、能呈现一定个性特色的、价格大致相当于半年到一年收入的消费品,作为汽车的替代。在没有了汽车这个重要道具之后,中产阶级将需要一组新的行为语言来具象表达“责任”、“财富”、“自由”、“放纵”乃至“爱情”等抽象概念。一套全新的装逼方式将被发明出来。

    参考资料