设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
爱吱声 标签 统计 相关日志

tag 标签: 统计

相关日志

分享 张鼓峰、诺门坎 的战伤统计(转)
热度 3 gordon 2017-5-19 11:19
诺门坎战役资料:苏军战伤原因分布。负伤总数:15251人。子弹杀伤44.2%;弹片(炮弹、地雷、手榴弹)杀伤48.4%;弹片杀伤(航空炸弹)6.5%;冷兵器杀伤0.9%. ​​​​ 苏军坦克被日军击毁手段统计(苏方统计):被反坦克炮击毁75-80%;被燃烧瓶击毁5-10%;被野战炮击毁15-20%;被飞机炸毁2-3%,被手榴弹和地雷炸毁2-3%。 ​​​​ 航空兵:42年关东军只有500-600架飞机,这是陆航的基本家底了——而当面的远东苏军有数千架飞机——同期海航所面对的美军并没有这么多飞机 ​​​​ *************************************************************************** 苏德战争尾声,反坦克手段的对比还是很鲜明的。德国人有的是75甚至75+的重反坦克炮,88-128的重高炮,几百万发“铁拳”。而苏联步兵师的标准反坦克炮还是45-57毫米,往往依赖榴弹炮和火箭弹去击退德国坦克群。而 这需要很强的战机捕捉能力 。 *************************************************************************** 诺门坎,基本上日军杀伤坦克是靠反坦克炮的 基本上,日军就是靠 枪、炮、反坦克炮 *************************************************************************** 日本炮兵缺少弹药,还是如一战前那样强调射击精度。训练倒是很好,但压制力并不强大。日本反坦克部队相当优秀,俄国人的战术报告说他们射击精确,而且不断变换发射阵地,让俄国人无法捕捉。只是他们的装备太差。 日军为什么重视拼刺?其实日军早期信奉的是“射击制胜论”。但日俄战争日军弹药不足,逼近阵地后,又往往被以刺刀迎战的俄军击退。1909年,日军作出战术修正,强调:虽然大部分战斗过程靠火力,但最后会爆发白刃近战。结果日俄战争中,俄军损失仅1.7%损失为白刃,诺门坎反上升为4%。 ​​​​ 1938年张鼓峰冲突,苏军战伤2752人,日军战伤914人。双方的卫勤部门统计了各自的负伤原因。比对如下:被枪伤,苏军869人,日军323人,2.7:1;被弹片伤,苏军1498人,日军572人,2.6:1;被冷兵器伤,苏军110人,日军4人,28:1!就是说每刺伤1名日军就有28名苏军被刺伤。难怪日军称苏军根本不懂拼刺。 ​​​​ *************************************************************************** 张鼓峰,日军靠的是刺刀。可能是山地的原因,近战 *************************************************************************** tg在抗战和内战的负伤原因:对日军作战,炸伤30%、枪伤53%、刀伤4%、打扑伤10%——对国军作战,炸伤59%,枪伤37%,刀伤少到可以忽略不计、打扑伤0.16%——由对比可知,日军对八路军作战,较少动用重火力,主要靠枪击,而且经常近战拼 刺刀 甚至肉搏。国民党军倒是偏爱重火力杀伤,近战能力极弱 ​​​​ *************************************************************************** 朝鲜战争 前五次战役,投入步枪不到18万条。可冲锋枪超过4万支、卡宾枪近9000、迫击炮5000多门、山野榴炮近1100门,另有大量步兵炮、反坦克炮、高炮和无后座力炮——这是事实 ​​​​ 所以美国人到51年基本就明白了:tg的后勤线并不太长, 而且得到山林掩护 ,美国靠战术空军无法切断。所以麦克阿瑟鼓吹攻击东北境内后勤基地。他甚至想动用原子弹和生化武器。 *************************************************************************** 近战主要还是靠冲锋枪,因为 冲锋枪是手枪弹,比步枪还好造 。 刺刀是日俄战争时期的近战手段。在一战时期,都是 战壕扫帚。 当然,还有工兵铲等乱七八糟的东东 *************************************************************************** 对越自卫反击战也是用冲锋枪,步枪不好使 *************************************************************************** 大家还是喜欢用一战前的观念看苏德战争,重视步兵好不好云云——其实苏德战争,步兵的作用空前的小——突击力量是坦克装甲兵,杀伤手段则是 炮兵 航空兵,步兵最大作用是保持战线(包括包围圈战线)的完整连贯提供掩护——所以苏德两军步兵都相当少,质量也较差 ​​​​ *************************************************************************** 武侠的历史意淫语境第一次在文学中被打破,可能是《荡寇志》。里面出现了这样的描写:官兵掏出洋枪,一枪就把水浒好汉给崩了——这是成书于太平天国前的作品,挺有预见性的 ​​​​ 太平天国战争,双方都大量进口外国火枪火炮,是冷兵器向热兵器全面过渡的重要阶段。俞万春显然看到了这种趋势 *************************************************************************** http://player.youku.com/player.php/sid/XNTE5NzEwMTA0/v.swf 德军的兵器资料啊,以前国民党有一份 ( 你懂的 ) 没什么特殊的,盟军都有,战胜国嘛 苏德战争尾声,反坦克手段的对比还是很鲜明的。德国人有的是75甚至75+的重反坦克炮,88-128的重高炮,几百万发“铁拳”。而苏联步兵师的标准反坦克炮还是45-57毫米,往往依赖榴弹炮和火箭弹去击退德国坦克群。而这需要很强的战机捕捉能力。 *************************************************************************** 冲锋枪还是孙中山 他们用的多。 tg 对另一个东西也是情有独钟,就是木柄手榴弹 巷战中证明最佳之武器是手榴弹 与81mm 迫击炮,虽然爆破之手榴弹的爆烈范围狭小,小于战车之炮弹, 因为是农业国,木材、化工原料还行, 金属对他们确实太困难了。 参考阅读: 淞沪会战—— 德国顾问团对中日双方兵器的分析 http://www.aswetalk.net/bbs/home.php?mod=spaceuid=663do=blogid=60726
351 次阅读|0 个评论
分享 统计力学 —— 死亡学科(转)
热度 1 gordon 2017-3-18 03:05
路德维希·玻尔兹曼 1906年自杀身亡,他毕生的大部分时光都在从事 统计力学 的研究工作。继续这项工作的保罗·厄仑菲斯同样于1933年自杀身亡。现在轮到我们来研究 统计力学 了。 也许小心谨慎地接近这一学科才是明智的。 统计力学 与 物理学的任何其他分支学科相比,更易受到方法论和表述问题的困扰 。哲学家对概率的含义争论不休,尤其是对单一“事件”应用概率时尤甚。数学家则用回避物理 解释的方法躲过了这一问题,他们只是简单地把概率作为由一系列规则所限定的“测量”。不过以这种方式脱离实际就不太适用于物理学了。对物理学家而言,概率 和统计方法一直使他们非常苦恼。统计方法是造成玻尔兹曼自杀的因素之一,保罗·厄仑菲斯的自杀也可能出于这个原因。即使到了今天,量子力学中猜不透的谜也 在于核心部位的概率在作祟。 统计力学 中,数学家的操作方法是同 E.T.Jaynts True的信息论方法相似的,这种方法经过几代杰出教育家的拼搏,已近完美,不过我承认这种方法并没有特别吸引人之处。当然这种方法或许只是得到结果的一 种权宜之计,但是就我内心深处而言,还只是模糊的理解而已。真正理解是物理学家殚思竭虑的目标。相比之下,T.L.H ill等学者的系综形式不但非常清晰而且物理含义明确。有人或许发现系综太形式化了,我却认为它十分迷人。第二个结构问题是 统计力学 与热力学这门较老的学科的关系问题 。它们应当各自独立地发展呢还是用一种统一的办法来处理更好呢?朗道坚决支持后一种看法,我本人几乎被他的论据所征服。在大学本科阶段,这一哲学观点 得益于Reif的重要阐释(他在伯克利物理丛书的《统计物理》一书中同样有此类解释)。这种观点很可能对当今职业物理学家中很多人的知识结构产生过重大的 影响。这也必定为研究朗道和栗弗席茨的书奠定了理想的基础。但不管怎么说,经典热力学的重要性是毋庸置疑的。最重要的特征是模型与其结果无关。热力学的抽 象形式多少有些令人生畏,的确,它的深层逻辑体系确实有些模糊不清。从Zemansky多次再版的热力学教科书中可以看到,热力学的逻辑体系逐步地转为 Carath odory的观点,那段时间里,经典热力学的逻辑结构已经相当清晰并经过Callen的条理化处理,但对大学本科水平的学生来说,要深入理解这种逻辑结构 恐怕是不恰当的。 撇开深刻的哲学问题,接下来的另一个突出的问题,是要重新解决必然性的问题。在大多数英国大学里,本科生的课程压力越来越大,简直没有可能再插入完备的经典热力学和 统计力学 的课程。的确,伦敦的RoyalHolloway大学就是这种情况。因此,把对四年级本科生的导介性材料同硕士生的学位课程(科学硕士或物理学硕士)合并在一起,就有利于把许多更加高级的素材纳入到学位课程的计划之中。 伦敦大学,King s,QueenMary,RoyalHolloway,以及University Colleges一起,对科学硕士四年级课程组织联合教学,讲座地点就设在伦敦市中心。这当中的课程门类很多,许多课程都属于边缘学科。这样一来,就有可 能更多地包括那些从传统的本科四年级学士学位课程中被排挤出来的素材。 本书就是一门适用于校际教学的 统计力学 课 程,我在过去的十多年时间里,一直给硕士四年级学生讲授这门课。这种校际教学有其自身的挑战性。读完三年硕士课程之后,他们已经达到一个相似的标准和水 平,都能理解第四年校际教学的课程了,尽管各所大学的侧重点和偏好会有所不同。热物理领域尤其属于这样的情形,其原因正如前面几段文字所阐明的那样。正因 为这一原因,这本教程中提供给学生的学习素材包括了很多“基本”的内容,当然表述的起点更高了。第一、第二章的一半左右内容,属于这种“基本”素材。这本 教程原先是一门“无纸教程”,当然学生可通过网站得到讲稿要点和其他学习资料。资料中包括讲课日程表、练习题等等,全部学生都可以在各自学校里,甚至在其 他任何很远的地方下载这些资料。当我收到来自伦敦之外,甚至世界各地的学生要求索取习题解答(常常已到了截止期)并回答讲课要点上的疑问时,我简直处于四 面楚歌的应急状态之中,当校园网的服务中断时更是如此,有时我发现有些email甚至气愤地责问, 你们究竟把资料搁到哪里了? 所以当帝国学院出版社 (Imperial College Press)找到我,想考虑为这门教程出一本书时,我欣然答应了。这本书是集体成果,是来自学生、同事和帝国学院出版社委派专家的共同努力、听取建议、反 复修改的结晶。 电磁学单位制是使学生在学习物理课时产生许多困难的原因。采用SI单位制之后,这类困难估计可以消除了,但阻力仍然存在。Kittel的《固体物理》一 书,有不少式子既有用高斯制的,也有用SI制的,似乎两种单位制混用也行。我几乎划一地全用SI制,尽管我对因此而引起BˉH的争论并不满意。不过读者会 注意到,我用M表示总磁矩而不是单位体积的磁矩,我也承认将复动力学磁化率写成χ(ω)=χ′(ω)+iχ〃(ω),的确不同于更常见的复共轭形式。 我应当对许多人表示谢意,我的妻子Louise,我的女儿Abigail,她们对于沉醉于学术工作的丈夫和父亲已习以为常了,因为我经常不在她们身边,如 果不是事实至少在精神上如此。我的老师M iˉchaelR ichards和BillMullin鼓励我献身于物理学这一分支的工作。他们千方百计地为我钻研朗道和栗弗席茨的著作提供帮助。我也被他们著作的明晰和 深刻所折服。在我早期的教学生涯中,我从Roland Dobbs和M ike Hoare那里学了很多,再后来,Bob Jones在回应我的模糊不清的提问时,一而再、再而三地阐释了他的百科全书式的 统计力学 知识。他耐心细致的方 法常常有助于通过难题的讨论而建立起深厚的师生感情。此外,John Saunders始终是我的忘年之交,他持续不断地以各种方式鼓励我。除此之外,我还要对许多学生表示感谢,他们使我在教学上不断长进。他们的观察、质 疑,甚至是反对,都有助于我在论证中消除混淆不清,把自己的观点解释得更透彻。不管怎么说,上面这些感谢并不推卸我在教学上的责任。差错、疏忽和过失,责 任完全由我来承担。 我以本书作为对父亲Stanley Cowan的纪念,他于1997年2月故世。他是一位天才的工程师,是一个特别有耐心的人。他忍受着疾病的痛苦,尽量克制而不让亲人感受到他的痛苦。他坚 信在求解问题中数学的威力,他使我也遵奉了这一信条。他鼓励我多问为什么,虽然我们之间有时也会有激烈的争论,但他使我始终保持着一种开放的心态。 Brian Cowan 2004年12月 ************************************************************************ 反正是够呛 ,金融定量分析也是如此 诺奖获得者,也是该栽跟头,也栽跟头。 呵呵 ************************************************************************ 玻尔兹曼的学术生涯十分坎坷,除有不少社会因素外,更多地应该与他个人的性格有关。玻尔兹曼与恩斯特 · 马赫及奥斯特瓦尔德之间所发生的 “ 原子论 ” 和 “ 唯能论 ” 的一场论战,在科学史上留下了一段著名的佳话。由于马赫在科学界的巨大影响,当时有许多著名的科学家一直满足于热力学理论而拒绝承认 “ 原子 ” 的实在性。他们认为, 原子和分子既然不能直接观测到,研究分子运动论就是空想 ,因而提出所谓“唯能论”的观点,坚持认为, 物理学的任务就是研究能量及其转化规律,再从微观角度研究分子运动论是多余的 。玻尔兹曼与 “ 唯能论 ” 者在学术上曾一度陷入孤军奋战,多年抗争,直到后来由于不断涌现的一大批年轻学者包括大名鼎鼎的普朗克站在了玻尔兹曼一边,最终使得以玻尔兹曼为代表的 `“ 原子论 ” 学派获胜, 1908 年, 终于在玻尔兹曼辞世两年后,“唯能论”学派的主将奥斯特瓦尔德不得不承认“ 原子假说已经成为一种基础巩固的科学理论 ”。这场科学论战,最终促进了原子物 理、量子力学、核子物理、固体物理等一大批现代物理学的巨大发展,从而以统计物理学为代表的微观科学领域与宏观科学领域在 20 世纪不断进步,成为科学主流。 如今统计力学已成为现代物理学的重要分支,在统计力学中,能量和熵这两个在热力学乃至整个自然科学中最普遍和深刻的概念得以被真正理解,并由概率而密切地联 系在一起。宇宙中的一切实际过程无一例外地增加着总体的熵值,而能量作为对抗熵增加的力量,绝望地做着局部的抵抗,虽然通过耗散结构,时而可以创造和维持 高度有序状态,但终究无法阻止宇宙滑向最后的混乱和无序,一切结构和组织的寂灭。这幅令人抑郁的图景,肯定是萦绕在波尔兹曼和其他统计物理学家心头的幽 灵。不幸的是,由于认识的局限性,他们无法让自己忘却这个幽灵,而注定需要用自己的生命和情感来探究、诠释它,为它增添生动的细节。加州理工学院的古德斯 坦对这种尴尬处境做了如下的抱怨: “ 一生中大部分时间花在统计力学上的路德维希-波尔兹曼,1906年自杀身亡。艾伦菲斯特继续了这项研究,但也以类似方式而死。现在轮到我们了 …” 如海德格尔所言: “ 行伟大之思者,致伟大之迷误 ” ,真诚思想者的无法完全摆脱深刻而有价值的思想所造成的情感和理智迷误,这是波尔兹曼的宿命和不朽。 如前所述,波尔兹曼的工作在其死后不久旋即被主流物理学家所认同。这种认同 不 仅是某种观念的复活,还是思想交融和传承过程中的不朽。波尔兹曼的洞察已超越统计物理范畴,深刻影响着整个科学和哲学共同体。例如, 对于信息科学这样的新 兴学科而言,一大类统计推断、约束优化和纠错码解码问题可以在源于统计力学的模型和算法之下得到更有效的解决。在这里,信息代替了能量,成为与熵相抗衡的 力量 。基于统计力学的自组织算法,问题求解的过程精确地同构于特定的吉布斯自由能水平下熵最大化的过程,波尔兹曼的思想以深刻的洞察力诠释了宇宙整体在毁 败之路上演化的非单调过程。
3268 次阅读|2 个评论
分享 优步自动驾驶车统计数据
热度 32 holycow 2017-3-18 00:09
平均每0.8英里需要驾驶员人工干预一次 平均每2英里会有一次急加速,急刹车,急转弯等令乘客不适的事件 平均每200英里有一次严重事故苗头,若非人工干预会造成撞人或5000刀以上财产损失 哈哈哈,技术是从古狗偷来的,抄也抄不好;偷得了技术偷不了大数据
746 次阅读|8 个评论
分享 实验设计与学科统计
热度 1 gordon 2016-11-16 12:03
实际上,你碰到现实问题,你问数学系的人,他们都搞不定。 甚至统计学专业的人。 这是因为 数学上的统计是相对严密的,但是当应用到具体学科时,实际上已经有了很多经验性成分 而这个经验性成分,恰恰是统计学专业所不知道或者不关心的 这个经验性成分,实际上就来自于研究设计 ************************************************************** 不将实验设计和数据处理结合,你很难应用到实践当中去。 这很可能和 “异中求同” 的累积有关。 “同中求异”,这是数学或者统计学科的工作范畴。 ************************************************************** 实际上,处理现实问题的时候,你是很难求助于 统计学专业的人的 总是有一段路,非常孤独 that‘s all
104 次阅读|0 个评论
分享 统计:美军标的来源 (转)
gordon 2016-11-16 07:17
这个不仅仅是教育体制的问题,美国很多东西是从英国、法国来的。 像法国在第一次世界大战时期,是好牛逼的。美国仿法国火炮都仿不出来。 二战,大家也都知道,英国的磁控管。 美国的统计,伯克利从 英国哪儿请人,考察了卡尔逊和费舍,然后才找的奈曼 奈曼要混口饭吃嘛,教学做的很好。跟柯郎一样 注:这个差距不是短期能弥补的,少做不切实际的梦想。 ******************************************************************************* 盛田绍夫的看法,完全胡扯 当前日本的教育体制越来越难以令人满意了。这种体制强迫学生花费大量时间学习,目的只是为了如何通过考试以便进入好学校。这种制度使学生没有足够的时间进行实践和具备创造性的思维。迄今为止它虽然对我们起了很大作用,但我们应探索新的方法使教育制度更为有成效,更能与我们生活的新时代息息相通。我总是要求我们的员工进行创造性的思考,并且一直是大有收益的。从经理人员的立场来说,学会如何发掘员工们潜在的创造能力是极为重要的。我的看法是任何人都有创造力,但是很少有人懂得如何运用人们的创造力。 要解决如何发掘创造力的问题,我的方法是建立目标。最好的例子是美国的“阿波罗计划”。苏联发射了第一颗人造卫星“斯普特尼克”,过后又将人类首次送入太空。这对美国是一个震惊。许多国家总是认为美国是一个具有最大的发明能力和最富于创造性的国家,它创造了许多奇迹,难以相信其它国家能够在太空事业中位居第一的。于是美国制订了赶超计划。肯尼迪总统建立了一个明确的目标十年内登上月球。此时,一切都在发生变化。这个目标是一个明明白白的挑战:它意味着必需有一个巨大的技术飞跃。谁也不知道应该如何着手,一切都还是理论。必须立即研究的是,究竟需要多大动力?需要什么样的导航系统?需要研制什么样的计算机?还要有各种新材料。发明了炭纤维。发明了惯性导航系统,这是一个全新的概念,今天我们的定期班机上仍在使用这种系统。 为了达到目标,许多人变得有创造力了。管理者必须决定目标,为之制订计划并鼓励工人加倍努力。实际上 美国国家航空和航天管理局发起的“无缺陷”运动对日本的质量管理计划产生了巨大的影响 。此之前,在朝鲜战争中(一九五一九五二年)我们曾接触过美国的高质量标准。联合国军从日本获取军需品时,日本工业巨幅上升并且引进了军用产品的要求标准。这种标准要求产品质量比普通民用产品的一般质量高得多。我们日本人对军需品标准和“无缺陷”运动是永志不忘的。 ******************************************************************************* 日本也只是做个工业化。 sony 的磁带录音机,也是仿 美国占领军的,他本身想做钢丝的 ******************************************************************************* 鱼是鱼,鸟是鸟; 鱼变鸟,这个难度可大了
85 次阅读|0 个评论
分享 当代英才 —— 统计学家霍华德·维纳(Howard Wainer)
热度 1 gordon 2016-11-15 12:38
其实我们知道的很多东西,并非来自远古的什么英雄人物,而是当代英才 ************************************************************************* 注: 文中的系统1与系统2指代心理学虚构出来的大脑的两种不同工作模式。 系统1指代无意识、快速、不费力、自主思考模式 系统2指代需要集中注意力、费脑力的思考模式 一项研究对美国3141个县的肾癌发病率进行了调查,调查显示该病的分布模式很值得注意。发病率最低的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。对此,你有何看法? 刚 刚过去的几秒钟里,你的大脑处于非常活跃的状态,这主要是因为系统2在运行。你谨慎地在记忆中搜寻着并作出假设。在这个过程中你也付出了一定的努力,你的 瞳孔会扩张,心跳会适度加快。系统1也没有闲着,因为系统2的运行需要从联想记忆中获取事实和建议。你很可能会否认共和党的政策提供了肾癌防控方法这个想 法,却会关注肾癌发病率低的县大多是乡村这个事实。这个例子是我从机智的 统计学家 霍华德·维纳( Howard Wainer )和哈里斯·泽维林(Harris Zwerling)那儿得到的,他们对这一案例的评论是:“人们很容易作出推断,认为肾癌发病率低主要是由于乡村的生活方式很健康,没有空气污染和水污染,食品没有添加剂,保证新鲜。”这一点完全说得通。 现在,考虑一下肾癌发病率最高的县的情况吧。假设这些易发病的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。霍华德· 维纳和哈里斯·泽维林半开玩笑地评论道:“人们可以很容易作出推断,导致肾癌高发病率的直接原因是乡村生活的贫困,医疗条件差、高脂肪饮食、酗酒、嗜烟 等。”当然这种说法肯定有问题,因为乡村生活方式不可能既是肾癌发病率高的原因又是其发病率低的原因。 问题的关键并不在 于这些县处在乡村地区或是由共和党掌管,而在于乡村地区人口少。 我们通过这个例子学到的不是流行病学知识,而是我们的大脑和统计数据之间的复杂关系 。系统 1非常擅长一种思维模式,自动且毫不费力地识别事物之间的因果联系,即使有时这种关系根本就不存在,它也会这样认定。当听到肾癌高发地区的情况时,你立刻 会想当然地认为这些县与其他县不同是有原因的,一定有个理由可以解释这种不同。然而,正如我们所见,当系统1面对“纯统计学”的数据时是束手无策的,因为 这些数据虽然可以改变结果出现的概率,却不能直接导致结果的发生。 根据定义,一个随机事件是不需要解释的,但一连串的随机事件就有规律可循。想象有一个装有大理石弹球的瓮,其中有一半的弹球是红色的,另一半弹球是白色 的。然后,再想象有一个非常有耐心的人(或一个机器人)随意从瓮中取出4个大理石球,记录其中的红球数,再把球放回去,重复这样的做法数次。总结记录结果 时,你会发现“2红2白”的结果出现的次数(几乎刚好)是“4个全红”或“4个全白”这种结果的6倍。这一倍数关系是个数学事实。你可以对这种从瓮中反复 抽样的结果作出自信的预测,就像你能预测到用锤子砸鸡蛋的结果一样。尽管你无法预见蛋壳破碎的具体细节,但大概结果还是很确定的。两件事的不同之处在于: 你想到锤子砸鸡蛋时感受到的那种明确的因果联系,在瓮中取样的设想中是找不到的。 相关的统计学事实与癌症那个例子也有联系。两个 耐心的计数者轮流从瓮中取大理石球,杰克每次拿出4个球,吉尔拿出7个。他们都记录了每次拿到相同颜色弹球的次数,要么全白,要么全红。如果他们取球的做 法持续的时间足够长,杰克拿到同颜色大理石的次数会是吉尔的8倍(两人的预期概率分别为12.5%和1.56%)。这个结果与锤子无关,也与因果联系无 关,这仅仅是一个数学上的事实:一次拿4个弹球与一次拿7个相比,出现极端结果的概率更大。 现在,将美国人口想象成一个巨大的瓮中的弹球。有些球上标有KC(即Kidney Cancer的简称)字样,表示肾癌。你抽取弹球样本,并依次按照所在县摆放,你会发现乡村地区的样本要比其他地区的少。如同杰克和吉尔所做的那个游戏一 样,极端的结果(非常高或非常低的癌症发病率)容易出现在人口稀少的县,这个故事告诉我们的就是这些。 我们从一个令人费解的事实 说起:肾癌的发病率在各县有所不同,且是有规律的,我用统计学理论对此作了解释:相比于大样本,极端的结果(高发病率和低发病率)更容易出现在小样本中。 这样的解释不存在因果联系。某县的人口稀少既不会引发癌症,也不能避免癌症,只会使癌症的发病率比人口稠密地方的发病率更高(或更低)。这就是真相,没什 么可解释的。在某个人口稀少的县,癌症发病率并非真的比正常情况更低或更高,只是这个县正好在某个特殊的年份赶上了抽样调查罢了。如果我们在第二年重复这 样的分析,也能预测到在小样本中出现极端结果的一般模式,但在前一年癌症发病率高的县,这一年发病率并不一定高。如果是这样的话,则人口稠密或稀少的因素 就无法对发病率作出解释了:这些表面因素就是科学家眼中所谓的假象,即观察结果完全依赖于调查方法的某一方面,在这个案例中,则依赖于样本大小。 我刚才说的例子也许会令你惊讶,但这并不是真相初次大白于天下。你早就知道应该更相信大样本,并且即使是对统计学一无所知的人也听说过大数法则。但是“知 道”并非是非抉择问题,你可能会发现下列陈述放在自己身上很合适:当你阅读这个关于流行病学的例子时,并没有立刻注意到“人口稀少”这一特点与此次调查有 何关联。对于采用4个样本还是7个样本所产生的不同结果,你至少会感到有一点惊讶。即使是现在,想要确定下面两个陈述句所说的完全是一回事,你也要费些脑 力: (1)大样本比小样本更精确。 (2)小样本比大样本产生极端结果的概率大。 第一个表述清晰地陈述了一个事实,但直到感受到第二个表述传达给你的意思,你才意识到自己并没有真正理解第一个表述的意思。 上述内容概括起来就是:没错,你知道大样本的结果更精确,但你现在可能才意识到你并不清楚为什么它们更精确。不仅你一人如此,阿莫斯与我在一起进行的第一个研究表明,即使是经验丰富的研究人员对样本效应也缺乏直觉,要么就是理解不到位。
291 次阅读|0 个评论
分享 嘻嘻嘻,虫虫来看
热度 22 jellobean 2016-7-3 07:14
我的际遇统计 : - 效率比你高不少吧
510 次阅读|8 个评论
分享 "打老师" 的谬误所在 —— 从数理统计的角度
gordon 2016-4-12 11:05
其实很多人,对普通的智力从业人员是瞧不上的 。 认为它又解决不了 “我的问题” ,还有更牛逼的人。我找更牛逼的 “抓大放小” 就可以了,就是古代的养士嘛 ******************************************************************************* 但实际上呢,超越均值是很困难的 这也是基金经理,把超越 沪深指数,作为业绩考核指标的原因所在。 向均值靠拢,这是个规律。 ******************************************************************************* 能人都是在环境中成长起来的 不可能来说,一群人是傻逼蛋,在中间出了一个奇才 就像 “红灯照” ,弄一个 “神童” ,神奇 中国社会爱搞这种事,呵呵 注:反正,真不真呢,我们不知道啊 ******************************************************************************* 鼓吹 “天才” 、“超天才” ,呵呵 不管你们信不信,反正我是信了。 ******************************************************************************* 长期的角度,超越均值是非常困难的一件事情 非要把你拉回来不行。 短期超越,当然没问题啊。 长期可不是那么容易。
165 次阅读|0 个评论
分享 我当年对电动车的判断,现在看来非常完美(转)
热度 2 gordon 2016-4-4 09:13
注:关键在于统计推断,统计是多么牛逼。我一看 “大部分开汽车就是上下班” ,我就认定,电动车必有前途。 因为现在电动车还不成熟呢,但你不能等成熟了,再做。先把市场做出来。 其实 战术才是最重要的,战略都是渣。这是这么多年的感受 注:哥在办公室当领导,当这么多年了。我连这个都不知道,我不是傻逼。 ****************************************************************************************** 中国的车,毕竟不是高档车。 有个市场,有点利润,才能慢慢往前做。 ****************************************************************************************** 使用体验链接 https://www.oursteps.com.au/bbs/forum.php?mod=viewthreadtid=1009327 ****************************************************************************************** 我的大玩具-纯电动汽车 一.简介 车型: 北汽E150EV 续航里程: 150KM 功率:额定20KW 峰值45KW 最高车速:125KM/H 0-60KM/H 加速时间 5秒 0-100KM/H加速时间约13.5秒 二.用车感受 爱,非常爱! 买之前也有各种顾虑,买之后就只有爱 之所以爱,是因为: 85%  极为经济,百公里耗电16度, 电费RMB8元, 5% 使用保养方便,只需在家充电,再也不用去加油站排队;没有机油三滤火花塞, 每一万公里做例行检查即可. 5% 对新事物的好奇 3% 各种鼓励政策,比如有补贴,免印花税,五年免费保养,免费救援等等 2% 环保,零排放 从2014年10月26提车,10月30上牌开始,到今天我的小E已经跑了4500公里,这段时间家中另一辆汽油车只跑了40公里,而且只是为了跑而跑, 怕长期不动对车不好。 这说明纯电动汽车能够满足绝大多数出行需求。 统计显示: 50%的人日常出行不超过50公里, 90%的人日常出行不超过90公里。 很多人一提纯电动车,第一反应就是续航里程短。 我认为 续航里程短是纯电动车的特点而不能说是缺点 :买这车就是跑短途用的,  说白了就是上下班买菜接孩子 。 如果你天天都要行驶300公里,那千万别买电动车。 飞机续航里程长,可没人坐飞机去商场买菜,因为这不是飞机的用途,你不能说飞机没用。 电动车特别适合当家中的第二辆车,甚至可以说:汽油车特别适合当家中的第二辆车 , 因为当你拥有一辆纯电动车时,另一辆汽油车10有89会放在车库里很少使用了,这不但是我,也是很多纯电动车主的共同感受-- 买纯电动车时是当备用车买的, 可一但开回家就成了主力 。 电动车改变了我出行习惯:它实在是太经济了, 北京的公交车已经够便宜了,它比坐公交车费用还低 ,所以只要目的地好停车, 我一定会开车去。而且我的外出频率也明显增加了。 再简单说说驾驶感受。 比较安静,车外噪音极低 ,以至于行人经常被吓一跳:怎么旁边突然来一车?! 车内噪音较低, 毕竟不是高档车,隔音可能不太好 ,高速行驶时能听到明显的斯斯声。 提速相当快,特别是起步时, 红绿灯起步能快过这车的是少数 。时速超过60公里后,再提速就没什么优势了。 有动力回收装置,一松油门动力回收就开始工作,因此 堵车并不明显增加电耗 。 气温对续航里程影响较大。10月底北京气温还比较高,经常可以跑超过150公里。 冬天气温低,不开暖风的话,大约能跑130-140公里。 如果开暖风的话,每小时减少18公里左右续航。澳洲冬天温度也相当高,完全不会有影响。 三.FAQ Q:你为什么买纯电动汽车? A: 感谢党的好政策,北京尾号限行,每周有一天车不能动, 打算买第二辆车但摇了快4年没中签, 才有了买电动车的想法 。因为在北京买新能源汽车免摇号(或者说中签率大于100%).更重要的是, 趁着电动汽车免摇号,赶快占一个北京牌照。 Q:你为什么选择北汽E150EV? A:2014年10月,北京“新能源汽车目录”里只有7款车, 而真正在售的只有三款,分别是北汽E150EV, 比亚迪E6, 江淮IEV4 。我对北汽还相对更信任一些,再加上当时北汽有活动,直降5.1万,原价23万的车,8.48万就能开回家。顺便说一句,TESLA不在北京新能源汽车目录里,也就是说,买TESLA是要摇号的. Q:150公里续航里程够用吗? A: 够用,以至于我的汽油车都闲置了 。 Q:电池寿命如何? A:我们是小白鼠,目前还不明朗,不过保6年15万公里衰减不超过20%,应该没什么大问题。网上各种评测不可全信,这个行业充满了“托儿”和“黑”, 以比亚迪为甚, 我也因此对比亚迪相当反感。 Q:换电池会不会很贵? A:不知道。 电池的成本应该是逐年降低的,手机锂电当年多贵,现在才多少钱。我相信政策上会有鼓励,到时候如果电池便宜就换电池,而且完全有可能直接换车了。 Q:锂电会不会爆炸? A:汽油一样会爆炸。 Q:有什么不满意? A:对车本身没有任何不满意, 不满意的是公共充电设施跟不上。 比如从我家到平谷金海湖90公里,够去不够回,如果金海湖有足够的充电设施,我就敢开电动车去,否则只能开汽油车去。 Q:最近网上很火的那个拉着发电机跑的,有何看法? A:如果不是哗众取宠的话,只能说明一点: 在北京发展纯电动车的瓶颈在于 居民小区内安装充电桩太难。 很多小区每年交几千块钱停车费,却没有固定车位, 更不必说安充电桩了。如果家里有充电桩,犯得上拉着个发电机到处跑吗。足迹里的人基本生活在澳洲, 住大HOUSE, 充电不是问题,而在国内,特别是北京,这是大问题。 ************************************************************************************ 注:这倒提醒了我,实在不行,可以买一个发电机。雅马哈的 这个发电机还能干其它,如果有什么需要 不间断供电的工作。 野外,也能用到。
209 次阅读|0 个评论
分享 双色球 这哥们太贪了,
热度 19 樱木花道 2015-1-26 16:59
寻性姿势2:据传,福彩中心派人乘飞机到广东购买今日开奖号码,在距离截止前6分钟打出了117倍单选倍投被另一彩民怀疑,待此人离开后,这位彩民打了7000倍那个号码,福彩中心统计数据发现异常,取消今日开奖#求辟谣#————这哥们太贪了,你打个77倍就差不多了呗
879 次阅读|9 个评论
分享 大数据与 医学统计的未来 (转)
gordon 2015-1-5 21:39
现代生物医学的方法论基础即将出现重大变革,从基于假设检验的统计分析演化为基于数据挖掘的知识发现。 20 世纪 80 年代以来,在“循证医学” (evidence-based medicine , EBM) 研究范式的引领之下,医学取得了许多重大进展,推动了临床实践的规范化。 EBM 的哲学根基是临床医生从经验、观察提出各种假设和猜想,并经由假设—演绎法来做检验。 EBM 所强调的方法论基石之一是随机对照试验( randomized control trial , RCT ),其步骤可概括为:猜想 — 搜集数据 — 假设检验 — 得出结论。但是,这种方法论在面对疾病,尤其是癌症等一系列有着异常复杂内在机制的疾病时,其内在缺陷也是不可忽略的。由于试图通过随机分组方式来简化影响干预效果的复杂性,从而可以使用简单的统计学手段来考察很少的一些影响因素对临床结局的作用。但是,这就使得 RCT 本质上成为一种“黑箱研究”,即忽视因果关系而将相关性作为评价干预对临床结局的效果。研究者未尝不知道相关性与逻辑因果有区别,但由于有各种应用上的便利性,研究者往往在结果解释时故意混淆概念,化相关为因果。以 RCT 为支柱的循证医学,使得临床实践几乎被大型 RCT 的结论主导,但当出现结果相反的 RCT 时,就会给临床医生造成极大困惑。 Meta 分析作为一种解决此类挑战的方法已经十分流行 , 但 Meta 分析从诞生开始就被异质性挑战缠身,对所得结论十之八九还要乞灵于“更多、更大样本的 RCT ”,从而进入了一个死循环。破解这一难题,需要另觅蹊径 随着计算机科学的大发展,近几年来,研究者们在临床上第一次有可能、也有能力去考察数据全集。传统的临床研究设计方法产生的前提, 就在于以前无法处理海量的临床数据,无法考察数据全集而必须抽样。无论 RCT 还是队列研究,究其根本,其核心技术都是围绕恰当的抽样设计。但由于各类疾病本身的复杂性和患者之间巨大的内在差异性, RCT 以及队列研究所能揭示的真相是有限的。当然,可以通过扩大样本量来减少异质性,但随着样本量扩大而带来的异质性减少却是边际递减的,而成本却呈数量级上升的。 随着计算机科学的进步,我们对临床数据的记录和处理能力已经远非 20 世纪 80 年 代的研究者所能想象 。利用计算机工具对海量的数据进行数据清洗、建模和计算,是旧有的、适用于传统临床设计的统计工具不堪胜任的,这需要由功能更为强大的 计算机语言来实现。这种语言不仅仅可用于假设和猜想的验证,还可以在没有假设和猜想时,通过对数据进行模式识别,将存在于海量临床数据中的重要信息提取出 来。这种模式识别分析方法对分析工具的灵活性要求很高,传统固定的分析软件难于实现。因此, R 比已有的商业化软件如 SPSS 和 SAS 更适用于临床数据挖掘的新分析模式。 海量数据的产生,还对计算机统计算法提出了新的要求,即统计分析的参数选择从基于研究者 / 统计学家的主观经验逐渐过渡到客观的智能化、自动化选择,这就为临床数据分析引入了一个全新的计算机研究领域——机器学习。 Tom Mitchell 在 1997 年对机器学习曾经进行了如下的定义:“ Machine Learning is the study of computer algorithms that improve automatically through experience (机器学习是对能通过经验来自动改进的计算机算法的研究)。”机器学习不仅要求对已经存在的数据进行分析和知识挖掘, 还要求计算机能够通过对已有数据的学习来实现临床上对各种趋势的预测。研发临床机器学习系统,其核心技术是构建有效的、可自动更新的临床知识库。开发此类 具有自动优化功能的机器学习系统,其工作量极其庞大,任务具有碎片化性质,现有的商业开发模式无法完成。显然,只有功能异常强大、用法灵活、且有众多专家 活跃的在线社区的支持下才能完成上。 ****************************************************************************** 在计划经济时代,中国和苏联的调查方法就有很大差别。 中国由于能力的限制,主要是抽样调查。 而苏联是全面调查、当然也更僵化。 1980图灵奖的 CAR Hoare 最为人知的是1959快速排序算法, 当时作为交换生在莫斯科州立大学跟随Kolmogorov(1903-1987)搞机器翻译 牛逼人就是因为跟对了大牛,呵呵 ****************************************************************************** 回顾一下 ”临床医学“ 的历史,对发展脉络的预测是有所帮助的。  自古希腊以来,生物学家们就发现,若要把握纷繁芜杂的生命现象,理解生命近乎无限的多样性,首要的是按照相似性形成“类别”观念,从相似中去查见差异, 这样就建立了以研究生物多样性和独特性为基础的分类学,它的另一个为现代生物学家所熟知的名称是“系统学”。由于“有机体只有在某种分类学建立了之后才能 按科学方法加以研究和处理”,并且由于“分类学的各个分支集中了、运用了、概括了有关有机体的一切已知知识” ,系统学因之成为一切生物学学科最基本 和范围最广泛的部分,并因而对生物学发展产生巨大影响的学科。毫无疑问,林奈使分类学对生物学的影响在1760年代达到顶峰,他创设的双名法严谨实用,为 更严格统一的命名奠定了基础,他对易于混淆的同义词进行标准化,使生物学家开始使用同一套语言交流,一句话,他使生物学“如何说”不再成为问题。  分类学的巨大影响波及生物科学的几乎所有领域,作为生命研究范畴组成部分的医学也不例外。分类医学从而成为这一时期的主流,疾病被认为是具有独立地位的 实体,病人的身体因而成为外在于疾病的无干物和阻碍医生发现真相的障碍。从对疾病所具有的此种概念出发,福柯发现,对分类医学而言,“人们所面对的(疾 病)是一些既是自然、又是理念的类型。”与“自然”概念相联系的本质使不符合疾病所具有的分类学地位的干预成为“反自然”,从而也是有害的。因此,观察和 期待,以及在恰当时候“帮助”疾病完成它的自然过程就成为理所当然。对达到这一目的来说,既然家庭是疾病发生和出现的空间,因此对促进疾病消亡显然具有特 殊意义。由此,“(疾病的)这种结构就与政治思考中对救助问题的思考完全契合了。”  既然家庭成为促进疾病康复的最好场所,原本由济贫院转变成为专门收治贫穷患者的医院也就没有存在的理由,而将用于建立医院的基金直接给予病人家庭也将更 为合理。经济学家们在此找到了与分类医学家的共同话语:18世纪的经济学家早已认为医院因其固定性和资产的非流动性而无法适应贫穷需求变化,这种性质与捐 赠财产作为公共财产的本质相违背——“这种独特而神圣的基金应该融化在一般性救助空间里,社会是其中唯一的管理者和无差别的收益者。”由于生老病死是人人 面对的问题,直接救助又必须依赖社会结构来支撑,因此医疗必定需要与国家相结合并成为一种国家任务。显然,这里已经出现一种促成近代医疗卫生体系的思想, 但若要实现这一社会对健康进行操作的过程,还需要另一种推动力——瘟疫或我们称为传染病的一类特殊疾病。  由于传染病发病迅速,每次流行时总导致相似症状和高度一致的病程,但当在不同时间和地区流行时,其强度和特点又差别甚大,因此它不具有一般疾病所有的独 立本质,采用分类医学赖以建立的单个观察、记录和分类的方法也就无法加以认识。它是一种集体现象,并总是具有某种历史独特性,所以“需要从其特殊的、偶然 的、意外的特质来描述。”换言之,需要灵敏的发现和全面充分的记录,这就导致了“流行病监测体系”雏形在18世纪末得以建立。由于认为流行病在本质上是由 当时当地特殊的气候、水土、社区条件和人的行为方式所导致的综合症状过程,因此,对流行病的控制只有通过社会干预和一系列强制手段才能实现。所以,福柯指 出,虽然“流行病学在所有方面都与分类医学相反,但一旦涉及对疾病、医疗经验以及医生对社会结构的监控进行分配这些第三级构型,流行病病理学和分类疾病病 理学就会碰到相同的要求:确定医学的政治地位,建构国家层次的医学意识。”正是这些要求促进了医学学科结构的改造,并在此后社会变革中催生出新的医学观念 和体系。  1790年代成为分水岭,社会的动荡和重组导致了对医学实践的新要求,而一般政治观念和信条又给医学观念造成持久影响并改变了医学观察的模式,最终,分类医学观念被我们称为现代医学观的“生理-病理医学”模式所替代。  大革命使人类解放的观念深入人心,天赋人权的理念促进人们思考不平等与疾病的关系,健康成为验证社会公正的天平。于是医学的政治使命不言而喻,医生的首要任务也因此而具有政治性:“与疾病作斗争必须首先与坏政府作斗争。人必须先获得解放,才能得到全面彻底的治疗。”  虽然这一理想最终被证明为不切实际,但重要的是,通过这一过程,它终于实现了医学与国家命运的结合,并经由随后的一系列政治实践彻底改造了临床医学。废 除旧的医学教育体制和医生执业制度是这些改革的第一步。但是,对行医资格限制的取消和旧有医学教育的关闭并未辅以有效的新制度,结果江湖医生大行其道,加 之战争带来的流血,创立新医院和医学成为必须解决的问题。重新建立的医学院开始出现,并在新环境中运行:这时的管理者和监督者由行会变成了国家。由于古典 大学教育已被废除,新医学院的教育在经过重建的诊所进行。不同的是,前此仅仅实施医学教育的诊所此时已肩负起治疗责任,因此医学生的学习是基于实实在在呈 现于眼前的病例的,对分类理论的学习已退居次要地位。患者的症状取代疾病实体而成为引导临床判断的指南针。分类医学由此嬗变为症状医学。  “我们应该尽可能地使科学视觉化”是症状医学时期最有代表性的箴言,“目视”成为这一时期医学的核心观念,它对诊断技术和概念的形成具有决定性意义。医 生只有借助于如炬的目光才能发现深藏于身体之中的疾病,恰如黑暗空间中的包含物只能由白昼之光来揭示。不难发现,这一认识其实正体现着“启蒙”的时代精 神。对疾病的这种感知依赖于对疾病症状和征候的认识,换句话说,“疾病是以症状和征候的方式呈现给观察者的” 。在这里,福柯区分了症状(symptome)和征候(signe)。症状是更具有本质性的表象,或者说,它表现着疾病本身。“在症状之外不再有什么病理 本质:疾病中的一切本身都是一种现象;就此而言,症状扮演着一个纯朴的、最自然的角色:‘它们的集合体构成了人们所谓的疾病’。”因此,疾病的本体被取消 而代之以症状的集合。征候则略有不同,如果说症状本身反映着疾病本身的存在,那征候就是为医生所感知的疾病的间接物。  症状和征候概念的形成对现代医学有着极其重要的作用。今天,所有的医生在其临床医学教育的第一课都会被教导牢记和理解症状和体征(现代医学对signe 的译名)的概念。现代诊断学将症状定义为“为患者感知并表达的不适或异常”,体征是“由医生通过客观检查发现的异常机体现象”。通过把医生置于客观和中立 的观察地位,体征在今日的诊断中获得了较症状更为显著的位置。由于症状医学关注的焦点是医生目光的直接和间接,而现代医学关注的是对异常过程感知的客观性 和主观性,所以,对症状和征候给以不同地位就不足为怪了。由于症状直接代表着疾病给患者造成的痛苦,因而是疾病存在的证据,而体征反映着已经存在的异常, 因此也表现着疾病。所以,无论是症状还是征候都可以是疾病的同一物,它们“诉说着相同的事物”。  在对症状-征候进行深入分析的基础上,福柯进一步运用符号学方法考察症状医学的观念结构,并将一对声名显赫的概念引入到对疾病认识的结构分析中,这就是 所指和能指。简单来说,前者可以理解为我们感知并企图加以把握的存在物,而后者则是我们加诸这一存在物的名称(或者按索绪尔的说法,所指和能指分别代表存 在物的概念和音响形象),而事物的整体,也即所指和能指的复合体就构成了一个可以为人所把握的符号。这样,由于症状构成了疾病表象,因而也就成为疾病的能 指。同时,因为症状的集合就是疾病本身,它也是所指并因为这种二重性成为叙述疾病全部事实的符号。由此,病理过程理当成为充分言说的对象,所以“疾病存在 的真实性是完全可以说明的”。如同语言的表达需要时间,症状的显现也是动态演变的过程,所以,疾病应当是包含时间维度的概念,分类医学中静止的疾病因而流 动起来。  症状理念指引着18世纪最后几年中的医学家们。但是,人们很快发现, 症状和征候是如此纷繁,不确定性又是如此令人绝望的无处不在 ——“不确定性既是对象 复杂性的特征,又是科学不完善性的特征;除了自身的极端狭窄与资料的过分丰富之间的关系外,医学的推测性质没有任何客观基础。”不和谐的偶然性变得越来越 引人注目,人们迫切需要能够处理这一新问题得新方法和新观念。正当其时,一门新数学的出现为解决概率问题提供了绝佳视角——统计学由此开始了融入医学方法 的过程,并最终成为医学科学化的重要支柱。   伴随工业革命的进程,近代国家开始形成,如何衡量国家实力成为政治计算的重大任务。 专门调查机构应运而生,人口、土地、出产以及疾病的数目字随之如雪崩 般涌现,1660年前后,统计学作为“政治算术”登上了历史舞台。扩张的野心、对利润的渴求以及实现“最大幸福”的理想把欧洲国家集体推上数字化管理进 程,统计学也迅速成为一门显学。“每个国家,幸福的还是不幸的,都以其自己的方式在统计学上表现出来。” 这是一个统计学家大显身手的时代,拉普拉斯(Laplace)、泊松(Poisson)开创性的工作奠定了统计学作为一门科学的基础,而孔德从对数目字的 测量中引发出“实证” 概念,此后的历史表明,它对近代科学、哲学乃至一般社会思想都发生了深远影响。  在这一观念背景下,现代临床医学的结构得以建立:“通过引进概率论思想,医学就彻底更新了其领域的感知价值……医学不再试图观看有感觉的个体背后的本质真实;它所面临的任务是,理解一个开放领域的事件,以至无穷。这就是临床医学。”  但是,症状医学的观念依然存在认识的迷雾:疾病被看作语言的类似物,没有本体,只有作为符号的症状在运行,医生的目光仅仅停留于身体的表面。显然,这是 缺乏深度的目视,机体的迷宫仍然保持在黑暗之中。要揭开迷雾,就必须打开身体,用洞察入微的光亮照进暗藏疾病的阴暗角落。瞥视(glance)取代目视成 为下一时期临床实践的核心观念,解剖学也取代症状成为解析疾病的利刃:“症状医学将逐渐消退,直到在关于器官、病灶和病因的医学面前,在完全按照病理解剖 学组建起来的临床医学面前最终消亡。”  经典医学史在论述这一临床医学向现代转变的时期时,总乐于强调存在于病理解剖学家与社会保守力量之间的戏剧冲突,并进而证明正是由于旧的社会势力的阻挠,医学才会在长达百年的时间中无 所进步,而冲破对尸体的禁忌才为临床医学带来了发现真理的希望。然而,福柯通过对历史文献的细致考证发现,这些叙述并非历史的本来面目,至少从18世纪中 期以来,为医学目的进行的解剖不存在障碍。之所以会出现这些虚幻的历史书写,乃是因为编撰者往往从日后对临床医学和解剖学紧密关系的解读出发去找寻历史发 展的痕迹,并 根据预先形成的结论 对历史文献做选择性编排,忽略乃至无视与自己观念不相吻合的记录,从而颠倒因果的建构了一部有关英雄与愚人,进步与退步的 历史。  早在17世纪,维萨里留斯就已经发表了解剖学巨著《论人体的结构》,1760年莫尔加尼的《病变的位置与原因》已经把疾病与病理解剖学联系起来。由于占 支配地位的观念并不关注病人身体的结构与疾病发生的关系,所以“在四十年间阻止医学听取莫尔加尼的教诲的,正是临床医学的思想。冲突不是发生在新知识与旧 信仰之间,而是发生在两种不同类型的知识之间。”  比夏(Bichat)的著作是这一时期最有代表性和最重要的医学文献。他将“组织”作为机体构成的最基本单位,并认为疾病最终可以还原为组织的损伤过 程,因此每一疾病都被给以一个解剖学地位。通过考察“每一系统内普遍的变化史”,病理解剖学最终建立了一套身体结构的疾病分类体系。所以,在某种意义上, 分类医学的基本观念通过病理解剖学获得了新生。毫无疑问,在这里“每个系统内普遍的变化史”具有极其重要的价值,这一认识促使人们去发现不同器官中类似的 发病过程,并成为今日病理学“运用基本病理过程及其发生发展的基本规律去深刻发现和认识各种疾病的特殊规律和本质” 的观念来源。  在解剖-病理医学中,死亡的地位也发生了转变:尸体成为关于生命和疾病的真理的来源,死亡也就不再仅仅是一个消极的终结者,而成为“获得关于生命的实症 真理的唯一可能途径”。死亡从一个突兀而来的事实变成了一个绵延于生命之中的过程,所以,“生命、疾病和死亡由此组成了一种在技术上和观念上的三位一 体。”正如一位研究者指出的,在这里,福柯发现了“死亡在医学感知中承担的新角色,成为疾病和生命关系的澄清者…死亡过程变成了一种特殊的生命过程,先于 病人的实际死亡而存在,而且在实际死亡瞬间之后依然存在。死亡提供了认识疾病和生命的最佳视角。”  虽然透过病理-解剖医学对已有观念的整和、改造与重建,现代临床医学的疾病观已初具雏形, 但仍然有一类疾病无法被纳入它的框架之中 ,早期的解剖学家们无 法给它们确定位置,这就是“热病”——一类包含甚广的炎症性疾病。“红、肿、热、痛”是这类疾病的共通特点,但常常无法发现发热与具体器官的联系,困惑的 医生们热烈的讨论,有时甚至发生激烈的争执,然而问题终于没有得到解决,直到1816年。这一年,布鲁塞发表《公认学说之考察》,明确指出,要理解炎症, 就必须认识到这是一种在不用解剖刀就可以用肉眼看到的生理学现实,因此就需要用一种“生理医学”的观察方法来把握。 炎症首先是一种“机能失调” ,所以疾病 的本体性再一次被取消,有关生理反应的观点取得了支配性的解释地位。人们需要的是“在生理学里寻找疾病的特征,并且通过娴熟的分析来分辨患病器官常常混为 一团的呼喊。” 由此,界定“正常”成为实现疾病生理分析的首要任务。不知道正常就无法了解异常,从这一思路出发,我们不难理解,为什么整个19世纪医学史会在克劳德贝尔 纳和路易巴斯德处达到颠峰。所以,福柯的下述结论就显得尤其令人信服“疾病医学已到了尽头;现在出现了一门病理反应医学。这种经验结构主宰了19世纪。因 为它还将包容致病媒介医学,因此虽然它也不免在方法论上有所修正,但还是在某种程度上支配了20世纪。” 恩斯特迈尔在其巨著《生物学思想发展的历史》中写到:“在一般人心目中发现就是科学的标志。新事实的发现一般是容易报道……然而 把科学仅仅看作是收集事实 则是很大的误解 。在生物科学中,绝大多数的重要进展是由引入新概念或改善现存的概念而取得的……通过概念的改善比经由新事实的发现能更有效的推进我们对世 界的了解,虽然这二者并不是互相排斥的。” 注:这种认识超越了经验科学,新概念的引入确实很牛叉。 但作为一个保守主义者,还是觉得英国人的经验主义 牢靠。
327 次阅读|0 个评论
分享 【财迷统计】金钱卡之最
热度 20 齐若散 2014-9-20 22:49
参与苏格兰独立赌局赢得1000两银子,以限量发放金钱卡的方式与民同乐 ,参见我在八卦闲聊栏目发的帖子 【财迷信息】限量发行金钱卡 http://www.aswetalk.net/bbs/thread-32489-1-1.html 这里只是对发放后的反馈信息统计一下开奖的最高、最低的前三名(根据最新结果,本日志内容或有更新),各位RP如何显露无遗。 1. 开奖最多: -- 14爱元:东张西望、Sylvia、料理鼠王 -- 13爱元:Jellobean、sduivy、澹泊敬诚、马鹿、理想的下午 -- 12爱元:空气精灵 2. 开奖最少: -- 2爱元:leekai、蓦然回首 -- 4爱元:如风如雨 -- 6爱元:沉宝、martian、懒猫猫 另外,那个主帖里鲫鱼不少啊: -- 齐 若散 缺钱花,找雪个要,获得 3 爱元 -- 无漏 今年又过一次生日,收红包 1 爱元 -- 然后203 亲自下厨房烧了一盘葱爆鲫鱼,大婶吃的高兴,打赏 2 爱元. -- 空气精灵去游泳,被泳池一群跳操的大妈表扬身材好,打赏3 爱元. -- 澹泊敬诚 在世界最2大会上来了个鹞子翻身,博得满场彩,奖励2 爱元 -- sylvia 见义勇为被送到阿尔巴尼亚讲演,回国后倒卖掉外汇券,赚了 3 爱元 -- 喜欢刮台风的时候打雨伞出行,飞行上万公里并兑换航空公司积分,旅游之余还赚了 2 爱元. -- 穿着裤衩裸奔兴冲冲地去Las Vegas,福神显灵,大杀四方,狂赢2 爱元 -- sduivy 梦见与饭岛爱共进晚餐,兴奋过度掉下床,医药费损失 3 爱元 -- 鲫鱼大神摸摸 马鹿 的头笑而不语,马鹿 损失 1 爱元. -- 鲫鱼大神摸摸 料理鼠王 的头笑而不语,料理鼠王 损失 1 爱元. -- 冰蚁 为移民提出假离婚被老大海扁,花费医疗费1 爱元 -- 洗心 观看三文鱼洄游时相机不慎落水损失 2 爱元. -- 齐若散 被钱袋砸中进医院,看病花了 3 爱元. -- 穿着裤衩裸奔经常辅导女生到深夜,身体透支,吃补药,花费 1 爱元. -- 雪个 酷爱夜晚唱歌,被大批次的狼群追咬,治疗花费 2 爱元. -- 到处停留的叶子 不幸碰到了黑虎帮,为了保住小命,到处停留的叶子 乖乖上缴2 爱元 居然有同学回赠我金钱卡、雷达卡、涂鸦板,真是喜出望外啊。
1938 次阅读|21 个评论
分享 神统计——转
热度 12 农民家的狗 2014-9-13 08:02
神统计——转
?图片为什么会变小 http://bbs.tianya.cn/post-54421-18510-1.shtml
787 次阅读|2 个评论
分享 世界杯赌球个人总结
热度 28 不爱吱声 2014-7-22 22:23
世界杯赌球个人总结
四年一届世界杯,对自己来说也是难得的一次可以可劲儿看足球的机会。得益于自己可以work from home,小组赛几乎场场不拉地看了直播比赛。但是到了淘汰赛,因为孩子们正好那段时间不需要上学,全家去阿拉斯加度假,因此16强和8强的比赛没有看全直播。好在阿拉斯加时差的原因,每天第一场比赛是八点钟,吃早饭时间总是可以在hotel里看一场球,然后再出去玩,在船上则更方便看比赛,因此也看了差不多一半的比赛。从四强开始,到了温哥华,就又可以在hotel里看球了。总的来说,这届世界杯过足了看球的瘾。 除了看球,就是赌球。像三妞这样的高手,可以靠赌球赢一套北京三环以内的房子,而自己只有羡慕的份,真金白银的木有,也就只敢在爱坛小赌怡情了。其实,赌球对自己来说就相当于找个主队,这样可以看球时候更容易出情绪。世界杯结束了,赌球也结束了,这里小小总结下自己的战绩,算是留个念。 爱坛赌场共有两种赌法,一个是吱票盘,有点类似于真正的赌球,参赌者必须使用自己拥有的吱票参与;还有一个是参赌者啥都不用直接参赌即可,不过有写千字文的风险。这两种赌法自己基本上能参合的都会参合,重要的在于参合么,再说,写签字文其实也没什么可怕的。 论坛整体的各赌盘数据可以参考这个帖子:阿姨赌场之数据总结。 所有的赌局及结果可参考淘贴专题。http://www.aswetalk.org/bbs/forum.php?mod=collectionaction=viewctid=47page=1 以下为我自己参与的赌盘结果数据总结:吱票盘结果(7,8,9三盘因为旅途中没法参与): 第1盘:-3 第2盘:-28 第3盘:-12 第4盘:20 第5盘:4 第6盘:0 第10盘(决赛盘):11 共参与7盘,合计输掉8吱票。 参与的愿赌服输千字文盘(14,15,16盘由于旅途中没法参与)结果: 第1盘:猜对三场,赢得2吱票 第2盘:猜错三场,千字文1篇 =〉阿姨赌局http://www.aswetalk.org/bbs/thread-30591-1-1.html 第3盘:四场全对,赢得5吱票 第4盘:猜中2场,赢得20爱元 第5盘:猜错三场,千字文1篇 =〉简评四场球http://www.aswetalk.org/bbs/thread-30690-1-1.html 第6盘:猜错三场,千字文1篇 =〉完美香蕉球,梅西制造http://www.aswetalk.org/bbs/thread-30809-1-1.html 第7盘:猜中2场,赢得20爱元 第8盘:猜错三场,千字文1篇 =〉世界杯之七大神技http://www.aswetalk.org/bbs/thread-30882-1-1.html 第9盘:猜中3场,奖金50爱元 第10盘:猜错三场,千字文1篇 =〉拟定题目:从梅西到牛顿,正在写作ing 第11盘:猜中3场,奖励50爱元 第12盘:猜中2场,奖励1吱票第13盘:猜中2场,但是附加题错,无奖励 第17盘(决赛盘):猜中2场,但是附加题错,无奖励。 总结,共参与14场,共获得8吱票,140爱元,需要写五篇千字文,目前已经完成四篇,最后一篇正在写作中。 吱票盘输给赌场8吱票,千字文盘又获得8吱票,合着一趟下来白玩儿。爱元除了从赌场直接获得,还有千字文获得的加分奖励,到还收获了不少。 最后,阿拉斯加真的很漂亮,留下很多美好记忆,正在整理照片,争取找时间写个游记出来,本着写日志要上图的原则,先随便放一张手机拍的广角全景图,是denali national park某处拍的。
个人分类: 生活拾趣|156 次阅读|7 个评论
分享 意大利今年起将贩毒和卖淫纳入GDP统计
热度 24 silentdarkness 2014-5-27 11:53
意大利《新闻报》24日称,为拉动国内GDP(国内生产总值)增长,意大利国家统计局宣布自2014年9月起,把贩毒、卖淫等非法交易计入GDP统计数据 意大利《新闻报》报道,除贩毒和卖淫,意大利国家统计局也将军火、烟草和酒类走私列入GDP统计对象。意大利国家统计局发言人称,新的统计方法“可更好地反映经济总体状况,经济往来中无论是合法还是非法收入,都会反映在经济总收入及消费中。” 《新闻报》说,统计方法变化后,意大利GDP将上升2%。此举将直接影响欧盟对意大利国家预算和财政赤字的统计。 彭博社说,新的统计方法将推动意大利长期以来陷入停滞的GDP数据,也有助于欧盟政府执行欧盟债务的相关规定,令年轻的意大利总理伦齐达成赤字/GDP目标。欧盟规定限制成员国政府每年的财政支出,不得超过GDP的3%。 报道称,39岁的总理伦齐正致力于将今年的赤字/GDP比率降至2.6%,如果此前没有计入GDP的地下经济登堂入室,完成这一工作的难度无疑会小一些。过去的13年当中,意大利经历了四次经济衰退,去年的GDP为1.56万亿欧元,如果对通胀做出修正,这一数据比2001年的GDP还要低2%。 不过,由于非法交易的隐蔽性等原因,这些交易如何量化对意大利政府是新的挑战。 据意大利银行估计,2012年意大利总体犯罪率经济高达GDP的10.9%。2008年,意大利曾将逃税的“灰色经济”纳入GDP统计总额,其收入占当年GDP的16.3%-17.5%。 欧盟统计机构Eurostat称,如果将非法经济收入计入GDP,欧盟经济将增长2.4% 。瑞典和芬兰两国算上非法交易,GDP增幅将高达5%。在英国,仅黑市交易就令GDP增长3-4%。
768 次阅读|11 个评论
分享 目前越南被砸企业,大陆5家,台湾120家,日资17家, 南朝鲜26家,新资3家,德资1家, ...
热度 8 silentdarkness 2014-5-15 15:47
据网友@战争事典主编援引统计数字,目前越南被砸企业,大陆5家,台湾120家,日资17家, 南朝鲜26家,新资3家,德资1家,马(来西亚)资1家,中资工业园基本安全。 越南这是要干啥啊,哈哈哈哈哈
636 次阅读|4 个评论
分享 关于陈一坚在<大家>里提到设计规范的一些闲谈
热度 3 gordon 2014-4-27 23:03
陈一坚在大家里面说了这么一个事,美国的设计规范一厚摞一厚摞的。 能从学科一般性的角度论述规范,估计的国内懂这个的不多 。恰好我自己做过一段标准,说一说这个事情。 早期的计算机,是替代人类劳动,也就是进行大量的繁琐的重复性计算,但它们的通用性非常低. 在多数情况下, 如果没有设计人员的干预, 这些程序不会做出有实用价值的设计. 也就是替代一部分计算的功能。换句话说, 这时候的程序一般并不模仿人的认知能力 , 并且它们是呆板的, 不能从其计算结果中获取任何经验. 你就把它当成计算器就好了。 设计新结构时, 设计人员要利用他以前的设计经验. 他的决策过程本质上取决于模式识别( Pattern recognization). 新设计完成后, 他总结出有价值的信息用于以后的设计. 最后, 他用记忆知识精华的方法存储这些信息. 这样的设计过程容易具有人脑的共同弱点, 即遗忘、遗漏、疏忽、前后矛盾或者不合理的决策等, 即使最细心的设计人员也可能有所遗漏。 人工智能( AI ) 领域的研究已达到的水平是, 许多实用的系统已经问世, 其中有些显示出了它们的学习本领 . 因此, 对下一代计算机程序来说, 看来应该将程序设计 看成是一种智能活动, 并且将A l 技术补充到这些程序中. 专家系统也称为以知识为基础的系统, 它是具有智能的交互式计算机程序, 这种程序通过利用启发性知识( hcuristic knowledge ), 即直觉、常识以及经验来起专家的作用. 启发性知识通常是科技专家经过多年积累起来的. 有了启发性知识, 专家系统就能作出受过训练的猜测, 识别有希望的途径, 避免盲目的搜索, 从而可以把解的空间中的搜索过程编小范围。 设计规范通常包括一般情况, 而将不常见的情况留给设计人员去判断 . 换句话说;设计规范有许多漏洞和空白需要设计人员去填补. 设计人员在新结构设计中要利用以前获得的经验. ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× 这个很麻烦,我也讲不清楚。 就是 通过提取人类专家知识,并表达为高质量的具体规则 (经验法则) 这个东西困难在哪里呢,就是计算机专家要懂领域知识,领域专家也要懂计算机。 ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× 当然,现在专家系统已经不流行了,比较流行的是基于统计的方法。 最典型的是李开复,听说是大拿。 乱七八糟,写点这个。是乱七八糟,但这个确实很难。 其实就是从经验中抽取规则,咱们国家以前都是用苏联的设计规范,自己估计没写过 注:万事开头难, 至少现在你知道了,这不是一个标准的问题,而是专家系统、人工智能的问题。 所以,不可能 凑数,和李鸿章一样,从美标抄点,从欧标抄点。 咱们国家有些东西制定的标准并不低,其实就是从美标、欧标抄的。 ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× 陈一坚算是一个比较老实的人,老实人说老实话,普通人能够听得懂。 老陈还说了一个事,叫脑子空白。其实这个东西,叫做什么啊,在认知领域叫做知识的束缚。 就是到你本身积累知识的边界了。 其实还有一种形式,就是思维定势,被称作 “知识的诅咒” 。
258 次阅读|2 个评论
分享 姓名与统计
gordon 2014-3-7 03:57
姓名的出现,跟征兵制有关,必须在册。《木兰辞》里说 ,唧唧复唧唧,木兰当户织。不闻机杼声,惟闻女叹息。 问女何所思,问女何所忆。女亦无所思,女亦无所忆。昨夜见军帖,可汗大点兵。军书十二卷,卷卷有爷名。阿爷无大儿,木兰无长兄。愿为市鞍马,从此替爷征。 姓名被 ID ( identification OR identity ) 取代,主要是因为唯一性解决不了。 ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××× 何包钢:欧树军 《国家基础能力的基础》序言 去年我曾建议欧博士回应一下自由主义对认证政治沦为国家监控手段的批评。欧树军作了很好的回应。他淡化了对认证政治的意识形态上的争论,凸现了对认证政治研究的科学性。他更做了很好的学术梳理,他强调认证是对社会事实的收集、储存和分类、处理。监控需要认证,但认证并不等同于监控。认证在学理上有自己自身的内在逻辑,知识类型,特征属性,制度形式及其政治内涵。 将认证简单地归之于监控,无法真正揭示认证自身在税收、福利与监管等国家基本制度上的作用 。欧树军跳出了简单的意识形态框架,把认证作为一门政治科学的对象。该书是追求和建构一个严谨的政治科学的典型:他深入人类历史,从比较政治的角度,分析各种不同认证政治的形成和发展,该书确实做到了休谟所说的"政治可以回归一门科学"。书中的导言,以山体滑坡灾害为例,说明了认证之于生命安全的重要性。 ×××××××××××××××××××××××××××××××××××××××××××××××××××××××××× 王绍光:欧树军《国家基础能力的基础》序言   所谓“认证”就是在数据与人或物之间建立一一对应的关系。没有认证,人类社会便无法运作,但我们却往往对它熟视无睹。   我第一次意识到认证对治理现代国家的必要性和重要性是在三十年前。1982年,我到美国康奈尔大学留学。报到后,校方马上告诉我必须去城里社会安全办 公室申请个人的社会安全号码。申请程序十分简单,我得到一张小小的纸卡片,上面什么都没有,只印着我的名字和属于我的、独一无二的九位数社会安全号码。刚 开始,对这个号码有什么作用一无所知。但很快我就认识到,那个卡片丢掉了都没关系,但号码却是在美国生活、学习、工作都须臾不可或缺的。它虽然被叫作“社 会安全号码”,其作用却远远超出“社会安全”的范围,签租房合同需要它,领取奖学金需要它,到银行开户需要它,申请信用卡需要它,买保险需要它,报税需要 它,填写形形色色的表格需要它……每个人的社会安全号码会像影子一样随时随地紧跟其后,直至离开人世。他们可以忘记任何东西,但绝不能忘掉这个号码。正因 为如此,虽然我已离开美国十多年,这个号码却还牢牢留在我脑海里。   那时的中国,流动性很低。所有人都属于特定的城镇单位或农村社队,绝大多数事情都是在本单位或本社队进行,万一超出这个范围,就要使用单位介绍信。在这种情形下,国家的触角只需延伸到单位或社队,足矣。   随着改革开放的深入,人、财、物的流动快了起来,社会、经济也越变越复杂。1984年,中国开始在一个个城市逐步试行居民身份证制度。不过,那时的居 民身份证更像一种便携的户口,身份证本身很重要,但上面的号码似乎可有可无。以至于无论是1984年4月颁布的《中华人民共和国居民身份证试行条 例》,1985年9月颁布的《中华人民共和国居民身份证条例》,还是1986年11月国务院批准的《中华人民共和国居民身份证条例实施细则》,都完全没有 提及身份证号码。这种情况一直到1999年才改变,那一年八月颁布了《国务院关于实行公民身份号码制度的决定》,规定自1999年10月1日起在全国建立 和实行公民身份号码制度,“公民身份号码是国家为每个公民从出生之日起编定的唯一的、终身不变的身份代码,将在我国公民办理涉及政治、经济、社会生活等权 益事务方面广泛使用”。   到二十世纪九十年代末中国开始推行公民身份号码时,全世界一百多个国家已经有了带编号的居民身份证;即使那些没有推行身份证制度的国家(如主要是英语系国家,如美国、英国、澳大利亚、新西兰、爱尔兰、印度),大都也实行公民身份号码制度。   大约七、八年前,在一次中印学者参加的学术研讨会上,我无意中向印度朋友们提到中国的公民身份号码制度,引起了印度朋友的极大兴趣。这些任职于印度高 级智库的朋友们大多曾留学欧美,对欧美的身份号码制度很熟悉。令他们惊讶与羡慕的是,中国这么一个13亿人口的大国也能在全国范围实施公民身份号码制度。 他们看到中国同行随身携带的二代身份证,兴奋不已。不知是不是由于他们的推动,2009年2月,印度开始实行AADHAAR制度,意图为每一位印度公民提 供一个独一无二的12位身份号码。到2012年7月16日,大约有15%的印度人获得了这种号码。很显然,作为一种认证标识,身份号码已成为现代国家运作 一种不可缺少的要件。   而我第一次意识到认证与国家基本制度建设的相关性大约是在二十年前。那时我已在耶鲁大学任教,有一天与政治系的同事詹姆斯·斯科特 (JamesScott)一起午餐闲聊时,他提到人们之所以有名有姓是国家为了治理的便利,不仅人名如此,地名也是如此。斯科特是我一生中见过的少数几位 绝顶聪明的学者,几乎每次与他聊天都能激发思想的火花。他对姓名的解释让我顿时眼睛一亮:原来认证不仅存在于现代国家,而且从古至今它一直是国家运作的基 本制度之一。   经过多年研究,斯科特于1998年出版了《国家的视角》一书,其中译本也于2004年问世。在这本书中,斯科特用了13页的篇幅讨论“姓的创造”。 2002年,他又与合作者发表了一篇长达41页的论文,讨论永久性的家庭姓氏是如何出现的。斯科特用详实的史料证明,近代国家的发展与它普遍推行家庭姓氏 是分不开的。在这里,家庭姓氏就是一种认证标识。   也许,在人类社会形成之初,取名便成为必要。然而,在很长的时期里,取名是随意的、不规范的、不固定的、没有姓氏的。斯科特发现,至少到十四世纪,欧 洲只有极少数有权有势的贵族家庭才有姓氏(他们的姓氏往往与其发祥地有关),绝大多数欧洲国家的绝大多数人没有固定的父系姓氏。直到十八世纪初,90%的 英格兰男人扎堆使用八种与基督教有关的名字(约翰、爱德华、威廉、亨利、查理斯、杰姆斯、理查德、罗伯特);只有10%的男人取别的名字。换句话说,每个 村庄,每个城镇都有一大批叫作约翰的人。当生活的社群规模很小、且天高皇帝远时,这种取名方式对当地人不会带来任何困扰。但是,如果国家为了征兵、征税、 征劳役或其它任何目的需要把触角延伸到每家每户、每个人(而不是封建领主)时,就有必要为所有相关的人加上一个规范的、永久的认证标识,由继承性的、源于 父名(或祖先名)的、固定的“姓”与他命或自命的“名”组成的“姓名”就是这样一种标识。虽然现代人对这种取名方式习以为常,实际上,在世界上很多地方, 它的普及化直到最近一两百年才完成,近代国家是其背后有力的推手。   斯科特的观察是:国家建设越早的国家,这种取名方式出现越早。如它在意大利、法国、英格兰出现较早;在瑞典、德国、挪威、土耳其出现较晚;在被殖民的 国家出现更晚。在欧洲,直到十九世纪中叶,这种取名方式才普及到所有人。在日本,直到明治维新之后的十九世纪末,政府才两次颁布法令规定其国民必须使用姓 氏,日本人才人人拥有了姓氏;印度、菲律宾等国普及姓氏也发生在十九世纪;而土耳其直到1935年才以法律形式规定使用姓氏。借助这项发明及其推广,国家 才得以越来越深入地了解并掌控其子民以及他们所拥有的资源。   斯科特知道,中国人在推行姓氏制度方面是早熟的。在《国家的视角》一书中,他认为,“早在汉代,中国就出现了正式的宗族姓氏制度”。在2002年那篇 合著的文章中,他修改了自己的判断:“早在公元前四世纪 ,出于征税、征兵、征劳役的目的,秦朝就试图给它治下的人口强加姓氏”。实际 上,中国姓氏出现的时间要早得多,在公元前二十一世纪的夏代初年,那时“已有了对建德立功的贵族赐姓的制度”。不过,夏、商、周三代,贵者有姓有氏,贱者 无姓无氏。直到春秋战国之际,这种贵族有姓有氏,平民有名无姓的局面才被打破。此后的情形,如顾炎武在《日知录·锡士姓》中所说:“今日天下,人人无土, 人人有姓”。   与姓氏制度匹配的是户口册籍制度。甲骨文中就有“登人”的字样,指的是“以征集兵丁、组建军队为目的的人口调查登记”。到了汉代,中国已出现一套比较 完善的户籍制度──编户齐民制度。此时的户籍要求每户必须将户主、妻子、兄妹、姓名、年龄、籍贯、住址、职业、田宅、牛马、车辆、奴婢等登记在册。按吕思 勉的说法,“户口之籍,皆其与国用有关者也”。早期,户口资料保存在当地,到了明代,户帖制度则规定每户在自己的帖内“详细列明本户的乡贯、人丁数目、姓 名、年岁、产业等等基本情况”,户帖登记完毕后,则需逐级汇总上报,直到中央户部。“全国每户所持有的户帖必须和户部保管的全国总户籍相符,可以用来互相 检核,并可据以较准确计算出全国和各地区所有的户口数字及户口增减的数字”。中国历朝历代之所以如此重视姓氏制度和户籍制度,原因很简单:“有人此有土, 有土此有财,有财此有用”(《大学》)。黄仁宇一直在自己的著作中批评古代中国不能实现“数目字管理”。其实,在很长的历史时期里,中国的“数目字管理” 水平比西方国家高得多,因为在没有普及姓氏制度之前,西方国家即使想实现“数目字管理”,也无从下手。   作为一种认证标识,带姓氏的名字也有缺陷;这些缺陷在现代社会尤为突出。一方面,名字不具有唯一性。随着社会活动半径不断扩大,重名现象十分普遍。在 人口超过一千万的国家,不管多么生僻的名字都可能被很多人共用。另一方面,名字可以改动。在一些文化中,结婚、离婚、收养都可能造成名字的变化。这两方面 的原因都使得名字不能作为一种独一无二的认证标识。   编号倒是一种独一无二的认证标识。 将认证标识从姓名转换为编号最极端的例子发生在1935年的加拿大,也就是在那一年,美国引入了社会安全号码的想 法,并于次年着手实施。 不过,当年加拿大并没有为每个公民提供一个身份号码(一直到1964年加拿大才推出类似美国的“社会保险号码”),而只是给因纽特 人(属于爱斯基摩人的一支)特设了这个制度,原因是 因纽特人没有姓氏 ,政府也无法标准化因纽特人名字的拼写方式。编号的设想于1935年提出,于1941 年正式付诸实施。加拿大政府为每个因纽特人制作了一个五分钱大小的皮革挂件,顶端有一个小孔,中心是女王像,沿圈印着“加拿大爱斯基摩认证”的字样,女王 像下方是一个编号。以“E9-1956”为例,“E9”是指这个人来自“东部第九区”,“1956”是这个人在该区的排号。有了这个编号,政府机关就可以 查到有关这个人的相应信息,包括名字、亲属、出生年月日、疫苗注射情况、犯罪记录、社会福利记录等等。在1970年以前,凡是需要与政府打交道时,因纽特 人都必须使用这个编号。   挂件顶端那个小孔是为了让因纽特人把它挂在脖子上,但因纽特人却不喜欢这种要求,认为它带有侮辱的意味。在越来越高的批评声浪中,加拿大政府于 1968年展开了一项“姓氏工程”(ProjectSurname),要求所有因纽特人挑选并注册姓氏,加在他们的名字里,并将他们全名的拼写标准化。这 项工程历时十余年,一直到1978年才完成。其后这项制度才寿终正寝。现在,与其他加拿大人一样,因纽特人有了自己的名字和社会保险号码。如前所述,这正 是当今世界上绝大多数国家的标准做法,可见认证对现代国家是必不可少的。   上面谈到自己如何从意识到认证对治理现代国家的必要性和重要性,发展至进一步意识到认证与国家基本制度建设的相关性。2000年,我与朋友们组成了一 个松散的国家基本制度建设研究群体,包括胡鞍钢(清华大学)、周建明(上海社科院)、曹锦清(华东理工大学)、朱云汉(台湾大学)、史天健(美国杜克大 学)、高柏(美国杜克大学)、王希(美国宾州印第安纳大学)、郑永年(新加坡国立大学东亚研究所)、王辉(美国兰德公司研究院公共政策博士)、康晓光(中 国人民大学)等。这个群体前前后后运作了四、五年,出版了一系列书籍、文章与报告。2000年末,这个群体第一次在北京翠宫饭店开碰头会时,与会者讨论并 拟定了几项基础性的国家能力,其中就包括识别认证能力。然而,在其后的分头研究中,这方面的研究却没有深入下去,原因是认证涉及的面太宽,要收集的素材太 多,而前人除了零星的讨论,并没有留下任何系统的著述。   2006年,欧树军来到香港中文大学政治与公共行政系攻读博士学位。在选择博士论文题目时,我向他提到了认证问题。没想到他很快就决定耕耘这片未开垦 的处女地。更没想到的是,他花费三年写完的论文涵盖面如此之广、水平如此之高,用精细的理论思维和厚实的实证素材证明:认证是国家基础能力的基础。可以 说,无论是在中文,还是在西文,这都是第一本系统、全面处理国家认证能力的书稿,无异于打开了一片全新的研究领域;它也是对国家基本制度研究的重要补充, 使之更坚固、更完善。对一位年轻学者而言,这实在是项了不得的成就,可喜可贺!我完全赞成何包钢的判断:“这将是政治与公共管理的必读书之一”。
280 次阅读|0 个评论
分享 书呆子与统计
热度 1 gordon 2014-3-2 15:19
注:英国的学术传统开始就不是辩论,辩论并不解决实际问题。 通常书呆子会认为 道高一尺魔高一丈,你再好的防御手段,都会有更先进的进攻手段来突破。 实际上呢,很多行为都是受制于成本的。 但社会问题呢,原因是多方面的,原因很难找。所以统计就成为解决现实问题的基本手段。 个人感觉啊,“不信谣,不传谣” 又是书呆子式的建议,这种没有效力的建议呢,最后会损害信任度的。 知识分子说的挺好,最后老百姓不信你了,这不是开玩笑的。 中国的知识分子阶层正在失去全国老百姓的信任,专家、教授都成笑话了。 个人感觉啊,鼓励平民穿上“防刺马甲” 是一个不错的建议,因为 近距离的突击啊,就是刚开始的 “冷不防” 那一下,只要那一下躲过去了,以后的生存概率就会大增。 受伤是难免的,但是不致命啊。 我这儿也没有什么数据,但个人感觉是这样。 早年日本的青少年犯罪,警察都是穿防刺马甲的。 注:中国的学术往往缺少干货,大多是老中医。 ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××× 从历史中汲取经验 S. L. A. Marshall 准将在第 一 次大战时在法国作战,是美国远征军中最年轻的军官之一,亲身经历过西线壕沟战中人命如草芥的惨烈战况。这种在火线上的亲 身体验,让他对於士兵在战斗中的反应有深刻的了解。第二次大战时,他重新入伍,官拜上校,在美国战争部特设参谋处历史组(Historical Division, War Department Special Staff)担任战史资料采集与分析的工作。 和以前历史学家不同之 处,在於他和同僚开始采用直接访谈参与战斗的士官兵的方式,尝试将个人在烽火漫天、生死存亡之际仅存零碎而片段的记忆拼凑起来,以类似刑事案件中「现场重 建」的方法将实际战况重建起来。由於他个人对第一线步兵的战斗经验,他特别著重於小单位的战斗,大抵以、连、营三级为主,即使对象是较大的单位,他也往往 将焦点放在其下属单位上。 另外,他们搜集资料的方法也和往常不同,尽量力求第一手的访谈采集。因此,他们得走出办公室,来到战场上直接采集,而且 往往是在激烈战斗的次日就在激战前线的边缘访谈记忆犹新的士官兵。他们首先在太平洋战区的岛屿战中实验这种作法,后来他更把这种方法带到欧洲战区作战处的 历史组中,在诺曼第登陆及其后的作战中,为后来的历史家采集了极为详细的资料。在这些战史中,最为知名的要属於「奥马哈滩头的第一波」(First Wave at Omaha Beach), 以及「贝斯特之战」(Battle at Best)。前者的资料来源主要是他在 1944 年 7 月中,当第二十九师准备对布列斯班的德军要塞突击时,他冒著德军的迫击炮火,在攻击准备线上对第二十九师参与奥马哈滩头登陆的幸存者之访谈结果。后者则是 在盟军失败的 「市场花园行动」中,直接在美军伞兵作战区域中,对一支失散的排在战斗第二天时进行的访谈;这个访谈挖掘出了一个原本可能被埋没的英雄和一枚国会荣誉勋章 ——一个重伤的伞兵为了救同伴伤兵,自己扑身在德军手榴弹上。 在二次大战结束后,马歇尔解甲归田,根据二次大战中 搜集的资料与经验,在 1947 年写了一本小书:「面对敌火:未来战争中战斗指挥的问题」(Men against Fire: The Problem of Battle Command in Future War)。在这本书中,他把许多对火线下步兵战斗的迷思及幻象一一粉碎,打破了长久以来由不知战场实况的高阶军官所撰写的回忆录及教科书营造出的假象。书 中最重要的一点是:从搜集的第一手资料中分析显示,美国步兵在火线上实际参与战斗的比例不到 25%,如果把自动武器或多人操作武器扣除,恐怕比例更要低到 15% 以下。这个比例并不是以包括后勤单位或是支援武器单位来计算,而是单纯地以在火线上的单位(例如,步兵连)来计算。他说「The thing is simply this, that out of an average one hundred men along the line of fire during the period of an encounter, only fifteen men on the average would take any part with the weapons. ... the man did not have to maintain fire to be counted among the active firers. If he had so much as fired a rifle once or twice, though not aiming it at anything in particular, or lobbed a grenade roughly in the direction of the enemy, he was scored on the positive side....」这本书的影响深厚,被奉为了解战斗真相的基本教范,也间接地为后来美军接受突击步枪的概念铺路。 到了韩战期间,马歇尔以 战地记者的身份重返战场,也同时被第八军团雇用进行类似的战斗分析。「中共部队的攻击战斗」这两篇报告就是他在 1950 年 12 月到 1951 年 1 月间对新敌人的战术分析。
59 次阅读|5 个评论
分享 央行首度公布了各省市社会融资规模统计数据
热度 13 然后203 2014-2-25 23:28
中国的金融系统在过去十年发生了巨大的变化,以往实体企业主要的融资方式是向银行借款,占比几乎达到100%,而当前这一比例的降幅超过了50%。 同样惊人的变化还体现在表外融资方面,其中 信托贷款、委托贷款和未贴现银行承兑汇票 是社会总融资中最接近影子银行的类别,因缺乏足够的监管,这几项业务增长迅猛。在2013年,这些业务的融资规模占到了新增社会融资规模的30%,达到创纪录的新高。 该数据显示中国地方政府对影子银行的风险分布并不平均,某些省市格外突出。非盈利研究机构 彼得森国际经济研究所 (Peterson Institute for International Economics)将接近影子银行的社会融资类别 信托贷款、委托贷款和未贴现银行承兑汇票 相加汇总,画出了中国不同省市(港澳台除外)对银子银行的风险敞口地图,具体如下图所示,红色、黄色、绿色所代表风险程度依次递减。 这些数据揭示了中国不同地区的金融风险,包括西藏、云南、贵州和黑龙江在内的一些内陆省份的风险敞口都比较大,类似的还包括河北、山东、福建、江西和湖北。此外值得注意的是,因为上海、北京和重庆属于区域性的金融中心,所以这些地方的风险不一定像数据显示的那么高。 随着很多信托产品、理财产品的到期,风险敞口较大的省市可能会更容易出现违约和财政困境,为应对危机的出现,地方政府可能会加强对地方金融机构的审查力度。 如果想知道地方出现债务违约的风险,一个有意思的做法是将上面提到的这些数据与地方政府债务情况进行对比,来看看哪些省市最有能力为金融机构提供救助。下面这张图显示了不同省市的情况,其中蓝色代表地方债务与GDP的比例,红色代表地方政府对影子银行的风险敞口。
912 次阅读|10 个评论
分享 为什么统计光棍多,现实中剩女多
热度 35 农民家的狗 2013-11-16 18:04
某A 2013-11-1415:33:59 现在是女生难嫁呀 某B 2013-11-1415:34:03 只有男士办不起来的 AA 2013-11-1415:34:35 肉多狼少,没有办法,现在只招募“狼”,“肉”太多了 女的报名人数远远超过男生 某C 2013-11-1415:35:26 看来还是剩女多呀 AA 2013-11-1415:35:42 嗯,确实 某C 2013-11-1415:36:52 可人口普查为什么还是说“光棍”多呢? AA 2013-11-1415:46:38 千万不要相信人口普查,一个大队书记,负责7八个自然村的人口统计,一个星期要交表,你相信这样的人口普查可信吗 AA 2013-11-1415:46:53 我亲眼目睹了一个大队书记的无奈 一辆摩托车,两天都搞不完一个村的人口统计,加上时间紧,结果坐在家里填表,做人口普查 AA 2013-11-1415:50:15 做研究要扎实去基层,贴近群众,贴近实际,不要采信伸手就能拿来的数据
1215 次阅读|27 个评论
分享 Mt Adams Hiking的技术统计
热度 14 机器猫 2013-7-19 14:00
Mt Adams Hiking的技术统计
就是GPS记录的数据啦
629 次阅读|0 个评论
分享 有奖竞猜: 有文化死得早?
热度 17 洗心 2013-7-3 19:23
@幸福西安 【西安现有120位百岁老人 95人是女性】西安最年长的人?110岁!市老龄委的统计数据显示,目前西安有120位百岁老人,男性25人,女性95人;拥有大学学历的有6人,中学学历7人,小学学历39人,其余68人均为文盲。这是在告诉俄们有文化死得早么。。。 (三秦都市报) 有奖竞猜: 这位小编辑的推论里有什么错误? 第一名奖10爱元。其实挺简单的。 得奖者 @ 大道至简君 至少需要同时期出生中国人的大学,中学,小学以及文盲人口比例做对比,才能看出是否有相关性。 从那条微薄的评论来看,中国大部分人脑子还不够好使。
92 次阅读|16 个评论
分享 统计数字会撒谎之鸡同鸭讲
热度 20 就爱抬杠 2012-6-19 08:25
有一段时间,相声里流行这么一种模式:强势的一方(王公贵族、番邦或者近代的外国人等)给弱势的一方出题,却不明说,而是用手势或者其他非语言方式表达;弱势方的代表往往是愣头青之类的人物,把强势方的手势理解为很简单低俗的意思。双方比划完后,强势方惊叹对方竟有如此人物,弱势方获胜,却还莫名其妙。 现实生活中这当然不可能,不过类似的情况却往往在统计数字的解读中出现,简单地说就是鸡同鸭讲,双方完全不是一个意思。 作者举了个例子,对著名医生组成的大样本调查结果显示,27%的医生抽的是喉宝牌香烟,高于其他所有品牌。这个统计结果说明了什么?难道医生们会有内部消息选择了危害最小的香烟品牌?其实除了它本身之外,什么也没有说明。但是大多数人,尤其是抽烟的人,肯定不是这么理解的。 去年因飞机失事死亡的人数远比1930年多,这能说明现代化的飞机更危险吗?其实只能说明现在乘飞机的人多了不知道多少倍而已。类似的例子在“723”事故后也出现了,居然不少人因此害怕乘火车而改自己开车走高速。是因为他们不知道每年死于公路交通事故的人远远多于死于火车事故的人吗?我猜即使把这个数字摆在他们面前,他们还是会这样做的。他们很难理解统计数字到底有什么样的含义,只是像受惊的小兔子一样,本能地害怕任何风吹草动。 1%的销售利润率高不高?当然不高,不过如果周转很快,每天能周转一次,那一年下来就可以获得年投资收益率365%。理解了这个概念,我们就完全可以把一个公司去年的表现用以下几种方式来描述:1%的销售利润率,15%的投资回收率,1000万元的利润,利润上升40%(与过去5年平均利润相比),利润下降60%(与去年相比),其实完全是一个意思。你可以根据你说话的对象,选择对你最有利的表达方式,而且谁也不能说你说了假话。美剧里的律师通常就是做这种事,他们都严格遵守法律,绝对不说假话,但是他们往往只说部分的真话,而且要把真话以最有利于自己当事人的方式说出来。 在美国与西班牙交战期间,美国海军的死亡率是千分之九,而同期纽约居民的死亡率是千分之十六,海军征兵人员即用此来证明其实参军更安全。你会同意这个观点吗?该怎么驳倒它?其实这么想想就很简单,把纽约居民放到美国海军的交战环境当然不公平,如果把海军放到纽约居民的环境中呢?这些二十郎当岁的小伙子,能有几个人会死?有没有十万分之十六的比例?这才是该和纽约居民死亡率相比的数据。
个人分类: 读书笔记|767 次阅读|6 个评论
分享 “统计数字会撒谎”之看上去很美
热度 7 就爱抬杠 2012-6-14 08:37
金玉其外的东西往往败絮其中,世上的东西,看上去很美的居多。 作者举了多克斯牙膏的例子,“用户反映使用多克斯牙膏将使蛀牙减少23%”。大字标题的广告。由于美国严格的法律,造假基本不可能的。其实如果用户仔细看下面的小字,会发现所谓的测试组只有12个用户。当然这个还不是最恶劣的,另一个牙粉的广告,只有仅仅6个案例。 在小样本的情况下,想要得到符合要求的统计数字当然就简单了。只要反复地一次次做这样的实验,直到得出符合自己需要的结果为止,而那些不符合要求的结果,就被直接被无视了。用这种方法,就是要证明吃糖对牙齿有好处,或者抽烟有利于长寿,也不是没有可能。 马三立有个相声叫“皮猴”,讲的就是个算命的扣着块石板,上面写着“没有”,来人算命他就不停问问题,最后总能问出“没有”来,然后把石板翻过来说我早知道没有。结果有次碰上个“全和人”,什么都有,最后实在没辙了,问冬天来了你有皮猴没有才好不容易交代过去。相声大师各有巧妙不同,马三立就最能揣摩人的心理,你不听到最后未准都乐不起来。八十年代他刚复出时就有人说,马三立的相声居然不被人欣赏,实在是个悲哀的事。当时还小,不以为然,后来才觉得实在是说得太对了。 当然,谁都知道12个样本对于证明某种东西效果而言实在是太少了,那么多少算够呢?有个关于小儿麻痹症疫苗的实验,有450名接种疫苗,同时680名儿童作为对照组,看上去应该是个大规模医学实验了。但实际情况是,疫苗组和对照组都没有发病儿童。为什么呢?因为即便在当时,小儿麻痹症的发病率也只有千分之二左右,因此千人左右的实验规模是远远不够的。 除了小样本以外,另一个误区就是没有来由的百分比。当电视上成龙大哥看上去很真诚地说“我要省电30%”时,有多少人会去深究他到底要跟哪家厂商的哪款空调在什么环境下比可以省电30%?设想如果去跟格力较真,格力恐怕不会拿自己的一款比,那样的话那款空调怎么卖;恐怕也不敢拿其他厂商的比,人家如果认真起来,在测试环境测试条件上稍微严格要求下,格力就得赔偿人家的名誉损失。如果我是格力,我就专门留着一款自己的老空调,等人家来较真时拿出来充数。不过在国内也没啥意义,中国没那样的法律环境。
个人分类: 读书笔记|615 次阅读|1 个评论
分享 “统计数字会撒谎”之平均值的迷思
热度 9 就爱抬杠 2012-6-12 21:37
平均数是什么?这似乎是一个很简单的问题,小学生都会。但作为统计来说,平均数却是一个很容易被人误导的问题。简单的说,我们平时看到的至少有以下几种概念:算数平均,中位数和众值。 算数平均是最好理解的,也是我们平常意义上的平均数。中位数是指这样一个数,在所有的样本里,一半的值在它之上,而另一半在它之下。众数是一个很少用到的概念,它的定义也很简单:在所有样本里出现最多的那个数。在正态分布里,这三种平均数会落在同一个点上。 平均数里最为人所诟病的就是人均收入问题,本书的作者也是用收入问题进行了举例。假如一个公司的总裁宣称,他们企业员工的平均收入是多少多少时,你应该好好思考一下他的前提条件。假如这个数字是中位数,可以获得的信息是显而易见的,一半员工收入超出这个数字,另一半则不到。假如是算数平均,这就完全取决于收入的分布情况。假如比尔盖茨在你们小区买了房子,你当然可以自豪地宣称本小区业主的平均财产超过一亿美元,虽然大家看不出来这和你到底有什么关系。假如用了中位数这个概念,多了一个比尔盖茨,几乎不会对结果产生任何影响。 在微博里,论坛上,这个问题几乎和地域之争一样,会定期来访。用google搜索“平均工资 质疑”的关键字,就有896,000条结果。统计局一公布平均工资,无论是国家统计局,还是地方统计局,就会有大批人出来说自己拖了统计局的后腿,而且每次都会拿比尔盖茨举例子,就像我一样。 按照统计局网站上的说明: “城镇非私营单位在岗职工平均工资的调查频率为每季度调查一次,其统计范围涵盖了包括全部国有单位、城镇集体单位,以及联营经济、股份制经济、外商投资经济、港澳台投资经济单位在内的约150万家单位,采用全面调查的方式收集数据,涉及在岗职工约1.23亿人。   城镇私营单位就业人员平均工资的调查频率为每年度调查一次,其统计范围涵盖约460万家私营法人单位。具体是指内资法人单位中自然人投资设立或由自然人控股的私营有限责任公司、私营股份有限公司、私营合伙企业和私营独资企业。采用抽样调查的方式搜集数据,抽样比约10%,涉及就业人员约8000万人。   平均工资=报告期城镇单位工资总额÷报告期城镇单位平均人数。” 非私营单位是全面调查,私营单位抽样10%,力度不可谓不大。但一搞算术平均,好比把满汉全席混到一起当盖浇饭卖,都说不出是什么味道。最后只能说,总体上增长多少多少,按行业分是何种比例等等。 至少在本书里,美国的统计数字五十年代就用了中位数。就在前两天,美联储公布了家庭财富报告:美国家庭净财富中位数是7万7300美元(没有看错小数点一半家庭在此以下,含房产),合48万7千人民币。 报告同时指出最高10%家庭财富中位数是119万,最低20%中位数是6,200,整整193倍。2007年是138倍,2001年是106倍。 国家统计局明明有足够的素材,公布中位数是完全没有问题的。对此,国家统计局的解释是工资统计自五十年代就有,为了保持和历史数据的对比,只能继续公布算数平均数云云。我真是有点同情统计局的发言人,这话说出来也不怕难为情。 至于到底为什么,这事真不能细说。
个人分类: 读书笔记|1510 次阅读|2 个评论
分享 “统计数字会撒谎”之样本的选取
热度 10 就爱抬杠 2012-6-11 09:01
“统计数字会撒谎”是美国记者达莱尔.哈夫1954年写的一本关于统计问题的书,书中讲述了各种统计上的问题与误区。书的篇幅不长,内容也不难懂,然而书中讲的统计上的误区甚至可以说是骗子的技巧,在近六十年后的今天,依然有其现实意义。 统计一般来说都会有样本,有意义的全面统计是很难做到的。即使所谓的举全国之力的人口普查,也会在很多方面存在误区,从某种意义上来,也不过是真实情况的一个“样本”而已。在很多情形下,等全面的统计出来,其结果的意义其实也就不大了。 要抽取样本,就面临抽取样本的方式或者说样本的选择问题,这也是很多问题产生的根源。 书中讲到抽样调查耶鲁大学毕业生毕业20年以后的收入,采用的方法是从相关的通讯录或媒体上能找到符合毕业20年条件的毕业生发放调查问卷的方法。问题是,二十年后,有多少收入低的毕业生的通讯录地址依然有效?媒体关注的耶鲁毕业生会是收入高的还是收入低?在找到的这些毕业生里,愿意填写问卷并寄回的,是收入高的还是收入低的呢?选择样本的方式,就可能决定了样本的特性,这往往被一般人所忽视。 书中还讲到50年代调查美国人每天刷牙的次数是1.04次,作者问道,在媒体整天宣传刷牙的好处以及刷牙才是尊重他人的生活方式的情况下,有多少人愿意诚实地告诉调查员,其实我一个星期都不刷一次牙? 现在人们都说,上微博一天后的沮丧心情,得看一个星期的新闻联播才能弥补,平时生活又觉得很正常,哪里来的那么多乌七八糟的事情?“幸福的家庭总是相似的,不幸的家庭则各有各的不幸”,在微博上想要赢得关注,获取转发量,靠晒幸福是做不到的——除非你是郭美美。由于微博传播的特点,话越出格、越离奇,越吸引眼球,就越能获取更多的粉丝和转发量;有了转发量和粉丝,这些事情又会被传播得更广更远......如此反馈下去,会有什么结果可想而知。中国这么大,就算没人造谣,寻找些不平事一点也不困难。如果你把中国当做统计对象,把微博当做统计样本,认为这个样本反映了真实的中国,陷入误区就是早晚的事。
个人分类: 读书笔记|691 次阅读|0 个评论
分享 思维的类型
热度 38 老马丁 2012-5-29 09:05
下面这个统计数据是真实的: 据统计,使用汽车运炸药出现的事故率(按里程计算)远远低于用汽车运橘子出现的事故率。 据此,你的结论是什么?
个人分类: As We Talk|170 次阅读|28 个评论
分享 超级强大的qq 居然统计俺的个人信息
热度 20 樱木花道 2012-4-24 18:06
超级强大的qq   居然统计俺的个人信息
我开始相信 安安一定是qq的大股东了 还统计男女。。 真强 。
749 次阅读|15 个评论
分享 圣诞、元旦期间的红包收支统计
热度 22 齐若散 2012-1-3 03:04
一、红包支出:爱元706 埋下红包 爱元 -500 在自已空间首页埋下红包 2011-12-31 03:49 购买道具 爱元 -10 购买 红包卡 道具 2011-12-31 03:49 埋下红包 爱元 -88 在自已空间首页埋下红包 2011-12-25 22:16 购买道具 爱元 -10 购买 红包卡 道具 2011-12-25 22:15 埋下红包 爱元 -88 在自已空间首页埋下红包 2011-12-25 06:10 购买道具 爱元 -10 购买 红包卡 道具 2011-12-25 06:08 二、红包收入:爱元379,威望1 获得红包 爱元 +5 访问空间领取的红包 2012-01-02 21:41 获得红包 爱元 +48 访问空间领取的红包 2012-01-02 11:34 获得红包 爱元 +2 访问空间领取的红包 2012-01-02 09:53 获得红包 爱元 +10 访问空间领取的红包 2012-01-02 06:06 获得红包 爱元 +1 访问空间领取的红包 2012-01-02 05:59 获得红包 爱元 +5 访问空间领取的红包 2012-01-02 00:41 获得红包 爱元 +6 访问空间领取的红包 2012-01-01 22:13 获得红包 爱元 +8 访问空间领取的红包 2012-01-01 13:35 获得红包 爱元 +2 访问空间领取的红包 2012-01-01 12:00 获得红包 爱元 +10 访问空间领取的红包 2012-01-01 12:00 获得红包 爱元 +5 访问空间领取的红包 2012-01-01 11:07 获得红包 爱元 +5 访问空间领取的红包 2012-01-01 11:07 获得红包 爱元 +10 访问空间领取的红包 2012-01-01 10:52 获得红包 爱元 +8 访问空间领取的红包 2012-01-01 09:53 获得红包 爱元 +6 访问空间领取的红包 2012-01-01 09:49 获得红包 爱元 +8 访问空间领取的红包 2012-01-01 09:48 获得红包 爱元 +5 访问空间领取的红包 2012-01-01 08:58 获得红包 爱元 +8 访问空间领取的红包 2012-01-01 08:58 获得红包 爱元 +1 访问空间领取的红包 2012-01-01 07:04 获得红包 爱元 +5 访问空间领取的红包 2012-01-01 07:02 获得红包 爱元 +8 访问空间领取的红包 2012-01-01 07:02 获得红包 爱元 +6 访问空间领取的红包 2012-01-01 07:02 获得红包 爱元 +2 访问空间领取的红包 2012-01-01 07:01 获得红包 爱元 +2 访问空间领取的红包 2012-01-01 07:01 获得红包 爱元 +6 访问空间领取的红包 2012-01-01 07:01 获得红包 威望 +1 访问空间领取的红包 2012-01-01 06:59 获得红包 爱元 +10 访问空间领取的红包 2012-01-01 06:58 获得红包 爱元 +1 访问空间领取的红包 2011-12-31 21:45 获得红包 爱元 +5 访问空间领取的红包 2011-12-31 21:44 获得红包 爱元 +5 访问空间领取的红包 2011-12-31 21:43 获得红包 爱元 +6 访问空间领取的红包 2011-12-31 21:39 获得红包 爱元 +1 访问空间领取的红包 2011-12-31 13:53 获得红包 爱元 +15 访问空间领取的红包 2011-12-31 13:26 获得红包 爱元 +6 访问空间领取的红包 2011-12-31 13:07 获得红包 爱元 +8 访问空间领取的红包 2011-12-31 11:43 获得红包 爱元 +10 访问空间领取的红包 2011-12-31 11:36 获得红包 爱元 +8 访问空间领取的红包 2011-12-31 11:34 获得红包 爱元 +2 访问空间领取的红包 2011-12-31 10:36 获得红包 爱元 +6 访问空间领取的红包 2011-12-31 10:23 获得红包 爱元 +5 访问空间领取的红包 2011-12-31 10:22 获得红包 爱元 +1 访问空间领取的红包 2011-12-31 10:18 获得红包 爱元 +8 访问空间领取的红包 2011-12-31 05:51 获得红包 爱元 +6 访问空间领取的红包 2011-12-31 05:46 获得红包 爱元 +5 访问空间领取的红包 2011-12-31 03:32 获得红包 爱元 +1 访问空间领取的红包 2011-12-31 03:29 获得红包 爱元 +1 访问空间领取的红包 2011-12-31 03:26 获得红包 爱元 +4 访问空间领取的红包 2011-12-31 03:15 获得红包 爱元 +5 访问空间领取的红包 2011-12-31 03:15 获得红包 爱元 +1 访问空间领取的红包 2011-12-31 03:09 获得红包 爱元 +5 访问空间领取的红包 2011-12-30 22:11 获得红包 爱元 +5 访问空间领取的红包 2011-12-30 22:10 获得红包 爱元 +10 访问空间领取的红包 2011-12-27 12:42 获得红包 爱元 +5 访问空间领取的红包 2011-12-25 22:04 获得红包 爱元 +2 访问空间领取的红包 2011-12-25 09:19 获得红包 爱元 +8 访问空间领取的红包 2011-12-25 03:23 获得红包 爱元 +5 访问空间领取的红包 2011-12-25 02:14 获得红包 爱元 +2 访问空间领取的红包 2011-12-24 23:13 获得红包 爱元 +5 访问空间领取的红包 2011-12-24 12:59 获得红包 爱元 +10 访问空间领取的红包 2011-12-24 03:52 获得红包 爱元 +10 访问空间领取的红包 2011-12-24 01:02 获得红包 爱元 +5 访问空间领取的红包 2011-12-24 00:41 获得红包 爱元 +5 访问空间领取的红包 2011-12-23 21:01
974 次阅读|19 个评论
分享 清汤牛肉面
热度 33 graceusa 2011-12-11 09:50
前几天听到广播说,每年节日期间(从感恩节到新年)美国人平均每人体重增长 6 磅。我不知道这个统计数据的准确性和代表性如何,但从一个侧面反映了这样一个事实:冬季身体对热量的需求明显增高。 我们这里虽然谈不上天寒地冻,但下班回家的时候还是期待有一碗热汤。为了减少又要烧饭又要烧汤的麻烦,索性就吃一碗热汤面吧。 牛腱煮熟后切片拌上酱油盐糖鸡精辣油等调料,装盘;牛肉汤下面。再有个蚝油生菜就是一顿晚餐。 我用这碗面谢谢在前两个帖子里捧场表态的各位吧 ,谢谢大家的鼓励,希望借这个东风我家小葛明年也能上一个理想的学校!
84 次阅读|31 个评论
12下一页

手机版|小黑屋|Archiver|网站错误报告|爱吱声   

GMT+8, 2024-6-17 06:30 , Processed in 0.066937 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部