代码说

code is poetry

代码说    
碎碎念:黎叔很生气,后果很严重。  换一换

第一次数据处理

作者:coderzheng 发布于:2016-8-23 19:56 Tuesday 分类:大话星程  阅读模式

巴贝奇未能实现把杰卡德机器变成计算机的夙愿,19世纪末,美国人口普查局的统计学家霍列瑞斯(H.Hollerith)博士,却首先用穿孔卡完成了第一次大规模数据处理。

美国人口普查始于1790年,当时至少花了9个月时间才完成了数据的统计。1860年,美国人口从380万增加到3180万,以至在1887年开始的人口普查,7年之后才完成了数据处理,此时,下一轮普查已在进行之中。这一事实表明,以落后的技术方法来编制统计表格完全不能适应统计需要。为了应付1890年第12次人口普查,美国人口普查局向社会招标,希望有人发明一种能自动编制表格的机器。

霍列瑞斯是为德国侨民后裔,出生在美国纽约州北部。19岁从哥仑比亚矿业学院毕业,虽然学的是采矿专业,却在人口普查局找到了一份工作。大型统计部门的领导人比林斯(J.Billings)博士学识渊博,特别关注有发展前途的青年。他告诉霍列瑞斯,杰卡德编织机的穿孔卡或许可以帮助设计纯机械式的制表机。

霍列瑞斯受到了启发,从此投入制表机的研制。他首先设想的是一种穿孔纸带输入方式:小孔在连续纸带的排列为两行,一个孔可以表示一个调查项目,例如,A孔说明某人是男性,而B孔则代表她是女性。1884年,霍列瑞斯在专利申请中写道:“每个人不同的统计项目,将由适当的孔给予记录,小孔分布于一条纸带上,由机器的引导盘控制纸带输入……”

基于这种设想,霍列瑞斯制作了第一台制表机。机器上装备着一个计算器,当纸带被牵引移动时,一旦有孔的地方通过鼓形转轮表面,计数器电路就被接通,完成一次累加统计。

原始的制表机工作不太可靠,迫使霍列瑞斯继续寻求改进。问题之一在于纸带输入无法对数据进行分类和修改。当他外出乘坐火车,火车票的形式启发了他的灵感,他说:“我到西部旅行,买了一张火车票。列车员在车票上打了一个孔,我脑海中火花一闪:一个人一张票,我需要的,正是为每个人制造一张代表身份的穿孔卡片。”

于是,霍列瑞斯把穿孔纸带改变成穿孔卡,每张卡片即为一份个人记录,便于分类和重新登记。更巧妙的设计在于自动统计。他在机器上安装了一组盛满水银的小杯,穿好孔的卡片就放置在这些水银杯上。卡片上方有几排精心调好的探针,探针连接在电路一端,水银杯则连接于电路另一端。只要某根探针撞到卡片上有孔的位置,便自动跌落下去,与水银接触接通电流,启动该项目的计数器前进一个刻度。

持续不断地打孔,劳动强度不言而喻。霍列瑞斯的岳母回忆说:“他从巴尔的摩回来,一天打了几百张卡片,每张至少有12个孔,手臂酸疼,痛苦万分……”霍列瑞斯决定改造他的打孔装置,精心设计出一个半自动打孔机,称为“缩放仪”,大大提高了工作效率。

有了新的打孔设备,霍列瑞斯甚至可以雇佣一些女职员来从事过去繁重的体力劳动,平均每个人一天能处理700张卡片。这些女职员,可能就是世界上第一批“数据录入员”。

经过竞争和测试,1890年美国第12次人口普查正式决定采用霍列瑞斯制表机。人口普查局雇佣5万人采集数据,在全国分布了235个调查点,调查内容包括性别、婚姻状况、有无孩子等40个项目,较1870年增加了6倍以上。

霍列瑞斯机器的速度和可靠性令人惊讶。每台制表机连接着40台计数器,处理高峰期,一天能统计2000~3000个家庭数据,总共处理的人数达到600万人。在霍列瑞斯制表机支持下,第12次人口普查的统计工作仅用了6个星期时间,其中一部分时间还被用来处理上次普查的遗留问题。这种制表机为人口普查局节省了约500万美元费用,是霍列瑞斯本人估计的10倍。

虽然霍列瑞斯博士的发明并不是通用计算机,除了能统计数据表格外,制表机几乎没有别的什么用途,然而,制表机穿孔卡第一次把数据转变成二进制信息。在早期计算机系统里,用穿孔卡片输入数据一直沿用到20世纪70年代,数据处理也发展成为电脑的主要功能之一。霍列瑞斯的成就使他跻身于“信息处理之父”的行列。

你可以发表评论、引用到你的网站或博客,或通过RSS 2.0订阅这个博客的所有文章。
上一篇: 晶体管革命  |  下一篇:第二代电脑与磁盘机