让中国有自己的数据库!这些人大人率先做到了

18.01.2019  02:10

2018年度国家科学技术奖励大会在京召开,中共中央总书记、国家主席、中央军委主席习近平等党和国家领导人出席大会并为获奖代表颁奖,学校信息学院杜小勇教授、王珊教授牵头申报的成果“数据库管理系统核心技术的创新与金仓数据库产业化”喜获国家科学技术进步奖二等奖,这也是我校首次获得的国家科技“三大奖”奖项。

数十年来,人大数据库技术研发团队以舍我其谁的勇气,在国产数据库科研攻关领域砥砺前行,书写出一部由0到1、敢为人先的创业史,擎起了中国数据库领域的一面旗帜。

1978年,中国人民大学信息学院的前身经济信息管理系正式创建。1999年6月,时任中国人民大学信息学院院长的王珊和数据库团队的老师们自掏腰包凑了43万元加上学校投资的10万,创办了北京人大金仓信息技术有限公司(以下简称“人大金仓”)。这是人民大学复校以来孵化的首家产学研一体化高科技企业。时隔数十年,王珊、杜小勇与人大数据库团队、人大金仓公司一同迎来了属于他们的高光时刻。

中国数据库教学与研究,在人大起航

(萨师煊教授在工作)

谈起中国数据库的发展,离不开其教学的先行者和研究的探索者萨师煊。

1949年全国解放前夕,萨师煊追求革命,跋涉千里来到解放区,加入华北大学(中国人民大学前身),开始了为人民教育事业奉献终身的历程。第二年,中国人民大学正式命名组建,年仅28岁的萨师煊出任数学教研室主任,1978年,创立了全国第一个以”信息”命名的学系:经济信息管理系并担任首任系主任、名誉系主任等职务。

直至2010年逝世,他在学科建设、教材建设和人才培养等方面的开拓性工作为中国人民大学理工科建设乃至全国的数据库学科的发展作出了独特而巨大的贡献。

跟踪世界现代科技发展,建设一个具有现代科技含量的新型信息学科,是萨师煊等老一辈学者长期追求的目标。早在20世纪60年代,萨师煊在学校有关领导的支持下成立经济数学研讨会,并且已经预见到了数学和计算机技术在未来经济管理中的应用前景。文革期间人民大学被迫停办但萨师煊仍关注世界科技发展趋势,在没有见过现代计算机的情况下,利用各种渠道收集相关资料,摸索计算机数据库技术。

(萨师煊教授指导学生上机)

1978年,复校伊始,百业待兴,中国人民大学信息学院的前身经济信息管理系正式创建,萨师煊等学者最早引入“信息”一词作为我国高等学校专业名称,这也是我国高等学校中第一个以信息技术在经济管理领域中的应用为特色的学系, 成为我国第一批计算机应用技术硕士授予单位,可谓“开信息之先河”。

在中国数据库教学与理论研究方面,萨师煊做出了开创性贡献。萨师煊率先在国内开设了数据库课程,并将讲稿汇集成《数据库系统简介》和《数据库方法》,发表在1979年的《电子计算机参考资料》。这是我国最早的数据库学术论文,对我国数据库研究和普及起到了启蒙的作用,而人民大学,也被同行赞誉为“中国数据库的发源地”。

(《数据库系统概论》国家优秀教材)

1983年,由萨师煊与弟子王珊合作编写的《数据库系统概论》,正式出版发行。这是国内第一部系统阐明数据库原理、技术和理论的教材。迄今,该书已发行至第五版,发行量超过300万册,被公认为国内数据库领域的经典权威教材。教材的多个版本先后被列入教育部计算机软件核心教材,“九五”“十五”及“十二五”国家级规划教材,2次获得国家级优秀教材奖。“数据库系统概论”课程亦先后入选北京市精品课程、国家精品课程、国家精品资源共享课程与教育部首批精品在线开放课程。

理论联系实际,是萨师煊一以贯之的准则,他一方面积极为国家大型计算机工程作技术咨询,另一方面更重视对技术难度大、投入多的数据库基础软件的研制。他领衔主持了国家“七五”科技攻关项目“国家经济信息系统分布式查询系统”的研制,这是在IBM大型机上实现的大型软件项目。该项目于1991年获得国家计委“杰出贡献奖”。

中国要有自己的数据库

(“大型通用数据库管理系统——金仓数据库KingbaseES”成果鉴定会)

上世纪80年代,中国没有自主知识产权的数据库产品,国内市场几乎全为国外三大巨头企业的产品所垄断。

1984年,王珊应邀赴美访问研究,在美国马里兰大学参与“可扩展关系数据库系统XDB”的开发。在每天编码10小时+的高强度工作中,王珊的两年“洋插队”生活过得艰苦而充实。走出国门,王珊看到了中国自主研发数据库的可能性。“我们不仅能做,而且我们一定要做!”行将回国之际,她给时任中国人民大学校长袁宝华写了一封信。王珊在信中建议学校批准成立“数据与知识工程研究所”,她写道:“我想,成立研究所确实是当务之急。我们要集中人力,搞一些切实的研究课题,开发真正能与国外竞争的数据库系统、应用生成系统产品。这是对国家最大的贡献…… 

于是,1987年,中国人民大学信息学院数据与知识工程研究所成立,王珊任所长。刚组建的研究所一无房产、二无电话、三无经费、四无人员编制,是“四无所”。从“”到“”,在这里,王珊和她的团队承担了一系列国家科研项目,包括国家攻关项目、863高技术项目、国家自然科学基金重点和重大项目等多项重量级科研项目,研制了多个具有自主知识产权的数据库系统。很快,研究所的一系列研究成果在国内外数据库领域产生了广泛影响,如何将这些学术成果转化为国家急需的数据库产品,成了当时摆在数据库研发团队面前的一个最为迫切的问题。

1999年,王珊带领着人大数据库技术团队,创办了人大金仓公司,王珊担任第一任董事长。

(王珊教授)

同年,已在日本拥有正式教职的杜小勇,放弃了国外优厚的待遇,回到人民大学信息学院执教,欣然答应王珊的邀请,成了人大金仓的第一任总经理。

人大金仓挂牌开张了,可最开始市场并不买账。

要将研究成果转化为面向市场的产品,只凭研究所雄厚的学术实力与创新能力,是很难做到的。掌握前沿技术固然重要,但洞察市场需求和用户体验才是“点金”的关键。一开始,人大金仓举步维艰,产品市场不认可、卖不出去,势必会被市场淘汰出局。

在这个节骨眼上,王珊、杜小勇到处奔走,获得了600万的融资,解了燃眉之急。研发团队由此意识到只有尊重市场逻辑,用产品说话,研发成果才能真正“变现”。于是,第一个十年间,人大金仓花大力气开始了国产数据库的产品化研发,数据库系统从实验室逐步走向市场,产品不断迭代优化,数据库应用也从边缘行业一点点深入核心部门。

打破国内数据库市场的国外垄断

(人大金仓首页)

2001年12月11日,中国正式加入WTO,国门打开,外资企业瞄准中国市场所蕴含的发展机遇和广阔前景,纷纷鱼贯而入。随着全球化时代国与国之间的经济较量与政治博弈日趋白热化,信息安全成了一柄悬在国家上空的达摩克里斯之剑。

作为信息系统基础与核心的数据库管理系统,是维护国家信息安全的有力屏障。但是,数据库管理系统结构复杂、开发难度大,囿于技术实力与软件研发的滞后性,中国数据库市场几乎为国外软件巨头瓜分殆尽,这不仅导致信息化建设成本居高不下,也严重威胁国家信息安全。

抱着国家信息安全不能受制于人的强烈信念,推进国产数据库技术和产业发展、打破数据库市场的国外垄断,成了人大数据库团队和人大金仓公司的头号使命。

十五”期间,人大数据库团队与人大金仓合作,连续承担了3个国家863计划数据库重大专项项目,杜小勇任国家863计划数据库重大专项专家组组长。“十一五”和“十二五”期间,又先后承担了一个国家863计划目标导向项目——“纯XML-关系数据库系统PXRDB研制与应用”和“核高基”重大专项项目——“大型通用数据库管理系统与套件”。

经过十多年的系统研究与开发,在国产数据库管理系统内核研制、XML数据和关系数据的统一管理、海量数据的联机分析加速等方面取得了一系列创新性研究成果,突破了数据库管理系统“三高一大”(高可靠、高性能、高安全、大数据量)的众多核心技术,研制了具有自主知识产权、安全可靠、自主可控的数据库管理系统——金仓数据库KingbaseES系列产品;提出了对等引擎系统架构,在数据存储、数据索引、并发控制、关键字检索四个层面提出了一系列创新技术,实现了对XML数据、关系数据和非结构数据的统一管理;针对海量数据的联机分析需求,从磁盘、内存、处理器缓存以及异构处理器架构四个硬件层次,提出了一系列OLAP加速技术。2002—2012年间获授权专利41项,软件著作权19项;出版著作6部;发表论文41篇,其中CCF A类9篇,SCI收录12篇。

目前,金仓数据库产品广泛应用于电力、军工、金融等十多个行业领域,在60多个全国性重大信息化工程核心关键业务中得到了规模化应用,全国累计推广超过50万套,遍布3000多个县市。社会和经济效益显著。

这些成果曾获得2016年度教育部科学技术进步奖一等奖、2015年度中国计算机学会科技进步奖一等奖、2005年度北京市科学技术奖一等奖等奖项。

建设世界一流数据库学科

(杜小勇教授)

计算机属于工学范畴,造出人工物并解决实际问题造福人类是工学的基本要求。发展一流的数据库学科,需要有顺畅的产学研的通道。因此,从初创之日起,人大金仓就被贴上了人大数据库学科“产学研一体化中的一环”的标签。面向高校人才培养,它是学生面向真问题开展科研创新的平台;面向市场应用,它是输出高校科研成果、开发产品和应用推广的企业。从学科建设到产品研发,从科研攻关到人才培养,人大数据库走出了一条成功的产学研协同发展之路。

然而,理顺高校和企业的关系,并不是一件容易的事,要取得大家的理解和支持就更难。为了理顺这一机制,2004年,王珊、杜小勇做了一个重要决定,人大金仓数据库研发团队与信息学院数据库学科教学科研团队开始正式“分家”。一部分人回到学院专心搞教学科研,另一部分人则留在公司继续做产品研发和推广。“要想实现市场化和专业化,老师带着学生兼职做的路子是行不通的。做学术也好,搞研发也好,靠得都是持续专注的投入。”时任总经理杜小勇如是说。

分家”后,杜小勇等多位教师先后回到中国人民大学信息学院。2005年,他开始担任信息学院院长,一掌舵就是10年。2008年,中国人民大学信息学院成立教育部数据工程与知识工程重点实验室,这也是我校成立的第一间省部级重点实验室。杜小勇成为第一任实验室主任。

从数据与知识工程研究所(“四无所”)到人大金仓,再到教育部数据工程与知识工程重点实验室,人民大学数据库学科逐步锻造出一支能打胜仗、不怕吃苦的坚强队伍,也培养了一批又一批专业过硬、肯干能干的青年学子。

只有打造一流的平台、建设一流的实验室,才能吸引一流的人才、迸发一流的学术生命力。” 人大金仓“创始团队”成员之一的陈红,现已是信息学院的党委书记,在她眼中,重点实验室就是这样的一个平台,能招徕人才、能锻造团队、能驱动创新。

打胜仗不骄傲,失败了不气馁,目标一致,团结协作,团队才有凝聚力。” 王珊总结说,人大数据库团队能取得今天的成绩,是靠一群“初生牛犊不怕虎”的“傻子”不知深浅闯出来的,正是这群“傻子”数十年如一日的坚持,中国才有了自己的数据库,人民大学数据库学科也才有更加辉煌的明天。