打造自主领先的密态数据库产品——记南开大学计算机学院副院长、网络空间安全学院副院长刘哲理
刘哲理
2022年6月28日,国家计算机病毒应急处理中心发布专题研究报告,披露美国国家安全局利用“酸狐狸平台”正重点对中国和俄罗斯的政府机构、重要组织和信息基础设施目标发起持续性攻击,并实时向美国国家安全局总部传送数据情报。“酸狐狸”事件以及当年震惊全球的斯诺登事件等不断发出警告,数据泄露威胁国家安全,如不采用国产自主可控的数据安全技术、产品,整个国家将毫无隐私可言。
数据库是信息的主要存储介质,与操作系统、芯片一同成为现代信息技术领域的三大核心基础。防止数据泄密,最关键是对数据进行加密。难题久攻不破,国外技术封锁,密态数据库研究成为相关科研人员自主创新的重要方向。研制密态数据库的关键是解决密文查询和密文计算问题,南开大学计算机学院副院长、网络空间安全学院副院长刘哲理教授向重大难题发起挑战。面向语义安全数据库、茫然操作数据库等世界性难题,刘哲理提出了算法,建立了模型,提供了有效方案,服务于国家重大需求,为国产自主可控的密态数据库产品的成功研制持续贡献着智慧与力量。
与企业共成长
与企业合作,一直伴随着刘哲理的科研历程:博士时参与对日外包项目;在天津环球磁卡股份有限公司做博士后研究;与东港股份合作,成功研制基于信息安全技术的Java卡操作系统;与北京安华金和科技有限公司合作,继2016年成立数据库安全联合实验室之后,在2021年联合共建数据安全与隐私计算联合实验室;与天津南大通用数据技术股份有限公司合作,开发的数据库透明加密算法获天津市科技进步奖二等奖。
随国家、行业的需求而拓展,刘哲理的研究一直在深入。早在2018年,为解决数据共享流通的难题,刘哲理与腾讯合作,率先开展了密文集合交集运算的应用研究,让隐私保护的密文数据共享成为现实,引领了联合广告精准推荐的产品新形态,为腾讯带来年流水2亿元、利润近亿元的收益。2020年,中央网信办组织评审中国首届十大数据安全典型实践案例,刘哲理与腾讯联合研制的“隐私保护的多平台联合广告推荐业务”成功入选,成为唯一高校牵头入选的案例,起到了引领示范的作用。
合作不仅为企业带来了新的发展可能,更为刘哲理的科研向深处走积累了宝贵的经验与动能。与华为的合作,就标志着刘哲理的科研迈入了深水区。
破世界级难题
在透明加密安全等级不够高的背景下,2003年,语义安全作为基本的数据库安全目标被提出。语义安全要求将相同的明文加密成不同的密文,即数据的“一次一密”。在明文上,数据库可以通过数值相等来完成两个列的连接查询,但“一次一密”加密后相同的值不相等,大小顺序也不再保持。如果客户端不存状态、客户端和服务器不交互,很难实现密文上的查询。
为解决相关问题,世界各地的科学家自2003年起就开展了一系列研究,但一直没有找到无交互、低存储、可应用到数据库的语义安全的密文查询方案,这些问题成为十余年悬而未决的技术难题,但就是这样棘手的难题,却被刘哲理在与华为的合作中破解了。相关成果也获得了2022年度中国密码学会密码创新奖。
2019年,刘哲理受邀与华为开始联合研制高斯数据库,成为华为高斯数据库安全(security)小组核心成员(唯一的非华为成员),全面参与密态高斯数据库研制,致力于攻克密文查询和密文计算的难题。2020年6月,华为数据库OpenGauss开源,刘哲理团队提供的密文等值查询、范围查询和密钥管理等方案被应用。两年左右,OpenGauss数据库被免费下载72万套,也就意味着,72万个信息系统完成了国外数据库产品的国产化替代。
目前,高斯数据库已推出12种商业发行版,取得了较大经济和社会效益。刘哲理提出的语义安全的保留顺序加密和可搜索加密算法、实用安全的揭序加密算法,面向数据库密文查询面临的安全性和效率问题,有针对性地解决了无交互低存储的语义安全密文范围查询、面向复杂查询的无交互索引树构建等一系列难题。成果已在华为数据库落地商用,使华为的算法级语义安全密态数据库产品走在了世界前列。这些研究也得到了包括中国科学院院士、加拿大皇家科学院院士、新加坡工程院院士、电子电气工程师学会会士、美国计算机协会会士等在内的多名知名学者的肯定。
刘哲理(左一)与学生进行学术研讨
服务国家战略
近几年数据库厂商开始利用可信执行环境来研制云加密数据库,但它们面临模式泄露攻击的风险,如何对访问模式保护已经成为关键的科学问题。“加密数据还不足以保护数据隐私,如果攻击者控制了服务器,它可以通过观察哪些记录被访问来完成破解。茫然操作数据库则要求采用茫然读写策略,让攻击者无法区分哪条记录被访问。”刘哲理介绍,研究高效茫然读写模型无疑是对访问模式进行保护的一个有效策略。
茫然操作伴随着大量虚假读写,与数据库的高性能要求冲突,这成为高效茫然读写模型设计的巨大挑战。经过深入探索,刘哲理构建了高效的轻量级客户端的茫然读写策略。他的研究获得业界学者的广泛关注,美国计算机协会会士、数据库期刊《国际大型数据库期刊》(VldbJ)(美国VLDB基金会赞助)前主编伊恩·阿巴迪教授曾给出高度评价,更在信息安全会议计算机系统协会安全会议(USENIX Security)2022年的论文中,多次引用了刘哲理的多云ORAM方案。
这些成果在应用中,同样获得了佳绩。基于异或操作的茫然算子在华为数据库可信硬件访问行为模式保护中应用,提升了系统的安全性,并在非开源和内部版本进行了集成。数据表明,千万级数据的洗牌操作开销由分钟级降低为毫秒级,这表示茫然操作数据库从设想到真正走向应用又前进了一大步。
谈起我国密态数据库研究的现状,刘哲理坦言,目前我国虽然已经跟上了国外的研究步伐,并在密文算法方面取得了部分领先,但这仅仅是构建了密文查询和密文计算的基本能力支撑,与分析型数据库、事务处理、并发控制的深层融合还远远不够。复杂密文查询难题、存储引擎读写优化难题、数据茫然高效存储难题,都是影响我国自主可控密态数据库技术走到世界前列的拦路虎。只有付出百倍努力,创新、求真、务实,才能克服这些难题。密态数据库的研制才刚刚开始,任重而道远。
但与华为合作,坚定了刘哲理向前迈步的信心。“能沉心静气去做大产品,华为的决心和投入是一般企业比不了的。OpenGauss并不赚钱,华为的目标不是为了赚钱,它要的是开源,去推动国产数据库生态的形成,这是华为的战略眼光。”与华为合作,刘哲理有这样的体会。
虽与华为合作已攻克了一些算法级语义安全密文查询的难题,但还有很多问题未得到解决,未来又是一个茫然操作数据库的时代,有诸多难题需要去克服。“与华为合作已经3年,但我们的合作才刚刚开始,我们的目标很明确:提供高安全性的数据库加密产品,服务于国家重点领域,将中国的密态数据库做到世界领先。”面对挑战,刘哲理始终目标坚定并充满信心。
追求完美卓越
从事信息安全与密码学研究的学者,无人不知在顶级会议、顶级刊物上发表文章的难度之大,但刘哲理却成为以第一作者和通讯作者在信息安全领域顶会和顶刊、数据库领域顶会和顶刊都发表论文的国内首个学者。从2013年开始投稿计算机和通信安全会议(ACM Conference on Computer and Communications Security,CCS),到近几年十余篇中国计算机学会A类(CCF-A类)IEEE会刊论文,2021年第一篇USENIX安全研讨会论文,再到近期一击即中两篇USENIX安全研讨会和一篇VLDB论文,久经考验、淬炼成钢,刘哲理战绩颇丰。在网络平台“知乎”上,刘哲理曾将自己的经验以一篇博文的形式分享给大家,仅发表两天阅读量就破了6万。
刘哲理(右)在课堂间歇与学生交流
刘哲理坦言,和一开始就站在高起点上,一下子就能在顶会、顶刊成功发表论文的人不同,他的经历有些特殊。平台不高,科研底子薄,能取得令人不可思议的成绩,靠的是勇攀高峰的信念和追求卓越的决心。
2011年,从天津环球磁卡股份有限公司博士后出站到南开大学工作时,刘哲理不在科研岗,而是在公共基础教学部的教学岗,教的也不是信息安全系的学生。教学压力大,但刘哲理从未放弃科研,没有自己的学生,他一个人一步步走,直到2015年进入信息安全系,有了自己的学生,他的科研生涯才真正起步。
“科研上我是后来进步,但在教学上我一直没落后。”刘哲理说。他是教育部宝钢优秀教师,获批天津市一流金课(已被推荐国家级金课)1门、天津市虚拟仿真建设项目1项、天津市课程思政示范教材1部,并以第一完成人获得天津市教学成果奖特等奖(已被推荐国家级教学成果奖),获得中国高等教育博览会“校企合作、双百计划”典型案例,获得中国计算机教育大会最佳论文奖,获得全国密码学与信息安全教学研讨会优秀论文奖3次,为国家培养了大批安全领域的高层次人才。在南开大学毕业典礼上,2019届硕士生李博曾这样表达对刘哲理的感谢之情,她说:“习总书记说,一个人遇到好老师是一生的幸运。我幸运地遇到了这样一位好老师,他就是我的导师——刘哲理教授。”
作为学生的引路人,刘哲理始终将教师教书育人的根本职责铭刻心间,一直密切关注课程讲授的实际效果,不断更新和改进授课形式,真正做到让学生将知识学为所用、内化于心。实践式教学是刘哲理上课的一大特点,他通过建设慕课和虚拟仿真实验、实验讲解视频和三维一体的线上、线下教学资源,形成了完备的实践教学体系。他的课程也因为深入浅出的理论讲授、丰富的动手实验内容、直观形象的原理辨析,深受学生喜爱,成为同学们口口相传的“必修课”。
勇攀高峰、追求卓越是刘哲理一贯的行事风格。做教学,他要成为学生的领路人,引导他们胸怀锦绣、腹有乾坤,以赤诚之心奉献社会。做科研,他要攻克世界级难题,把国产自主可控的密态数据库做到世界前列。作为南开大学网络空间安全学院副院长、网络安全学科带头人,他要凝聚大家形成合力,一起去推动学科的发展,扩大学科的影响力。
刘哲理(右)耐心为学生做学术指导
赓续密码情怀
近年来,南开大学网络安全学科发展迅猛。2018年,学院刚成立时只有寥寥几人,刘哲理虽然是副教授,但是被学校委以重任,担任网络空间安全学院副院长。现在,学院规模已逐渐壮大,刘哲理领衔拿到国家自然科学基金重点项目、国防科技创新重点项目、国家重点研发计划课题,实现了南开大学工科副教授承担重点项目的首个突破。大项目接踵而至,刘哲理带领团队作战,大家斗志满怀。
刘哲理说,作为南开人,理应有信心去达成这些目标,因为南开人本身就肩负着这样的使命。南开大学是国内首批密码专业的获批点,杰出校友周恩来总理创制了中国共产党首部密码“豪密”,原副校长胡国定是国内信息论的创始人,数学学院的首任院长沈世镒先生是国内密码编码领域的创始人……在推动网络安全学科建设与发展的同时,刘哲理也带领大家梳理挖掘植根南开精神深处的密码基因与情怀。
为将这种精神力量传递下去,刘哲理主导了以豪密为主题的密码科普基地的建设并获批天津市科普基地,承办了全国大学生信息安全竞赛创新实践赛、第一届和第二届全国密码科普知识竞赛,组织了全国信息安全和密码学教学研讨会,组织了天津市“第五空间”智能安全大赛等……这些活动同时也扩大了南开大学密码学科的影响力。在2022年软科学科排名中,南开大学密码科学技术专业获得A+的好成绩,是对刘哲理所做工作的肯定。但刘哲理深知,传承老一辈留下的宝贵财富,唯有百折不挠、奋勇克难,才能用更优异的成绩赓续南开的密码情怀。