300229 拓尔思
202301-13
海贝搜索引擎数据库助力国家企业信用信息公示系统,有效促进社会信用体系建设
发布时间:2023 -01-13
分享至:
分享
01  案例背景
随着中国的发展,很多技术因为一些原因越来越受制于人,尤其是上游核心技术。为了解决这个问题,我国明确了“数字中国”建设战略,抢占数字经济产业链制高点。信创是目前的一项国家战略,也是当今形势下国家经济发展的新动能。信创产业发展已经成为经济数字化转型、提升产业链发展的关键,从技术体系引进、强化产业基础、加强保障能力等方面着手,促进信创产业在本地落地生根,带动传统IT信息产业转型、构建区域级产业聚集集群。
 
国家市场监督管理总局牵头建设的国家企业信用信息公示系统,是国家级企业信用信息归集公示平台,是政府部门协同监管和联合惩戒的跨部门工作平台,是企业报送并公示年报和即时信息的法定权威平台,是社会公众免费查询使用企业信用信息的操作平台。该系统从项目筹建之初,按照以往的项目经验,广泛采用开源的全文搜索引擎ElasticSearch(以下简称ES),但是由于信创的国家战略,通过优选,选择了纯国产自主研发的拓尔思海贝搜索引擎数据库进行测试对比。通过测试对比,海贝在数据安全、综合能力和生态兼容等方面要优于ES,尤其是在搜索能力方面,相较于以Lucene为引擎的ES,海贝基于一个纯C内核的TRS引擎,系统资源的使用更加合理可控,复杂搜索响应性能更优,不会出现因为数据索引、超长表达式检索、通配符检索等操作导致系统进入长时间FullGC而无法响应的情况。海贝提供了更加专业的段、句、位检索、XML检索,支持度量衡数据的数值区间检索等高级功能。具体功能对比如下:
通过测试对比,拓尔思完全自主研发的纯国产搜索引擎数据库-海贝,成功中标,成为其系统建设服务商。该系统吸收了拓尔思在信息检索和NLP领域多年的技术积累,不仅安全、高效、专业,还集成了众多开源检索系统不具备的企业级功能,能够有效降低用户的系统建设成本、开发成本和运维成本,并且已完成与国产操作系统的适配工作。
 
02  案例内容
该公示系统公示的主要内容包括:市场主体的注册登记、行政许可、行政处罚、年度报告、抽查结果、经营异常名录等信息。它是加强信用监管的重要手段,也是改进和创新市场监管的重要载体,有利于降低市场交易风险和社会交易成本,提高经济运行效率,有效促进社会信用体系建设。该网站提供全国企业等市场主体信用信息的公示和查询服务,日均访问量在1亿以上。
 
该系统建设完成的功能如下:
● 索引功能,实现了分词快速检索;
 
● 为用户提供了日志解析入库,实现了海量数据分析;
 
● 企业画像,提供了全景画像功能。
 
以全文检索技术为核心构建的海贝,不仅能够做到全字段索引、支持任意字段的组合查询、在数据查询和分析的效率上,要大大高于其他的大数据管理系统,同时,海贝还引入了内存索引、列存储、索引分片等技术,进一步提高了数据存储、检索和分析的效率。
 
基于统计分析、分类统计等方法,对市场主体的注册登记、行政许可、行政处罚、年度报告、抽查结果、经营异常名录等信息进行企业画像。通过企业画像,加强信用监管,有利于降低市场交易风险和社会交易成本,提高经济运行效率,有效促进社会信用体系建设。
 
03  案例成效
该系统采用海贝搜索引擎数据库作为数据支撑并提供查询,部署了数十个索引节点,存储了数亿条索引记录,日均检索量突破亿级。系统每秒并发检索数超过1000次。
 
因国家企业信用信息公示系统是法定的企业信用信息公示平台,随着系统的影响力提升,目前已经成为企业办理业务以及社会公众获取企业信息的重要平台,得到了国家市场监督管理总局的高度认可。