300229 拓尔思
202312-01
拓尔思入选《2023爱分析·数据要素流通厂商全景报告》
发布时间:2023 -12-01
分享至:
分享
随着数字经济的崛起,数据成为一项与土地、劳动力、资本、技术并列,能够推动社会生产力发展的重要生产因素,已逐渐成为各界的共识。从顶层框架到细则规范,数据要素政策逐渐具体,推动数据要素落地步伐加快。根据中国数据交易市场研究分析报告,2023年数据要素流通市场规模将达到1198.5亿元。预计2025年数据要素流通市场规模将达到2046亿元。
 
近日,数字化市场专业服务平台爱分析发布了《2023爱分析·数据要素流通厂商全景报告》。拓尔思信息技术股份有限公司凭借在数据要素市场的全面布局以及在数据技术和数据资产方面的深厚积累,入选 “数据即服务”和“数据产品开发”代表厂商。
 
 
本次报告综合考虑企业需求、关注度等因素,选取数据即服务和数据产品开发两个市场进行重点分析,根据产品服务满足各市场定义的厂商能力要求、具备一定数量以上的付费客户、在特定市场的营业收入达到指标要求三大标准,遴选出具备成熟数据产品和服务能力的厂商,为企业厂商选型提供参考。
 
#数据即服务#
 
爱分析调研认为,拓尔思在数据即服务市场深耕多年,在数据资产积累、数据要素加工技术、场景化解决方案以及案例积累等方面具有明显优势。
 
01 拓尔思数据资产积累深厚,可满足媒体、金融、企业、政府等行业数据升级需求。
拓尔思数据资产规模非常可观,数据规模体量超2000亿,并以每天亿级的速度高速增长,积累了超3万个标签规则和30余个专业领域知识库。拓尔思数据种类也非常丰富,主流资讯类数据覆盖165个国家,采集类型包含文字、图片、音视频等多种模态数据,覆盖报刊数据、互联网主流新闻网站、新闻资讯客户端数据、权威第三方平台数据、政府类门户网站、微信公众号数据、金融研报数据、金融风控数据、产业服务数据、专利数据等多维度数据,用户可秒级检索。
 
02 拓尔思具备专业、智能化数据要素治理加工能力,为用户提供高质量、高精度数据支持。
拓尔思通过TRS人工智能平台对原始数据进行数据结构化、属性知识化、内容标签化以及场景服务化,实现数据治理全过程。其中,属性知识化和内容标签化均属于打标过程,拓尔思通过专家级的知识标引团队对行业知识进行梳理,保证数据标签的精准度和契合度,再通过NLP技术实现内容智能化标引,保证打标智能高效完成。场景服务化是对数据要素融合资产化的过程,拓尔思基于专题库模型设计、专题业务规则梳理、专题业务数据处理算子设计等对多模态数据进行融合,使数据精准适配业务应用场景。
 
03 融合深刻的业务场景洞察,拓尔思在融媒体、金融风险监控、专利服务、政策分析等场景为用户提供专业解决方案。
以媒体资讯使用场景为例,拓尔思积累了丰富的媒体用户服务经验,在对媒体用户的数据使用场景深刻理解的基础上持续完善“数家”平台。“数家”平台不仅能为用户提供丰富的互联网素材供给,包括报纸库、期刊库、网站库、人物报道库等,更结合自然语言处理、图片识别、OCR识别和视频分析等能力提供线索发现、热点分析、专题跟踪、用户数据、行为数据等功能,一站式满足媒体用户内容生产和运营过程中的数据需求。
 
04 拓尔思提供SAAS、DAAS、KAAS、MAAS等多种数据产品形式,满足用户多样化数据服务需求。
以拓尔思的非法集资监测预警平台“冒烟指数”为例,平台可根据客户实际需求灵活调整数据服务形式。如针对信息化投入低、非法集资事件少的用户,通过购买SAAS订阅服务,定期查看有无风险企业即能满足需求。对于非法集资活动频繁、监测时效要求高的金融监管用户,通过本地部署加采购DAAS数据服务,就能满足实时监测、及时预警的需求。对于监管人员、专业性、技术等条件不足的用户,KAAS数据服务能提供便捷的线索发现、定期报告、定期培训、案例总结等支持。最后,对于数据来源丰富,但缺乏监管经验、监管模型质量低的用户,拓尔思提供“冒烟指数”MAAS模型服务,该模型持续迭代已构建起立体的三级指标体系,可支持用户高效决策。
 
05 拓尔思在数据服务市场深耕十余年,客户案例积累丰富。
如“数星风控”已服务包括中国银行、农业银行、国家开发银行、进出口银行、平安银行、中国人保等高端客户;“数家”平台服务了数百家中央媒体、省级媒体以及行业媒体等客户,其中新华社、教育报、浙报传媒是“数家”的标杆用户,均已连续签约。
 
 
 
#数据产品开发#
 
在数据产品开发方面,拓尔思具备数据获取、数据治理、数据检索、数据分析挖掘全生命周期的技术能力;拥有完整的大数据产品矩阵,涵盖数据采集、汇聚、加工、治理、存储、共享、开放等全流程,包括TRS网络信息雷达系统、TRS海聚数据融合平台、天骄数据中台、TRS海贝搜索数据库等大数据技术产品,为业务应用提供数智化能力。
 
同时,拓尔思数据中心目前拥有3大专业IDC机房,上千台高端机架式服务器完成对互联网公开数据的7*24小时不间断采集,具备数千亿数据量的数据索引、标记、查询、挖掘分析能力,万亿级数据总量的秒级检索能力,日均亿级数据获取能力。目前数据总量超2000亿。