数据采集:爬取全站网页内容,包括文字、图片、附件、音视频等,智能识别数据结构,清洗干扰因素,持久化存储。 基础能力:NLP分词确保搜索结果全且准,智能权重计算确保搜索效果排序合理。 后台管理:租户+站点模式,利于数据隔离和数据安全;结构化的库表数据管理,便于搜索能力的灵活配置、扩展和调优。
词库管理:词库种类丰富,包括敏感词、同/近义词、百姓体、自动纠错、拼音转换等;能力强大,实现字词联想、自动纠错、自动补齐、权重设置、新词自动发现等实用特性。 搜索运营:包括内容置顶、敏感内容屏蔽、设定搜索暗文、设定热搜词、用户反馈、搜索轨迹分析等特性。 框应用:默认内置行业化的框应用,包括领导人名片、相关领导、机构名片、相关机构、地图服务等,也可自定义扩展框应用,实现自定义的静态内容和动态服务的搜索。 统计分析:包括搜索次数和趋势、点击次数和趋势、搜索排行、词条使用统计等。
搜索前,提供热搜词、搜索暗文、自动纠错、近义词推荐、拼音转化等引导和辅助特性;搜索时,提供常规搜索、高级搜索、附件搜索等搜索能力;搜索后,系统自动搜集用户的搜索行为和点击行为,同时也支持用户主动提交留言反馈。
数据采集:爬取全站网页内容,包括文字、图片、附件、音视频等,智能识别数据结构,清洗干扰因素,持久化存储。 基础能力:NLP分词确保搜索结果全且准,智能权重计算确保搜索效果排序合理。 后台管理:租户+站点模式,利于数据隔离和数据安全;结构化的库表数据管理,便于搜索能力的灵活配置、扩展和调优。
词库管理:词库种类丰富,包括敏感词、同/近义词、百姓体、自动纠错、拼音转换等;能力强大,实现字词联想、自动纠错、自动补齐、权重设置、新词自动发现等实用特性。 搜索运营:包括内容置顶、敏感内容屏蔽、设定搜索暗文、设定热搜词、用户反馈、搜索轨迹分析等特性。 框应用:默认内置行业化的框应用,包括领导人名片、相关领导、机构名片、相关机构、地图服务等,也可自定义扩展框应用,实现自定义的静态内容和动态服务的搜索。 统计分析:包括搜索次数和趋势、点击次数和趋势、搜索排行、词条使用统计等。
搜索前,提供热搜词、搜索暗文、自动纠错、近义词推荐、拼音转化等引导和辅助特性;搜索时,提供常规搜索、高级搜索、附件搜索等搜索能力;搜索后,系统自动搜集用户的搜索行为和点击行为,同时也支持用户主动提交留言反馈。