全国服务热线:400-6966-109 总部总机号码:010-62220090
概述
随着互联网的普及,中国网民超过3.38亿人,成为世界第一大网民国家,网络的重要性凸显,而网络舆论热点也层出不穷,上海市户籍新政、陕西神木县全民免费医疗……都是通过网络进行第一时间传播,互联网已经成为政府了解民情的直接渠道,也是新形势下政府的重要舆论阵地。因此,网络舆论一旦被错误地控制和引导,将成为影响社会稳定的重大隐患。如何应对网络舆情,目前正在考验着我国各级政府。
网络舆论复杂化,互联网言论空间在2010年继续扩大,特别是“微博”的崛起,网络议题得到传统媒体的响应和深入挖掘,而传统媒体的报道也经常在网上被迅速发酵、放大成全国性舆论。部分网民开始以一些温和的网下行动干预现实。政府对网络民意的应答提速,并把网络举报列为党纪、政纪和司法监督新渠道,追究激起民怨的官员责任。同时,由于一些突发事件中对抗性增加,某些地方容易把限制网络信息流动作为控制局势的优先选择,而另一些地方政府则大胆探索舆论应对和突发事件处理的新机制
多数据源采集融合问题,目前新闻、论坛、博客、微博客、视频网站等多种舆情信息传播渠道,同一个舆情信息可散布在不同传播渠道中,造成了数据监测系统对不同来源数据的处理不一致、标准不统一的问题,为了保证监管的效率,需要对监管系统的元信息进行数据标准化和数据集成,形成一个统一的互联网舆情信息基础数据库
多维度监测问题,舆情监测要求对多数据源进行多维度分析,根据不同用户的需要进行不同的维度的分析与展现。
分析结果关联与融合问题,现有监测系统对舆情信息传播的分析功能的实现还比较少,只有简单的舆情信息文本内容分析,因此对于多种传播渠道新闻、论坛、博客、微博客传播方式和相关信息的综合分析目前还没有相应的系统和技术,导致分析关联能力不足,对潜在热点发现能力不足,需要有效的解决方案
海量数据处理问题,互联网数据数以亿计,每天都产生TB以上规模的数据,如何对海量的数据进行存储,如何对海量数据及时有效的处理,如何使系统的架构能够随着数据规模增大而自动扩展,都是海量数据处理面临的挑战性问题。
系统特点
一是采集灵活性,网页探索器作为全球领先的网页分析工具,可以按照网页视觉特征精确定位并分析网页任意一部分的源码结构,节点结构,CSS 特性;对任何复杂的页面布局都可以灵活处理,内置几十种数据处理方式,轻松支持从任意半结构化数据中抽取结构化数据;
二是采集时效性,分布式搜索、元搜索、垂直搜索互为补充,搜索引擎采用分布式、并行负载平衡技术,当服务器出现运行负载失衡的状态,系统可根据事先设定的调节机制,自动调节服务器和网络设备的负载,充分利用既有资源,确保系统稳定运行,提高运行效率,从而达到我们快速搜索数据采集目标;
三是可定制性,即能够根据用户的自定义需求,对重点对象、话题进行聚焦监测;
四是持续性,即能追踪已知话题的后续各类互联网媒体相关报道、转载、评论数,掌握其发展范围、动态、趋势;
五是全面性,对于针对不同技术形态建立的系统数据进行整合、分析处理,确保管辖范围内数据的全面性。
服务热线:
官方微信
Copyright © 北京天大清源通信科技股份有限公司版权所有