LEARN MORE
从信息技术到大数据:大数据调查的理由
发布机构:杏耀娱乐 发布日期:2019-01-25 访问量:

  介绍

  目前,调查领域的大数据的理论研究和实际应用的日益广泛和深入,这无疑是时代变化的积极响应。然而,作为一个整体,说,在实践中,小侦探工作仍在数据或通常被称为信息化水平,一些建筑物和数据库集成算法,设计和分析工具的做法,因此,在本质上,是也还是一个小的数据调查模式,小,零星建设成果没有形成大规模应用,目前还处于探索阶段。在理论研究中,什么是大数据的调查,所不同的是大数据调查的结果,也是实现大数据的调查情况的信息调查了其下的基本问杏耀主管题仍然是很暧昧的情况下,活泼和轻松的使用大数据反而容易标记这个时代的大数据调查的模糊认识,例如,拥有大批“在大数据的背景下XX情况调查”,“大数据时代背景下,XX调查”作为演讲的标题仍是研究所的,但调查信息。因此,要真正推动实现大数据的调查,第一个是大数据,特别是大型和小型数据差数据的本质的深刻理解,看到导致在此基础上的大数据调查之路。

  数据特征大数据

  对于大数据,被引用最多的概念的说法是:大数据是指数据集的大小超过了传统的数据库工具采集,存储,管理和分析能力。我认为,这种说法并不能帮助人们真正了解大数据。在一方面,表达本身的否定形式的概念,不规范,不严谨,就应该告诉我们的概念是一个什么样的,但不能说A不是B,和C都; 在另一方面,数据库的大小是相对的,所以定义并不分 - 至少不是划分大数据和数据上的一个小的基本等级限制。我认为,它应该在大数据特性大数据的定义中明确表示,为了与小数据分开,从而勾勒出一个框架,以实现在基本范畴的水平大数据调查。为此,大数据可以定义为:综合,动态的,反映各种社会活动,帮助开展的特定事物或行为的综合进化的异构数据挖掘分析的全采样。根据这个定义,比数据更小,字符数据具有以下特点大数据:

  具有质量的大的数据范围(A)数据

  数据社会化,一切社会活动皆可数据为大数据或标志的一个重要特征。对人类生活和测量和记录的客观世界数据。过去是什么,我们需要把它给记录之前选择记录; 在大数据时代,什么是选择,不需要记录,只是取消其备案。随着记录的范围的不断杏耀开户扩大,可以肯定的,人的总数据量也不断扩大雪球。基于完整的数据和大数据挖掘分析传统统计抽样中也局限[我],并发展成为一个全样本的分析,准确度,丰富性和容错性分析结果也将由此的巨大改进。

  数据(b)中具有大的数据字符的动态

  动态大数据指的是实时数据生成,主动反馈,甚至自动滚屏。在一方面,该数据不仅从静态的,孤立的片段成为连贯的轨迹,可以形成一个集群轨迹,会有越级轨迹断点缔合形成的轨迹重叠,编织表面活性; 在另一方面,数据不再仅仅是被查询和对象对准,也成为了操作的一部分 - 通过学习数据挖掘技术,允许基于挖掘,增加计算和自我调整的计算的数量数据库机器的手段参数,从而使数据“活着”,以推动实现预测,以弥补短板调查滞后。

  数据(C)具有大的数据特性异构

  异质性数据,是具有大的多个结构数据,不仅包括传统的结构化数据的信息是数据,越是大的非结构化数据。例如,关于具体的个人,无论是轮廓数据,资产和银行账户数据,电子商务购物数据和其他数据,而且还包括图像的结构化数据,视频数据反映了他们的个人形象和个人的情况下,数据的行为过程,登录网上非结构化数据等。,社会,情感和数据,数据等习惯,以及非电子数据。随着大数据的发展,非结构化数据将日趋丰富,含有调查值,[1]然而,目前尚缺乏非结构化数据的分析,绝大多数非结构化数据的不现场调查已经应用或不充分的应用。

  大大小小的数据调查调查数据

  从上述三个数据分析和应用特性,我们可以理清大型和小型数据检测数据检测之间的差异(ⅰ。e。,检测信息)。

  在(a)中的数据的质量的差

  总体而言,调查数据,动态的,非均匀度比检测大数据下的完整信息。资料如有信息调查使用的数据公安机关形成,如手机话费,酒店住宿信息,临时登记信息,车辆信息,网络登录地址和登录计算机的MAC地址聚会的日常工作; 此外,有银行,民航,交通等行业数据。大多数这些数据都被结构化,标准化的数据反映社会生活,社会活动或特定类型的特定的人的一个方面,对于其他类型的社交活动,各类社会成员的数据,如日常行为非电子社交数据和资料,信息和非结构化社交媒体等数据的习惯一直没有大规模应用; 此外,视频信息,而且在屏幕上的内容,并分析观察到的具体时间和空间的整个视频的经验信息。为了实现一个小问题数据的飞跃大的数据,丰富的数据源,数据扩大覆盖范围,提高数据的异质性,尤其是非结构化数据集合的发展,存储和分析能力,必须重点解决。

  (B)在数据的大小的差

  从“碎片化,基于块的”系统和警方的调查,负责决策职能分工,目前的调查信息的数据库基本上都是商业信息数据库,每个主题和一个单独的搜索系统的分析,并通过关联一个特定的网络操作平台,但大规模数据库集成。如果不是所有的数据挖掘,分析工作“顺利地集成到一个统一的数据处理中心,现有搜索系统的各种实际应用是紧耦合到一个无缝统一的框架”,应用程序处理的数据仍然只在小信息阶段的数据不能飞跃在大数据时代。由此也可以看出,大量的数据调查,不仅需要技术支持和突破,也将形成目前的调查系统上有较大的影响。

  的差(c)中的数据处理和应用模式

  目前的调查主要是通过信息技术和计算机网络技术,以提高定位的信息查询,搜索精度和速度。例如,在一个大的数据治安的媒体报道标题,对扒窃一起街头的调查过程是:监控录像提取网站获悉,犯罪嫌疑人体貌特征 - 调查报告发现,在该领域,粮食系统后,周边市场也有类似的发病率 - 的情形相比,视频直播更嫌疑人体貌特征相同,且乘坐出租车逃离现场 - 出租车跟踪,以确定犯罪嫌疑人行驶居住地。尽管速度,精度和广泛的工作本身可以做一个质的飞跃,信息化手段的应用,无疑将提高调查的效率,但是,很显然,这不是一个很大的调查数据,至少不是大数据调查的典型,成熟感。在目前的调查过程中的信息,经验,主观假定和调查的准确性的逻辑电平分析,从而提出要为前提的成功检测,数据信息的准确性是关键嫌疑人查获; 和逻辑,容错数据结垢之间的信息非相关的海量数据是大数据的本质。

  当然,我认为是没有考虑或调查的坏传统,应该放弃,也没有否定调查和信息技术操作的当前模式的结果,而是想说明目前的调查和信息之间的差异大数据调查 - 虽然即使在大数据调查,这些方法是非常重要的,主要的,但是,如果它们与大数据的调查混淆,我们会让其成果已取得如此盲目,看不到前进的方向。

  大数据调查

  排序的调查资料和大数据调查之间的区别是,找出差距,明确了方向和路径,妥善推进大调查数据就可以实现。

  (一)建设数据库集成

  建立数据库集成,首先面临的资源和技术的瓶颈。

  在一方面,数据生成,记录的信息的数据源的全面性是不够宽。“我们如何才能达到收敛?一般来说,主要的方式是按照事物的概念,以建立一个更加快速,稳定的网络基础设施,特别是在全市推广宽带,无线城市的建设,特别是城市一起,建筑物,道路,车辆,工厂,电网和甚至家庭设备配有传感器,定位系统,让一些正在联合起来,记录,开放式计算。“很显然,要做到这一点,技术支持和资源,还有相当大的差距。

  在另一方面,在共享和应用方面,平台建设仍然可以遵循这样的小数据时代的各自为战,配合相应需要建立存储处理能力,管理平台。脸谱,百度,腾讯等企业数据平台是一个共同的平台,形成了数据采集和处理的模型; 在公共安全领域的工作,全国各地公安机关已投入显著的资源和技术来创建一个数据平台,例如,北京中建的200多个类别的公安内部和社会信息资源的集合,实现“一个键关联,自动对准”搜索,分析的功能的‘情报信息智能检索系统'; 广西建成公安“云计算”中心,承载着警务系统47,实现全区域两级公安业务系统的互联,互通,大网络的互控,共享一个大的,大的应用模式。虽然热烈的掌声,并给他们的这些探索和实践成果的期待,也应该反思:未能跳出来阻止主要功能,并从这些基本限制中分离到各省,市,自治区,自主建设的数据库集成或半集成数据库仍然是可能作为作为信息系统的信息施工过程中,因为他们自己的方式,相互争斗以形成屏障数据,共享困难?

  因此,数据库集成的建设也需要解决的第二个 - 也许更难以解决的问题 - 侦查机制的问题。在不改变条块分割,职能分离制度背景下,应该制定具体的警方数据管理的法律法规,完善和加强数据管理系统,以减少封闭数据的现象。例如,在商业世界中,通过市场的力量来关闭数据破坏,使数据可以成为一种商品交易,开展的交易数据,形成融合和创新引导趋势的方法之一。公安的市场数据的区域内的特殊性质当然不能 - 或者无法实现市场化的一般意义。但数据市场,但他们可以给我们在数据管理和法律规范共享一些灵感的发展。

  (B)的数据挖掘工具的发展

  数据内涵大型数据大大拓展了调查,不仅包括传统的数字,还包括文字,图片,甚至音频,视频等。因此,该算法的数据也将更加多样化和复杂化。大数据是核心数据计算的方法和技术,特别是有关的数据分析,机器学习和模式识别。

  数据相关性分析发现,在大量分散的数据的数据之间的相关性,而这些数据形成数据集,其中描绘的事物或事件或趋势的发展规律。主要的区别信息分析和信息,其调查没有强有力的针对性,不关心数据,因果关系等,只需找出数据的质量隐含的落后特定算法趋势的规则之间的逻辑连接; 机器学习是让计算机模拟人类学习,通过输入大量数据到计算机,使得其自学习和调整,其中,偶然和数据质量不平衡的问题可以通过将数据的庞大规模来减轻,以软化调查信息的信息的准确性的刚性需求; 通过数据的计算机分析模式识别表征一个特定的对象或现象,所描述的现象或事物,识别和分类用于识别文本,语音,图像等的形成。

  总之,更加多样,技术含量更高的数据处理能力超出了大量的数据信息调查的性能调查的核心。在调查的最新信息,调查部门作为一个整体仍然使用传统的数据分析工具和方法,分析工具都相对较弱,分析工具是不够的在用户体验方面,专注,专业性和实用性等发展。。公共公安机关应该是独立的R&d和外包双管齐下,数据的基础上,充分了解调查工作的特点和需求上,注重工作分析工具的开发,应用反馈和持续改进等方面。

  (三)制定大数据调查感

  大数据调查思维和大数据调查的建筑相得益彰,不仅指导大型数据调查的建设,是一个庞大的数据调查的一个组成部分。

  传统的思维方式是担心犯罪分子的案件之间的因果关系进行调查的基础上,大量的调查经验,社会生活经验“隐性知识”的动机,对犯罪嫌疑人与之间的关系受害人的犯罪方法,犯罪嫌疑人的条件,如逻辑分析,研究者假设或案件的轮廓的理解,与其他犯罪嫌疑人采取的行为言语交流或使用互联网电子技术进行信息搜索,找到线索并获得证据不是在此基础上的其他方法,对案件的调查明的事实,犯罪嫌疑人查获。在这个过程中,驱动数据或信息是仅部分地或逐步地。相比之下,大数据可以被称为数据驱动的侦查思维的意识,那就是,在案件调查过程中,犯罪控制和数据分析形成三个表格数据之间的动态挖掘水洗 - 调查 - 控制 - 数据 - - 检测 - 控制 - 周期性数据。换句话说,观念意识,数据本身并案侦查和控制犯罪是事物的同一水平,而不仅仅是寻找线索或证据,扣押手段。例如,通过案件的客观事实形成了大数据挖掘调查反映逻辑思维的元素之间的相关性来弥补经验不足,思维,直觉思维等。我们发现,逻辑思维无法找到“尿布和啤酒”之间的关联,从而更快,更主动地发现案件事实之间的关联,并通过机器学习和数据挖掘聚类分析,形成指导调查方向。

   在意识的调查过程中,开发大数据,一方面是调查部门应该总结从传统的调查,调查的信息大调查的数据模型,工作流的某些不同; 而另一方面,以检测为指导的需要,加强调查经验和大型数据挖掘之间的联系,大数据的可视化的重要性,以加强大数据的实用性。

  当然,你需要再次强调,大数据和传统的调查意识调查意识是相辅相成的关系,不是取代的关系取代。

  综上所述,调查仍然是一个大的数据 - 可能不是很远,但肯定还有很长的路要走规划或想象之前去。目前所有的努力实践和理论研究部门做的是致力于推动其早日实现。但首先一个清醒的认识应该是:在调查领域,我们在侦查阶段的信息技术和大数据调查阶段至少有一个质的差别。

  杨吁俊

  JD

  学校调查反恐中国人民公安大学,主要研究方向的教授:刑事调查。

  

  关掉

  注意

  I

  他们

更多资讯

回到顶部