来源:刑侦案审
作者:张全涛 西南政法大学诉讼法学专业博士研究生
重庆警察学院侦查系侦查基础理论教研室主任
重庆市公安局渝北区分局刑侦支队副支队长
本文系国家社科基金项目(15BFX072)、重庆市教育委员会2015年教育科学技术研究项目(KJ1501507)、重庆高校创新团队建设计划项目(CXTDX2201601041)、重庆市教育委员会2017年人文社会科学研究项目(17SKG227)、重庆警察学院2016年科研研究项目(cqjy201605)的阶段性研究成果。
【内容提要】
“互联网+”时代,信息技术的高速发展与经济社会的交汇融合引发了大数据的极速增长,对社会生活方式和国家治理模式产生了重要影响。大数据技术的诸多特征与刑事侦查工作存在密切关联,将大数据技术引入刑事侦查领域,不仅能够有效应对智能化的犯罪形势与信息化侦查工作的发展瓶颈,而且能够积极适应“以审判为中心”的诉讼制度改革对侦查取证工作和证明模式改革提出的要求,进而对侦查理念的重塑、侦查情报的收集、侦查模式的变革等内容产生重要价值。囿于大数据技术在我国起步较晚,积极探寻大数据侦查的基本内涵、理性认识大数据侦查现存的技术难题,是构建大数据侦查理论的首要任务。树立大数据侦查思维、构建大数据侦查运行机制、完善大数据侦查隐私权保障加强大数据侦查队伍发展、强化大数据侦查分析应用,是探索侦查阶段客观证据生成机制和推动大数据侦查工作向纵深发展的重要进路。
【关键词】
大数据技术 大数据侦查 诉讼制度改革 侦查模式转型 隐私权利保障
【引言】
自1890年开始,美国赫尔曼·霍尔瑞斯发明了第一台用于读取数据的电动器,由此引发了全球范围内的数据处理新纪元。后来,美国国家安全局(nsA)开始采用计算机对自动收集超量的信号磁盘信息进行数字化处理。到了1997年,美国学者迈克尔·考克提出了超级计算机生成了大量不能被处理和可视化的信息,超出了各类存储器的承载能力,同时在人类史上第一次提出了“大数据问题”,并使用了“大数据”这一概念.自此,有关大数据(Big Data)的理论研究,不断繁荣。其中,具有代表性的是2005年,由英国牛津大学网络学院教授维克托·迈尔-舍恩伯(《VikorMayer-Shonbeg《-hnberger)及《经济学人》数据编辑肯尼思·库克耶(KennthCukier)在其著作《大数据时代:工作、生活与思维的大变革》中,详细阐述了大数据将对人们的工作、生活、思维带来哪些根本性的变革,以此重塑人们对世界的传统认知和改造。2011年6月,美国著名咨询公司麦肯锡在其发布的《大数据:下一个竞争、创新和生产力的前沿领域》研究报告中指出了大数据时代的到来,不仅对国民经济部门的生产效率等方面产生重要影响,同时也将成为世界各国国力竞争新的增长点。另外,从美国白宫发布的《2014年大数据白皮书》可以看出,大数据技术已经广泛应用于政府、企业、医疗、教育、商业、网络、电子商务、城市建设等领域,充分表明了大数据技术在各行业领域的广泛利用价值。
至于我国关于大数据技术的发展,2012年,由中国科学院院长白春礼院士呼吁中国应制定国家大数据战略。2012年5月5日,国家发改委印发《“十二五”国家政务信息化工程建设规划》(发改高技[2012]1202号),以加快推进国家政务信息化工程建设,科技部也部署了关于物联网、云计算的相关科技专项。随后,2012年12月,广东省启动了《广东省实施大数据战略工作方案》,北京成立了“中关村大数据产业联盟”。2013年8月8日,国务院印发《关于促进信息消费扩大内需的若干意见》,目的是促进信息消费规模快速增长、信息基础设施显著改善、信息消费市场健康活跃。2013年,上海、重庆等地也启动了大数据研发三年的行动计划。2014年2月27日,中央网络安全和信息化领导小组宣告成立。2014年5月,工业和信息化部电信研究院发布《大数据白皮书(2014)》。2015年国务院分别印发了《关于促进云计算创新发展培育信息产业新业态的意见》(国发[2015]5号)、《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》(国办发[2015]51号)、《促进大数据发展行动纲要的通知》(国发[2015]50号)等规范性文件。2016年4月,国务院办公厅发布《关于转发国家发展改革委等部门推进“互联网+政务服务”开展信息惠民试点实施方案的通知》(国办发〔2016〕23号)。至此,我国政府开始全面将云计算、大数据、“互联网+”等信息技术作为支撑国家政府治理创新的重要的驱动手段和方法体系。
在学术研究领域,将大数据技术引入刑事侦查工作,有其重要的背景性思考。一是当前严峻的智能化犯罪形势,2016年,最高人民检察院与最高人民法院、公安部等共同重拳打击以电信网络诈骗犯罪为代表的智能化犯罪,全年批准逮捕电信网络诈骗犯罪19345人,占总批捕人数的2.3%。二是信息化侦查工作出现了新的“瓶颈”,主要体现在信息共享困难、信息壁垒严重。三是党的十八届四中全会提出了推进“以审判为中心”的诉讼制度改革,旨在改变传统“侦查中心主义”的各种弊端,确保侦查、审查起诉的案件事实证据经得起法律的检验。所以,引入大数据侦查具有重要的理论价值和实践意义。
一、问题的提出:新形势下侦查工作面临的新问题
不同的时代,犯罪与侦查都各具特点,但长期以来“被动回应型”侦查模式难以有效维护社会的治安和人民群众对安全感的期待。因此,正确认识侦查工作新情势,是创新侦查模式急需解决的首要问题。
(一)犯罪的智能化给传统侦查方式带来严重挑战
在“互联网+”时代,犯罪分子利用计算机、网络实施犯罪,犯罪数量居高不下,传统犯罪模式呈现出智能化的新特点。2015年,国内首份《现代网络诈骗产业链分析报告》中指出:“网络诈骗已形成一条完整的、分工明确的产业链,其中具体分工可达15种。”《报告》初步统计从事网络诈骗者可达160万人,“年产值”超过1100亿元。同时,网络金融犯罪形势也异常严峻,借助P2P网络借贷、互联网银行、电子货币、众筹融资等网络平台实施的新型网络金融犯罪层出不穷,给正常金融管理秩序带来严重的挑战。在此状态下,网络恐怖主义犯罪也应运而生,导致了不亚于传统恐怖主义犯罪产生的危害后果。目前,这种智能化、科技化、数字化的犯罪新形势,正威胁着社会的和谐与稳定,也考验着侦查机关的传统办案方式。
(二)信息化时代侦查工作向纵深发展的“瓶颈”和问题
我国侦查工作当前正处于信息化与大数据侦查阶段的过渡时期。毋庸置疑,信息化对侦查工作产生过积极的作用,但在大数据时代,却出现了一些“瓶颈”问题。主要表现:一是由于信息价值密度低、信息泛滥,导致有效侦查信息难以筛选,即侦查人员信息化阶段的思维、技术与“互联网+大数据时代”数据资源的“巨量”不相匹配,以致侦查人员难以及时有效地搜寻、挖掘、分析、研判对侦查工作有价值的信息。二是地区差异部门壁垒、信息烟囱等导致信息共享程度低,制约信息化侦查工作的向前发展,即当前信息资源的拥有者和使用者呈现各自为营、各自建库、单独使用封闭保留等局面,严重制约侦查工作的信息共享共用。三是传统思维障碍、信息化阶段侦查技术落后制约着大数据时代的数据挖掘、模糊碰撞等信息收集、整理研判能力,难以有效应对新型违法犯罪案件的高发。
(三)“以审判为中心”的诉讼改革对侦查取证工作提出的新要求
党的十八届四中全会《中共中央关于全面推进依法治国若干重大问题的决定》提出:推进“以审判为中心”的诉讼制度改革,确保侦查、审查起诉的案件事实证据经得起法律的检验。全面贯彻证据裁判规则,严格依法收集、固定、保存、审查、运用证据等改革要求表明,严格落实非法证据排除,贯彻证据裁判是审判中心的核心,重塑我国的刑事证明模式,强化审判阶段诉讼证明的中心地位,形成以证据能力为核心的证据规则体系和完善以严格证明为主的证明体系,是推动“以审判为中心”的诉讼制度改革的重要路径。而这些新的改革的要求直指证据制度的改革和完善,其中最突出的特征就是改变传统“从供到证”的侦查模式,弱化传统侦查对口供证据的依赖,逐步实现从重视主观证据收集向重视客观证据收集的转变,这就需要依靠大数据技术改变传统侦查工作的“人海战术”“体力战术”“刑讯战术”等取证方式,实现逐步向数字化、科技化、智能化的侦查取证方式转变,推动客观证据生成机制的发展完善。
二、问题的突破:大数据技术引入侦查领域的新思路
如上所述,智能化的犯罪形势倒逼侦查工作效能的提升,信息化侦查工作的“瓶颈”障碍推动侦查工作的转型升级,“审判中心主义”诉讼制度改革要求侦查取证范式的重塑。所以,大数据侦查理论的构建,对打击犯罪效能的提升、侦查工作发展的推动以及诉讼制度改革背景下证明模式的改革具有重要价值。
(一)大数据与大数据技术概论
随着互联网的应用越来越广泛、新型社交网络的出现、云计算技术的发展以及新型移动设备的增长,数据量呈现了爆炸式增长。“数据”从过去简单的“数字”概念逐渐发展成为集数字、文本、图片视频等为一体的“大数据”,数据结构也从过去单一的结构化数据向现在复杂多变的非结构化数据扩展。而对大数据概念的界定,相对过去传统数据的概念而言,就字面意思,大数据之所以称为大(big),也是一个修辞学意义上的概念。麦肯锡在其报告《Bigdata: The next frontier for innovation competition and productivity》中对大数据的定义是指大数据的大小超出常规的数据库工具获取、存储、管理和分析能力的数据集,但它同时强调,并不是一定要超过特定TB值的数据集才能算是大数据。美国国家标准与技术研究院(National Institute of Standards and TechnologyNIST)发布的研究报告指出,大数据是用来描述在我们网络的、数字的、遍布传感器的、信息驱动的世界中呈现出的数据泛滥的常用词语。大量数据资源为解决以前不可能解决的问题带来了可能性。而中国电子技术标准化研究院发布的《大数据标准化白皮书(2014)》中指出:大数据是代表着数据从量到质的转变过程,是代表着数据作为一种资源在经济与社会实践中扮演越来越重要的角色,是相关的技术、产业、应用、政策等环境会与之相互影响,互为促进。2015年9月国务院印发的《促进大数据发展行动纲要的通知》(国发〔2015〕50号)中指出:大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。概言之,大数据的概念包含着量和质的双重属性,在量的方面体现在数据体量的庞大,在质的方面着重数据的深度分析和应用,是资源、技术、应用的集合体。
最大数据技术,则是指从各种各样类型的数据中快速获得有价值信息的能力。因此,大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的大数据进行专业化处理。常见的大数据分析技术包括关联分析、聚类分析、分类分析、异常分析等。
关于大数据的特征,当前的通说认为大数据具有“4V”特征,主要表现在:一是数据体量大(Volume),常见的数据存储单位一般都用EB、GB或TB单位来衡量,而大数据则直接从TB单位跃升到了PB、EB,乃至于ZB单位来衡量。二是数据的类型多(Variety),即传统的常见数据主要是文本为主的结构化数据,而大数据时代则包含视频、音频、图片地理位置、个人社交等各种类型的数据和信息。三是价值使用密度低(alue),即小时代的数据主要追求的是精确性、精准性,因此价值密度大,而大数据时代主要体现的是数据信息的繁杂性、数据的模糊性等特征,导致了数据的使用价值降低,这种密度的高低取决于数据提纯的精度大小。四是数据处理的速度快(Velocity),即改变了传统先收集再处理的现状,大数据时代实现了收集与处理的同步进行,通过更先进的处理技术使数据发挥最大的价值和效用。
(二)大数据技术与侦查工作的关联
1.大数据技术的预测功能与侦查防范工作的关联性
埃里克·西格尔博士在著作《大数据预测》中谈到,预测功能是大数据技术的重要功能。在大数据时代,人的行为模式通过大量的客观数据予以记录、聚合后,能够对人的未来一定时段的行为进行预测。当前,大数据技术的预测功能广泛应用在网络购物中,运营后台通过对消费者浏览、消费的轨迹进行收集、分析,很容易研发出受顾客青睐的商品。而在刑事侦查工作中,一方面,要围绕犯罪事实发生的条件,依照法定程序收集证据,直至查获犯罪嫌疑人,准确的认定犯罪事实,为后续的诉讼活动作准备;另一方面,要通过案件的侦破,警示犯罪潜在的犯罪分子,教育引导公民严格守法。同时,更重要的任务则是通过对侦查破案工作的科学分析和深入研判,对犯罪进行准确预测、有效预防。因此,大数据技术的预测功能与侦查工作的预防犯罪任务具有密切关联,大数据技术引入侦查工作中能够为犯罪的预防提供更为精准的决策导向。
2.大数据技术的全景记录功能与侦查途径选择的关联性
在大数据时代,涉及上网、休闲、娱乐、购物、交友、旅游、导航、浏览等产生的数据是海量的,每个人从早上开始到晚上活动结束,都有大量数据进行记录,而这些数以万计的海量数据则构成了对人的全景记录。通过对全景记录的研析能够推导出每个人的职业特点、兴趣爱好、消费习惯、运动轨迹等基本内容。而侦查工作的实现途径就是依靠痕迹物证围绕犯罪嫌疑人的个体特征,通过信息数据的发现、提取、固定、保存、分析和研判等途径,刻画犯罪嫌疑人的基本情况,从而准确认定犯罪嫌疑人。大数据技术的全景记录功能为现代化侦查工作的精准打击提供了重要的基础数据,为准确查明犯罪、认定案件事实提供了重要的信息基础。
3.大数据技术的数据化特征与侦查证明模式革新的关联性
正如何家弘教授所言,人类从“神证”时代走入了“人证”时代,又从“人证”时代走入“物证”时代,随着信息化时代的到来,人类又走进了另一个新的司法证明时代,即电子证据时代。大数据时代的到来,侦查取证活动将主要依托随时记录的视频、拍照、定位等信息,更是与侦查工作息息相关,侦查机关通过合法取证,获得了大量电子化的形式以及可视化的视听资料,这使得电子化、数字化证据占全案证据的比例进一步加大,同时也改变着传统证据审查的方式,以及“从供到证”的证据证明模式。研究近年曝光的大量冤假错案可以发现,对口供证据的依赖与迷信是促成侦査机关惯性采用刑讯逼供等非法取证手段的主要动因。未来,随着非法证据排除规则的普遍适用与证据裁判原则的“落地”实施,传统取证方式将难以“适从”,依靠大数据留存的电子证据将成为主要证据成分,推动取证方式的改革、证明模式的革新。
(三)大数据侦查的概念界定
概因大数据侦查作为新生事物,目前学术界并未形成一致的概念,对大数据侦査概念的界定应在传统侦査概念的基础上,结合大数据的特点,赋予其新的内涵。而传统侦查的概念,历史上也曾出现用语的混乱,至今也未明确固定,主要表现为“侦查”“侦察”“犯罪侦查”“犯罪侦察”“刑事侦查”“刑事犯罪侦查”等概念的共存。其中,“侦查”与“侦察”含义存在差异并无争论,但究竟使用“侦查”“犯罪侦查”“刑事侦查”,抑或“刑事犯罪侦查”还未统一。如果单从国家追究犯罪效果角度观察中国的刑事程序,侦查毫无疑问是整个程序的中心,从一定意义上可以说,真正决定犯罪嫌疑人和被告人命运的程序不是审判,而是侦查。当然,随着党的十八届四中全会后“以审判为中心”的诉讼制度改革的全面推进,这种“侦查中心主义”的现象将会改变,但不能否认侦查在整个刑事诉讼程序中的重要地位,侦查程序的开端决定着后续的诉讼进程。因此,从目前规范的文本和实践惯例来看,“侦查”一词用语更为普遍。
大数据侦查是指以传统侦查理论为基础,以海量公安网信息、互联网信息、社会资源信息、视频监控信息等大数据资源为前提,综合运用云计算、智能引擎、模糊碰撞、数据挖掘等信息技术手段,通过智能关联分析和高效计算手段,准确查明犯罪事实、收集犯罪证据、查获犯罪嫌疑人,精准预防犯罪发生的现代化侦查技术手段。
理解大数据侦查的核心内涵,则需要从广义和狭义两个角度对侦查的概念进行理解。首先,广义上的大数据侦查是指侦查的理念、思维、模式、方法、机制等宏观方面的改变,而狭义的大数据侦查则仅指相对于传统侦查技术手段的更新升级,本文的大数据侦查概念应是广义的概念。其次,大数据侦查是诸多诸如现场勘查技术、视频侦查技术、心理测谎技术等侦查技术的一种类型,主要是凭借数据信息技术手段解决侦查工作中的实际问题。同时,大数据侦查也是信息化侦查向纵深发展的一个阶段,确切来说大数据侦查是信息化侦查发展的高级阶段。此外,大数据侦查也不能混同于技术侦查。技术侦查是我国《国家安全法》《刑事诉讼法》《人民警察法》等法律所规定的带有秘密性质的以记录监控、行踪监控、通信监控、场所监控等为内容的侦查手段,而大数据侦查则是依靠海量数据进行侦查,以数据关联、数据挖掘、数据碰撞和犯罪防范的数据预测等为主要内容。
(四)大数据侦查的特征描述
通过分析上述概念可知,大数据侦查是传统侦查工作的转型升级,是信息化侦查发展的高级阶段,所以大数据侦查既具有信息化侦查的一般特征,又具有大数据技术的鲜明特点。
1.大数据侦查是由传统经验驱动侦查向海量数据驱动侦查转变
传统侦查工作,是以侦查人员长期积累的侦查经验为基础,通过分析犯罪嫌疑人与被害人之间的因果联系、犯罪现场的痕迹物证与犯罪嫌疑人的个人特征结合等方面划定侦查方向,确定侦查范围。这种基于逻辑经验分析推动侦查工作进行的模式,一旦某一个环节出现障碍,侦查就可能陷入僵局,从而影响整个侦查工作的进程。而大数据时代的侦查工作,则更加注重海量数据的相关性分析、数据的模糊碰撞以及深度挖掘。通过大量的数据挖掘,探寻深层次的侦查关系关联,围绕刑事案件的“人、事、物、时、空、痕”等任何要素,进行任意关联,如“条条大路通罗马”之势,为侦查案件和犯罪预测提供重要决策。
2.大数据侦查是由被动回应型侦查向主动预防型侦查转变
在传统侦查工作过程中,由于侦查工作大部分是在犯罪案件发生之后启动的,侦查工作主要是围绕事后获知的有限信息开展相关调查,信息的不对称性、侦查技术装备的落后性、侦查技术人员的岗位核心能力及犯罪嫌疑人超高的反侦查能力等因素导致侦查工作时常陷入被动,有时甚至被犯罪分子牵着“鼻子走”,导致侦查资源的消耗和侦查目的功能的限缩。而在大数据时代,由于侦查机关掌握了海量的数据,既能够通过海量的数据进行数据挖掘、模糊碰撞、相关性查询等及时有效地查明犯罪事实、收集证据、查获犯罪嫌疑人,还能够通过大数据技术研究犯罪规律、绘制犯罪热图,主动开展犯罪预防,将其控制在萌芽之中,实现打击犯罪与人权保障的平衡。
3.大数据侦查是由粗放型侦查方式向集约化侦查方式转变
传统侦查工作主要以“现场勘查、摸底排队、审查讯问”式的“三板斧”方式推动侦查工作前进,这些“车轮战”“人海战”式的粗放型侦查模式所进行的勘查、摸底、守候、抓捕、讯问等侦查工作需要耗费大量的人力、物力、财力,而造成的冤假错案也难以及时纠错。即使在信息化侦查时代,大量的基础资源仍要赖以侦查员、技术员进行手工录入,由于基础信息录入时间不及时、录入质量不达标、录入数量不准确等而造成贻误侦查战机、虚假错误研判等问题时有发生。在大数据时代条件下,通过树立“以网找人、从人到案、从案到数据、从数据到数据、从数据到案件”等侦查思维,对不同的数据资源库及导航模块,科学合理地设置检索条件,通过准确检索、模糊检索、跨系统检索和综合检索等多种方式,进行数据信息的检索比对、关联研判、深度挖掘、多点碰撞、批量比对、筛选数据等,获取与案件相关的侦查要素,从而实现集约化侦查。
4.大数据侦查是由追求因果关系的精确性向追求相关关系的模糊性转变
传统侦查工作中,侦查人员主要是以犯罪行为与犯罪动机之间的因果关系、犯罪嫌疑人与被害人之间的相互关系等为主要线索进行回溯型侦查。因此,前期的侦查线索对后期的侦查进程具有重要的导向作用,如果前期的因果关系判断错误,将对后期侦查结果的准确性造成严重性影响或错误性指示。所以,侦查人员对前期侦查结果的容错率(容错率是指在某个体系中能减小一些因素或选择对某个系统产生不稳定的概率。容错率越高,对效果的影响越小;容错率越低,对效果的影响越大。)要求非常低。而在大数据时代,数据增量大、体量大、数据类型多样性以及混杂性,降低了对因果关系精确性的追求,放宽了容错率的标准,具备了从不同的角度去认识案件的基本情况,而非一味地追求案件本身的因果关系,侦查人员可以在相关关系的基础之上进一步认识案件的基本内容,并进一步梳理是否存在因果关系,降低了传统侦查单纯追求因果关系精确性所耗费的侦查成本。
三、解决的路径:大数据技术推动侦查工作转型的新发展
综上所述,大数据侦查推动传统侦查工作的转型升级,是集大数据的“资源、技术、应用”综合效果的运用,不仅仅体现在侦查理念思维的转变,更主要的是丰富了传统侦查的基础理论,扩大了传统侦查手段的应有内涵。
(一)大数据技术推动传统侦查理念的革新
大数据时代,大数据技术对于侦查理念的变革主要体现在三个方面:一是在侦查过程中,拓展了侦查取证的思维限制。大数据时代,更加注重所有相关数据的获取,侦查取证工作可以向获取通话记录、购物信息、上网信息、地理位置、微博微信信息等方面转移,以获取更多的客观性证据证明犯罪行为是否发生,犯罪行为是否为犯罪嫌疑人所实施,进一步判断是否需要追究刑事责任。二是侦查过程中,更加注重数据的类型多样化、庞杂化,改变传统侦查对精确性的要求。三是更加注重关联关系的应用,降低对因果关系的不当追求。这突破了传统侦查工作通过刑讯逼供或以暴力、威胁、引诱、欺骗等非法方法获取口供进行证明的思维,降低了因果关系错误而造成的侦查资源消耗。
(二)大数据技术拓展传统侦查情报工作范式的转型
侦查情报,是侦查机关为打击和预防刑事犯罪,依法获取的与犯罪活动有关的情况和线索的信息及其加工产品。在大数据时代,侦查情报的内涵应作广义的理解,即不再单纯收集有利于打击刑事犯罪的情报(intelligence),而应扩大到具有关联性信息(information)的关联,同时要更加注重数据信息的过滤和清洗。所以大数据对侦查情报工作的影响是拓宽了情报搜集的渠道,即由现实中的物理空间情报搜集扩大到了移动网、互联网物联网中的情报搜集;改变了过去“先收集后利用”的方式,大数据时代侦查情报的使用方式是集侦查工作的开展过程与情报搜集、整理、共享、分析、研判的过程同时进行,以侦查检验情报的价值,以情报的研判促进侦查工作的进程,推动了侦查情报的数量和质量的双重升级,实现了侦查与预防的双重功效。
(三)大数据技术推动传统侦查模式的变革
侦查模式是侦查工作采取的方式、程式和标准。不同的标准划分各有不同。通说认为,传统的侦查模式是“从案到人”或“从人到案”的模式。在信息化侦查时代,侦查模式又出现了“从人到机”“从机到人”“从案到机”的模式。而在大数据时代,侦查人员是以大数据的资源、技术和应用为基础获得案件的线索和信息,并通过数据挖掘的方法,精确刻画犯罪嫌疑人的作案人数、作案特征、个体特征、行为轨迹等内容。因此大数据时代的侦査模式将会实现“从数据到人再到案”“从数据到案再到人”“从人到数据再到人”或“从人到数据再到案”“从案到数据再到人”“从案到数据再到案”等多种侦查模式。
(四)大数据技术推动现有侦查队伍的专业化发展
全球知名咨询管理公司麦肯锡曾预测,数据科学家是当今和未来稀缺的资源。谷歌的首席经济学家哈尔·范里安(Hal Varian)认为:“数据非常之多而且具有战略重要性,但是真正缺少的是从数据中提取价值的能力。这也就是为什么统计学家、数据库管理者和掌握机器理论的人是真正了不起的人。”所以,在未来的侦查工作中,加强大数据技术侦查队伍具有重要的价值。依靠大数据侦查人才将大数据技术应用于侦查工作中能够有效驱动大数据技术侦查队伍的大力发展和侦查队伍的专业化、现代化、职业化建设。
(五)大数据技术推动犯罪的数据预测和侦查防范
侦查工作的根本价值体现为对犯罪的预防。当前,以美国为代表的很多西方国家依靠大数据技术加强了对犯罪的预防。其中,美国大数据犯罪预测系统被美国《时代周刊》评为2012年度的50大发明之一,同时美国的芝加哥警察局与社会组织(如麦克阿瑟基金会)及知名院校(如耶鲁大学、芝加哥大学)等机构的信息技术专家合作,运用大数据、云计算和科学分析模型,绘制暴力犯罪发生人员的“热名单”、事件发生的“热地图”以及警方预防处置的“主战场”,有针对性地采取一定的措施,以至于2013年该地区的枪击案件与谋杀案件分别比上一年度减少了24%和18%,从而有效地推动了“芝加哥减少暴力犯罪战略”的项目进展。加州圣克鲁斯市警方2011年也开始依靠大数据技术预防犯罪的试点,运行一年后破案率提高了一半以上,同时,纽约、洛杉矶、亚特兰大、西雅图等城市警方也已成功运用大数据技术强化对诸如抢劫案件、贩卖毒品案件、枪击案件等暴力犯罪案件的打击和预防工作。在我国,北京警方建立的犯罪数据分析和趋势预测系统,也有力地助推了2014年亚太经合组织的安保工作。广州、苏州、贵州、济南等其他地区也纷纷利用大数据技术加强对犯罪的防范。
四、理性的认识:大数据技术应用于侦查工作的新难题
诚然,将大数据技术引入刑事侦查工作中,具有前所未有的正面效果,但大数据技术本身存在的难题也致使侦查工作出现新的障碍。正视现存问题,理性认识这一新技术,才能有效采取相关措施,最大限度地发挥大数据侦查的应有价值。
(一)大数据增量大、存量广,侦查应用中的数据存储难、适用效率低
当前,我们正处于数据大爆炸的时代,据相关部门预测,到2020年整个世界的数据总量将会增长44倍,达到35.2ZB(ZB=10亿TB)。因此,大数据侦查存在的困难主要表现在:一是由于大数据的增量大、存量广,导致大数据的存储难。对大数据的存储不仅体现在静态的数据管理方面,诸如对数据的采集方法、质量标准、规模的大小、范围的设定等方面进行细化指标,而且更加注重数据的动态调整,即数据的增加与减少,数据的删除与修改,数据的更替与更新等37。二是当前缺乏大数据质量的统一标准,导致数据质量低、结构单一、应用效能低等情况,大量侦查急需的视频、位置等非结构化数据的整合力度不够,单一的数据结构难以适应侦查工作的需要。
(二)大数据类型多、密度低,侦查应用中的数据挖掘浅、分析难度大
当前,大数据技术广泛应用于金融、交通、商业、医疗、健康、社交、政府治理等领域,数据的数量越来越庞大,数据的类型越来越复杂。随着视频监控技术、个人智能化电子产品类型的出现,促成了诸如视频、音频、位置等非结构化数据资源的大量产生,占据了整个大数据资源的85%以上。现在侦查工作中依靠的大数据信息资源不再是过去单一的公安网数据资源、有限的社会数据资源等,随着数据来源和类型的复杂多样,原来基于公安网、互联网存储的传统数据挖掘技术不再适应大数据时代的新要求。同时,大数据时代数据的混杂性、虚假性、错误性不断增强,过去基于数据精确性的犯罪情报分析研判技术不再胜任大数据时代侦查工作的新模式,如何清洗、过滤数据也存在着技术挑战。正如IBM的调研报告《现实世界中的大数据使用》中指出的,在已经开展大数据应用的机构中,查询和报表、数据挖掘、数据可视化、预测建模等是机构容易形成的数据分析能力,而视频分析和语音分析能力则较难形成。总之,在大数据侦查时代,如何将传统的数据挖掘技术向大数据时代改进,如何将单一的数据算法向类型复杂多样的数据集的数据挖掘算法(如异质网络挖掘)改进,成为大数据资源是否能够有效服务于现代侦查工作的重要标志和关键所在。
(三)利益驱动、部门为战,侦查应用中的数据开放障碍多、共享难
大数据的开放及共享,是信息化时代的显著特征也是信息化侦查相对于传统侦查所具有的明显优势、超价值所在。因为强化数据的开放、共享,是数据产生价值的重要基础,是实现数据信息的互联互通互享,提升政府管理水平的重要参考,也是社会治安综合治理的重要依据。在刑事侦查方面,是有助于提高侦查效率,预防犯罪和合理调配使用警力的重要参考。但是,当前侦查工作所需的、海量的、类型多样的数据资源却不是侦查机关可以全部共享使用的,信息资源的拥有者和使用者呈现部门为战、各自为营等局面,这也是制约当前信息化侦查向纵深发展的重要问题。公安网信息资源目前都很难做到全网公用、信息共享,依旧存在着根据部门职能定位各自建库,单独使用、封闭保留等共享难题,更别说掌握大量社会信息资源的政府管理部门。如何实现政府的数据开放、共享,是实现侦查信息的互联互通、全面构筑大数据侦查的重要前提。
(四)立法缺位、机制不全,大数据侦查应用中隐私保障低、安全防护不足
2013年美国“斯诺登事件”爆发后,人们将大数据时代又喻为公民的“裸奔”时代。诸如淘宝、京东、亚马逊等平台监视着我们的购物习惯;网页浏览器监视着我们的网页浏览习惯;语音、视频、通信了解着我们的社交关系,手机定位地图记录着我们的踪迹;微博微信记载着我们的社交关系网,等等。因此,将大数据技术应用于侦查工作、公民隐私权的保护和大数据侦查本身的安全防护至关重要。由于当前立法对公民个人信息权利保障不足,以及公安机关适用大数据信息的规范不健全等突出问题,大数据侦查也面临着诸多问题。主要表现在:一是大数据用户隐私保护力度不够导致隐私泄露的风险。如不加以规范,侦査机关在使用大数据的过程中,存在着可能对预测性用户隐私泄密的风险,即可以通过关联关系分析出用户很多的隐私和秘密。二是大数据质量控制不足导致大数据侦查错误引导风险。大数据时代,大量数据的庞杂、失真、虚假可能引导侦查的错误,从而发生冤假错案的风险。如何通过立法构建和机制完善是当前大数据侦查所面临的重要问题。三是大数据侦查的技术应用平台风险防控问题。由于侦查工作带有高度的秘密性,如对技术应用平台安全防护不足,可能导致技术性的入侵和资料泄露等风险,同时还可能造成系统的瘫痪和无法正常运行。
五、完善的进路:大数据技术推动侦查工作向纵深发展的新思考
(一)树立大数据侦查理念新思维
侦查思维是指侦查主体在侦查活动中基于对已获知的人、事、物、时、空、痕迹等信息进行研判,运用科学的思维,选择有关的侦查途径、措施、手段等决策活动,大数据侦查思维则是侦查主体依靠大数据信息对案件进行深入研判、科学决策的活动。因此,大数据侦查思维应当包含以下侦查思维:
1.树立关联性的侦查思维
关联性思维是大数据时代的重要特征。正如《大数据时代》作者维克托·迈尔-舍恩伯格所揭示的,在“大数据”面前,最重要的不再是精确度和因果关系,而是探索事物之间的相关性,发现其潜在的巨大价值43。关联性思维是相对于小数据时代的因果关系而言的,在大数据时代,通过关联关系分析,能够从各种数据中寻找出一定的相关关系,然后通过这种关系,能够比以前更快捷、更便利地正确分析事物与认识事物。一般而言,关联关系呈现正比例关系,即一个关联数据增加时,另一个数据值很有可能也会随之增加。例如,在购物网站上选取一本美国刑事诉讼法书籍,网页立即会在选取的页面推送美国证据法书籍,以及美国刑事司法审判方面的书籍同时弹跳出其他买家在选取该书时另外浏览的相关书籍,这是关联关系在商业中的应用。在侦查过程中,要寻找一起案件的犯罪嫌疑人,可以分别从购物的数据、通信信息的数据、网页浏览的数据、购买物品的数据、地理位置的数据、自媒体的数据等方面综合刻画犯罪嫌疑人的个体特征,从而分析犯罪嫌疑人与案件的关系及犯罪嫌疑人与被害人之间的因果联系。
2.树立预测性的侦查思维
预测性思维是大数据时代的核心思维。预测未来是大数据时代的重要价值,在大数据全景记录时代,可以通过关联关系的应用,对某一事物进行推算和预测。在侦查活动中,可以对某一特定时空场景已经发生的犯罪行为以及犯罪嫌疑人作案特征进行大数据计算,就可以精确预测某个空间的某个时段是何种犯罪行为高发地,从而能够实现犯罪的有效预防。例如,洛杉矶警局通过与加州大学洛杉矶分校合作,采集分析了80年来1300万起犯罪案件,用于进行犯罪行为的大型研究,通过算法预测成功将相关区域的犯罪率降低了36个百分点。
(二)强化大数据侦查技术新应用
大数据建设的目的在于分析与应用,只有在侦查工作中强化大数据侦查技术的分析与应用,才能够体现大数据侦查的价值,具体表现就是数据的挖掘。而数据的挖掘主要是从大数据的处理和分析应用两个方面予以规范。从广义上说,数据的挖掘是指从大量的、无规律的复杂的、实际获得的数据中发掘隐含其中的有潜在应用价值的信息和知识的过程。在侦查过程中,数据的分析和数据的挖掘都是从提取来的数据中发现寻找对侦查破案有利的信息,然后通过对数据进行详细的研究并应用于侦查破案之中。
1.规范大数据侦查的数据处理流程
一是规范大数据的采集,公安部应当通过顶层设计的方式,规范采集的范围和渠道,畅通互联网、公安网、社会信息资源网、视频监控信息网、公民个人客户端网的数据的收集、查询和处理。二是规范数据的质量管理。在规范源头性数据收集的基础上,通过制定统一、标准性的规范性制度,强化对数据收集的质量和管理,从而有利于后期数据的处理和应用。三是规范数据的导入或预处理。涉及侦查的信息资源很多,但必须将互联网、社会信息资源网、视频监控信息网、公民个人客户网端的数据导入公安网,或举全国之力自上而下重新组建一个新的公安大数据网,但就目前情况而言,技术都是可以解决的,而第一种方式要更加经济便捷,从而规范对数据的清洗和预处理工作。四是规范数据的统计和分析工作。通过构建数据存储协议,利用分布式数据库,将收集在公安网的一个大的集群数据按照公安侦查工作的特点进行分类汇总,以满足侦查工作的分析需求。公安侦查大数据的挖掘围绕打击犯罪和侦查防范两大功能预设主题,通过各种算法,实现对犯罪分子的精确追踪和对热点犯罪的提前预测。
2.强化大数据侦查的具体分析和应用
首先是实现对大数据的可视化分析。即通过大数据可视化的计算框架(Hadoop MapReduce)将海量数据分类整理成能够让侦查人员直观可视的各类图形、图表、动画、地图等形式。其次是加强对大数据的算法挖掘。有了可视化的数据前提侦查人员就可以按照不同的侦查需求,通过集群、分割、孤立点分析等方式深入数据内部,更好地解读诸如人员数据、购物数据、出行数据、金融数据、通信数据、运动数据等内容,挖掘与犯罪关联的数据价值。最后是通过大数据的挖掘,掌握犯罪分子的犯罪事实和线索,然后通过海量数据挖掘的分析结果对某一时空范围内的高发犯罪形势进行预测性的判断,从而更好地服务案件侦查和犯罪预防。
(三)完善大数据侦查运行新机制
大数据侦查是依靠大数据对诸多侦查手段的集合,是侦查方法技术的一种类型,但仍然要纳入刑事诉讼法等相关法律规范之中。因此,在开展大数据侦查的过程中,侦查机关需要建立健全大数据侦查的运行管理机制,确保大数据侦查实施的合法性、诉讼性和正当性。
1.建立大数据侦查启动程序控制机制
立案程序是刑事诉讼的启动程序,也是侦查阶段各项侦查措施依法使用的前提但在当前仍然存在“有案不立”“立案不实”“不破不立”“先破再立”的情况,这是新一轮司法改革的重点,也是在大数据侦查条件下,设计大数据侦查之前的网上立案程序开启端需要解决的问题。即在大数据侦查工作开始之前,必须通过立案程序的开启,才能开展后续的大数据侦查工作,否则,大数据侦查的各项功能将无法启动。这能够避免在未立案的情况下实施大数据侦查措施,回归立案作为刑事诉讼程序启动的本位功能。但就侦查的实践需要而言,确有需要侦查人员在法律授权例外的情形下采取相关行动,为了保证侦查活动能够顺利进行,在大数据侦查启动的网上立案程序中应增加紧急例外模块,以满足侦查人员特定情境下的案件侦查需要。
2.建立大数据侦查工作过程管理机制
大数据侦查的过程管理机制,是大数据侦查实施中最重要的管理方式,也是较为困难的方式。因为侦查的过程中通过大数据分析很容易获取相关人员的隐私信息,对公民个人隐私权造成潜在威胁。而且这种管理基本上属于侦査机关内部层级的管理,缺乏中立的第三方监督。建立大数据侦查的过程管理,不仅要在适用特殊敏感的数据业务上进行控制,同时也要有程序审批事项上的控制。
(四)加强大数据侦查私权保障新防护
加强大数据侦查的隐私权保护和大数据侦查应用的安全防护是大数据侦查具备生命力的关键所在,主要体现在使用过程中的规范和大数据侦查本身的安全保障。
1.加强大数据侦查的隐私权保障
这主要是针对大数据侦查的分析结果而言。大数据侦查的过程是运用大数据分析的过程,这一过程很容易关联获取相关人员的隐私秘密,对公民个人的隐私权造成潜在威胁。2016年11月7日正式通过的《网络安全法》第四章对网络信息安全保障进行了较为详细的规定。对侦查机关来说,在大数据侦查实施过程中,应该完善相关工作机制。一是严格规范个人信息的采集使用制度。即在大数据侦查中,公安机关应建立专门的公民个人数据信息收集使用规范,依法对侦查机关收集、使用公民个人信息等相关问题予以规制。从打击犯罪的角度考量,在立法上赋予侦查机关采集相关信息的权利,而对这些信息在采集和适用中应有严格的授权制度,坚持分级授权、严格审批、严格管理的原则。二是设定严格的主体使用制度和程序控制机制即只有负有相关案件侦查任务的侦查指挥员和办案人员在案件侦查需要之时,通过履行手续、严格审批,获准之后方可通过大数据侦查进行数据查阅、关联和使用。三是完善机制,建立公民隐私权被侵犯的救济制度。通过赋予大数据侦查信息使用人的公民隐私权保护主体责任,坚持以侦查需要、利益平衡、比例适当和最小侵害为原则,严格规范大数据侦查数据的输入、更正、删除、修改与输出等权力;严格设定侵权责任追究及救济渠道。例如,以大数据侦查为理由,实施隐私泄露、信息交易、非法侵入等违法犯罪行为,分别根据情节的严重程度给予内部惩戒、治安违法或刑事犯罪惩处,根据对物质和精神造成损失的不同程度分别给予相应赔偿。
2.加强大数据侦查中的安全防护
加强大数据侦查平台以及其中数据的安全性,应在积极应用大数据侦查优势的基础上明确自身大数据环境所面临的安全威胁,由技术层面到管理层面应用多种策略加强大数据侦查网络的安全防护,提升大数据侦查本身及其系统运行的安全性一是规范大数据侦查的数据来源过滤机制。通过对大数据的采集、传输、存储、管理和使用各个环节进行安全加密、备份机制等方面采取安全措施,提高安全防护能力。二是加强大数据侦查关联使用安全。各个侦查部门的情报信息部门应对大数据侦查系统进行集中管理,保持数据口径一致,通过严格的字段级授权访问控制、数据加密,实现在规定范围内对大数据资源快速、便捷、准确地综合查询与统计分析,防止超过侦查范围进行查询数据、数据研判。三是加强大数据侦查的安全管理措施。可以借鉴当前的信息化侦查管理机制,通过数字证据授权,对不同级别的侦查人员进行严格的访问控制,以有效保证大数据的应用安全,建立使用日志分析、跟踪记录轨迹,时时安全监控与检测,审计报告通报等制度,实现大数据侦查的动态安全监控机制,确保大数据侦查网络和系统的健康运行。
(五)拓展大数据侦查数据开放新渠道
加强政府数据的开放和共享是解决各部门、各地方普遍存在“数据壁垒”和“数据孤岛”现象的重要手段,是实现跨部门业务协同“信息共享”的重要举措。2015年9月,国务院印发《关于促进大数据发展行动纲要的通知》(国发2015]50号)(以下简称《纲要》),系统推动大数据的发展工作。其中,《纲要》部属的三大任务中首要任务就是大力推动政府部门的数据共享,稳步推动公共数据资源的开放,推动公共资源的整合。
在大数据侦查工作中,主要应做到以下几个方面:
1.强力推进公安系统内部的信息资源共享和共用
以公安网为架构,通过配套统一的硬件设备、制定统一的数据管理标准、规范统一的数据接口协议、构建全国统一集中的大数据侦查系统,以改变当前各警种、各部门各自为政、部门为战、信息烟囱、信息分散、互不兼容的局面。通过积极整合公安内部优质资源,利用大数据侦查系统开展犯罪侦查、社会治理服务,从而使全国侦查机关共同利用大数据提升侦查打击和犯罪预防能力,构筑规范、共享、互信的大数据侦查流程。
2.积极拓展与相关执法部门间的数据接入和信息流通
以公安网为基础,尤其是与各级检察院、法院、司法、工商、交通、监察、税务、食品药品监督、产品质量技术监督部门、审计部门、国土部门、文化管理部门、交通运输部门、安全生产管理部门等协同推进信息共享,共享执法大数据,强化重大突发公共事件的执法数据支持,提高公共安全保障的能力。
3.积极推动与社会资源信息的数据开放和共享
以公安网为基础,通过部门协调,逐步与银行、社保、健康、信用、就业统计、能源、农业、邮局、民航、公路、城乡建设、企业登记等重要领域的数据资源共享;积极拓展各部大数据时代的犯罪与侦查门的视频监控资源整合,在法律允许的框架范围内,加强相关领域的数据收集、处理、发掘及关联应用,加强对危害社会治理的突出犯罪形势,对严重侵犯公民生命财产安全的违法犯罪案件进行打击和处理,提升智能化犯罪防控和综合治理。
4.建立健全政府促进大数据开放的管理制度
积极促进政府大数据开放,是实施大数据侦查的重要保障。为此,首先,要制定政府数据开放的规范标准,通过规范的文件对各部门上传的数据的要求、格式、内容等进行统一的规定和说明,从源头保障数据的规范。其次,要建立及时的反馈机制,各侦查部门在其情报信息中心的基础上,健全信息员反馈制度时时向各政府部门反馈数据开放的质量、传输的意见与建议,不断完善数据开放的互动。最后,要加强数据开放的制度保障,政府各部门要按照国务院《纲要》要求,积极强化部门数据开放,健全数据开放的政策法规和配套制度设定主体责任、考核指标,切实有效地推动数据开放的制度基础和责任依据。
(六)推动大数据侦查队伍建设新发展
公安队伍正规化建设是公安部“四项建设”的重要内容,加强大数据侦查队伍的专业化、职业化建设是应有内涵。上海市副市长、公安局长白少康曾经指出:“刑侦队伍必须是一支稳定的队伍,队伍的专业化建设需要依靠职业化保障,没有职业化也就没有真正意义上的专业化。”
1.加强大数据侦查队伍的专业化建设
首先要强化大数据、“互联网+”、云计算技术等基础知识的学习和业务培训熟悉与大数据相关的数据的抽取、清洗、算法、建模、挖掘、关联、整合、分析应用等技能和知识,同时继续强化侦查思维、侦查能力、侦查技术等方面的专业培训,使大数据侦查人员既是传统侦查的大数据技术拥有者,又是大数据技术人才的优秀侦查员,改变信息化侦查时代两者难以有效结合的局面,通过技能培训和再教育,实现数据、侦查、预警的全面结合。
2.强化大数据侦查队伍的职业化发展
大数据技术人才是社会封层中的高精尖人才,是推动我国走向网络强国的排头兵。以当前公安体制改革为背景,强力推进基层侦查技术人员分类改革,通过侦查部门的考核评价与岗位履职表现,发现充分挖掘大数据侦查人才,通过专业技术引进、进行量身定做,为大数据侦查员的个人职业发展规划长远目标,推动基层大数据侦查员的职业化发展,防止人才流失。各级侦查机关政工部门应根据大数据侦查员的个人职业化发展计划进行整体规划、分类管理、定期考察跟踪帮扶、激励引导、适时修正,不断鼓励和推进大数据侦查员的职业化发展目标同时,大力加强大数据侦查这一高精尖侦查队伍的职业权利、职业待遇等保障机制,充分实现科技强警、数据强侦、智慧侦查这一重要目标。
六、结语:大数据技术应用于侦查工作的新语境
“一项新生事物的蓬勃发展,需要春雨如油般的滋长环境;一项制度改革的落地生根,需要不断创新工作模式与机制。”当前,正值全面推进“以审判为中心”的诉讼制度改革之际,这项具有“四梁八柱”性质的司法改革项目之一,就是要通过严格贯彻直接言词原则、严格贯彻证据裁判原则、严格非法证据排除规则,构建“以审判为中心”,来改变刑事诉讼长期异化为“以侦查为中心”的局面;就是要通过保障人权,促使程序公正,进而实现实体公正。长期以来,我国的传统侦查工作囿于过分依赖口供证据价值的思维,将其神话为开启侦查进程的“金钥匙”,导致了大量刑讯逼供等违法侦查行为的产生。而在大数据时代,创新大数据侦查新模式,可以依靠海量数据进行关联性侦査、模糊性碰撞、依靠全景式侦查、透明化侦查,不仅能够降低前期侦查工作对因果关系的过分追求,还能通过大数据分析促进客观证据生成、有效推动侦查模式转变,从而大大提升侦查犯罪的效能和预防犯罪、人权保障水平。理性认识当前大数据侦查的问题,通过机制、体制的改革和完善,从而促使这项新的侦查技术不断向更先进、更完善的侦查模式转型发展。