大数据司法就是大数据+司法?

【法宝引证码】CLI.A.0102860
【学科类别】司法
【出处】原文载于2017年《人民检察》第23期
【写作时间】2017年
【中文摘要】什么是大数据司法?仅仅是“大数据+司法”吗?我认为不能够这样简单地进行理解。对大数据司法的理解应结合“智慧法院”“智慧检务”等相关概念,应当特别强调通过数据的运用产生智慧。总的来说,理解大数据司法的一个核心要点为法官和检察官的决定权中含有相当多的科技支撑的成分。
【中文关键字】大数据司法;科技支撑
【全文】

 

  类案、关联案件(法条)推送

  类案推送是探索引入人工智能深度学习技术,在完成案件要素信息抽取研究的前提下,实现依据案由、犯罪手段、量刑情节、刑罚、法院、地区、相关法条等多种关联因素综合检索同类案件的方法。在2017年3月山东“辱母杀人案”持续发酵后,我们试着进行了类案搜索。具体做法是,对中国裁判文书网上100多万起故意伤害案,选择反映案件独特信息的关键词如“高利贷”“辱母”“警察在场”等,进行技术搜索。结果发现已有很多类似案件。研读这些案件可将审判结果归为两类:一类是轻判的,比如河北省保定市的一起同类案件被认定为正当防卫,判处七年有期徒刑;一类是重判的,比如安徽省黄山市的一起同类案件,没有被认定为正当防卫,适用死缓。两种判决差异的关键在于是否认定为正当防卫。在此基础上,可以继续使用类案搜索技术进一步搜索“正当防卫”案件……在类案推送基础上还可以实现相关法条的精准推送。通过对海量类似案例的文本分析,可以对某一类案件法律适用情况进行大数据分析,统计出哪些法条适用最多,并给办案人员实时推送关联法条。可见,大数据类案推送应用可以快速找到同类案件,进而起到促进“同案同判”的作用,增强司法裁判的说服力。

  大数据定罪

  大数据辅助定罪量刑是借助文本相似度分析等技术,挖掘隐藏在以往司法文书中的法官、检察官定罪量刑集体经验,计算出各定罪量刑情节对刑罚的影响程度,赋予各情节不同的影响系数,从而使定罪量刑方法更具个性化、精准化与合理化。关于大数据的定罪应用,我们对盗窃罪与诈骗罪进行了实验。选择“盗窃罪”和“诈骗罪”这两个罪名,各找两万起案件来进行机器学习,截取从关键词“经审理查明”到关键词“本院认为”之间的文本交给机器,通过分词的技术进行机器学习。为了检验机器定罪的准确率,我们又用1000起案件进行测试。结果表明,机器对测试案件作出是否有罪判断的结果与人工判断的结果基本是一样的,准确率分别高达98.4%和97.6%。一般认为,机器作出的判断只要与法官作出的结论相比达到90%以上相同,就可以用于辅助定罪。另外,还可以采取“实践”检验方法,即将大数据定罪系统放在某一检察院试点运行一段时间,将其辅助办案结果与法院实际判决结果进行对比,也可检验其定罪的准确性。

  大数据量刑

  大数据量刑的关键点在于能否得出精准的量刑建议?以当前智慧公诉系统较为成熟的“交通肇事罪”大数据量刑为例,选取“是否造成人员死亡”“财产损失数额”“是否醉驾(醉驾酒精含量多少)”等要素,由司法人员制定量刑计算公式,并交由机器进行学习。在这一过程中,大数据系统相当于计算器,自动计算出量刑结果,比人为主观量刑更为客观化、准确化,从而实现“精准量刑”。大数据量刑结果具有较好的裁判力与说服力。特别是在认罪认罚从宽程序中,大数据量刑可以使被告人看到其实施的不同行为所可能带来的具体不同后果,更容易为当事人所接受,从而带来更好的认罪认罚从宽制度实施效果。不同于人为制定量刑公式,大数据量刑还有另外一种实现路径,即交由机器自动算出量刑公式。我们曾对破坏公用电信设施罪进行过大数据量刑研究。通过对1767份破坏公用电信设施罪判决书进行初步处理,抽取出其中触犯相关罪名并判处刑罚的判决书372份,并提取“造成财产损失数额”“造成通信中断用户数”“造成网间通信中断时间”这三个均体现社会危害性的特征,计算这些特征与判处刑期之间的关系后得出较为复杂的量刑公式。经验证,该机器量刑结果与实际判决结果基本一致。因此,我们可以利用这一方法提供辅助量刑建议,在此基础上还可以实现量刑偏离度分析。

  案件偏离度分析

  案件偏离度分析主要功能是对办案质量、案件处理结果进行监管,其原理是将个案的定罪量刑结果与同类案件定罪量刑平均值进行偏差比对。例如,我们设置某类案件偏离度标准(假定为30%),在此范围内的个案偏离都是可以接受的,而一旦某个案件的偏离度超过30%,那么系统就会提示办案人员对案件处理结果进行合理的解释。在设计大数据案件偏离度系统时,要注意“阈值”设置的个性化,不同罪名的阈值不同,重罪与轻罪的阈值不同。另外,还需要设置其他标准的偏离度,如罪名偏离度标准与量刑偏离度标准等。在案件偏离度分析基础上,还可以实现对法官、检察官甚至办案部门的办案质量考核。如我们运用北京市检立方系统,对海淀区所有批捕人员进行了办案质量检测,发现办案人员办理案件的平均不捕率普遍在20%以下;但系统发现某一办案人员的不捕率竟高达90%,且其办案量基数很大,该现象立即引起重视。其背后的原理在于大数据挖掘出了司法人员办案的普遍规律,再以此规律为标准,测试实践中司法人员办案是否在规律范围内。

  数据化的证据标准

  现行法律对证明标准的规定是“案件事实清楚,证据确实、充分”,但这是整体性的、针对全案的证明标准,司法实践中对证明标准的理解不一致产生很多问题。如何通过大数据对证明标准进行细化呢?对此,我国司法大数据的先行地区如贵州省、上海市进行了宝贵的探索。以贵州省做法为例,其针对故意伤害罪等罪名,按照犯罪构成要件,梳理为十个证明要件,再进一步分析每个证明要件中通常需要哪些证据类型。通过层层递进的方法完成犯罪构成知识图谱,将案件实体要素与证据标准一一对应,从而形成统一的证据标准。

  尽管上述系统在证据审查方面取得了一些初步突破,但也遇到了较大的阻碍,仍有很长的路要走。首先,上述系统主要停留在“证据规格”层面而非“证明”层面,实现了统一的数据化的证据标准,还不是统一的数据化的证明标准。其次,系统功能主要集中于证据的数量及合法性审查方面,对于机器如何审查判断证据关联性、真实性等问题尚未解决。再次,系统在证据合法性自动审查方面取得的进步是形式审查,在实质审查方面还存在一些障碍。对于大数据证据审查的难题,我们或许可以转换思路、另辟蹊径,重点突破“反向审查”而非正向审查,即让机器识别什么情况下案件中的证据还不足以支持作出肯定性裁判。具体可以从最高法不予核准死刑或者高级法院未判决死刑立即执行的案件切入,让机器对这些案件的证据进行学习,得出一个反向的证据公式,即不会被判处死刑的公式,以此来辅助司法人员在办案中审查证据,对可能存在的证据问题作出提示、进行预警,这对于防范冤假错案具有良好效果。

  自动生成文书

  目前,在许多地区自动生成法律文书技术已经较为成熟,可以通过机器自动生成审查报告、起诉书、判决书、送达通知等。就司法文书而言,大部分文书具有既定的框架和标准,实质上相当于一个“表格”。通过对海量文书分析,能够自动生成各类文书模板。在此基础上,通过将内容部分抽出,再填入到相应位置上,即能以“表格”形式生成法律文书。针对机器无法自动填入的部分,可以结合智能语音输入功能由人工来完成,未来还可以考虑通过机器学习进行填写。如此可以大大提高司法效率,解决司法人员人手不足的问题。

  法律咨询

  法律咨询也是目前大数据司法的有益探索方向。其是指通过机器学习自动实现法律问答、法律咨询,如学习控告申诉检察部门通过电话、网络接待群众的访问。在银行、电子商务等领域已经能够实现机器问答,如通过电话进行自动答疑,待机器无法回答时再自动切换到人工服务。同时机器还可采用人的发音,为咨询者提供更为真切的服务。法律自动问答可以基于大数据统计等技术,如通过搜索互联网上相关法律问题出现次数最多的回答,自动推送给询问者;或是收集全国司法人员的电话回应资料,再进行归纳、推送。

 

【作者简介】
刘品新,最高人民检察院检察技术信息研究中心副主任。


本网站文章仅代表作者个人观点,不代表本网站的观点与看法。
本文转自北大法律信息网,版权属原作者所有。如有问题,敬请及时联系我们。

    运营单位:北大法宝学堂 客服电话:010-82668266-808 客服手机:15801349397(微信同号)

    版权所有 :北京北大英华科技有限公司

    免责声明:本网课程中老师的观点,仅代表其个人观点。