技术难题的应用领域:
2013年裁判文书首次在中国裁判文书网集中分布,从此开始,法律相关的从业人员,案件当事人等可以通过网络快速获取到自己所需要的案件信息,用于了解,参考,统计。2016年《最高人民法院关于人民法院在互联网公布裁判文书的规定》正式开始实行,宣告法律相关行业开始全面拥抱互联网。但由裁判文书网所公开的信息为基础信息,很多时候无法满足专业人士的搜索需求,所以团队开发了一种文书智能处理的流程。满足案件相关人员查询相似案例,法条;满足法律专业的人士检索参考案例生成检索报告;满足学习法律的学生和老师检索相关领域案例学习批注和数据分析使用;满足内部工作人员查询案例,法条。随着业务线的扩展,接下来我们希望对已有的处理进行优化,并且增加检察文书及法律法规的处理。
技术需突破难点:
因行业领域特殊,且需要对于识别后的文档准确度有一定要求,所以现在需要法律,数据流转智能处理,搜索引擎相关领域的专家支持。
需请专家支持或解决的问题:
1、对于系统软件的指导优化。2、对于系统硬件环境的优化。3、对于已存在软件问题给予一些更正。
需要解决关键技术难题:
1、文书智能处理后结果准确率需提高,目前软件能达到的准确率能达到约90%左右,这个指标是团队的相关法律人员制定的,主要为文本分类及关键短语抽取指标。2、文本处理效率需要提升,目前的处理速度为每分钟10000篇左右,但由于基数庞大,且关键短语动态变化,所以需要更高的效率。3、搜索引擎优化,对于大多数搜索条件,我们的系统都能满足,但响应时间并不理想(平均响应时间在6秒),而少数特殊的搜索条件需要达到20秒以上,甚至响应超时,影响了客户的使用。
技术参数与相关指标描述:
1、网站日PV量10万,访客数3000。 2、网站平均响应时间:2秒。 3、搜索引擎平均响应时间:6秒。 4、网站页面请求用户并发数:100。 5、搜索请求并发数:10。 6、搜索查询结果准确度96%。