1. 课题研究任务概述
“跨部门金融案件数据共享与知识服务关键技术研究”课题为了解决金融案件数据共享能力不足、精准智能知识服务欠缺的问题,研究金融类案件基础数据收集与预处理技术,进行有效的数据清洗、整合和归纳,为建立专家知识概念模式提供数据基础;研究金融类案件专家知识概念模式构建方法,定义相关概念层、属性、语义约束规则等,实现金融法律专业知识要素化、金融类案件知识要素规范化、项目关键案由与罪名知识要素体系;研究金融类案件知识抽取和图谱建模技术,融合专家知识图谱与金融法律大模型,研制金融类案件涉案实体和关联关系挖掘算法,研究基于人在回路的案件知识抽取和增量式知识库自动构建方法,构建法检司金融类案件共享知识库;基于金融法律领域大语言模型,支持语义理解和认知推理,并结合近似子图匹配方法,构建面向金融类案件的跨部门知识服务系统,实现基于知识库问答的金融法律专业辅助和基于个案信息抽取的办案辅助,实现金融类案件法律知识精准推送。
课题一跨部门金融案件数据共享与知识服务关键技术研究分为4个子任务。子任务1.1金融类案件基础数据收集与预处理技术研究,研究金融类案件基础数据收集与预处理技术,为建立专家知识概念模式和金融类案件共享知识库奠定数据基础。子任务1.2 金融类案件专家知识概念模式构建方法研究,研究金融类案件专家知识概念模式构建方法,实现金融法律专业知识要素化、金融类案件知识要素规范化、项目关键案由与罪名知识要素体系化。子任务1.3法检司金融类案件共享知识库构建,通过神经与规则结合的增量式法检司金融类案件知识库自动化构建技术形成具备增量式知识库自动构建功能的法检司金融类案件共享知识库。子任务1.4面向金融类案件的跨部门知识服务系统构建,研究构建基于知识库问答的金融法律专业辅助和基于个案信息抽取的办案辅助,实现金融类案件法律知识精准推送。
2. 具体研究任务完成情况
针对子任务1.1金融类案件基础数据收集与预处理技术研究,建立了涵盖广泛的金融类法律法规与案件基础数据集,覆盖裁判文书、金融法规、司法解释、行政处罚等。数据集实现了结构化分类,特别关注金融与法律交叉领域,汇集了工作报告、内部知识等内容。通过与上海法院的合作,建立了数据访问协同机制,确保课题组获取高质量、不宜公开的裁判文书用于研究。
针对子任务1.2金融类案件专家知识概念模式构建研究,构建了金融类案件专家知识概念模式,并编制了金融法律知识汇编与标签集。通过本体化设定和逻辑表示,结合司法办案流程,建立了系统化的案由与罪名框架,覆盖14项罪名案由、24种实体、23种关系、300余条知识汇编,基本形成《金融法律知识图谱精析》初稿,为共享知识库扩展和跨部门知识服务系统奠定理论基础。
针对子任务1.3法检司金融类案件共享知识库构建研究,在金融类案件专家知识概念模式的基础上,已完成构建法检司金融类案件共享知识库初版1个,包含25类实体共计59万个;15类关系共计135万个。涵盖了非法吸收公众存款罪、集资诈骗罪、金融借款合同纠纷等共计14个案由或罪名的金融类案件2.6万篇,及相关法律法规6千余篇。为子任务1.4提供了数据支撑。
针对子任务1.4面向金融类案件的跨部门知识服务系统研制,当前已在服务器上部署基于微调大模型知识服务系统原型,基于子任务1.1、1.2、1.3任务成果,通过neo4j图数据库建立法检司金融类案件共享知识库初版,实现了检索增强生成(RAG)联调,并跟进最新RAG进展结合知识图谱(KG)研究基于知识图谱的检索增强生成(GraphRAG)实现,初步具备案件分类、信息抽取、追问机制、判决生成等功能。
知识产权方面,申请2项发明专利、1项软件著作权,分别为《一种生成式多跳法律链式规则挖掘与评估方法》、《基于大语言模型与知识图谱的金融类案件实体和关系挖掘方法》和《海盾金融案件知识服务功能测试原型系统》。3项知识产权均已取得专利受理申请通知书或软件著作权登记证书。