17767 lines
1.9 MiB
17767 lines
1.9 MiB
2025-06-11 02:17:35,441 - INFO -
|
||
测试 2:列出所有 db_types 和文档映射
|
||
2025-06-11 02:17:35,443 - DEBUG - 创建 Milvus 目录: /d/wangmeihua/rag/conf/Milvus
|
||
2025-06-11 02:17:37,323 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 02:17:37,325 - DEBUG - 可用 db_types 和数据: {}
|
||
2025-06-11 02:17:37,325 - INFO - 可用 db_types 和文档: {}
|
||
2025-06-11 02:17:37,325 - INFO -
|
||
测试 3:查看 userid testuser2 的所有集合
|
||
2025-06-11 02:17:37,325 - DEBUG - 正在查看 userid testuser2 的集合
|
||
2025-06-11 02:17:37,326 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 02:17:37,327 - DEBUG - 未找到任何集合
|
||
2025-06-11 02:17:37,327 - INFO -
|
||
测试 5:获取 userid testuser2 在textdb数据库的文档映射
|
||
2025-06-11 02:17:37,327 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 02:17:37,330 - WARNING - 集合 ragdb_textdb 不存在
|
||
2025-06-11 02:17:37,330 - INFO - 文档映射: {}
|
||
2025-06-11 02:21:27,494 - ERROR - 加载 mREBEL 模型失败: Repo id must be in the form 'repo_name' or 'namespace/repo_name': '/share/models/Babelscape/mrebel-large'. Use `repo_type` argument if needed.
|
||
2025-06-11 02:21:27,494 - ERROR - 加载 mREBEL 模型失败: Repo id must be in the form 'repo_name' or 'namespace/repo_name': '/share/models/Babelscape/mrebel-large'. Use `repo_type` argument if needed.
|
||
2025-06-11 10:39:58,597 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 10:39:59,559 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 10:40:00,530 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 10:40:00,531 - WARNING - 集合 ragdb_textdb 不存在
|
||
2025-06-11 10:40:00,729 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 10:40:35,631 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:40:35,631 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:40:35,639 - INFO - 生成 document_id: 29c93db6-c633-42cc-a9b0-1fa83a49d8bc for file: /share/wangmeihua/rag/data/test.txt
|
||
2025-06-11 10:40:35,639 - INFO - 开始处理文件 /share/wangmeihua/rag/data/test.txt,userid: testuser1,db_type: textdb
|
||
2025-06-11 10:40:35,639 - DEBUG - 检查文件: /share/wangmeihua/rag/data/test.txt, 大小: 2355 字节
|
||
2025-06-11 10:40:35,639 - DEBUG - 文件扩展名: txt
|
||
2025-06-11 10:40:35,639 - DEBUG - 开始加载文件
|
||
2025-06-11 10:40:35,640 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-11 10:40:35,641 - DEBUG - 分割完成,生成 1 个文档块
|
||
2025-06-11 10:40:35,641 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': '29c93db6-c633-42cc-a9b0-1fa83a49d8bc', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.txt'}
|
||
2025-06-11 10:40:35,641 - DEBUG - 文件 /share/wangmeihua/rag/data/test.txt 加载并分割为 1 个文档块,document_id: 29c93db6-c633-42cc-a9b0-1fa83a49d8bc
|
||
2025-06-11 10:40:35,641 - DEBUG - 处理文件 /share/wangmeihua/rag/data/test.txt,生成 1 个文档块
|
||
2025-06-11 10:40:35,641 - DEBUG - 第一个文档块: 开元云(北京)科技有限公司,是一家注册于2020年的高科技企业,在上海、南京、深圳、济南等地设有分支机构,创始团队核心成员来自一流的云计算公司及电信运营商,拥有云计算、超算、智算和网络运营专业经验,在企业市场均拥有超过十年以上行业经验,服务客户超过2万家。公司以自主研发的业务操作支撑系统(KBoss)为底座,打造开放算力应用服务平台(open-computing),将云计算、算力资源和算力应用进行
|
||
2025-06-11 10:40:36,363 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 10:40:41,476 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-11 10:40:41,476 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-11 10:40:45,157 - DEBUG - 成功创建并加载集合: ragdb_textdb
|
||
2025-06-11 10:40:45,167 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-11 10:40:45,167 - DEBUG - 正在为 userid testuser1 插入 1 个文档到 ragdb_textdb
|
||
2025-06-11 10:40:45,167 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '29c93db6-c633-42cc-a9b0-1fa83a49d8bc', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.txt'}
|
||
2025-06-11 10:40:45,327 - DEBUG - 成功插入 1 个文档
|
||
2025-06-11 10:40:45,334 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 10:40:45,334 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 10:40:48,339 - INFO - 开始抽取文档 29c93db6-c633-42cc-a9b0-1fa83a49d8bc 的三元组,userid: testuser1
|
||
2025-06-11 10:40:48,340 - DEBUG - 分割为 7 个文本块
|
||
2025-06-11 10:40:48,340 - DEBUG - 处理块 1/7: 开元云(北京)科技有限公司,是一家注册于2020年的高科技企业,在上海、南京、深圳、济南等地设有分支...
|
||
2025-06-11 10:40:48,932 - DEBUG - 块 1 生成文本: <triplet> 云计算 <concept> 开元云 <org> manufacturer</s>
|
||
2025-06-11 10:40:48,932 - DEBUG - 原始生成文本: <triplet> 云计算 <concept> 开元云 <org> manufacturer</s>
|
||
2025-06-11 10:40:48,932 - DEBUG - 处理后标记: ['<triplet>', '云计算', '<concept>', '开元云', '<org>', 'manufacturer']
|
||
2025-06-11 10:40:48,932 - DEBUG - 添加三元组: 云计算(concept) - manufacturer - 开元云(org)
|
||
2025-06-11 10:40:48,932 - DEBUG - 块 1 提取到 1 个三元组
|
||
2025-06-11 10:40:48,932 - DEBUG - 处理块 2/7: 公司以自主研发的业务操作支撑系统(KBoss)为底座,打造开放算力应用服务平台(open-compu...
|
||
2025-06-11 10:40:49,353 - DEBUG - 块 2 生成文本: <triplet> <unk> 云计算 <concept> facet of</s>
|
||
2025-06-11 10:40:49,353 - DEBUG - 原始生成文本: <triplet> <unk> 云计算 <concept> facet of</s>
|
||
2025-06-11 10:40:49,353 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '云计算', '<concept>', 'facet of']
|
||
2025-06-11 10:40:49,353 - DEBUG - 处理块 3/7: 在2021年,我们荣幸地成为阿里云计算的合作伙伴,致力于提供算力应用、算力网络、算网一体的产品和服务...
|
||
2025-06-11 10:40:49,656 - DEBUG - 块 3 生成文本: <triplet> 阿里云计算 <media> 国家超级计算 <org> owned by</s>
|
||
2025-06-11 10:40:49,656 - DEBUG - 原始生成文本: <triplet> 阿里云计算 <media> 国家超级计算 <org> owned by</s>
|
||
2025-06-11 10:40:49,656 - DEBUG - 处理后标记: ['<triplet>', '阿里云计算', '<media>', '国家超级计算', '<org>', 'owned by']
|
||
2025-06-11 10:40:49,656 - DEBUG - 添加三元组: 阿里云计算(media) - owned by - 国家超级计算(org)
|
||
2025-06-11 10:40:49,656 - DEBUG - 块 3 提取到 1 个三元组
|
||
2025-06-11 10:40:49,656 - DEBUG - 处理块 4/7: 在2023年,我们的平台进一步发展,成功引入火山引擎、百度智能云。目前,我们已成为阿里云、江苏未来网...
|
||
2025-06-11 10:40:49,946 - DEBUG - 块 4 生成文本: <triplet> 火山引擎 <concept> 阿里云 <media> part of</s>
|
||
2025-06-11 10:40:49,946 - DEBUG - 原始生成文本: <triplet> 火山引擎 <concept> 阿里云 <media> part of</s>
|
||
2025-06-11 10:40:49,946 - DEBUG - 处理后标记: ['<triplet>', '火山引擎', '<concept>', '阿里云', '<media>', 'part of']
|
||
2025-06-11 10:40:49,946 - DEBUG - 添加三元组: 火山引擎(concept) - part of - 阿里云(media)
|
||
2025-06-11 10:40:49,946 - DEBUG - 块 4 提取到 1 个三元组
|
||
2025-06-11 10:40:49,946 - DEBUG - 处理块 5/7: 公司提供新一代算力云应用服务模式,通过自主研发的开元算力云应用服务平台,整合算力资源和算法应用,利用...
|
||
2025-06-11 10:40:50,180 - DEBUG - 块 5 生成文本: <triplet> <unk> 算法 <concept> subclass of</s>
|
||
2025-06-11 10:40:50,180 - DEBUG - 原始生成文本: <triplet> <unk> 算法 <concept> subclass of</s>
|
||
2025-06-11 10:40:50,180 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '算法', '<concept>', 'subclass of']
|
||
2025-06-11 10:40:50,180 - DEBUG - 处理块 6/7: 旨在为政府和企业提供"技术+资源+场景+运营”的产业互联网算力云应用服务平台,实现以算力云服务推动数...
|
||
2025-06-11 10:40:50,361 - DEBUG - 块 6 生成文本: <triplet> 算力云 <concept> 应用服务平台 <media> instance of</s>
|
||
2025-06-11 10:40:50,361 - DEBUG - 原始生成文本: <triplet> 算力云 <concept> 应用服务平台 <media> instance of</s>
|
||
2025-06-11 10:40:50,361 - DEBUG - 处理后标记: ['<triplet>', '算力云', '<concept>', '应用服务平台', '<media>', 'instance of']
|
||
2025-06-11 10:40:50,361 - DEBUG - 添加三元组: 算力云(concept) - instance of - 应用服务平台(media)
|
||
2025-06-11 10:40:50,361 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-11 10:40:50,361 - DEBUG - 处理块 7/7: 开元云科技自成立以来得到了包括工信部、教育部、全国高校学会、国家超算中心以及南京未来网络研究院等政府...
|
||
2025-06-11 10:40:50,845 - DEBUG - 块 7 生成文本: <triplet> 南京未来网络研究院 <concept> 国家超算中心 <loc> 教育部 <org> 全国高校学会 <media></s>
|
||
2025-06-11 10:40:50,845 - DEBUG - 原始生成文本: <triplet> 南京未来网络研究院 <concept> 国家超算中心 <loc> 教育部 <org> 全国高校学会 <media></s>
|
||
2025-06-11 10:40:50,845 - DEBUG - 处理后标记: ['<triplet>', '南京未来网络研究院', '<concept>', '国家超算中心', '<loc>', '教育部', '<org>', '全国高校学会', '<media>']
|
||
2025-06-11 10:40:50,845 - DEBUG - 添加三元组: 南京未来网络研究院(concept) - 教育部 - 国家超算中心(loc)
|
||
2025-06-11 10:40:50,845 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-11 10:40:50,851 - INFO - 文档 29c93db6-c633-42cc-a9b0-1fa83a49d8bc 的 5 个三元组已保存到: /share/wangmeihua/rag/triples/29c93db6-c633-42cc-a9b0-1fa83a49d8bc_testuser1.txt
|
||
2025-06-11 10:40:50,851 - INFO - 文档 29c93db6-c633-42cc-a9b0-1fa83a49d8bc 三元组抽取完成,耗时: 2.51 秒
|
||
2025-06-11 10:40:50,851 - INFO - 文件 /share/wangmeihua/rag/data/test.txt 成功嵌入到数据库 ragdb_textdb
|
||
2025-06-11 10:44:16,784 - INFO -
|
||
测试 2:列出所有 db_types 和文档映射
|
||
2025-06-11 10:44:17,589 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 10:44:17,590 - DEBUG - 处理集合: ragdb_textdb (db_type: textdb)
|
||
2025-06-11 10:44:17,664 - DEBUG - 集合 ragdb_textdb 中找到用户和文档映射: {'testuser1': ['29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}
|
||
2025-06-11 10:44:17,664 - DEBUG - 可用 db_types 和数据: {'textdb': {'userids': {'testuser1': ['29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-11 10:44:17,664 - INFO - 可用 db_types 和文档: {'textdb': {'userids': {'testuser1': ['29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-11 10:44:17,664 - INFO -
|
||
测试 3:查看 userid testuser2 的所有集合
|
||
2025-06-11 10:44:17,664 - DEBUG - 正在查看 userid testuser2 的集合
|
||
2025-06-11 10:44:17,665 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 10:44:17,672 - DEBUG - 集合 ragdb_textdb 中 userid testuser2 的文档数: 0
|
||
2025-06-11 10:44:17,672 - DEBUG - 集合 ragdb_textdb 中 userid testuser2 无文档
|
||
2025-06-11 10:44:17,672 - INFO -
|
||
测试 5:获取 userid testuser2 在textdb数据库的文档映射
|
||
2025-06-11 10:44:17,672 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 10:44:17,677 - DEBUG - 找到 0 个文档的映射
|
||
2025-06-11 10:44:17,677 - INFO - 文档映射: {}
|
||
2025-06-11 10:44:51,100 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:44:51,100 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:44:51,108 - ERROR - 嵌入文件 /share/wangmeihua/rag/data/zongshu.txt 失败: 文件 /share/wangmeihua/rag/data/zongshu.txt 不存在
|
||
2025-06-11 10:46:36,680 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:46:36,680 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:46:36,688 - ERROR - 嵌入文件 /data/zongshu.txt 失败: 文件 /data/zongshu.txt 不存在
|
||
2025-06-11 10:47:01,293 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:47:01,293 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:47:01,301 - ERROR - 嵌入文件 data/zongshu.txt 失败: 文件 data/zongshu.txt 不存在
|
||
2025-06-11 10:53:35,765 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:53:35,765 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:53:35,773 - ERROR - 嵌入文件 /d/wangmeihua/rag/data/zongshu.txt 失败: 文件 /d/wangmeihua/rag/data/zongshu.txt 不存在
|
||
2025-06-11 10:54:55,446 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:54:55,446 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:54:55,454 - ERROR - 嵌入文件 /d/wangmeihua/rag/data/zongshu.txt 失败: 文件 /d/wangmeihua/rag/data/zongshu.txt 不存在
|
||
2025-06-11 10:55:31,288 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:55:31,288 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:55:31,296 - ERROR - 嵌入文件 /share/wangmeihua/rag/data/zongshu.txt 失败: 文件 /share/wangmeihua/rag/data/zongshu.txt 不存在
|
||
2025-06-11 10:58:29,639 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:58:29,639 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 10:58:29,647 - INFO - 生成 document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5 for file: /share/wangmeihua/rag/data/qianru.pdf
|
||
2025-06-11 10:58:29,647 - INFO - 开始处理文件 /share/wangmeihua/rag/data/qianru.pdf,userid: testuser1,db_type: textdb
|
||
2025-06-11 10:58:29,647 - DEBUG - 检查文件: /share/wangmeihua/rag/data/qianru.pdf, 大小: 3042456 字节
|
||
2025-06-11 10:58:29,647 - DEBUG - 文件扩展名: pdf
|
||
2025-06-11 10:58:29,647 - DEBUG - 开始加载文件
|
||
2025-06-11 10:58:34,013 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-11 10:58:34,017 - DEBUG - 分割完成,生成 51 个文档块
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 1: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 2: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 3: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 4: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 4, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 5: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 5, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 6: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 6, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 7: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 7, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 8: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 8, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 9: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 9, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 10: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 10, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 11: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 11, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 12: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 12, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 13: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 13, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 14: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 14, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 15: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 15, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 16: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 16, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 17: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 17, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 18: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 18, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 19: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 19, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 20: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 20, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 21: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 21, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,018 - DEBUG - 生成文档块 22: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 22, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 23: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 23, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 24: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 24, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 25: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 25, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 26: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 26, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 27: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 27, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 28: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 28, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 29: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 29, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 30: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 30, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 31: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 31, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 32: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 32, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 33: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 33, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 34: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 34, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 35: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 35, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 36: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 36, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 37: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 37, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 38: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 38, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 39: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 39, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 40: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 40, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 41: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 41, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 42: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 42, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 43: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 43, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 44: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 44, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 45: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 45, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 46: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 46, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 47: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 47, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,019 - DEBUG - 生成文档块 48: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 48, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,020 - DEBUG - 生成文档块 49: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 49, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,020 - DEBUG - 生成文档块 50: metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 50, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:34,020 - DEBUG - 文件 /share/wangmeihua/rag/data/qianru.pdf 加载并分割为 51 个文档块,document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5
|
||
2025-06-11 10:58:34,020 - DEBUG - 处理文件 /share/wangmeihua/rag/data/qianru.pdf,生成 51 个文档块
|
||
2025-06-11 10:58:34,020 - DEBUG - 第一个文档块: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建
|
||
2025-06-11 10:58:34,817 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 10:58:40,351 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-11 10:58:40,351 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-11 10:58:40,355 - DEBUG - 检查集合 ragdb_textdb 的 schema: 字段匹配=True, vector_field存在=True, dtype=101, dim=1024
|
||
2025-06-11 10:58:40,465 - DEBUG - 集合 ragdb_textdb 已存在并加载成功
|
||
2025-06-11 10:58:40,475 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-11 10:58:40,475 - DEBUG - 正在为 userid testuser1 插入 51 个文档到 ragdb_textdb
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 4, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 5, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 6, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,475 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 7, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 8, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 9, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 10, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 11, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 12, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 13, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 14, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 15, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 16, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 17, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 18, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,476 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 19, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 20, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 21, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 22, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 23, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 24, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 25, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 26, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 27, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 28, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 29, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 30, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,477 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 31, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 32, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 33, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 34, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 35, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 36, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 37, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 38, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 39, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 40, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 41, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 42, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 43, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,478 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 44, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,479 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 45, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,479 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 46, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,479 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 47, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,479 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 48, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,479 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 49, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:40,479 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf', 'chunk_index': 50, 'source': '/share/wangmeihua/rag/data/qianru.pdf'}
|
||
2025-06-11 10:58:42,099 - DEBUG - 成功插入 51 个文档
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104512, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104513, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104514, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104515, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104516, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104517, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104518, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,107 - DEBUG - 插入后查询结果: pk=458649953127104519, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,108 - DEBUG - 插入后查询结果: pk=458649953127104520, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 10:58:42,108 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 10:58:49,453 - INFO - 开始抽取文档 796af784-5a60-47f1-a4e2-3d73643fd4c5 的三元组,userid: testuser1
|
||
2025-06-11 10:58:49,456 - DEBUG - 分割为 753 个文本块
|
||
2025-06-11 10:58:49,456 - DEBUG - 处理块 1/753:
|
||
知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2...
|
||
2025-06-11 10:58:49,828 - DEBUG - 块 1 生成文本: <triplet> 东北大学 <org> 沈阳 <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 10:58:49,828 - DEBUG - 原始生成文本: <triplet> 东北大学 <org> 沈阳 <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 10:58:49,828 - DEBUG - 处理后标记: ['<triplet>', '东北大学', '<org>', '沈阳', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 10:58:49,828 - DEBUG - 添加三元组: 东北大学(org) - located in the administrative territorial entity - 沈阳(loc)
|
||
2025-06-11 10:58:49,828 - DEBUG - 块 1 提取到 1 个三元组
|
||
2025-06-11 10:58:49,828 - DEBUG - 处理块 2/753: 通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识...
|
||
2025-06-11 10:58:50,022 - DEBUG - 块 2 生成文本: <triplet> 知识图谱嵌入 <media> 图模型 <concept> instance of</s>
|
||
2025-06-11 10:58:50,022 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <media> 图模型 <concept> instance of</s>
|
||
2025-06-11 10:58:50,022 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<media>', '图模型', '<concept>', 'instance of']
|
||
2025-06-11 10:58:50,022 - DEBUG - 添加三元组: 知识图谱嵌入(media) - instance of - 图模型(concept)
|
||
2025-06-11 10:58:50,022 - DEBUG - 块 2 提取到 1 个三元组
|
||
2025-06-11 10:58:50,022 - DEBUG - 处理块 3/753: 种被广泛采用的知识表示方法, 其主要思想是将知识图谱中的实体和关系嵌入到连续的向量空间中, 用来简化...
|
||
2025-06-11 10:58:50,552 - DEBUG - 块 3 生成文本: <triplet> 种被广泛采用的知识表示方法 <concept> 知识图谱 <misc> 结构 <unk> <media> 分类 <per> instance of</s>
|
||
2025-06-11 10:58:50,552 - DEBUG - 原始生成文本: <triplet> 种被广泛采用的知识表示方法 <concept> 知识图谱 <misc> 结构 <unk> <media> 分类 <per> instance of</s>
|
||
2025-06-11 10:58:50,552 - DEBUG - 处理后标记: ['<triplet>', '种被广泛采用的知识表示方法', '<concept>', '知识图谱', '<misc>', '结构', '<unk>', '<media>', '分类', '<per>', 'instance of']
|
||
2025-06-11 10:58:50,552 - DEBUG - 添加三元组: 种被广泛采用的知识表示方法(concept) - 结构 - 知识图谱(misc)
|
||
2025-06-11 10:58:50,552 - DEBUG - 块 3 提取到 1 个三元组
|
||
2025-06-11 10:58:50,552 - DEBUG - 处理块 4/753: 嵌入技术进行全面回顾, 不仅包括使用KG中观察到的事实进行嵌入的技术, 还包括添加时间维度的动态KG...
|
||
2025-06-11 10:58:50,840 - DEBUG - 块 4 生成文本: <triplet> 嵌入技术 <concept> 实体 <misc> studies</s>
|
||
2025-06-11 10:58:50,841 - DEBUG - 原始生成文本: <triplet> 嵌入技术 <concept> 实体 <misc> studies</s>
|
||
2025-06-11 10:58:50,841 - DEBUG - 处理后标记: ['<triplet>', '嵌入技术', '<concept>', '实体', '<misc>', 'studies']
|
||
2025-06-11 10:58:50,841 - DEBUG - 添加三元组: 嵌入技术(concept) - studies - 实体(misc)
|
||
2025-06-11 10:58:50,841 - DEBUG - 块 4 提取到 1 个三元组
|
||
2025-06-11 10:58:50,841 - DEBUG - 处理块 5/753: 比与总结. 然后简要介绍KG嵌入技术在下游任务中的典型应用, 包括问答系统、推荐系统和关系提取等. ...
|
||
2025-06-11 10:58:51,333 - DEBUG - 块 5 生成文本: <triplet> 知识图谱嵌入 <concept> 中图法分类号: TP182 <misc> 分类 <media> 词汇 <org> <unk> 名稱 <per> grapher</s>
|
||
2025-06-11 10:58:51,333 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <concept> 中图法分类号: TP182 <misc> 分类 <media> 词汇 <org> <unk> 名稱 <per> grapher</s>
|
||
2025-06-11 10:58:51,333 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<concept>', '中图法分类号: TP182', '<misc>', '分类', '<media>', '词汇', '<org>', '<unk>', '名稱', '<per>', 'grapher']
|
||
2025-06-11 10:58:51,333 - DEBUG - 添加三元组: 知识图谱嵌入(concept) - 分类 - 中图法分类号: TP182(misc)
|
||
2025-06-11 10:58:51,333 - DEBUG - 块 5 提取到 1 个三元组
|
||
2025-06-11 10:58:51,333 - DEBUG - 处理块 6/753: 中文引用格式: 张天成, 田雪, 孙相会, 于明鹤, 孙艳红, 于戈. 知识图谱嵌入技术研究综述. ...
|
||
2025-06-11 10:58:51,567 - DEBUG - 块 6 生成文本: <triplet> 知识图谱嵌入技术研究综述 <unk> 2023 <date> publication date</s>
|
||
2025-06-11 10:58:51,567 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术研究综述 <unk> 2023 <date> publication date</s>
|
||
2025-06-11 10:58:51,567 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术研究综述', '<unk>', '2023', '<date>', 'publication date']
|
||
2025-06-11 10:58:51,568 - DEBUG - 添加三元组: 知识图谱嵌入技术研究综述(unk) - publication date - 2023(date)
|
||
2025-06-11 10:58:51,568 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-11 10:58:51,568 - DEBUG - 处理块 7/753: 英文引用格式: Zhang TC, Tian X, Sun XH, Yu MH, Sun YH, Y...
|
||
2025-06-11 10:58:51,900 - DEBUG - 块 7 生成文本: <triplet> XH <per> Knowledge Graph Embedding Technology <media> notable work location</s>
|
||
2025-06-11 10:58:51,900 - DEBUG - 原始生成文本: <triplet> XH <per> Knowledge Graph Embedding Technology <media> notable work location</s>
|
||
2025-06-11 10:58:51,900 - DEBUG - 处理后标记: ['<triplet>', 'XH', '<per>', 'Knowledge Graph Embedding Technology', '<media>', 'notable work location']
|
||
2025-06-11 10:58:51,900 - DEBUG - 添加三元组: XH(per) - notable work location - Knowledge Graph Embedding Technology(media)
|
||
2025-06-11 10:58:51,900 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-11 10:58:51,900 - DEBUG - 处理块 8/753: Research. Ruan Jian Xue Bao/Journal of Software, 2...
|
||
2025-06-11 10:58:52,039 - DEBUG - 块 8 生成文本: <triplet> <concept> Journal of Software <media> published in</s>
|
||
2025-06-11 10:58:52,039 - DEBUG - 原始生成文本: <triplet> <concept> Journal of Software <media> published in</s>
|
||
2025-06-11 10:58:52,039 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Journal of Software', '<media>', 'published in']
|
||
2025-06-11 10:58:52,039 - DEBUG - 处理块 9/753: Overview on Knowledge Graph Embedding Technology R...
|
||
2025-06-11 10:58:52,574 - DEBUG - 块 9 生成文本: <triplet> ZHANG Tian-Cheng1 <per> YU Ming-He2</s>
|
||
2025-06-11 10:58:52,574 - DEBUG - 原始生成文本: <triplet> ZHANG Tian-Cheng1 <per> YU Ming-He2</s>
|
||
2025-06-11 10:58:52,574 - DEBUG - 处理后标记: ['<triplet>', 'ZHANG Tian-Cheng1', '<per>', 'YU Ming-He2']
|
||
2025-06-11 10:58:52,574 - DEBUG - 处理块 10/753: 1(School of Computer Science and Engineering, Nort...
|
||
2025-06-11 10:58:52,883 - DEBUG - 块 10 生成文本: <triplet> <org> Shenyang <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 10:58:52,883 - DEBUG - 原始生成文本: <triplet> <org> Shenyang <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 10:58:52,883 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Shenyang', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 10:58:52,883 - DEBUG - 处理块 11/753: 2(Software College, Northeastern University, Sheny...
|
||
2025-06-11 10:58:53,277 - DEBUG - 块 11 生成文本: <triplet> <org> Shenyang <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 10:58:53,277 - DEBUG - 原始生成文本: <triplet> <org> Shenyang <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 10:58:53,277 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Shenyang', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 10:58:53,277 - DEBUG - 处理块 12/753: Abstract: Knowledge graph (KG) is a kind of...
|
||
2025-06-11 10:58:54,578 - DEBUG - 块 12 生成文本: <triplet> graph <concept> Knowledge <media> part of technology that uses <misc> Knowledge model <org> Knowledge Model <eve> <triplet> knowledge <per> Knowledge models <unk> <dis> <time> <date> <cel> <loc> Knowledge based on the relationship between knowledge and Knowledge and 그래 on knowledge in 를 을 ,graph model to describe the relation between और graaf kształt,theory,com,andtheore,or,by,dank,to,i,de,d,graf,di,e,art,s,g,t)</s>
|
||
2025-06-11 10:58:54,578 - DEBUG - 原始生成文本: <triplet> graph <concept> Knowledge <media> part of technology that uses <misc> Knowledge model <org> Knowledge Model <eve> <triplet> knowledge <per> Knowledge models <unk> <dis> <time> <date> <cel> <loc> Knowledge based on the relationship between knowledge and Knowledge and 그래 on knowledge in 를 을 ,graph model to describe the relation between और graaf kształt,theory,com,andtheore,or,by,dank,to,i,de,d,graf,di,e,art,s,g,t)</s>
|
||
2025-06-11 10:58:54,578 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Knowledge', '<media>', 'part of technology that uses', '<misc>', 'Knowledge model', '<org>', 'Knowledge Model', '<eve>', '<triplet>', 'knowledge', '<per>', 'Knowledge models', '<unk>', '<dis>', '<time>', '<date>', '<cel>', '<loc>', 'Knowledge based on the relationship between knowledge and Knowledge and 그래 on knowledge in 를 을 ,graph model to describe the relation between और graaf kształt,theory,com,andtheore,or,by,dank,to,i,de,d,graf,di,e,art,s,g,t)']
|
||
2025-06-11 10:58:54,578 - DEBUG - 添加三元组: graph(concept) - part of technology that uses - Knowledge(media)
|
||
2025-06-11 10:58:54,578 - DEBUG - 添加三元组: knowledge(per) - <dis> - Knowledge models(unk)
|
||
2025-06-11 10:58:54,578 - DEBUG - 块 12 提取到 2 个三元组
|
||
2025-06-11 10:58:54,578 - DEBUG - 处理块 13/753: modeling things. Knowledge graph embedding (KGE), ...
|
||
2025-06-11 10:58:54,806 - DEBUG - 块 13 生成文本: <triplet> graph embedding <media> knowledge representation <concept> use</s>
|
||
2025-06-11 10:58:54,806 - DEBUG - 原始生成文本: <triplet> graph embedding <media> knowledge representation <concept> use</s>
|
||
2025-06-11 10:58:54,806 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding', '<media>', 'knowledge representation', '<concept>', 'use']
|
||
2025-06-11 10:58:54,806 - DEBUG - 添加三元组: graph embedding(media) - use - knowledge representation(concept)
|
||
2025-06-11 10:58:54,806 - DEBUG - 块 13 提取到 1 个三元组
|
||
2025-06-11 10:58:54,806 - DEBUG - 处理块 14/753: entities and relationships in a knowledge graph in...
|
||
2025-06-11 10:58:55,030 - DEBUG - 块 14 生成文本: <triplet> <concept> knowledge graph <misc> subclass of <triplet> vector space</s>
|
||
2025-06-11 10:58:55,031 - DEBUG - 原始生成文本: <triplet> <concept> knowledge graph <misc> subclass of <triplet> vector space</s>
|
||
2025-06-11 10:58:55,031 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge graph', '<misc>', 'subclass of', '<triplet>', 'vector space']
|
||
2025-06-11 10:58:55,031 - DEBUG - 处理块 15/753: intrinsic structure of the KG. It can benefit a va...
|
||
2025-06-11 10:58:55,383 - DEBUG - 块 15 生成文本: <triplet> <concept> KG completion <media> part of</s>
|
||
2025-06-11 10:58:55,383 - DEBUG - 原始生成文本: <triplet> <concept> KG completion <media> part of</s>
|
||
2025-06-11 10:58:55,383 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KG completion', '<media>', 'part of']
|
||
2025-06-11 10:58:55,383 - DEBUG - 处理块 16/753: existing knowledge graph embedding technologies ar...
|
||
2025-06-11 10:58:55,545 - DEBUG - 块 16 生成文本: <triplet> <concept> knowledge graph embedding <media> use</s>
|
||
2025-06-11 10:58:55,545 - DEBUG - 原始生成文本: <triplet> <concept> knowledge graph embedding <media> use</s>
|
||
2025-06-11 10:58:55,545 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge graph embedding', '<media>', 'use']
|
||
2025-06-11 10:58:55,545 - DEBUG - 处理块 17/753: KG for embedding, but also dynamic KG embed...
|
||
2025-06-11 10:58:55,780 - DEBUG - 块 17 生成文本: <triplet> <concept> embedding <media> subclass of</s>
|
||
2025-06-11 10:58:55,780 - DEBUG - 原始生成文本: <triplet> <concept> embedding <media> subclass of</s>
|
||
2025-06-11 10:58:55,780 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'embedding', '<media>', 'subclass of']
|
||
2025-06-11 10:58:55,780 - DEBUG - 处理块 18/753: integrate multi-source information. The releva...
|
||
2025-06-11 10:58:56,132 - DEBUG - 块 18 生成文本: <triplet> <concept> multi-source information <media> subclass of entity</s>
|
||
2025-06-11 10:58:56,132 - DEBUG - 原始生成文本: <triplet> <concept> multi-source information <media> subclass of entity</s>
|
||
2025-06-11 10:58:56,132 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'multi-source information', '<media>', 'subclass of entity']
|
||
2025-06-11 10:58:56,132 - DEBUG - 处理块 19/753: embedding, relation embedding and scoring function...
|
||
2025-06-11 10:58:56,259 - DEBUG - 块 19 生成文本: <triplet> embedding <concept> KG <org> manufacturer</s>
|
||
2025-06-11 10:58:56,260 - DEBUG - 原始生成文本: <triplet> embedding <concept> KG <org> manufacturer</s>
|
||
2025-06-11 10:58:56,260 - DEBUG - 处理后标记: ['<triplet>', 'embedding', '<concept>', 'KG', '<org>', 'manufacturer']
|
||
2025-06-11 10:58:56,260 - DEBUG - 添加三元组: embedding(concept) - manufacturer - KG(org)
|
||
2025-06-11 10:58:56,260 - DEBUG - 块 19 提取到 1 个三元组
|
||
2025-06-11 10:58:56,260 - DEBUG - 处理块 20/753: briefly introduced, including question answering s...
|
||
2025-06-11 10:58:56,590 - DEBUG - 块 20 生成文本: <triplet> <concept> question answering system <misc> subclass of</s>
|
||
2025-06-11 10:58:56,590 - DEBUG - 原始生成文本: <triplet> <concept> question answering system <misc> subclass of</s>
|
||
2025-06-11 10:58:56,590 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'question answering system', '<misc>', 'subclass of']
|
||
2025-06-11 10:58:56,590 - DEBUG - 处理块 21/753: knowledge graph embedding are expounded, and the f...
|
||
2025-06-11 10:58:56,923 - DEBUG - 块 21 生成文本: <triplet> <concept> knowledge graph embedding <misc> subclass of</s>
|
||
2025-06-11 10:58:56,923 - DEBUG - 原始生成文本: <triplet> <concept> knowledge graph embedding <misc> subclass of</s>
|
||
2025-06-11 10:58:56,923 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge graph embedding', '<misc>', 'subclass of']
|
||
2025-06-11 10:58:56,923 - DEBUG - 处理块 22/753: Key words: knowledge graph embedding (KGE); t...
|
||
2025-06-11 10:58:57,093 - DEBUG - 块 22 生成文本: <triplet> embedding <concept> knowledge graph <misc> subclass of</s>
|
||
2025-06-11 10:58:57,093 - DEBUG - 原始生成文本: <triplet> embedding <concept> knowledge graph <misc> subclass of</s>
|
||
2025-06-11 10:58:57,093 - DEBUG - 处理后标记: ['<triplet>', 'embedding', '<concept>', 'knowledge graph', '<misc>', 'subclass of']
|
||
2025-06-11 10:58:57,093 - DEBUG - 添加三元组: embedding(concept) - subclass of - knowledge graph(misc)
|
||
2025-06-11 10:58:57,093 - DEBUG - 块 22 提取到 1 个三元组
|
||
2025-06-11 10:58:57,093 - DEBUG - 处理块 23/753: relationship extraction
|
||
|
||
|
||
* 基金项目: 国家自然科学基金(U1...
|
||
2025-06-11 10:58:57,317 - DEBUG - 块 23 生成文本: <triplet> 中央高校基本科研业务费 <concept> 国家自然科学基金 <org> sponsor</s>
|
||
2025-06-11 10:58:57,317 - DEBUG - 原始生成文本: <triplet> 中央高校基本科研业务费 <concept> 国家自然科学基金 <org> sponsor</s>
|
||
2025-06-11 10:58:57,317 - DEBUG - 处理后标记: ['<triplet>', '中央高校基本科研业务费', '<concept>', '国家自然科学基金', '<org>', 'sponsor']
|
||
2025-06-11 10:58:57,317 - DEBUG - 添加三元组: 中央高校基本科研业务费(concept) - sponsor - 国家自然科学基金(org)
|
||
2025-06-11 10:58:57,317 - DEBUG - 块 23 提取到 1 个三元组
|
||
2025-06-11 10:58:57,317 - DEBUG - 处理块 24/753: 收稿时间: 2021-03-29; 修改时间: 2021-06-28; 采用时间: 2021-08-...
|
||
2025-06-11 10:58:57,488 - DEBUG - 块 24 生成文本: <triplet> 修改时间 <concept> CNKI网络 <media> part of</s>
|
||
2025-06-11 10:58:57,488 - DEBUG - 原始生成文本: <triplet> 修改时间 <concept> CNKI网络 <media> part of</s>
|
||
2025-06-11 10:58:57,488 - DEBUG - 处理后标记: ['<triplet>', '修改时间', '<concept>', 'CNKI网络', '<media>', 'part of']
|
||
2025-06-11 10:58:57,488 - DEBUG - 添加三元组: 修改时间(concept) - part of - CNKI网络(media)
|
||
2025-06-11 10:58:57,488 - DEBUG - 块 24 提取到 1 个三元组
|
||
2025-06-11 10:58:57,488 - DEBUG - 处理块 25/753: 软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@isca...
|
||
2025-06-11 10:58:57,747 - DEBUG - 块 25 生成文本: <triplet> 软件学报 <concept> ISSN 1000-9825 <dis> CODEN RUXUEW <org> publisher</s>
|
||
2025-06-11 10:58:57,747 - DEBUG - 原始生成文本: <triplet> 软件学报 <concept> ISSN 1000-9825 <dis> CODEN RUXUEW <org> publisher</s>
|
||
2025-06-11 10:58:57,748 - DEBUG - 处理后标记: ['<triplet>', '软件学报', '<concept>', 'ISSN 1000-9825', '<dis>', 'CODEN RUXUEW', '<org>', 'publisher']
|
||
2025-06-11 10:58:57,748 - DEBUG - 添加三元组: 软件学报(concept) - CODEN RUXUEW - ISSN 1000-9825(dis)
|
||
2025-06-11 10:58:57,748 - DEBUG - 块 25 提取到 1 个三元组
|
||
2025-06-11 10:58:57,748 - DEBUG - 处理块 26/753: Journal of Software,2023,34(1):277−311 [doi: 10.13...
|
||
2025-06-11 10:58:57,971 - DEBUG - 块 26 生成文本: <triplet> 软件 <concept> 中国科学院软件研究所 <loc> manufacturer</s>
|
||
2025-06-11 10:58:57,971 - DEBUG - 原始生成文本: <triplet> 软件 <concept> 中国科学院软件研究所 <loc> manufacturer</s>
|
||
2025-06-11 10:58:57,972 - DEBUG - 处理后标记: ['<triplet>', '软件', '<concept>', '中国科学院软件研究所', '<loc>', 'manufacturer']
|
||
2025-06-11 10:58:57,972 - DEBUG - 添加三元组: 软件(concept) - manufacturer - 中国科学院软件研究所(loc)
|
||
2025-06-11 10:58:57,972 - DEBUG - 块 26 提取到 1 个三元组
|
||
2025-06-11 10:58:57,972 - DEBUG - 处理块 27/753: 知识图谱(knowledge graph, KG)作为人工智能的一个分支, 引起了学术界和工业界的广...
|
||
2025-06-11 10:58:58,366 - DEBUG - 块 27 生成文本: <triplet> 知识图谱 <media> 人工智能 <concept> subclass of</s>
|
||
2025-06-11 10:58:58,366 - DEBUG - 原始生成文本: <triplet> 知识图谱 <media> 人工智能 <concept> subclass of</s>
|
||
2025-06-11 10:58:58,366 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<media>', '人工智能', '<concept>', 'subclass of']
|
||
2025-06-11 10:58:58,367 - DEBUG - 添加三元组: 知识图谱(media) - subclass of - 人工智能(concept)
|
||
2025-06-11 10:58:58,367 - DEBUG - 块 27 提取到 1 个三元组
|
||
2025-06-11 10:58:58,367 - DEBUG - 处理块 28/753: 于许多现实世界应用, 从语义分析[6,7]、命名实体消歧[8,9], 到信息提取[10,11]和问答...
|
||
2025-06-11 10:58:58,530 - DEBUG - 块 28 生成文本: <triplet> 知识图谱 <concept> 三 <misc> part of</s>
|
||
2025-06-11 10:58:58,530 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 三 <misc> part of</s>
|
||
2025-06-11 10:58:58,530 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '三', '<misc>', 'part of']
|
||
2025-06-11 10:58:58,530 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 三(misc)
|
||
2025-06-11 10:58:58,530 - DEBUG - 块 28 提取到 1 个三元组
|
||
2025-06-11 10:58:58,530 - DEBUG - 处理块 29/753: 元组, 即(头实体, 关系, 尾实体), 表示头实体与尾实体通过关系进行连接. 尽管知识图谱在表示结...
|
||
2025-06-11 10:58:58,690 - DEBUG - 块 29 生成文本: <triplet> 元组 <concept> 知识图谱 <misc> part of</s>
|
||
2025-06-11 10:58:58,690 - DEBUG - 原始生成文本: <triplet> 元组 <concept> 知识图谱 <misc> part of</s>
|
||
2025-06-11 10:58:58,690 - DEBUG - 处理后标记: ['<triplet>', '元组', '<concept>', '知识图谱', '<misc>', 'part of']
|
||
2025-06-11 10:58:58,690 - DEBUG - 添加三元组: 元组(concept) - part of - 知识图谱(misc)
|
||
2025-06-11 10:58:58,690 - DEBUG - 块 29 提取到 1 个三元组
|
||
2025-06-11 10:58:58,690 - DEBUG - 处理块 30/753: 为了解决这个问题, 近年来提出了一个新的研究方向, 称为知识图谱嵌入(knowledge graph...
|
||
2025-06-11 10:58:58,871 - DEBUG - 块 30 生成文本: <triplet> 知识图谱嵌入 <concept> KG <media> part of</s>
|
||
2025-06-11 10:58:58,872 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <concept> KG <media> part of</s>
|
||
2025-06-11 10:58:58,872 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<concept>', 'KG', '<media>', 'part of']
|
||
2025-06-11 10:58:58,872 - DEBUG - 添加三元组: 知识图谱嵌入(concept) - part of - KG(media)
|
||
2025-06-11 10:58:58,872 - DEBUG - 块 30 提取到 1 个三元组
|
||
2025-06-11 10:58:58,872 - DEBUG - 处理块 31/753: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体...
|
||
2025-06-11 10:58:59,074 - DEBUG - 块 31 生成文本: <triplet> 关系低维嵌入的相似性 <concept> KGE <misc> used by</s>
|
||
2025-06-11 10:58:59,074 - DEBUG - 原始生成文本: <triplet> 关系低维嵌入的相似性 <concept> KGE <misc> used by</s>
|
||
2025-06-11 10:58:59,074 - DEBUG - 处理后标记: ['<triplet>', '关系低维嵌入的相似性', '<concept>', 'KGE', '<misc>', 'used by']
|
||
2025-06-11 10:58:59,074 - DEBUG - 添加三元组: 关系低维嵌入的相似性(concept) - used by - KGE(misc)
|
||
2025-06-11 10:58:59,074 - DEBUG - 块 31 提取到 1 个三元组
|
||
2025-06-11 10:58:59,074 - DEBUG - 处理块 32/753: 尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱...
|
||
2025-06-11 10:58:59,440 - DEBUG - 块 32 生成文本: <triplet> 知识图 谱 <concept> <unk> 嵌入任务 <misc> <media> 分类 <per> <eve> <org></s>
|
||
2025-06-11 10:58:59,441 - DEBUG - 原始生成文本: <triplet> 知识图 谱 <concept> <unk> 嵌入任务 <misc> <media> 分类 <per> <eve> <org></s>
|
||
2025-06-11 10:58:59,441 - DEBUG - 处理后标记: ['<triplet>', '知识图 谱', '<concept>', '<unk>', '嵌入任务', '<misc>', '<media>', '分类', '<per>', '<eve>', '<org>']
|
||
2025-06-11 10:58:59,441 - DEBUG - 处理块 33/753: 三元组定义一个评分函数以衡量其在该空间中的合理性. 然后通过最大化观察到的三元组的总合理性来学习实体...
|
||
2025-06-11 10:58:59,632 - DEBUG - 块 33 生成文本: <triplet> 实体分 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 10:58:59,633 - DEBUG - 原始生成文本: <triplet> 实体分 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 10:58:59,633 - DEBUG - 处理后标记: ['<triplet>', '实体分', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 10:58:59,633 - DEBUG - 添加三元组: 实体分(concept) - part of - 三元组(misc)
|
||
2025-06-11 10:58:59,633 - DEBUG - 块 33 提取到 1 个三元组
|
||
2025-06-11 10:58:59,633 - DEBUG - 处理块 34/753: 类[18,19], 实体解析[18,20]等. 由于在整个过程中仅要求学习的嵌入在每个单独的事实中兼...
|
||
2025-06-11 10:58:59,813 - DEBUG - 块 34 生成文本: <triplet> 类 <concept> 实体类型 <misc> subclass of</s>
|
||
2025-06-11 10:58:59,814 - DEBUG - 原始生成文本: <triplet> 类 <concept> 实体类型 <misc> subclass of</s>
|
||
2025-06-11 10:58:59,814 - DEBUG - 处理后标记: ['<triplet>', '类', '<concept>', '实体类型', '<misc>', 'subclass of']
|
||
2025-06-11 10:58:59,814 - DEBUG - 添加三元组: 类(concept) - subclass of - 实体类型(misc)
|
||
2025-06-11 10:58:59,814 - DEBUG - 块 34 提取到 1 个三元组
|
||
2025-06-11 10:58:59,814 - DEBUG - 处理块 35/753: 描述[25−28], 关系路径[29−31], 甚至逻辑规则[32,33]来学习更多的预测嵌入.
|
||
本...
|
||
2025-06-11 10:59:00,124 - DEBUG - 块 35 生成文本: <triplet> 嵌入 <concept> 工作调查 <media> part of</s>
|
||
2025-06-11 10:59:00,124 - DEBUG - 原始生成文本: <triplet> 嵌入 <concept> 工作调查 <media> part of</s>
|
||
2025-06-11 10:59:00,124 - DEBUG - 处理后标记: ['<triplet>', '嵌入', '<concept>', '工作调查', '<media>', 'part of']
|
||
2025-06-11 10:59:00,124 - DEBUG - 添加三元组: 嵌入(concept) - part of - 工作调查(media)
|
||
2025-06-11 10:59:00,124 - DEBUG - 块 35 提取到 1 个三元组
|
||
2025-06-11 10:59:00,124 - DEBUG - 处理块 36/753: 面回顾, 具体介绍基于距离的模型, 语义匹配模型以及最新的KGE技术; 第3节主要讨论了融合时间信息...
|
||
2025-06-11 10:59:00,713 - DEBUG - 块 36 生成文本: <triplet> 知识图谱嵌入技术 <concept> KGE <misc> part of</s>
|
||
2025-06-11 10:59:00,713 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术 <concept> KGE <misc> part of</s>
|
||
2025-06-11 10:59:00,714 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术', '<concept>', 'KGE', '<misc>', 'part of']
|
||
2025-06-11 10:59:00,714 - DEBUG - 添加三元组: 知识图谱嵌入技术(concept) - part of - KGE(misc)
|
||
2025-06-11 10:59:00,714 - DEBUG - 块 36 提取到 1 个三元组
|
||
2025-06-11 10:59:00,714 - DEBUG - 处理块 37/753: 了除KG中观察到的事实以外的结合附加信息的KGE技术, 例如实体类别、文本描述、关系路径等. 第5节...
|
||
2025-06-11 10:59:00,884 - DEBUG - 块 37 生成文本: <triplet> 绍KGE技术 <media> KGE <misc> subclass of</s>
|
||
2025-06-11 10:59:00,884 - DEBUG - 原始生成文本: <triplet> 绍KGE技术 <media> KGE <misc> subclass of</s>
|
||
2025-06-11 10:59:00,884 - DEBUG - 处理后标记: ['<triplet>', '绍KGE技术', '<media>', 'KGE', '<misc>', 'subclass of']
|
||
2025-06-11 10:59:00,884 - DEBUG - 添加三元组: 绍KGE技术(media) - subclass of - KGE(misc)
|
||
2025-06-11 10:59:00,884 - DEBUG - 块 37 提取到 1 个三元组
|
||
2025-06-11 10:59:00,884 - DEBUG - 处理块 38/753: 先前有关知识图谱的调查论文主要集中在统计关系学习(statistical relational le...
|
||
2025-06-11 10:59:01,225 - DEBUG - 块 38 生成文本: <triplet> 统计关系学习 <concept> 知识图谱 <misc> studies</s>
|
||
2025-06-11 10:59:01,225 - DEBUG - 原始生成文本: <triplet> 统计关系学习 <concept> 知识图谱 <misc> studies</s>
|
||
2025-06-11 10:59:01,225 - DEBUG - 处理后标记: ['<triplet>', '统计关系学习', '<concept>', '知识图谱', '<misc>', 'studies']
|
||
2025-06-11 10:59:01,225 - DEBUG - 添加三元组: 统计关系学习(concept) - studies - 知识图谱(misc)
|
||
2025-06-11 10:59:01,225 - DEBUG - 块 38 提取到 1 个三元组
|
||
2025-06-11 10:59:01,225 - DEBUG - 处理块 39/753: refinement[35], 中文知识图谱构建(Chinese knowledge graph c...
|
||
2025-06-11 10:59:01,534 - DEBUG - 块 39 生成文本: <triplet> <org> 中文知识图谱构建 <concept> instance of</s>
|
||
2025-06-11 10:59:01,534 - DEBUG - 原始生成文本: <triplet> <org> 中文知识图谱构建 <concept> instance of</s>
|
||
2025-06-11 10:59:01,534 - DEBUG - 处理后标记: ['<triplet>', '<org>', '中文知识图谱构建', '<concept>', 'instance of']
|
||
2025-06-11 10:59:01,534 - DEBUG - 处理块 40/753: 年详细介绍了知识表示学习(KRL)的基本概念和主要方法, 对知识表示学习面临的主要挑战、已有解决方案...
|
||
2025-06-11 10:59:04,952 - DEBUG - 块 40 生成文本: <triplet> 线性方式 <concept> Lin等人 <per> named <media> Lin <org> <misc> Lin等 <unk> <dis> <loc> Lin· <eve> Lin基 <cel> <time> 基基网 <triplet> Lin系统 graph الية ciąg RNA esh基线基学习 grid 网网线网系统线学习学学 elect性学习学习系统模型 instruction rail ics architecture istid基站 <num>学线学基立学习和网网络学系统学习基路线图线站立立网和网络网立基座学习站站和学习网络系统和立站网学习网的网络和和系统立校网路和分布式学习的分布学算法和线路和分类和编程和校和对对立方位学的系统以及分布分布和位置和偏住系统等分布等网络学习与分布与偏在分布的偏离学习中偏学偏和研究和迁移学和重建和配置和定性偏好和建和组合和固式偏门学等偏型偏差偏人偏多学习偏对学习、偏远距离学习以及偏近距离偏移和移学习之间的偏中和流行和新兴偏子偏分布偏系统偏偏学习和其他偏前偏行偏地偏方偏器偏所在偏</s>
|
||
2025-06-11 10:59:04,952 - DEBUG - 原始生成文本: <triplet> 线性方式 <concept> Lin等人 <per> named <media> Lin <org> <misc> Lin等 <unk> <dis> <loc> Lin· <eve> Lin基 <cel> <time> 基基网 <triplet> Lin系统 graph الية ciąg RNA esh基线基学习 grid 网网线网系统线学习学学 elect性学习学习系统模型 instruction rail ics architecture istid基站 <num>学线学基立学习和网网络学系统学习基路线图线站立立网和网络网立基座学习站站和学习网络系统和立站网学习网的网络和和系统立校网路和分布式学习的分布学算法和线路和分类和编程和校和对对立方位学的系统以及分布分布和位置和偏住系统等分布等网络学习与分布与偏在分布的偏离学习中偏学偏和研究和迁移学和重建和配置和定性偏好和建和组合和固式偏门学等偏型偏差偏人偏多学习偏对学习、偏远距离学习以及偏近距离偏移和移学习之间的偏中和流行和新兴偏子偏分布偏系统偏偏学习和其他偏前偏行偏地偏方偏器偏所在偏</s>
|
||
2025-06-11 10:59:04,952 - DEBUG - 处理后标记: ['<triplet>', '线性方式', '<concept>', 'Lin等人', '<per>', 'named', '<media>', 'Lin', '<org>', '<misc>', 'Lin等', '<unk>', '<dis>', '<loc>', 'Lin·', '<eve>', 'Lin基', '<cel>', '<time>', '基基网', '<triplet>', 'Lin系统 graph الية ciąg RNA esh基线基学习 grid 网网线网系统线学习学学 elect性学习学习系统模型 instruction rail ics architecture istid基站', '<num>', '学线学基立学习和网网络学系统学习基路线图线站立立网和网络网立基座学习站站和学习网络系统和立站网学习网的网络和和系统立校网路和分布式学习的分布学算法和线路和分类和编程和校和对对立方位学的系统以及分布分布和位置和偏住系统等分布等网络学习与分布与偏在分布的偏离学习中偏学偏和研究和迁移学和重建和配置和定性偏好和建和组合和固式偏门学等偏型偏差偏人偏多学习偏对学习、偏远距离学习以及偏近距离偏移和移学习之间的偏中和流行和新兴偏子偏分布偏系统偏偏学习和其他偏前偏行偏地偏方偏器偏所在偏']
|
||
2025-06-11 10:59:04,952 - DEBUG - 添加三元组: 线性方式(concept) - named - Lin等人(per)
|
||
2025-06-11 10:59:04,952 - DEBUG - 块 40 提取到 1 个三元组
|
||
2025-06-11 10:59:04,953 - DEBUG - 处理块 41/753: KRL, 着重于进行定量分析. Wang等人[14]根据评分函数对KRL模型进行分类, 侧重于KRL...
|
||
2025-06-11 10:59:05,116 - DEBUG - 块 41 生成文本: <triplet> 定量分析 <concept> KRL <misc> studies</s>
|
||
2025-06-11 10:59:05,116 - DEBUG - 原始生成文本: <triplet> 定量分析 <concept> KRL <misc> studies</s>
|
||
2025-06-11 10:59:05,117 - DEBUG - 处理后标记: ['<triplet>', '定量分析', '<concept>', 'KRL', '<misc>', 'studies']
|
||
2025-06-11 10:59:05,117 - DEBUG - 添加三元组: 定量分析(concept) - studies - KRL(misc)
|
||
2025-06-11 10:59:05,117 - DEBUG - 块 41 提取到 1 个三元组
|
||
2025-06-11 10:59:05,117 - DEBUG - 处理块 42/753: 了全新角度的分类, 对主流KGE技术进行了阐述, 同时介绍了动态知识图谱嵌入方法的最新进展, 并分析...
|
||
2025-06-11 10:59:05,501 - DEBUG - 块 42 生成文本: <triplet> <concept> 动态知识图谱嵌入方法 <media> KGE技术 <misc> part of</s>
|
||
2025-06-11 10:59:05,501 - DEBUG - 原始生成文本: <triplet> <concept> 动态知识图谱嵌入方法 <media> KGE技术 <misc> part of</s>
|
||
2025-06-11 10:59:05,501 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '动态知识图谱嵌入方法', '<media>', 'KGE技术', '<misc>', 'part of']
|
||
2025-06-11 10:59:05,501 - DEBUG - 处理块 43/753: G= (E;R;S)
|
||
E= {e1;e2;:::;e|E|}
|
||
|E|
|
||
R= {r1;r2;:::;r...
|
||
2025-06-11 10:59:06,329 - DEBUG - 块 43 生成文本: <triplet> 知识图谱嵌入 <concept> 定义几 <misc> G= (E;R;S) E={e1;e2;E|E <media> G <loc> part of <triplet> S⊆ E×R×E (h;r;t) <org> G; <per> part</s>
|
||
2025-06-11 10:59:06,329 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <concept> 定义几 <misc> G= (E;R;S) E={e1;e2;E|E <media> G <loc> part of <triplet> S⊆ E×R×E (h;r;t) <org> G; <per> part</s>
|
||
2025-06-11 10:59:06,329 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<concept>', '定义几', '<misc>', 'G= (E;R;S) E={e1;e2;E|E', '<media>', 'G', '<loc>', 'part of', '<triplet>', 'S⊆ E×R×E (h;r;t)', '<org>', 'G;', '<per>', 'part']
|
||
2025-06-11 10:59:06,329 - DEBUG - 添加三元组: 知识图谱嵌入(concept) - G= (E;R;S) E={e1;e2;E|E - 定义几(misc)
|
||
2025-06-11 10:59:06,329 - DEBUG - 添加三元组: S⊆ E×R×E (h;r;t)(org) - part - G;(per)
|
||
2025-06-11 10:59:06,329 - DEBUG - 块 43 提取到 2 个三元组
|
||
2025-06-11 10:59:06,329 - DEBUG - 处理块 44/753: 种基本符号. 首先, 定义知识图谱为 , 其中 是事实集合, 包含 种不同实体;
|
||
代...
|
||
2025-06-11 10:59:06,899 - DEBUG - 块 44 生成文本: <triplet> 种基本符号 <concept> 知识图谱 <misc> 软件学报 2023年第 34卷第 1期 <dis> 278 <date> publication date</s>
|
||
2025-06-11 10:59:06,899 - DEBUG - 原始生成文本: <triplet> 种基本符号 <concept> 知识图谱 <misc> 软件学报 2023年第 34卷第 1期 <dis> 278 <date> publication date</s>
|
||
2025-06-11 10:59:06,899 - DEBUG - 处理后标记: ['<triplet>', '种基本符号', '<concept>', '知识图谱', '<misc>', '软件学报 2023年第 34卷第 1期', '<dis>', '278', '<date>', 'publication date']
|
||
2025-06-11 10:59:06,899 - DEBUG - 添加三元组: 种基本符号(concept) - 软件学报 2023年第 34卷第 1期 - 知识图谱(misc)
|
||
2025-06-11 10:59:06,899 - DEBUG - 块 44 提取到 1 个三元组
|
||
2025-06-11 10:59:06,899 - DEBUG - 处理块 45/753: 中h和t分别表示头、尾实体, r表示它们之间的关系. 例如三元组(BillClinton, wasP...
|
||
2025-06-11 10:59:07,467 - DEBUG - 块 45 生成文本: <triplet> 描述 <concept> 基本符号定义 <media> 符號 <org> 表 1 <misc> part of</s>
|
||
2025-06-11 10:59:07,467 - DEBUG - 原始生成文本: <triplet> 描述 <concept> 基本符号定义 <media> 符號 <org> 表 1 <misc> part of</s>
|
||
2025-06-11 10:59:07,467 - DEBUG - 处理后标记: ['<triplet>', '描述', '<concept>', '基本符号定义', '<media>', '符號', '<org>', '表 1', '<misc>', 'part of']
|
||
2025-06-11 10:59:07,467 - DEBUG - 添加三元组: 描述(concept) - 符號 - 基本符号定义(media)
|
||
2025-06-11 10:59:07,467 - DEBUG - 块 45 提取到 1 个三元组
|
||
2025-06-11 10:59:07,467 - DEBUG - 处理块 46/753: G
|
||
知识图谱
|
||
S 事实集合
|
||
(h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
...
|
||
2025-06-11 10:59:08,453 - DEBUG - 块 46 生成文本: <triplet> 嵌入三元组 <concept> 知识图谱 S <misc> <media> 事实集合 (h;r;t) <unk> <eve> part of <triplet> r ∈ R <dis> 映射矩阵 <org> 实值空间 Cd <loc> part</s>
|
||
2025-06-11 10:59:08,453 - DEBUG - 原始生成文本: <triplet> 嵌入三元组 <concept> 知识图谱 S <misc> <media> 事实集合 (h;r;t) <unk> <eve> part of <triplet> r ∈ R <dis> 映射矩阵 <org> 实值空间 Cd <loc> part</s>
|
||
2025-06-11 10:59:08,453 - DEBUG - 处理后标记: ['<triplet>', '嵌入三元组', '<concept>', '知识图谱 S', '<misc>', '<media>', '事实集合 (h;r;t)', '<unk>', '<eve>', 'part of', '<triplet>', 'r ∈ R', '<dis>', '映射矩阵', '<org>', '实值空间 Cd', '<loc>', 'part']
|
||
2025-06-11 10:59:08,453 - DEBUG - 添加三元组: 嵌入三元组(concept) - <media> - 知识图谱 S(misc)
|
||
2025-06-11 10:59:08,453 - DEBUG - 添加三元组: r ∈ R(dis) - 实值空间 Cd - 映射矩阵(org)
|
||
2025-06-11 10:59:08,453 - DEBUG - 块 46 提取到 2 个三元组
|
||
2025-06-11 10:59:08,453 - DEBUG - 处理块 47/753: d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦...
|
||
2025-06-11 10:59:09,062 - DEBUG - 块 47 生成文本: <triplet> <unk> Hamilton乘积 <concept> has quality</s>
|
||
2025-06-11 10:59:09,062 - DEBUG - 原始生成文本: <triplet> <unk> Hamilton乘积 <concept> has quality</s>
|
||
2025-06-11 10:59:09,062 - DEBUG - 处理后标记: ['<triplet>', '<unk>', 'Hamilton乘积', '<concept>', 'has quality']
|
||
2025-06-11 10:59:09,062 - DEBUG - 处理块 48/753: [M r]i;j
|
||
M r 矩阵 的第ij项
|
||
|
||
2 使用事实进行知识图谱嵌入
|
||
本节对...
|
||
2025-06-11 10:59:09,456 - DEBUG - 块 48 生成文本: <triplet> 评分函数 <concept> 矩阵 <misc> part of</s>
|
||
2025-06-11 10:59:09,456 - DEBUG - 原始生成文本: <triplet> 评分函数 <concept> 矩阵 <misc> part of</s>
|
||
2025-06-11 10:59:09,456 - DEBUG - 处理后标记: ['<triplet>', '评分函数', '<concept>', '矩阵', '<misc>', 'part of']
|
||
2025-06-11 10:59:09,456 - DEBUG - 添加三元组: 评分函数(concept) - part of - 矩阵(misc)
|
||
2025-06-11 10:59:09,456 - DEBUG - 块 48 提取到 1 个三元组
|
||
2025-06-11 10:59:09,456 - DEBUG - 处理块 49/753: 于能量的学习框架中也被称为能量函数. 典型类型的评分函数分为两种: 基于距离的评分函数(如图1(a)...
|
||
2025-06-11 10:59:09,958 - DEBUG - 块 49 生成文本: <triplet> 于能量 <concept> 的学习框架 <media> <misc> 评分函数 <org> <eve> <unk> <per> 函数函数学 <loc> part of</s>
|
||
2025-06-11 10:59:09,959 - DEBUG - 原始生成文本: <triplet> 于能量 <concept> 的学习框架 <media> <misc> 评分函数 <org> <eve> <unk> <per> 函数函数学 <loc> part of</s>
|
||
2025-06-11 10:59:09,959 - DEBUG - 处理后标记: ['<triplet>', '于能量', '<concept>', '的学习框架', '<media>', '<misc>', '评分函数', '<org>', '<eve>', '<unk>', '<per>', '函数函数学', '<loc>', 'part of']
|
||
2025-06-11 10:59:09,959 - DEBUG - 添加三元组: 于能量(concept) - <misc> - 的学习框架(media)
|
||
2025-06-11 10:59:09,959 - DEBUG - 块 49 提取到 1 个三元组
|
||
2025-06-11 10:59:09,959 - DEBUG - 处理块 50/753: h t
|
||
|
||
图 1 以TransE[15]和DistMult[38]为例说明基于距离和基于相似性匹配...
|
||
2025-06-11 10:59:10,610 - DEBUG - 块 50 生成文本: <triplet> 图 1 <concept> 基于相似性匹配的评分函数 <misc> 相似度 <media> <per> <unk> <loc> <dis> <eve> 论 <triplet> TransE[15] <org> TransMult[38] <cel> 类似的 <time> instance of</s>
|
||
2025-06-11 10:59:10,610 - DEBUG - 原始生成文本: <triplet> 图 1 <concept> 基于相似性匹配的评分函数 <misc> 相似度 <media> <per> <unk> <loc> <dis> <eve> 论 <triplet> TransE[15] <org> TransMult[38] <cel> 类似的 <time> instance of</s>
|
||
2025-06-11 10:59:10,610 - DEBUG - 处理后标记: ['<triplet>', '图 1', '<concept>', '基于相似性匹配的评分函数', '<misc>', '相似度', '<media>', '<per>', '<unk>', '<loc>', '<dis>', '<eve>', '论', '<triplet>', 'TransE[15]', '<org>', 'TransMult[38]', '<cel>', '类似的', '<time>', 'instance of']
|
||
2025-06-11 10:59:10,610 - DEBUG - 添加三元组: 图 1(concept) - 相似度 - 基于相似性匹配的评分函数(misc)
|
||
2025-06-11 10:59:10,610 - DEBUG - 添加三元组: TransE[15](org) - 类似的 - TransMult[38](cel)
|
||
2025-06-11 10:59:10,610 - DEBUG - 块 50 提取到 2 个三元组
|
||
2025-06-11 10:59:10,610 - DEBUG - 处理块 51/753: 翻译原理 被广泛使用. 也就是说, 基于距离的模型通常由关系执行翻译后, 根据两个实体之间的距离...
|
||
2025-06-11 10:59:11,090 - DEBUG - 块 51 生成文本: <triplet> 基本距离模型 <concept> 翻译模型和复杂关系建模 <unk> <misc> part of</s>
|
||
2025-06-11 10:59:11,090 - DEBUG - 原始生成文本: <triplet> 基本距离模型 <concept> 翻译模型和复杂关系建模 <unk> <misc> part of</s>
|
||
2025-06-11 10:59:11,091 - DEBUG - 处理后标记: ['<triplet>', '基本距离模型', '<concept>', '翻译模型和复杂关系建模', '<unk>', '<misc>', 'part of']
|
||
2025-06-11 10:59:11,091 - DEBUG - 添加三元组: 基本距离模型(concept) - <misc> - 翻译模型和复杂关系建模(unk)
|
||
2025-06-11 10:59:11,091 - DEBUG - 块 51 提取到 1 个三元组
|
||
2025-06-11 10:59:11,091 - DEBUG - 处理块 52/753: ● SE: 一种直观的基于距离的方法是计算实体在关系的对应空间中的投影向量之间的距离. 结构表示
|
||
(...
|
||
2025-06-11 10:59:11,571 - DEBUG - 块 52 生成文本: <triplet> 投影矩阵 <concept> 距离学习结构嵌入 <misc> 结构表示 <org> <media> <unk> <per> <triplet></s>
|
||
2025-06-11 10:59:11,571 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> 距离学习结构嵌入 <misc> 结构表示 <org> <media> <unk> <per> <triplet></s>
|
||
2025-06-11 10:59:11,571 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', '距离学习结构嵌入', '<misc>', '结构表示', '<org>', '<media>', '<unk>', '<per>', '<triplet>']
|
||
2025-06-11 10:59:11,571 - DEBUG - 添加三元组: 投影矩阵(concept) - 结构表示 - 距离学习结构嵌入(misc)
|
||
2025-06-11 10:59:11,571 - DEBUG - 块 52 提取到 1 个三元组
|
||
2025-06-11 10:59:11,571 - DEBUG - 处理块 53/753: fr (h;t)= −
|
||
‖‖‖M r;1h −M r;2t
|
||
‖‖‖1 (1)
|
||
|
||
该距离表明头实体h...
|
||
2025-06-11 10:59:11,763 - DEBUG - 块 53 生成文本: <triplet> 张天成 <misc> 矩阵 <concept> instance of</s>
|
||
2025-06-11 10:59:11,763 - DEBUG - 原始生成文本: <triplet> 张天成 <misc> 矩阵 <concept> instance of</s>
|
||
2025-06-11 10:59:11,763 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<misc>', '矩阵', '<concept>', 'instance of']
|
||
2025-06-11 10:59:11,763 - DEBUG - 添加三元组: 张天成(misc) - instance of - 矩阵(concept)
|
||
2025-06-11 10:59:11,763 - DEBUG - 块 53 提取到 1 个三元组
|
||
2025-06-11 10:59:11,763 - DEBUG - 处理块 54/753: 进行投影, 因此, SE模型的协同性较差, 无法精确刻画头、尾实体与关系之间语义联系的强弱.
|
||
2....
|
||
2025-06-11 10:59:11,911 - DEBUG - 块 54 生成文本: <triplet> 翻译模型 <concept> <misc> 2 <org> part of</s>
|
||
2025-06-11 10:59:11,912 - DEBUG - 原始生成文本: <triplet> 翻译模型 <concept> <misc> 2 <org> part of</s>
|
||
2025-06-11 10:59:11,912 - DEBUG - 处理后标记: ['<triplet>', '翻译模型', '<concept>', '<misc>', '2', '<org>', 'part of']
|
||
2025-06-11 10:59:11,912 - DEBUG - 处理块 55/753: ● TransE: Mikolov等人在2013年提出了Word2Vec词表示学习模型和工具包[40...
|
||
2025-06-11 10:59:12,660 - DEBUG - 块 55 生成文本: <triplet> 词向量空间 <concept> 学习模型 <media> Word2Vec词表示 <misc> <per> Word <org> <eve> Word3 <unk> <loc> <dis> WordWord2 ++ <triplet> Word4 <time> <date> point in time</s>
|
||
2025-06-11 10:59:12,660 - DEBUG - 原始生成文本: <triplet> 词向量空间 <concept> 学习模型 <media> Word2Vec词表示 <misc> <per> Word <org> <eve> Word3 <unk> <loc> <dis> WordWord2 ++ <triplet> Word4 <time> <date> point in time</s>
|
||
2025-06-11 10:59:12,660 - DEBUG - 处理后标记: ['<triplet>', '词向量空间', '<concept>', '学习模型', '<media>', 'Word2Vec词表示', '<misc>', '<per>', 'Word', '<org>', '<eve>', 'Word3', '<unk>', '<loc>', '<dis>', 'WordWord2 ++', '<triplet>', 'Word4', '<time>', '<date>', 'point in time']
|
||
2025-06-11 10:59:12,660 - DEBUG - 添加三元组: 词向量空间(concept) - Word2Vec词表示 - 学习模型(media)
|
||
2025-06-11 10:59:12,660 - DEBUG - 块 55 提取到 1 个三元组
|
||
2025-06-11 10:59:12,660 - DEBUG - 处理块 56/753: 型将关系和实体表示为同一空间中的向量. 给定事实 , 关系r的向量r被解释为头实体向量h与尾实体...
|
||
2025-06-11 10:59:13,173 - DEBUG - 块 56 生成文本: <triplet> 向量 <concept> TransE <misc> <media> 三元组 <dis> part of</s>
|
||
2025-06-11 10:59:13,173 - DEBUG - 原始生成文本: <triplet> 向量 <concept> TransE <misc> <media> 三元组 <dis> part of</s>
|
||
2025-06-11 10:59:13,173 - DEBUG - 处理后标记: ['<triplet>', '向量', '<concept>', 'TransE', '<misc>', '<media>', '三元组', '<dis>', 'part of']
|
||
2025-06-11 10:59:13,173 - DEBUG - 添加三元组: 向量(concept) - <media> - TransE(misc)
|
||
2025-06-11 10:59:13,173 - DEBUG - 块 56 提取到 1 个三元组
|
||
2025-06-11 10:59:13,173 - DEBUG - 处理块 57/753: fr (h;t)= −
|
||
‖‖‖h +r −t
|
||
‖‖‖1=2 (2)
|
||
|
||
h +r
|
||
L1
|
||
L2
|
||
即向量...
|
||
2025-06-11 10:59:13,471 - DEBUG - 块 57 生成文本: <triplet> 非结构模型 <concept> TransE <misc> part of</s>
|
||
2025-06-11 10:59:13,471 - DEBUG - 原始生成文本: <triplet> 非结构模型 <concept> TransE <misc> part of</s>
|
||
2025-06-11 10:59:13,471 - DEBUG - 处理后标记: ['<triplet>', '非结构模型', '<concept>', 'TransE', '<misc>', 'part of']
|
||
2025-06-11 10:59:13,471 - DEBUG - 添加三元组: 非结构模型(concept) - part of - TransE(misc)
|
||
2025-06-11 10:59:13,471 - DEBUG - 块 57 提取到 1 个三元组
|
||
2025-06-11 10:59:13,471 - DEBUG - 处理块 58/753: 有r=0, 则UM的评分函数为:
|
||
fr (h;t)= −∥h−t∥2
|
||
2 (3)
|
||
|
||
UM通常用作其...
|
||
2025-06-11 10:59:13,620 - DEBUG - 块 58 生成文本: <triplet> 实体空间 <concept> UM <misc> part of</s>
|
||
2025-06-11 10:59:13,621 - DEBUG - 原始生成文本: <triplet> 实体空间 <concept> UM <misc> part of</s>
|
||
2025-06-11 10:59:13,621 - DEBUG - 处理后标记: ['<triplet>', '实体空间', '<concept>', 'UM', '<misc>', 'part of']
|
||
2025-06-11 10:59:13,621 - DEBUG - 添加三元组: 实体空间(concept) - part of - UM(misc)
|
||
2025-06-11 10:59:13,621 - DEBUG - 块 58 提取到 1 个三元组
|
||
2025-06-11 10:59:13,621 - DEBUG - 处理块 59/753: (a) TransE (b) TransH (c) TransR ( 其中圆圈表示实体,三角形表示对...
|
||
2025-06-11 10:59:14,144 - DEBUG - 块 59 生成文本: <triplet> 图 2 <concept> TransR模型 <misc> part of</s>
|
||
2025-06-11 10:59:14,144 - DEBUG - 原始生成文本: <triplet> 图 2 <concept> TransR模型 <misc> part of</s>
|
||
2025-06-11 10:59:14,144 - DEBUG - 处理后标记: ['<triplet>', '图 2', '<concept>', 'TransR模型', '<misc>', 'part of']
|
||
2025-06-11 10:59:14,144 - DEBUG - 添加三元组: 图 2(concept) - part of - TransR模型(misc)
|
||
2025-06-11 10:59:14,144 - DEBUG - 块 59 提取到 1 个三元组
|
||
2025-06-11 10:59:14,144 - DEBUG - 处理块 60/753: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, ...
|
||
2025-06-11 10:59:14,485 - DEBUG - 块 60 生成文本: <triplet> 复杂关系建模 <concept> 知识库 <media> part of</s>
|
||
2025-06-11 10:59:14,485 - DEBUG - 原始生成文本: <triplet> 复杂关系建模 <concept> 知识库 <media> part of</s>
|
||
2025-06-11 10:59:14,485 - DEBUG - 处理后标记: ['<triplet>', '复杂关系建模', '<concept>', '知识库', '<media>', 'part of']
|
||
2025-06-11 10:59:14,485 - DEBUG - 添加三元组: 复杂关系建模(concept) - part of - 知识库(media)
|
||
2025-06-11 10:59:14,485 - DEBUG - 块 60 提取到 1 个三元组
|
||
2025-06-11 10:59:14,485 - DEBUG - 处理块 61/753: 这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-...
|
||
2025-06-11 10:59:14,689 - DEBUG - 块 61 生成文本: <triplet> 复杂关系 <concept> 4种类型 <misc> part of</s>
|
||
2025-06-11 10:59:14,689 - DEBUG - 原始生成文本: <triplet> 复杂关系 <concept> 4种类型 <misc> part of</s>
|
||
2025-06-11 10:59:14,689 - DEBUG - 处理后标记: ['<triplet>', '复杂关系', '<concept>', '4种类型', '<misc>', 'part of']
|
||
2025-06-11 10:59:14,689 - DEBUG - 添加三元组: 复杂关系(concept) - part of - 4种类型(misc)
|
||
2025-06-11 10:59:14,689 - DEBUG - 块 61 提取到 1 个三元组
|
||
2025-06-11 10:59:14,689 - DEBUG - 处理块 62/753: 例如: 事实“比尔·克林顿在1993年到2001年间担任美国总统”可以被抽象为如下三元组:
|
||
(hi ...
|
||
2025-06-11 10:59:14,977 - DEBUG - 块 62 生成文本: <triplet> 比尔·克林顿 <per> 美国总统 <concept> position held</s>
|
||
2025-06-11 10:59:14,977 - DEBUG - 原始生成文本: <triplet> 比尔·克林顿 <per> 美国总统 <concept> position held</s>
|
||
2025-06-11 10:59:14,977 - DEBUG - 处理后标记: ['<triplet>', '比尔·克林顿', '<per>', '美国总统', '<concept>', 'position held']
|
||
2025-06-11 10:59:14,977 - DEBUG - 添加三元组: 比尔·克林顿(per) - position held - 美国总统(concept)
|
||
2025-06-11 10:59:14,977 - DEBUG - 块 62 提取到 1 个三元组
|
||
2025-06-11 10:59:14,977 - DEBUG - 处理块 63/753: (hj : GeorgeWalkerBush;rj : wasPresidentOf;tj: USA...
|
||
2025-06-11 10:59:15,308 - DEBUG - 块 63 生成文本: <triplet> 实体 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 10:59:15,308 - DEBUG - 原始生成文本: <triplet> 实体 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 10:59:15,308 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 10:59:15,308 - DEBUG - 添加三元组: 实体(concept) - part of - 三元组(misc)
|
||
2025-06-11 10:59:15,308 - DEBUG - 块 63 提取到 1 个三元组
|
||
2025-06-11 10:59:15,308 - DEBUG - 处理块 64/753: 元组学习知识表示, TransE会推导出 的错误结论. 为了解决这一问题, 近年来涌现了大量关于...
|
||
2025-06-11 10:59:15,501 - DEBUG - 块 64 生成文本: <triplet> 元组学习知识 <concept> Point-Wise空间 <misc> part of</s>
|
||
2025-06-11 10:59:15,502 - DEBUG - 原始生成文本: <triplet> 元组学习知识 <concept> Point-Wise空间 <misc> part of</s>
|
||
2025-06-11 10:59:15,502 - DEBUG - 处理后标记: ['<triplet>', '元组学习知识', '<concept>', 'Point-Wise空间', '<misc>', 'part of']
|
||
2025-06-11 10:59:15,502 - DEBUG - 添加三元组: 元组学习知识(concept) - part of - Point-Wise空间(misc)
|
||
2025-06-11 10:59:15,502 - DEBUG - 块 64 提取到 1 个三元组
|
||
2025-06-11 10:59:15,502 - DEBUG - 处理块 65/753: Point-Wise欧氏空间广泛应用于表示实体和关系, 在向量或矩阵空间中投影关系嵌入, 或者捕捉关...
|
||
2025-06-11 10:59:16,005 - DEBUG - 块 65 生成文本: <triplet> 投影关系 <concept> 矩阵空间 <misc> <triplet> r <unk> Point-Wise欧氏 <media> <dis> Point <loc> part of</s>
|
||
2025-06-11 10:59:16,005 - DEBUG - 原始生成文本: <triplet> 投影关系 <concept> 矩阵空间 <misc> <triplet> r <unk> Point-Wise欧氏 <media> <dis> Point <loc> part of</s>
|
||
2025-06-11 10:59:16,005 - DEBUG - 处理后标记: ['<triplet>', '投影关系', '<concept>', '矩阵空间', '<misc>', '<triplet>', 'r', '<unk>', 'Point-Wise欧氏', '<media>', '<dis>', 'Point', '<loc>', 'part of']
|
||
2025-06-11 10:59:16,005 - DEBUG - 添加三元组: 投影关系(concept) - <triplet> - 矩阵空间(misc)
|
||
2025-06-11 10:59:16,005 - DEBUG - 块 65 提取到 1 个三元组
|
||
2025-06-11 10:59:16,005 - DEBUG - 处理块 66/753: ● TransH: TransH模型[16]使得一个实体在涉及不同关系时具有分布式表示. 如图2(b...
|
||
2025-06-11 10:59:16,616 - DEBUG - 块 66 生成文本: <triplet> 向量 <concept> TransH <misc> 超平面 <dis> 三元组 <loc> <cel> <triplet> Trans H <media> <time> 模 <org> <per> <unk> <eve> 表 <date> point in time</s>
|
||
2025-06-11 10:59:16,616 - DEBUG - 原始生成文本: <triplet> 向量 <concept> TransH <misc> 超平面 <dis> 三元组 <loc> <cel> <triplet> Trans H <media> <time> 模 <org> <per> <unk> <eve> 表 <date> point in time</s>
|
||
2025-06-11 10:59:16,616 - DEBUG - 处理后标记: ['<triplet>', '向量', '<concept>', 'TransH', '<misc>', '超平面', '<dis>', '三元组', '<loc>', '<cel>', '<triplet>', 'Trans H', '<media>', '<time>', '模', '<org>', '<per>', '<unk>', '<eve>', '表', '<date>', 'point in time']
|
||
2025-06-11 10:59:16,616 - DEBUG - 添加三元组: 向量(concept) - 超平面 - TransH(misc)
|
||
2025-06-11 10:59:16,616 - DEBUG - 块 66 提取到 1 个三元组
|
||
2025-06-11 10:59:16,616 - DEBUG - 处理块 67/753: , TransH首先将头实体向量h与尾实体向量 沿法线 投影到关系r对应的超平面上,
|
||
投...
|
||
2025-06-11 10:59:16,818 - DEBUG - 块 67 生成文本: <triplet> 软件学报 2023年第 34卷 <unk> <concept> is a list of</s>
|
||
2025-06-11 10:59:16,818 - DEBUG - 原始生成文本: <triplet> 软件学报 2023年第 34卷 <unk> <concept> is a list of</s>
|
||
2025-06-11 10:59:16,818 - DEBUG - 处理后标记: ['<triplet>', '软件学报 2023年第 34卷', '<unk>', '<concept>', 'is a list of']
|
||
2025-06-11 10:59:16,818 - DEBUG - 处理块 68/753: h⊥ +r ≈ t⊥
|
||
如果三元组 成立, 即 , 假设投影在超平面上由r以低误差连接, 则T...
|
||
2025-06-11 10:59:17,298 - DEBUG - 块 68 生成文本: <triplet> <concept> TransH <misc> part of <triplet> Trans H <media> 评分函数 <unk> <loc> <per> <dis> 三元组 <org> <eve> <time> <cel> <date> point in time</s>
|
||
2025-06-11 10:59:17,298 - DEBUG - 原始生成文本: <triplet> <concept> TransH <misc> part of <triplet> Trans H <media> 评分函数 <unk> <loc> <per> <dis> 三元组 <org> <eve> <time> <cel> <date> point in time</s>
|
||
2025-06-11 10:59:17,299 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransH', '<misc>', 'part of', '<triplet>', 'Trans H', '<media>', '评分函数', '<unk>', '<loc>', '<per>', '<dis>', '三元组', '<org>', '<eve>', '<time>', '<cel>', '<date>', 'point in time']
|
||
2025-06-11 10:59:17,299 - DEBUG - 处理块 69/753: ● TransR: TransE和TransH模型假定实体和关系嵌入在同一空间 中, 但是关系和...
|
||
2025-06-11 10:59:17,564 - DEBUG - 块 69 生成文本: <triplet> 实体 <concept> TransR <misc> part of</s>
|
||
2025-06-11 10:59:17,565 - DEBUG - 原始生成文本: <triplet> 实体 <concept> TransR <misc> part of</s>
|
||
2025-06-11 10:59:17,565 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', 'TransR', '<misc>', 'part of']
|
||
2025-06-11 10:59:17,565 - DEBUG - 添加三元组: 实体(concept) - part of - TransR(misc)
|
||
2025-06-11 10:59:17,565 - DEBUG - 块 69 提取到 1 个三元组
|
||
2025-06-11 10:59:17,565 - DEBUG - 处理块 70/753: 而在某些特定属性上不同, 在对应的关系空间中应彼此远离. 为了解决这个问题, Lin等人[43]提出...
|
||
2025-06-11 10:59:17,758 - DEBUG - 块 70 生成文本: <triplet> 实体空间 <concept> TransR <misc> part of</s>
|
||
2025-06-11 10:59:17,758 - DEBUG - 原始生成文本: <triplet> 实体空间 <concept> TransR <misc> part of</s>
|
||
2025-06-11 10:59:17,758 - DEBUG - 处理后标记: ['<triplet>', '实体空间', '<concept>', 'TransR', '<misc>', 'part of']
|
||
2025-06-11 10:59:17,758 - DEBUG - 添加三元组: 实体空间(concept) - part of - TransR(misc)
|
||
2025-06-11 10:59:17,758 - DEBUG - 块 70 提取到 1 个三元组
|
||
2025-06-11 10:59:17,758 - DEBUG - 处理块 71/753: TransR的基本思想如图2(c)所示, 对于每个三元组 , 首先将头、尾实体向量向关系r空间投...
|
||
2025-06-11 10:59:18,111 - DEBUG - 块 71 生成文本: <triplet> 实体 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 10:59:18,111 - DEBUG - 原始生成文本: <triplet> 实体 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 10:59:18,112 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 10:59:18,112 - DEBUG - 添加三元组: 实体(concept) - part of - 三元组(misc)
|
||
2025-06-11 10:59:18,112 - DEBUG - 块 71 提取到 1 个三元组
|
||
2025-06-11 10:59:18,112 - DEBUG - 处理块 72/753: 影矩阵 , 将实体 从实体空间投影到关系 空间. 利用投影矩阵, 实体的投影向量定义如下...
|
||
2025-06-11 10:59:18,473 - DEBUG - 块 72 生成文本: <triplet> 投影向量 <concept> 影矩阵 <misc> part of</s>
|
||
2025-06-11 10:59:18,474 - DEBUG - 原始生成文本: <triplet> 投影向量 <concept> 影矩阵 <misc> part of</s>
|
||
2025-06-11 10:59:18,474 - DEBUG - 处理后标记: ['<triplet>', '投影向量', '<concept>', '影矩阵', '<misc>', 'part of']
|
||
2025-06-11 10:59:18,474 - DEBUG - 添加三元组: 投影向量(concept) - part of - 影矩阵(misc)
|
||
2025-06-11 10:59:18,474 - DEBUG - 块 72 提取到 1 个三元组
|
||
2025-06-11 10:59:18,474 - DEBUG - 处理块 73/753: fr (h;t) = −∥h⊥ +r−t⊥∥2
|
||
2 (7)
|
||
|
||
Mr
|
||
● TransD: 虽然Tra...
|
||
2025-06-11 10:59:19,050 - DEBUG - 块 73 生成文本: <triplet> <concept> TransR <misc> part of the series <triplet> TransD <media> TransE <org> TransH <eve> Trans <dis> Trans R <loc> Trans D <unk> <per> <time> <cel> . <date> point in the Series</s>
|
||
2025-06-11 10:59:19,050 - DEBUG - 原始生成文本: <triplet> <concept> TransR <misc> part of the series <triplet> TransD <media> TransE <org> TransH <eve> Trans <dis> Trans R <loc> Trans D <unk> <per> <time> <cel> . <date> point in the Series</s>
|
||
2025-06-11 10:59:19,050 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransR', '<misc>', 'part of the series', '<triplet>', 'TransD', '<media>', 'TransE', '<org>', 'TransH', '<eve>', 'Trans', '<dis>', 'Trans R', '<loc>', 'Trans D', '<unk>', '<per>', '<time>', '<cel>', '.', '<date>', 'point in the Series']
|
||
2025-06-11 10:59:19,050 - DEBUG - 处理块 74/753: 实体共享相同的投影矩阵 , 忽略了头、尾实体不同的类型和属性; ② 投影操作是实体与关系之间的交...
|
||
2025-06-11 10:59:19,562 - DEBUG - 块 74 生成文本: <triplet> 矩阵-向量乘法 <concept> TransR模型 <misc> 投影操作 <media> 实体共享相同的投影 <eve> <org> 交互过程 <unk> <time> 图谱 <loc> part of</s>
|
||
2025-06-11 10:59:19,562 - DEBUG - 原始生成文本: <triplet> 矩阵-向量乘法 <concept> TransR模型 <misc> 投影操作 <media> 实体共享相同的投影 <eve> <org> 交互过程 <unk> <time> 图谱 <loc> part of</s>
|
||
2025-06-11 10:59:19,562 - DEBUG - 处理后标记: ['<triplet>', '矩阵-向量乘法', '<concept>', 'TransR模型', '<misc>', '投影操作', '<media>', '实体共享相同的投影', '<eve>', '<org>', '交互过程', '<unk>', '<time>', '图谱', '<loc>', 'part of']
|
||
2025-06-11 10:59:19,562 - DEBUG - 添加三元组: 矩阵-向量乘法(concept) - 投影操作 - TransR模型(misc)
|
||
2025-06-11 10:59:19,562 - DEBUG - 块 74 提取到 1 个三元组
|
||
2025-06-11 10:59:19,563 - DEBUG - 处理块 75/753: Mrt
|
||
whi
|
||
wti
|
||
(i = 1;2;3)
|
||
wr
|
||
hi⊥
|
||
ti⊥
|
||
hi⊥ +r ≈ ti⊥
|
||
(i...
|
||
2025-06-11 10:59:19,839 - DEBUG - 块 75 生成文本: <triplet> <concept> Rk <misc> part of <triplet> Mrh <media> Mrt <org> Rd <dis> follows</s>
|
||
2025-06-11 10:59:19,839 - DEBUG - 原始生成文本: <triplet> <concept> Rk <misc> part of <triplet> Mrh <media> Mrt <org> Rd <dis> follows</s>
|
||
2025-06-11 10:59:19,839 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Rk', '<misc>', 'part of', '<triplet>', 'Mrh', '<media>', 'Mrt', '<org>', 'Rd', '<dis>', 'follows']
|
||
2025-06-11 10:59:19,839 - DEBUG - 处理块 76/753: 为此, Ji等人[44]提出改进模型TransD, 图3显示了其基本思想, 每个形状表示出现在关系r...
|
||
2025-06-11 10:59:20,361 - DEBUG - 块 76 生成文本: <triplet> 投影矩阵 <concept> TransD <misc> 关系r的三元组 <unk> <media> 实体 <dis> <cel> <triplet> t的投影向量 <loc> 的关系r <org> <time> part of</s>
|
||
2025-06-11 10:59:20,362 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> TransD <misc> 关系r的三元组 <unk> <media> 实体 <dis> <cel> <triplet> t的投影向量 <loc> 的关系r <org> <time> part of</s>
|
||
2025-06-11 10:59:20,362 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', 'TransD', '<misc>', '关系r的三元组', '<unk>', '<media>', '实体', '<dis>', '<cel>', '<triplet>', 't的投影向量', '<loc>', '的关系r', '<org>', '<time>', 'part of']
|
||
2025-06-11 10:59:20,362 - DEBUG - 添加三元组: 投影矩阵(concept) - 关系r的三元组 - TransD(misc)
|
||
2025-06-11 10:59:20,362 - DEBUG - 添加三元组: t的投影向量(loc) - <time> - 的关系r(org)
|
||
2025-06-11 10:59:20,362 - DEBUG - 块 76 提取到 2 个三元组
|
||
2025-06-11 10:59:20,362 - DEBUG - 处理块 77/753: 满足 . TransD为每个实体和关系定义两个向量, 一个是实体/关系表示, 另一个用于构...
|
||
2025-06-11 10:59:20,532 - DEBUG - 块 77 生成文本: <triplet> 投影 矩阵 <concept> TransD <misc> part of</s>
|
||
2025-06-11 10:59:20,532 - DEBUG - 原始生成文本: <triplet> 投影 矩阵 <concept> TransD <misc> part of</s>
|
||
2025-06-11 10:59:20,532 - DEBUG - 处理后标记: ['<triplet>', '投影 矩阵', '<concept>', 'TransD', '<misc>', 'part of']
|
||
2025-06-11 10:59:20,533 - DEBUG - 添加三元组: 投影 矩阵(concept) - part of - TransD(misc)
|
||
2025-06-11 10:59:20,533 - DEBUG - 块 77 提取到 1 个三元组
|
||
2025-06-11 10:59:20,533 - DEBUG - 处理块 78/753: 实体与尾实体投影到关系空间的投影矩阵 , , 具体定义如下:
|
||
Mrh = wrw⊤
|
||
h +...
|
||
2025-06-11 10:59:21,204 - DEBUG - 块 78 生成文本: <triplet> 投影矩阵 <concept> 实体空间 <unk> 关系空间 r <dis> <misc> <media> <cel> part of</s>
|
||
2025-06-11 10:59:21,205 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> 实体空间 <unk> 关系空间 r <dis> <misc> <media> <cel> part of</s>
|
||
2025-06-11 10:59:21,205 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', '实体空间', '<unk>', '关系空间 r', '<dis>', '<misc>', '<media>', '<cel>', 'part of']
|
||
2025-06-11 10:59:21,205 - DEBUG - 添加三元组: 投影矩阵(concept) - 关系空间 r - 实体空间(unk)
|
||
2025-06-11 10:59:21,205 - DEBUG - 块 78 提取到 1 个三元组
|
||
2025-06-11 10:59:21,205 - DEBUG - 处理块 79/753: h3⊥
|
||
⊥
|
||
⊥ r
|
||
r
|
||
r
|
||
t1
|
||
t2⊥
|
||
t3⊥
|
||
wrwhi+
|
||
Mrti= Ik×d
|
||
Ik×d
|
||
|
||
...
|
||
2025-06-11 10:59:21,481 - DEBUG - 块 79 生成文本: <triplet> <concept> TransR面 <misc> part of</s>
|
||
2025-06-11 10:59:21,481 - DEBUG - 原始生成文本: <triplet> <concept> TransR面 <misc> part of</s>
|
||
2025-06-11 10:59:21,481 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransR面', '<misc>', 'part of']
|
||
2025-06-11 10:59:21,481 - DEBUG - 处理块 80/753: 临的参数众多问题. 对于三元组 , TransD的评分函数定义如下:
|
||
fr (h;t) = −∥...
|
||
2025-06-11 10:59:22,229 - DEBUG - 块 80 生成文本: <triplet> 嵌入模型 <concept> 临的参数众多问题 <media> 三元组 <misc> 评分函数定义如下 <unk> <eve> 函数 <org> <per> part of</s>
|
||
2025-06-11 10:59:22,229 - DEBUG - 原始生成文本: <triplet> 嵌入模型 <concept> 临的参数众多问题 <media> 三元组 <misc> 评分函数定义如下 <unk> <eve> 函数 <org> <per> part of</s>
|
||
2025-06-11 10:59:22,229 - DEBUG - 处理后标记: ['<triplet>', '嵌入模型', '<concept>', '临的参数众多问题', '<media>', '三元组', '<misc>', '评分函数定义如下', '<unk>', '<eve>', '函数', '<org>', '<per>', 'part of']
|
||
2025-06-11 10:59:22,229 - DEBUG - 添加三元组: 嵌入模型(concept) - 三元组 - 临的参数众多问题(media)
|
||
2025-06-11 10:59:22,229 - DEBUG - 块 80 提取到 1 个三元组
|
||
2025-06-11 10:59:22,229 - DEBUG - 处理块 81/753: STransE[45], 该模型将每个实体表示为一个低维向量, 并通过两个矩阵和一个平移向量表示每个...
|
||
2025-06-11 10:59:22,579 - DEBUG - 块 81 生成文本: <triplet> 移向量 <concept> STransE[45 <misc> <media> <dis> <time> <eve> <cel> <unk> <per> <loc></s>
|
||
2025-06-11 10:59:22,580 - DEBUG - 原始生成文本: <triplet> 移向量 <concept> STransE[45 <misc> <media> <dis> <time> <eve> <cel> <unk> <per> <loc></s>
|
||
2025-06-11 10:59:22,580 - DEBUG - 处理后标记: ['<triplet>', '移向量', '<concept>', 'STransE[45', '<misc>', '<media>', '<dis>', '<time>', '<eve>', '<cel>', '<unk>', '<per>', '<loc>']
|
||
2025-06-11 10:59:22,580 - DEBUG - 添加三元组: 移向量(concept) - <media> - STransE[45(misc)
|
||
2025-06-11 10:59:22,580 - DEBUG - 块 81 提取到 1 个三元组
|
||
2025-06-11 10:59:22,580 - DEBUG - 处理块 82/753: STransE可以看作是TransR模型的扩展. 它对每个关系使用两个投影矩阵, 一个用于头实体, ...
|
||
2025-06-11 10:59:23,231 - DEBUG - 块 82 生成文本: <triplet> <concept> 知识图谱的异质性 <misc> 的知识库中一些关系 <media> <org> 知識库 <unk> <eve> 库里 <loc> part of</s>
|
||
2025-06-11 10:59:23,231 - DEBUG - 原始生成文本: <triplet> <concept> 知识图谱的异质性 <misc> 的知识库中一些关系 <media> <org> 知識库 <unk> <eve> 库里 <loc> part of</s>
|
||
2025-06-11 10:59:23,231 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '知识图谱的异质性', '<misc>', '的知识库中一些关系', '<media>', '<org>', '知識库', '<unk>', '<eve>', '库里', '<loc>', 'part of']
|
||
2025-06-11 10:59:23,231 - DEBUG - 处理块 83/753: 连接许多实体对, 而另一些关系则不连接)和不平衡性(不平衡性指一个关系中头实体与尾实体的数目可能不同...
|
||
2025-06-11 10:59:23,539 - DEBUG - 块 83 生成文本: <triplet> 张天成 <concept> 知识图谱嵌入技术研究综述 <unk> 等 <org> is a list of</s>
|
||
2025-06-11 10:59:23,539 - DEBUG - 原始生成文本: <triplet> 张天成 <concept> 知识图谱嵌入技术研究综述 <unk> 等 <org> is a list of</s>
|
||
2025-06-11 10:59:23,540 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<concept>', '知识图谱嵌入技术研究综述', '<unk>', '等', '<org>', 'is a list of']
|
||
2025-06-11 10:59:23,540 - DEBUG - 添加三元组: 张天成(concept) - 等 - 知识图谱嵌入技术研究综述(unk)
|
||
2025-06-11 10:59:23,540 - DEBUG - 块 83 提取到 1 个三元组
|
||
2025-06-11 10:59:23,540 - DEBUG - 处理块 84/753: 为了处理这两个问题, Ji等人提出了TranSparse模型[46], 它有TranSparse(s...
|
||
2025-06-11 10:59:24,061 - DEBUG - 块 84 生成文本: <triplet> <concept> Rk×d r <unk> 1 <misc> part of</s>
|
||
2025-06-11 10:59:24,061 - DEBUG - 原始生成文本: <triplet> <concept> Rk×d r <unk> 1 <misc> part of</s>
|
||
2025-06-11 10:59:24,062 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Rk×d r', '<unk>', '1', '<misc>', 'part of']
|
||
2025-06-11 10:59:24,062 - DEBUG - 处理块 85/753: 为了克服异质性, TranSparse(share)模型中投影矩阵的稀疏度由关系连接的实体对数量决定...
|
||
2025-06-11 10:59:24,263 - DEBUG - 块 85 生成文本: <triplet> 投影矩阵 <concept> TranSparse <misc> used by</s>
|
||
2025-06-11 10:59:24,263 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> TranSparse <misc> used by</s>
|
||
2025-06-11 10:59:24,263 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', 'TranSparse', '<misc>', 'used by']
|
||
2025-06-11 10:59:24,263 - DEBUG - 添加三元组: 投影矩阵(concept) - used by - TranSparse(misc)
|
||
2025-06-11 10:59:24,263 - DEBUG - 块 85 提取到 1 个三元组
|
||
2025-06-11 10:59:24,263 - DEBUG - 处理块 86/753: , 表示关系r连接的实体对数量, 表示它们的最大数量, 是计算稀疏度的超参数....
|
||
2025-06-11 10:59:24,508 - DEBUG - 块 86 生成文本: <triplet> <concept> 影矩阵 <misc> part of</s>
|
||
2025-06-11 10:59:24,508 - DEBUG - 原始生成文本: <triplet> <concept> 影矩阵 <misc> part of</s>
|
||
2025-06-11 10:59:24,508 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '影矩阵', '<misc>', 'part of']
|
||
2025-06-11 10:59:24,508 - DEBUG - 处理块 87/753: Mt
|
||
r
|
||
( t
|
||
r
|
||
) ∈ Rk×d
|
||
Nl
|
||
r
|
||
l = h;t
|
||
Nl∗
|
||
r∗
|
||
Nl
|
||
r
|
||
为了处理...
|
||
2025-06-11 10:59:25,008 - DEBUG - 块 87 生成文本: <triplet> <concept> Ji等人 <per> discoverer <media> <misc> <unk> <dis> ∈ Rk×d <loc> <eve> <org> <cel> 그래 <triplet> Nl <time> <num></s>
|
||
2025-06-11 10:59:25,008 - DEBUG - 原始生成文本: <triplet> <concept> Ji等人 <per> discoverer <media> <misc> <unk> <dis> ∈ Rk×d <loc> <eve> <org> <cel> 그래 <triplet> Nl <time> <num></s>
|
||
2025-06-11 10:59:25,008 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Ji等人', '<per>', 'discoverer', '<media>', '<misc>', '<unk>', '<dis>', '∈ Rk×d', '<loc>', '<eve>', '<org>', '<cel>', '그래', '<triplet>', 'Nl', '<time>', '<num>']
|
||
2025-06-11 10:59:25,008 - DEBUG - 处理块 88/753: 投影矩阵, 分别用于头实体与尾实体, 稀疏度由关系连接的头(尾)实体数量确定. 具体来说, 在Tra...
|
||
2025-06-11 10:59:25,456 - DEBUG - 块 88 生成文本: <triplet> 投影矩阵 <concept> TranSparse <misc> part of</s>
|
||
2025-06-11 10:59:25,456 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> TranSparse <misc> part of</s>
|
||
2025-06-11 10:59:25,456 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', 'TranSparse', '<misc>', 'part of']
|
||
2025-06-11 10:59:25,456 - DEBUG - 添加三元组: 投影矩阵(concept) - part of - TranSparse(misc)
|
||
2025-06-11 10:59:25,456 - DEBUG - 块 88 提取到 1 个三元组
|
||
2025-06-11 10:59:25,456 - DEBUG - 处理块 89/753: 系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体...
|
||
2025-06-11 10:59:25,925 - DEBUG - 块 89 生成文本: <triplet> 投影向量 <concept> 稀疏度</s>
|
||
2025-06-11 10:59:25,925 - DEBUG - 原始生成文本: <triplet> 投影向量 <concept> 稀疏度</s>
|
||
2025-06-11 10:59:25,925 - DEBUG - 处理后标记: ['<triplet>', '投影向量', '<concept>', '稀疏度']
|
||
2025-06-11 10:59:25,925 - DEBUG - 处理块 90/753: h;t⊥ = Mt
|
||
r
|
||
( t
|
||
r
|
||
)t (13)
|
||
|
||
(h;r;t)
|
||
wr
|
||
● TransM: ...
|
||
2025-06-11 10:59:26,148 - DEBUG - 块 90 生成文本: <triplet> <unk> 事实三元组 <concept> subclass of</s>
|
||
2025-06-11 10:59:26,148 - DEBUG - 原始生成文本: <triplet> <unk> 事实三元组 <concept> subclass of</s>
|
||
2025-06-11 10:59:26,148 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '事实三元组', '<concept>', 'subclass of']
|
||
2025-06-11 10:59:26,148 - DEBUG - 处理块 91/753: fr (h;t)= wr∥h+r−t∥1=2 (14)
|
||
|
||
h
|
||
r
|
||
t ∈ Rd
|
||
其中, , ...
|
||
2025-06-11 10:59:26,456 - DEBUG - 块 91 生成文本: <triplet> <concept> TransE模型 <misc> part of</s>
|
||
2025-06-11 10:59:26,456 - DEBUG - 原始生成文本: <triplet> <concept> TransE模型 <misc> part of</s>
|
||
2025-06-11 10:59:26,457 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransE模型', '<misc>', 'part of']
|
||
2025-06-11 10:59:26,457 - DEBUG - 处理块 92/753: TransE TransM
|
||
tr
|
||
h
|
||
r
|
||
h
|
||
t1
|
||
t2
|
||
mtt1, t2, ..., tm
|
||
|
||
图...
|
||
2025-06-11 10:59:26,584 - DEBUG - 块 92 生成文本: <triplet> <misc> 扩展模型 <concept> instance of</s>
|
||
2025-06-11 10:59:26,584 - DEBUG - 原始生成文本: <triplet> <misc> 扩展模型 <concept> instance of</s>
|
||
2025-06-11 10:59:26,584 - DEBUG - 处理后标记: ['<triplet>', '<misc>', '扩展模型', '<concept>', 'instance of']
|
||
2025-06-11 10:59:26,585 - DEBUG - 处理块 93/753: 嵌入拓扑, 而球形等势超曲面的灵活性不足以表征拓扑结构. ② 损失函数过于简化, 实体和关系向量的每...
|
||
2025-06-11 10:59:27,011 - DEBUG - 块 93 生成文本: <triplet> 势超曲面 <concept> 拓扑结构.2 <media> 损失函数 <misc> 实体和关系向量 <triplet> TransA <eve> Xiao <per> named after</s>
|
||
2025-06-11 10:59:27,011 - DEBUG - 原始生成文本: <triplet> 势超曲面 <concept> 拓扑结构.2 <media> 损失函数 <misc> 实体和关系向量 <triplet> TransA <eve> Xiao <per> named after</s>
|
||
2025-06-11 10:59:27,011 - DEBUG - 处理后标记: ['<triplet>', '势超曲面', '<concept>', '拓扑结构.2', '<media>', '损失函数', '<misc>', '实体和关系向量', '<triplet>', 'TransA', '<eve>', 'Xiao', '<per>', 'named after']
|
||
2025-06-11 10:59:27,011 - DEBUG - 添加三元组: 势超曲面(concept) - 损失函数 - 拓扑结构.2(media)
|
||
2025-06-11 10:59:27,011 - DEBUG - 添加三元组: TransA(eve) - named after - Xiao(per)
|
||
2025-06-11 10:59:27,011 - DEBUG - 块 93 提取到 2 个三元组
|
||
2025-06-11 10:59:27,011 - DEBUG - 处理块 94/753: TransA利用绝对损失的自适应马氏距离取代相对不够灵活的欧几里德距离[49]. 评分函数定义为:
|
||
...
|
||
2025-06-11 10:59:27,596 - DEBUG - 块 94 生成文本: <triplet> 马氏距离 <concept> 欧几里德距离</s>
|
||
2025-06-11 10:59:27,596 - DEBUG - 原始生成文本: <triplet> 马氏距离 <concept> 欧几里德距离</s>
|
||
2025-06-11 10:59:27,596 - DEBUG - 处理后标记: ['<triplet>', '马氏距离', '<concept>', '欧几里德距离']
|
||
2025-06-11 10:59:27,597 - DEBUG - 处理块 95/753: h;t;r ∈ Rd
|
||
Mr ∈ Rd×d
|
||
其中, , , 是与自适应度量相对应的关...
|
||
2025-06-11 10:59:28,196 - DEBUG - 块 95 生成文本: <triplet> <concept> TransA <misc> subclass of <triplet> Rd <unk> <dis> <cel> 权重矩阵 <media> <eve> 対 定 <per> <org> 域 <loc> part of</s>
|
||
2025-06-11 10:59:28,196 - DEBUG - 原始生成文本: <triplet> <concept> TransA <misc> subclass of <triplet> Rd <unk> <dis> <cel> 权重矩阵 <media> <eve> 対 定 <per> <org> 域 <loc> part of</s>
|
||
2025-06-11 10:59:28,196 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransA', '<misc>', 'subclass of', '<triplet>', 'Rd', '<unk>', '<dis>', '<cel>', '权重矩阵', '<media>', '<eve>', '対 定', '<per>', '<org>', '域', '<loc>', 'part of']
|
||
2025-06-11 10:59:28,196 - DEBUG - 处理块 96/753: 以被视为加权转换后的特征维数, 抑制了来自无关维度的噪声.
|
||
h+r
|
||
t−r
|
||
t
|
||
h
|
||
● TransF...
|
||
2025-06-11 10:59:28,355 - DEBUG - 块 96 生成文本: <triplet> 翻译原理 <concept> Feng等人 <org> part of</s>
|
||
2025-06-11 10:59:28,356 - DEBUG - 原始生成文本: <triplet> 翻译原理 <concept> Feng等人 <org> part of</s>
|
||
2025-06-11 10:59:28,356 - DEBUG - 处理后标记: ['<triplet>', '翻译原理', '<concept>', 'Feng等人', '<org>', 'part of']
|
||
2025-06-11 10:59:28,356 - DEBUG - 添加三元组: 翻译原理(concept) - part of - Feng等人(org)
|
||
2025-06-11 10:59:28,356 - DEBUG - 块 96 提取到 1 个三元组
|
||
2025-06-11 10:59:28,356 - DEBUG - 处理块 97/753: 此, 提出允许灵活的翻译对复杂多样的实体和关系建模, 即: 仅约束 (或 )的方向与 (...
|
||
2025-06-11 10:59:29,019 - DEBUG - 块 97 生成文本: <triplet> 评分函数 <concept> Rd <misc> part of</s>
|
||
2025-06-11 10:59:29,019 - DEBUG - 原始生成文本: <triplet> 评分函数 <concept> Rd <misc> part of</s>
|
||
2025-06-11 10:59:29,019 - DEBUG - 处理后标记: ['<triplet>', '评分函数', '<concept>', 'Rd', '<misc>', 'part of']
|
||
2025-06-11 10:59:29,019 - DEBUG - 添加三元组: 评分函数(concept) - part of - Rd(misc)
|
||
2025-06-11 10:59:29,019 - DEBUG - 块 97 提取到 1 个三元组
|
||
2025-06-11 10:59:29,019 - DEBUG - 处理块 98/753: 其中, h, r, . TransF模型遵循“灵活翻译”的原则, 因此在处理复杂关系时, 可以...
|
||
2025-06-11 10:59:29,350 - DEBUG - 块 98 生成文本: <triplet> <concept> ITransF <misc> used by</s>
|
||
2025-06-11 10:59:29,350 - DEBUG - 原始生成文本: <triplet> <concept> ITransF <misc> used by</s>
|
||
2025-06-11 10:59:29,350 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ITransF', '<misc>', 'used by']
|
||
2025-06-11 10:59:29,350 - DEBUG - 处理块 99/753: 型ITransF[51], 通过稀疏注意力向量学习关系与概念之间的关联, 实现了隐藏概念的发现和统计...
|
||
2025-06-11 10:59:29,733 - DEBUG - 块 99 生成文本: <triplet> 软件学报 2023年第 34卷 <concept> 2023年 <date> point in time</s>
|
||
2025-06-11 10:59:29,734 - DEBUG - 原始生成文本: <triplet> 软件学报 2023年第 34卷 <concept> 2023年 <date> point in time</s>
|
||
2025-06-11 10:59:29,734 - DEBUG - 处理后标记: ['<triplet>', '软件学报 2023年第 34卷', '<concept>', '2023年', '<date>', 'point in time']
|
||
2025-06-11 10:59:29,734 - DEBUG - 添加三元组: 软件学报 2023年第 34卷(concept) - point in time - 2023年(date)
|
||
2025-06-11 10:59:29,734 - DEBUG - 块 99 提取到 1 个三元组
|
||
2025-06-11 10:59:29,734 - DEBUG - 处理块 100/753: ITransF将所有概念投影矩阵堆叠为一个三维张量 , 其中 是预先指定的概念投影矩阵数目,...
|
||
2025-06-11 10:59:30,333 - DEBUG - 块 100 生成文本: <triplet> 投影矩阵堆叠 <concept> ITransF <misc> 三维张量 <unk> <dis> <cel> 的概念投影 <media> <org> <per> 概念 <loc> part of</s>
|
||
2025-06-11 10:59:30,334 - DEBUG - 原始生成文本: <triplet> 投影矩阵堆叠 <concept> ITransF <misc> 三维张量 <unk> <dis> <cel> 的概念投影 <media> <org> <per> 概念 <loc> part of</s>
|
||
2025-06-11 10:59:30,334 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵堆叠', '<concept>', 'ITransF', '<misc>', '三维张量', '<unk>', '<dis>', '<cel>', '的概念投影', '<media>', '<org>', '<per>', '概念', '<loc>', 'part of']
|
||
2025-06-11 10:59:30,334 - DEBUG - 添加三元组: 投影矩阵堆叠(concept) - 三维张量 - ITransF(misc)
|
||
2025-06-11 10:59:30,334 - DEBUG - 块 100 提取到 1 个三元组
|
||
2025-06-11 10:59:30,334 - DEBUG - 处理块 101/753: r ∈ [0;1]m
|
||
∑
|
||
i
|
||
H
|
||
r;i =
|
||
∑
|
||
i
|
||
T
|
||
r;i =1
|
||
m = 2|R|
|
||
其...
|
||
2025-06-11 10:59:30,878 - DEBUG - 块 101 生成文本: <triplet> 的概念矩阵 <concept> ITransF模型 <misc> I TransF <media> <per> <eve> 量 <unk> <dis> <cel> 그래 <org> <loc> <time> チャー <triplet> STransE</s>
|
||
2025-06-11 10:59:30,878 - DEBUG - 原始生成文本: <triplet> 的概念矩阵 <concept> ITransF模型 <misc> I TransF <media> <per> <eve> 量 <unk> <dis> <cel> 그래 <org> <loc> <time> チャー <triplet> STransE</s>
|
||
2025-06-11 10:59:30,879 - DEBUG - 处理后标记: ['<triplet>', '的概念矩阵', '<concept>', 'ITransF模型', '<misc>', 'I TransF', '<media>', '<per>', '<eve>', '量', '<unk>', '<dis>', '<cel>', '그래', '<org>', '<loc>', '<time>', 'チャー', '<triplet>', 'STransE']
|
||
2025-06-11 10:59:30,879 - DEBUG - 添加三元组: 的概念矩阵(concept) - I TransF - ITransF模型(misc)
|
||
2025-06-11 10:59:30,879 - DEBUG - 块 101 提取到 1 个三元组
|
||
2025-06-11 10:59:30,879 - DEBUG - 处理块 102/753: ● TransAt: Qian等人[52]认为人类对关系的认知遵循一种层次化规律, 并且实体之间存在...
|
||
2025-06-11 10:59:31,423 - DEBUG - 块 102 生成文本: <triplet> 链接 <concept> 层次化规律 <misc> Qian <per></s>
|
||
2025-06-11 10:59:31,423 - DEBUG - 原始生成文本: <triplet> 链接 <concept> 层次化规律 <misc> Qian <per></s>
|
||
2025-06-11 10:59:31,423 - DEBUG - 处理后标记: ['<triplet>', '链接', '<concept>', '层次化规律', '<misc>', 'Qian', '<per>']
|
||
2025-06-11 10:59:31,423 - DEBUG - 添加三元组: 链接(concept) - Qian - 层次化规律(misc)
|
||
2025-06-11 10:59:31,423 - DEBUG - 块 102 提取到 1 个三元组
|
||
2025-06-11 10:59:31,423 - DEBUG - 处理块 103/753: 集候选实体: 第二阶段, 对于那些可能的三元组组合, 关注实体的细粒度属性以区分它们与特定关系的联系...
|
||
2025-06-11 10:59:31,957 - DEBUG - 块 103 生成文本: <triplet> 集候选实体 <concept> 细粒度属性 <misc> 学习嵌入 <unk> <media> <eve> <per> <time> <dis> <date> point in time</s>
|
||
2025-06-11 10:59:31,957 - DEBUG - 原始生成文本: <triplet> 集候选实体 <concept> 细粒度属性 <misc> 学习嵌入 <unk> <media> <eve> <per> <time> <dis> <date> point in time</s>
|
||
2025-06-11 10:59:31,957 - DEBUG - 处理后标记: ['<triplet>', '集候选实体', '<concept>', '细粒度属性', '<misc>', '学习嵌入', '<unk>', '<media>', '<eve>', '<per>', '<time>', '<dis>', '<date>', 'point in time']
|
||
2025-06-11 10:59:31,957 - DEBUG - 添加三元组: 集候选实体(concept) - 学习嵌入 - 细粒度属性(misc)
|
||
2025-06-11 10:59:31,957 - DEBUG - 块 103 提取到 1 个三元组
|
||
2025-06-11 10:59:31,957 - DEBUG - 处理块 104/753: 由此, Qian等人[52]提出TransAt模型来同时学习嵌入, 关系相关候选对象和关系相关注意力...
|
||
2025-06-11 10:59:32,086 - DEBUG - 块 104 生成文本: <triplet> 函数 <concept> TransAt <media> used by</s>
|
||
2025-06-11 10:59:32,086 - DEBUG - 原始生成文本: <triplet> 函数 <concept> TransAt <media> used by</s>
|
||
2025-06-11 10:59:32,086 - DEBUG - 处理后标记: ['<triplet>', '函数', '<concept>', 'TransAt', '<media>', 'used by']
|
||
2025-06-11 10:59:32,086 - DEBUG - 添加三元组: 函数(concept) - used by - TransAt(media)
|
||
2025-06-11 10:59:32,086 - DEBUG - 块 104 提取到 1 个三元组
|
||
2025-06-11 10:59:32,086 - DEBUG - 处理块 105/753: 其中, 是仅保留与r有关维数的投影, 是Sigmoid激活函数, , 是与关...
|
||
2025-06-11 10:59:32,726 - DEBUG - 块 105 生成文本: <triplet> 偏置向量传输多向语义 <concept> TransMS模型 <misc> <media> <eve> <per> 评分函数 <unk> <loc> <dis> <cel></s>
|
||
2025-06-11 10:59:32,727 - DEBUG - 原始生成文本: <triplet> 偏置向量传输多向语义 <concept> TransMS模型 <misc> <media> <eve> <per> 评分函数 <unk> <loc> <dis> <cel></s>
|
||
2025-06-11 10:59:32,727 - DEBUG - 处理后标记: ['<triplet>', '偏置向量传输多向语义', '<concept>', 'TransMS模型', '<misc>', '<media>', '<eve>', '<per>', '评分函数', '<unk>', '<loc>', '<dis>', '<cel>']
|
||
2025-06-11 10:59:32,727 - DEBUG - 添加三元组: 偏置向量传输多向语义(concept) - <media> - TransMS模型(misc)
|
||
2025-06-11 10:59:32,727 - DEBUG - 块 105 提取到 1 个三元组
|
||
2025-06-11 10:59:32,727 - DEBUG - 处理块 106/753: ‖‖‖ −tanh(t◦r)◦h+r−tanh(h◦r)◦t+ ·(h◦t)
|
||
‖‖‖1=2 (19...
|
||
2025-06-11 10:59:33,313 - DEBUG - 块 106 生成文本: <triplet> 流形 <concept> 拓扑空间 <misc> 不适定 <unk> <media> 数学 <org> <triplet> Point-Wise建模 <loc> <per> 集合论 <eve> subclass of</s>
|
||
2025-06-11 10:59:33,313 - DEBUG - 原始生成文本: <triplet> 流形 <concept> 拓扑空间 <misc> 不适定 <unk> <media> 数学 <org> <triplet> Point-Wise建模 <loc> <per> 集合论 <eve> subclass of</s>
|
||
2025-06-11 10:59:33,313 - DEBUG - 处理后标记: ['<triplet>', '流形', '<concept>', '拓扑空间', '<misc>', '不适定', '<unk>', '<media>', '数学', '<org>', '<triplet>', 'Point-Wise建模', '<loc>', '<per>', '集合论', '<eve>', 'subclass of']
|
||
2025-06-11 10:59:33,313 - DEBUG - 添加三元组: 流形(concept) - 不适定 - 拓扑空间(misc)
|
||
2025-06-11 10:59:33,313 - DEBUG - 块 106 提取到 1 个三元组
|
||
2025-06-11 10:59:33,313 - DEBUG - 处理块 107/753: 的代数系统通常会使解决方案不精确且不稳定)的代数系统, 无法在大规模知识图谱中进行精确的链接预测[5...
|
||
2025-06-11 10:59:33,804 - DEBUG - 块 107 生成文本: <triplet> 代数系统 <concept> Point-Wise嵌入扩展 <misc> 基于流形的 <media> 系统的 subclass of</s>
|
||
2025-06-11 10:59:33,805 - DEBUG - 原始生成文本: <triplet> 代数系统 <concept> Point-Wise嵌入扩展 <misc> 基于流形的 <media> 系统的 subclass of</s>
|
||
2025-06-11 10:59:33,805 - DEBUG - 处理后标记: ['<triplet>', '代数系统', '<concept>', 'Point-Wise嵌入扩展', '<misc>', '基于流形的', '<media>', '系统的 subclass of']
|
||
2025-06-11 10:59:33,805 - DEBUG - 添加三元组: 代数系统(concept) - 基于流形的 - Point-Wise嵌入扩展(misc)
|
||
2025-06-11 10:59:33,805 - DEBUG - 块 107 提取到 1 个三元组
|
||
2025-06-11 10:59:33,805 - DEBUG - 处理块 108/753: (h;r;t)
|
||
MF(h;r;t)≈ D2
|
||
r
|
||
给定三元组 , ManifoldE基于流形的原理...
|
||
2025-06-11 10:59:34,412 - DEBUG - 块 108 生成文本: <triplet> 高维流形 <concept> 三元组 <misc> <unk> <dis> <media> <cel> <per> <triplet> MF (h;r;t)≈ D2 r 给定三元 <eve> <org> <loc> <time> <date> point in time </s>
|
||
2025-06-11 10:59:34,413 - DEBUG - 原始生成文本: <triplet> 高维流形 <concept> 三元组 <misc> <unk> <dis> <media> <cel> <per> <triplet> MF (h;r;t)≈ D2 r 给定三元 <eve> <org> <loc> <time> <date> point in time </s>
|
||
2025-06-11 10:59:34,413 - DEBUG - 处理后标记: ['<triplet>', '高维流形', '<concept>', '三元组', '<misc>', '<unk>', '<dis>', '<media>', '<cel>', '<per>', '<triplet>', 'MF (h;r;t)≈ D2 r 给定三元', '<eve>', '<org>', '<loc>', '<time>', '<date>', 'point in time']
|
||
2025-06-11 10:59:34,413 - DEBUG - 添加三元组: 高维流形(concept) - <unk> - 三元组(misc)
|
||
2025-06-11 10:59:34,413 - DEBUG - 添加三元组: MF (h;r;t)≈ D2 r 给定三元(eve) - <time> - <org>(loc)
|
||
2025-06-11 10:59:34,413 - DEBUG - 块 108 提取到 2 个三元组
|
||
2025-06-11 10:59:34,413 - DEBUG - 处理块 109/753: 2
|
||
(20)
|
||
|
||
Dr
|
||
MF :E×L×E → R
|
||
E
|
||
L
|
||
R
|
||
其中, 是关系特定的流形参数,...
|
||
2025-06-11 10:59:35,150 - DEBUG - 块 109 生成文本: <triplet> 实数字段 <concept> 2 <misc> 2</s>
|
||
2025-06-11 10:59:35,150 - DEBUG - 原始生成文本: <triplet> 实数字段 <concept> 2 <misc> 2</s>
|
||
2025-06-11 10:59:35,150 - DEBUG - 处理后标记: ['<triplet>', '实数字段', '<concept>', '2', '<misc>', '2']
|
||
2025-06-11 10:59:35,150 - DEBUG - 添加三元组: 实数字段(concept) - 2 - 2(misc)
|
||
2025-06-11 10:59:35,150 - DEBUG - 块 109 提取到 1 个三元组
|
||
2025-06-11 10:59:35,150 - DEBUG - 处理块 110/753: Xiao等人[55]介绍了基于流形嵌入的两种设置, 即Sphere和Hyperplane. 在Sph...
|
||
2025-06-11 10:59:35,310 - DEBUG - 块 110 生成文本: <triplet> <concept> Hilbert space (RKHS) <misc> used by</s>
|
||
2025-06-11 10:59:35,310 - DEBUG - 原始生成文本: <triplet> <concept> Hilbert space (RKHS) <misc> used by</s>
|
||
2025-06-11 10:59:35,310 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Hilbert space (RKHS)', '<misc>', 'used by']
|
||
2025-06-11 10:59:35,310 - DEBUG - 处理块 111/753: MF (h;r;t)= ∥φ(h)+φ(r)−φ(t)∥2= K (h;h)+ K (t;t)+ K...
|
||
2025-06-11 10:59:35,789 - DEBUG - 块 111 生成文本: <triplet> 原始空间 <concept> 核函数 <misc> 映射 <unk> <dis> <cel> 原子 <time> part of</s>
|
||
2025-06-11 10:59:35,789 - DEBUG - 原始生成文本: <triplet> 原始空间 <concept> 核函数 <misc> 映射 <unk> <dis> <cel> 原子 <time> part of</s>
|
||
2025-06-11 10:59:35,789 - DEBUG - 处理后标记: ['<triplet>', '原始空间', '<concept>', '核函数', '<misc>', '映射', '<unk>', '<dis>', '<cel>', '原子', '<time>', 'part of']
|
||
2025-06-11 10:59:35,789 - DEBUG - 添加三元组: 原始空间(concept) - 映射 - 核函数(misc)
|
||
2025-06-11 10:59:35,789 - DEBUG - 块 111 提取到 1 个三元组
|
||
2025-06-11 10:59:35,789 - DEBUG - 处理块 112/753: 另一个Hyperplane提出将头、尾实体嵌入两个单独超平面中, 并在它们的超平面不平行时彼此相交....
|
||
2025-06-11 10:59:36,354 - DEBUG - 块 112 生成文本: <triplet> 特定关系向量 <concept> MF <misc> subclass of</s>
|
||
2025-06-11 10:59:36,354 - DEBUG - 原始生成文本: <triplet> 特定关系向量 <concept> MF <misc> subclass of</s>
|
||
2025-06-11 10:59:36,354 - DEBUG - 处理后标记: ['<triplet>', '特定关系向量', '<concept>', 'MF', '<misc>', 'subclass of']
|
||
2025-06-11 10:59:36,354 - DEBUG - 添加三元组: 特定关系向量(concept) - subclass of - MF(misc)
|
||
2025-06-11 10:59:36,354 - DEBUG - 块 112 提取到 1 个三元组
|
||
2025-06-11 10:59:36,354 - DEBUG - 处理块 113/753: TransE模型在计算实体距离之前, 对所有的实体和关系向量进行了正则化, 这种规范化虽然避免了向量...
|
||
2025-06-11 10:59:36,567 - DEBUG - 块 113 生成文本: <triplet> 普通向量空间 <concept> TorusE模型 <misc> part of</s>
|
||
2025-06-11 10:59:36,567 - DEBUG - 原始生成文本: <triplet> 普通向量空间 <concept> TorusE模型 <misc> part of</s>
|
||
2025-06-11 10:59:36,568 - DEBUG - 处理后标记: ['<triplet>', '普通向量空间', '<concept>', 'TorusE模型', '<misc>', 'part of']
|
||
2025-06-11 10:59:36,568 - DEBUG - 添加三元组: 普通向量空间(concept) - part of - TorusE模型(misc)
|
||
2025-06-11 10:59:36,568 - DEBUG - 块 113 提取到 1 个三元组
|
||
2025-06-11 10:59:36,568 - DEBUG - 处理块 114/753: 换成了李群. 在TransE的嵌入模型中, 向量空间需要满足的条件有: (1)可微的流形空间, (2...
|
||
2025-06-11 10:59:37,090 - DEBUG - 块 114 生成文本: <triplet> 向量空间 <concept> 空间紧致性的条件 <misc> TorusE模型 <media> based on</s>
|
||
2025-06-11 10:59:37,091 - DEBUG - 原始生成文本: <triplet> 向量空间 <concept> 空间紧致性的条件 <misc> TorusE模型 <media> based on</s>
|
||
2025-06-11 10:59:37,091 - DEBUG - 处理后标记: ['<triplet>', '向量空间', '<concept>', '空间紧致性的条件', '<misc>', 'TorusE模型', '<media>', 'based on']
|
||
2025-06-11 10:59:37,091 - DEBUG - 添加三元组: 向量空间(concept) - TorusE模型 - 空间紧致性的条件(misc)
|
||
2025-06-11 10:59:37,091 - DEBUG - 块 114 提取到 1 个三元组
|
||
2025-06-11 10:59:37,091 - DEBUG - 处理块 115/753: 明, 紧李群可以满足TransE遵循的优化目标和正则化条件.
|
||
张天成 等 : 知识图谱嵌入技术研究...
|
||
2025-06-11 10:59:37,388 - DEBUG - 块 115 生成文本: <triplet> 张天成 <per> 等 <concept> instance of</s>
|
||
2025-06-11 10:59:37,388 - DEBUG - 原始生成文本: <triplet> 张天成 <per> 等 <concept> instance of</s>
|
||
2025-06-11 10:59:37,388 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<per>', '等', '<concept>', 'instance of']
|
||
2025-06-11 10:59:37,388 - DEBUG - 添加三元组: 张天成(per) - instance of - 等(concept)
|
||
2025-06-11 10:59:37,388 - DEBUG - 块 115 提取到 1 个三元组
|
||
2025-06-11 10:59:37,388 - DEBUG - 处理块 116/753: Zhang等人[56]构架了一个紧李群 的圆环空间和圆环空间上的不同范式的距离函数 , 实体...
|
||
2025-06-11 10:59:38,082 - DEBUG - 块 116 生成文本: <triplet> 距离函数 <concept> 紧李群 <misc> 圆环空间 <loc> <dis> <cel> <unk> 系 <triplet> TransE <media> 优化目标 <eve> <per> Torus <org> part of</s>
|
||
2025-06-11 10:59:38,082 - DEBUG - 原始生成文本: <triplet> 距离函数 <concept> 紧李群 <misc> 圆环空间 <loc> <dis> <cel> <unk> 系 <triplet> TransE <media> 优化目标 <eve> <per> Torus <org> part of</s>
|
||
2025-06-11 10:59:38,082 - DEBUG - 处理后标记: ['<triplet>', '距离函数', '<concept>', '紧李群', '<misc>', '圆环空间', '<loc>', '<dis>', '<cel>', '<unk>', '系', '<triplet>', 'TransE', '<media>', '优化目标', '<eve>', '<per>', 'Torus', '<org>', 'part of']
|
||
2025-06-11 10:59:38,082 - DEBUG - 添加三元组: 距离函数(concept) - 圆环空间 - 紧李群(misc)
|
||
2025-06-11 10:59:38,082 - DEBUG - 添加三元组: TransE(media) - <per> - 优化目标(eve)
|
||
2025-06-11 10:59:38,082 - DEBUG - 块 116 提取到 2 个三元组
|
||
2025-06-11 10:59:38,082 - DEBUG - 处理块 117/753: fL1 (h;r;t) = 2dL1 ([h] +[r];[t])
|
||
fL2 (h;r;t) = (2...
|
||
2025-06-11 10:59:38,252 - DEBUG - 块 117 生成文本: <triplet> <concept> TorusE <misc> part of</s>
|
||
2025-06-11 10:59:38,252 - DEBUG - 原始生成文本: <triplet> <concept> TorusE <misc> part of</s>
|
||
2025-06-11 10:59:38,252 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TorusE', '<misc>', 'part of']
|
||
2025-06-11 10:59:38,252 - DEBUG - 处理块 118/753: (3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组...
|
||
2025-06-11 10:59:38,646 - DEBUG - 块 118 生成文本: <triplet> 高斯空间 <concept> 随机变量</s>
|
||
2025-06-11 10:59:38,646 - DEBUG - 原始生成文本: <triplet> 高斯空间 <concept> 随机变量</s>
|
||
2025-06-11 10:59:38,646 - DEBUG - 处理后标记: ['<triplet>', '高斯空间', '<concept>', '随机变量']
|
||
2025-06-11 10:59:38,646 - DEBUG - 处理块 119/753: ● KG2E: 受高斯词嵌入的启发, 基于密度的嵌入模型KG2E[57]引入了高斯分布来处理实体和关...
|
||
2025-06-11 10:59:39,105 - DEBUG - 块 119 生成文本: <triplet> 高斯词嵌入 <concept> 多维 <misc> 矩阵 <dis> part of</s>
|
||
2025-06-11 10:59:39,105 - DEBUG - 原始生成文本: <triplet> 高斯词嵌入 <concept> 多维 <misc> 矩阵 <dis> part of</s>
|
||
2025-06-11 10:59:39,105 - DEBUG - 处理后标记: ['<triplet>', '高斯词嵌入', '<concept>', '多维', '<misc>', '矩阵', '<dis>', 'part of']
|
||
2025-06-11 10:59:39,105 - DEBUG - 添加三元组: 高斯词嵌入(concept) - 矩阵 - 多维(misc)
|
||
2025-06-11 10:59:39,105 - DEBUG - 块 119 提取到 1 个三元组
|
||
2025-06-11 10:59:39,105 - DEBUG - 处理块 120/753: h ~ N (uh;h);t ~ N (ut;t);r ~ N (ur;r) (24)
|
||
|
||
u...
|
||
2025-06-11 10:59:39,840 - DEBUG - 块 120 生成文本: <triplet> 中心位置 <concept> 语义空间 <misc> 高斯分布 <dis> <cel> <unk> 方差 <media> 阵 <org> <per> <triplet> h <loc> ~ N (uh;t;u;ut;r ∈ Rd h;ur <time> N <eve> part of</s>
|
||
2025-06-11 10:59:39,841 - DEBUG - 原始生成文本: <triplet> 中心位置 <concept> 语义空间 <misc> 高斯分布 <dis> <cel> <unk> 方差 <media> 阵 <org> <per> <triplet> h <loc> ~ N (uh;t;u;ut;r ∈ Rd h;ur <time> N <eve> part of</s>
|
||
2025-06-11 10:59:39,841 - DEBUG - 处理后标记: ['<triplet>', '中心位置', '<concept>', '语义空间', '<misc>', '高斯分布', '<dis>', '<cel>', '<unk>', '方差', '<media>', '阵', '<org>', '<per>', '<triplet>', 'h', '<loc>', '~ N (uh;t;u;ut;r ∈ Rd h;ur', '<time>', 'N', '<eve>', 'part of']
|
||
2025-06-11 10:59:39,841 - DEBUG - 添加三元组: 中心位置(concept) - 高斯分布 - 语义空间(misc)
|
||
2025-06-11 10:59:39,841 - DEBUG - 添加三元组: h(loc) - N - ~ N (uh;t;u;ut;r ∈ Rd h;ur(time)
|
||
2025-06-11 10:59:39,841 - DEBUG - 块 120 提取到 2 个三元组
|
||
2025-06-11 10:59:39,841 - DEBUG - 处理块 121/753: 借用基于翻译的方法[15,16,43]中的概念, He等人[57]认为从头实体到尾实体的转换结果类似...
|
||
2025-06-11 10:59:40,213 - DEBUG - 块 121 生成文本: <triplet> 关 系 <concept> 正三元组 <misc> part of</s>
|
||
2025-06-11 10:59:40,214 - DEBUG - 原始生成文本: <triplet> 关 系 <concept> 正三元组 <misc> part of</s>
|
||
2025-06-11 10:59:40,214 - DEBUG - 处理后标记: ['<triplet>', '关 系', '<concept>', '正三元组', '<misc>', 'part of']
|
||
2025-06-11 10:59:40,214 - DEBUG - 添加三元组: 关 系(concept) - part of - 正三元组(misc)
|
||
2025-06-11 10:59:40,214 - DEBUG - 块 121 提取到 1 个三元组
|
||
2025-06-11 10:59:40,214 - DEBUG - 处理块 122/753: KG2E考虑了2种计算相似度的方法: KL散度和期望似然. KL散度是一种不对称相似度, 评分函数定...
|
||
2025-06-11 10:59:40,501 - DEBUG - 块 122 生成文本: <triplet> 期望似然 <concept> 相似度</s>
|
||
2025-06-11 10:59:40,502 - DEBUG - 原始生成文本: <triplet> 期望似然 <concept> 相似度</s>
|
||
2025-06-11 10:59:40,502 - DEBUG - 处理后标记: ['<triplet>', '期望似然', '<concept>', '相似度']
|
||
2025-06-11 10:59:40,502 - DEBUG - 处理块 123/753: fr (h;t) = log
|
||
∫
|
||
x∈Rke
|
||
N (x;ue;e) N (x;ur;r)dx (...
|
||
2025-06-11 10:59:40,991 - DEBUG - 块 123 生成文本: <triplet> <concept> KGE <media> part of the series</s>
|
||
2025-06-11 10:59:40,992 - DEBUG - 原始生成文本: <triplet> <concept> KGE <media> part of the series</s>
|
||
2025-06-11 10:59:40,992 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KGE', '<media>', 'part of the series']
|
||
2025-06-11 10:59:40,992 - DEBUG - 处理块 124/753: 元组关联的实体对所揭示的多种含义. TransG是知识图谱嵌入的第一个生成模型, 用以解决多重关系语...
|
||
2025-06-11 10:59:41,685 - DEBUG - 块 124 生成文本: <triplet> 知识图谱 <concept> TransG <media> 生成模型 <misc> <unk> <per> 多重关系语义问题 <eve> <org> <time> 关系 <cel> <dis> <date> point in time</s>
|
||
2025-06-11 10:59:41,685 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> TransG <media> 生成模型 <misc> <unk> <per> 多重关系语义问题 <eve> <org> <time> 关系 <cel> <dis> <date> point in time</s>
|
||
2025-06-11 10:59:41,685 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', 'TransG', '<media>', '生成模型', '<misc>', '<unk>', '<per>', '多重关系语义问题', '<eve>', '<org>', '<time>', '关系', '<cel>', '<dis>', '<date>', 'point in time']
|
||
2025-06-11 10:59:41,685 - DEBUG - 添加三元组: 知识图谱(concept) - 生成模型 - TransG(media)
|
||
2025-06-11 10:59:41,685 - DEBUG - 块 124 提取到 1 个三元组
|
||
2025-06-11 10:59:41,685 - DEBUG - 处理块 125/753: 因此现有的基于翻译的模型不能区分有效的三元组和不正确的三元组. 图5(b)表明, 通过考虑关系的多重...
|
||
2025-06-11 10:59:42,508 - DEBUG - 块 125 生成文本: <triplet> 传统模型 <concept> TransG <misc> part of</s>
|
||
2025-06-11 10:59:42,508 - DEBUG - 原始生成文本: <triplet> 传统模型 <concept> TransG <misc> part of</s>
|
||
2025-06-11 10:59:42,508 - DEBUG - 处理后标记: ['<triplet>', '传统模型', '<concept>', 'TransG', '<misc>', 'part of']
|
||
2025-06-11 10:59:42,508 - DEBUG - 添加三元组: 传统模型(concept) - part of - TransG(misc)
|
||
2025-06-11 10:59:42,508 - DEBUG - 块 125 提取到 1 个三元组
|
||
2025-06-11 10:59:42,508 - DEBUG - 处理块 126/753: lt5 lt5
|
||
|
||
图 5 传统模型与TransG模型比较, 其中三角形表示正确的尾实体, 圆形表示...
|
||
2025-06-11 10:59:42,667 - DEBUG - 块 126 生成文本: <triplet> 实体 <concept> TransG模型 <misc> part of</s>
|
||
2025-06-11 10:59:42,667 - DEBUG - 原始生成文本: <triplet> 实体 <concept> TransG模型 <misc> part of</s>
|
||
2025-06-11 10:59:42,667 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', 'TransG模型', '<misc>', 'part of']
|
||
2025-06-11 10:59:42,668 - DEBUG - 添加三元组: 实体(concept) - part of - TransG模型(misc)
|
||
2025-06-11 10:59:42,668 - DEBUG - 块 126 提取到 1 个三元组
|
||
2025-06-11 10:59:42,668 - DEBUG - 处理块 127/753: uh;2
|
||
hI
|
||
)
|
||
;t ~ N
|
||
(
|
||
ut;2
|
||
t I
|
||
)
|
||
(28)
|
||
|
||
I ∈ Rd×d
|
||
uh...
|
||
2025-06-11 10:59:43,318 - DEBUG - 块 127 生成文本: <triplet> 矩阵 <concept> 嵌入向量</s>
|
||
2025-06-11 10:59:43,318 - DEBUG - 原始生成文本: <triplet> 矩阵 <concept> 嵌入向量</s>
|
||
2025-06-11 10:59:43,318 - DEBUG - 处理后标记: ['<triplet>', '矩阵', '<concept>', '嵌入向量']
|
||
2025-06-11 10:59:43,318 - DEBUG - 处理块 128/753: 284 软件学报 202 3 年第 3 4 卷第 1 期
|
||
TransG认为一个关系可以具有多种语...
|
||
2025-06-11 10:59:43,969 - DEBUG - 块 128 生成文本: <triplet> 软件学报 <media> TransG <org> <per> <loc> <concept> <misc> <time> <dis> 卷 <unk> <eve> <cel> 关系嵌入向量定义为 2 <num> quantity</s>
|
||
2025-06-11 10:59:43,969 - DEBUG - 原始生成文本: <triplet> 软件学报 <media> TransG <org> <per> <loc> <concept> <misc> <time> <dis> 卷 <unk> <eve> <cel> 关系嵌入向量定义为 2 <num> quantity</s>
|
||
2025-06-11 10:59:43,969 - DEBUG - 处理后标记: ['<triplet>', '软件学报', '<media>', 'TransG', '<org>', '<per>', '<loc>', '<concept>', '<misc>', '<time>', '<dis>', '卷', '<unk>', '<eve>', '<cel>', '关系嵌入向量定义为 2', '<num>', 'quantity']
|
||
2025-06-11 10:59:43,969 - DEBUG - 添加三元组: 软件学报(media) - <per> - TransG(org)
|
||
2025-06-11 10:59:43,969 - DEBUG - 块 128 提取到 1 个三元组
|
||
2025-06-11 10:59:43,969 - DEBUG - 处理块 129/753: 其中, ri表示关系r的第i个语义的关系嵌入向量, TransG的评分函数定义如下:
|
||
fr (h;t...
|
||
2025-06-11 10:59:44,600 - DEBUG - 块 129 生成文本: <triplet> 的关系嵌入向量 <concept> TransG <misc> 评分函数 <eve> <media> 函数定义 <org> <unk> <per> <loc> <dis> <cel> 语义的关系 <time> part of</s>
|
||
2025-06-11 10:59:44,600 - DEBUG - 原始生成文本: <triplet> 的关系嵌入向量 <concept> TransG <misc> 评分函数 <eve> <media> 函数定义 <org> <unk> <per> <loc> <dis> <cel> 语义的关系 <time> part of</s>
|
||
2025-06-11 10:59:44,600 - DEBUG - 处理后标记: ['<triplet>', '的关系嵌入向量', '<concept>', 'TransG', '<misc>', '评分函数', '<eve>', '<media>', '函数定义', '<org>', '<unk>', '<per>', '<loc>', '<dis>', '<cel>', '语义的关系', '<time>', 'part of']
|
||
2025-06-11 10:59:44,600 - DEBUG - 添加三元组: 的关系嵌入向量(concept) - 评分函数 - TransG(misc)
|
||
2025-06-11 10:59:44,600 - DEBUG - 块 129 提取到 1 个三元组
|
||
2025-06-11 10:59:44,600 - DEBUG - 处理块 130/753: 其中, 是对应于关系 的第 个语义的权重因子, 是关系 的语义分量的数量, ...
|
||
2025-06-11 10:59:44,921 - DEBUG - 块 130 生成文本: <triplet> 权重因子 <concept> 语义分量</s>
|
||
2025-06-11 10:59:44,921 - DEBUG - 原始生成文本: <triplet> 权重因子 <concept> 语义分量</s>
|
||
2025-06-11 10:59:44,921 - DEBUG - 处理后标记: ['<triplet>', '权重因子', '<concept>', '语义分量']
|
||
2025-06-11 10:59:44,921 - DEBUG - 处理块 131/753: 本节介绍了基于距离的评分函数的代表模型, 具体划分为基本距离模型, 翻译模型, 复杂关系建模3个小节...
|
||
2025-06-11 10:59:45,511 - DEBUG - 块 131 生成文本: <triplet> 基于距离的评分函数 <concept> 类别 <media> 模型 实体嵌入 <loc> <misc> 关系 <org> part of <triplet></s>
|
||
2025-06-11 10:59:45,512 - DEBUG - 原始生成文本: <triplet> 基于距离的评分函数 <concept> 类别 <media> 模型 实体嵌入 <loc> <misc> 关系 <org> part of <triplet></s>
|
||
2025-06-11 10:59:45,512 - DEBUG - 处理后标记: ['<triplet>', '基于距离的评分函数', '<concept>', '类别', '<media>', '模型 实体嵌入', '<loc>', '<misc>', '关系', '<org>', 'part of', '<triplet>']
|
||
2025-06-11 10:59:45,512 - DEBUG - 添加三元组: 基于距离的评分函数(concept) - 模型 实体嵌入 - 类别(media)
|
||
2025-06-11 10:59:45,512 - DEBUG - 块 131 提取到 1 个三元组
|
||
2025-06-11 10:59:45,512 - DEBUG - 处理块 132/753: fr (h;t) 评分函数
|
||
基本距离模型 SE[39]
|
||
h;t ∈ Rd
|
||
Mr;1
|
||
Mr;...
|
||
2025-06-11 10:59:46,151 - DEBUG - 块 132 生成文本: <triplet> 评分函数 <concept> 基本距离模型 SE[39] h;t <misc> TransE[15] <dis> <media> <org> 翻译模型 <unk> <loc> instance of</s>
|
||
2025-06-11 10:59:46,151 - DEBUG - 原始生成文本: <triplet> 评分函数 <concept> 基本距离模型 SE[39] h;t <misc> TransE[15] <dis> <media> <org> 翻译模型 <unk> <loc> instance of</s>
|
||
2025-06-11 10:59:46,151 - DEBUG - 处理后标记: ['<triplet>', '评分函数', '<concept>', '基本距离模型 SE[39] h;t', '<misc>', 'TransE[15]', '<dis>', '<media>', '<org>', '翻译模型', '<unk>', '<loc>', 'instance of']
|
||
2025-06-11 10:59:46,151 - DEBUG - 添加三元组: 评分函数(concept) - TransE[15] - 基本距离模型 SE[39] h;t(misc)
|
||
2025-06-11 10:59:46,151 - DEBUG - 块 132 提取到 1 个三元组
|
||
2025-06-11 10:59:46,151 - DEBUG - 处理块 133/753: UM[42]
|
||
h;t ∈ Rd -
|
||
−∥h−t∥2
|
||
2
|
||
复杂关系
|
||
建模
|
||
Point-
|
||
Wi...
|
||
2025-06-11 10:59:46,353 - DEBUG - 块 133 生成文本: <triplet> <concept> UM <misc> part of <triplet> Point- Wise空间</s>
|
||
2025-06-11 10:59:46,353 - DEBUG - 原始生成文本: <triplet> <concept> UM <misc> part of <triplet> Point- Wise空间</s>
|
||
2025-06-11 10:59:46,353 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'UM', '<misc>', 'part of', '<triplet>', 'Point- Wise空间']
|
||
2025-06-11 10:59:46,353 - DEBUG - 处理块 134/753: h;t ∈ Rd
|
||
r ∈ Rk
|
||
Mr ∈ Rk×d ,
|
||
−∥Mrh+r−Mrt∥2...
|
||
2025-06-11 10:59:46,653 - DEBUG - 块 134 生成文本: <triplet> <concept> 2 <num> quantity <triplet> 2 TransD <misc> Trans <media> Trans D</s>
|
||
2025-06-11 10:59:46,653 - DEBUG - 原始生成文本: <triplet> <concept> 2 <num> quantity <triplet> 2 TransD <misc> Trans <media> Trans D</s>
|
||
2025-06-11 10:59:46,653 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '2', '<num>', 'quantity', '<triplet>', '2 TransD', '<misc>', 'Trans', '<media>', 'Trans D']
|
||
2025-06-11 10:59:46,653 - DEBUG - 处理块 135/753: 2
|
||
STransE[45]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
Mr;1
|
||
Mr;2∈ Rd×...
|
||
2025-06-11 10:59:46,866 - DEBUG - 块 135 生成文本: <triplet> <concept> STransE <misc> part of</s>
|
||
2025-06-11 10:59:46,866 - DEBUG - 原始生成文本: <triplet> <concept> STransE <misc> part of</s>
|
||
2025-06-11 10:59:46,866 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'STransE', '<misc>', 'part of']
|
||
2025-06-11 10:59:46,866 - DEBUG - 处理块 136/753: r
|
||
)
|
||
Mt
|
||
r
|
||
( t
|
||
r
|
||
) ∈ Rk×d
|
||
, ,
|
||
,
|
||
−∥Mr ( ...
|
||
2025-06-11 10:59:47,270 - DEBUG - 块 136 生成文本: <triplet> <concept> TransM <misc> part of the series <triplet> r (t r(t <media> Trans M <loc> part</s>
|
||
2025-06-11 10:59:47,270 - DEBUG - 原始生成文本: <triplet> <concept> TransM <misc> part of the series <triplet> r (t r(t <media> Trans M <loc> part</s>
|
||
2025-06-11 10:59:47,270 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransM', '<misc>', 'part of the series', '<triplet>', 'r (t r(t', '<media>', 'Trans M', '<loc>', 'part']
|
||
2025-06-11 10:59:47,270 - DEBUG - 处理块 137/753: h;t ∈ Rd
|
||
r ∈ Rd
|
||
wr∥h+r−t∥1=2
|
||
TransA[48]
|
||
h...
|
||
2025-06-11 10:59:47,547 - DEBUG - 块 137 生成文本: <triplet> <concept> TransF <media> part of <triplet> TransA <misc> Trans F <org> opposite of</s>
|
||
2025-06-11 10:59:47,547 - DEBUG - 原始生成文本: <triplet> <concept> TransF <media> part of <triplet> TransA <misc> Trans F <org> opposite of</s>
|
||
2025-06-11 10:59:47,547 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransF', '<media>', 'part of', '<triplet>', 'TransA', '<misc>', 'Trans F', '<org>', 'opposite of']
|
||
2025-06-11 10:59:47,547 - DEBUG - 处理块 138/753: (h+r)⊤t+h⊤ (t−r)
|
||
ITransF[51]
|
||
h;t ∈ Rd
|
||
r ∈ Rd...
|
||
2025-06-11 10:59:47,835 - DEBUG - 块 138 生成文本: <triplet> <concept> ITransF <misc> part of</s>
|
||
2025-06-11 10:59:47,835 - DEBUG - 原始生成文本: <triplet> <concept> ITransF <misc> part of</s>
|
||
2025-06-11 10:59:47,835 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ITransF', '<misc>', 'part of']
|
||
2025-06-11 10:59:47,835 - DEBUG - 处理块 139/753: Pr ( (rh)h)+r− Pr ( (rt)t)
|
||
TransMS[53]
|
||
h;t ∈ ...
|
||
2025-06-11 10:59:48,316 - DEBUG - 块 139 生成文本: <triplet> 流形和群 <concept> ManifoldE[55] <misc> part of</s>
|
||
2025-06-11 10:59:48,316 - DEBUG - 原始生成文本: <triplet> 流形和群 <concept> ManifoldE[55] <misc> part of</s>
|
||
2025-06-11 10:59:48,316 - DEBUG - 处理后标记: ['<triplet>', '流形和群', '<concept>', 'ManifoldE[55]', '<misc>', 'part of']
|
||
2025-06-11 10:59:48,316 - DEBUG - 添加三元组: 流形和群(concept) - part of - ManifoldE[55](misc)
|
||
2025-06-11 10:59:48,316 - DEBUG - 块 139 提取到 1 个三元组
|
||
2025-06-11 10:59:48,317 - DEBUG - 处理块 140/753: h;t ∈ Rd
|
||
r ∈ Rd
|
||
‖‖‖M (h;r;t)− D2
|
||
r
|
||
‖‖‖2
|
||
T...
|
||
2025-06-11 10:59:48,444 - DEBUG - 块 140 生成文本: <triplet> <cel> 高斯空间 <concept> instance of</s>
|
||
2025-06-11 10:59:48,444 - DEBUG - 原始生成文本: <triplet> <cel> 高斯空间 <concept> instance of</s>
|
||
2025-06-11 10:59:48,444 - DEBUG - 处理后标记: ['<triplet>', '<cel>', '高斯空间', '<concept>', 'instance of']
|
||
2025-06-11 10:59:48,445 - DEBUG - 处理块 141/753: t ~ N(ut;t)
|
||
h;t ∈ Rd×d
|
||
|
||
|
||
|
||
r ~ N(ur;r)
|
||
ur ∈...
|
||
2025-06-11 10:59:48,785 - DEBUG - 块 141 生成文本: <triplet> <concept> N <misc> part of <triplet> Rke N(x;ur;r <unk> N (ur <dis> follows</s>
|
||
2025-06-11 10:59:48,785 - DEBUG - 原始生成文本: <triplet> <concept> N <misc> part of <triplet> Rke N(x;ur;r <unk> N (ur <dis> follows</s>
|
||
2025-06-11 10:59:48,785 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'N', '<misc>', 'part of', '<triplet>', 'Rke N(x;ur;r', '<unk>', 'N (ur', '<dis>', 'follows']
|
||
2025-06-11 10:59:48,785 - DEBUG - 处理块 142/753: ∑
|
||
r
|
||
)dx
|
||
|
||
|
||
TransG[58]
|
||
h ~ N
|
||
(
|
||
uh;2
|
||
hI
|
||
)
|
||
t ~ N
|
||
(...
|
||
2025-06-11 10:59:49,169 - DEBUG - 块 142 生成文本: <triplet> ∑ <concept> TransG <misc> part of</s>
|
||
2025-06-11 10:59:49,169 - DEBUG - 原始生成文本: <triplet> ∑ <concept> TransG <misc> part of</s>
|
||
2025-06-11 10:59:49,169 - DEBUG - 处理后标记: ['<triplet>', '∑', '<concept>', 'TransG', '<misc>', 'part of']
|
||
2025-06-11 10:59:49,169 - DEBUG - 添加三元组: ∑(concept) - part of - TransG(misc)
|
||
2025-06-11 10:59:49,169 - DEBUG - 块 142 提取到 1 个三元组
|
||
2025-06-11 10:59:49,169 - DEBUG - 处理块 143/753: r exp
|
||
■|||||■
|
||
−∥h +ri −t∥2
|
||
2
|
||
2
|
||
h + 2
|
||
t
|
||
■|||||■
|
||
...
|
||
2025-06-11 10:59:49,350 - DEBUG - 块 143 生成文本: <triplet> 285 <concept> 张天成 <per> discoverer or inventor</s>
|
||
2025-06-11 10:59:49,350 - DEBUG - 原始生成文本: <triplet> 285 <concept> 张天成 <per> discoverer or inventor</s>
|
||
2025-06-11 10:59:49,350 - DEBUG - 处理后标记: ['<triplet>', '285', '<concept>', '张天成', '<per>', 'discoverer or inventor']
|
||
2025-06-11 10:59:49,350 - DEBUG - 添加三元组: 285(concept) - discoverer or inventor - 张天成(per)
|
||
2025-06-11 10:59:49,350 - DEBUG - 块 143 提取到 1 个三元组
|
||
2025-06-11 10:59:49,350 - DEBUG - 处理块 144/753: 语义匹配模型利用基于相似性的评分函数, 即通过语义匹配来衡量事实的合理性. 语义匹配通常采用乘法公
|
||
...
|
||
2025-06-11 10:59:49,840 - DEBUG - 块 144 生成文本: <triplet> 语义匹配模型 <concept> 评分函数 <misc> 相似性 <media> <cel> <unk> <per></s>
|
||
2025-06-11 10:59:49,840 - DEBUG - 原始生成文本: <triplet> 语义匹配模型 <concept> 评分函数 <misc> 相似性 <media> <cel> <unk> <per></s>
|
||
2025-06-11 10:59:49,840 - DEBUG - 处理后标记: ['<triplet>', '语义匹配模型', '<concept>', '评分函数', '<misc>', '相似性', '<media>', '<cel>', '<unk>', '<per>']
|
||
2025-06-11 10:59:49,840 - DEBUG - 添加三元组: 语义匹配模型(concept) - 相似性 - 评分函数(misc)
|
||
2025-06-11 10:59:49,840 - DEBUG - 块 144 提取到 1 个三元组
|
||
2025-06-11 10:59:49,840 - DEBUG - 处理块 145/753: 线性/双线性模型(虽然这里考虑的一些模型乍看起来可能不是双线性的, 但文献[62]证明了它们与双线性...
|
||
2025-06-11 10:59:50,213 - DEBUG - 块 145 生成文本: <triplet> 线性模 <concept> 型 <unk> 模范 <misc> part of</s>
|
||
2025-06-11 10:59:50,213 - DEBUG - 原始生成文本: <triplet> 线性模 <concept> 型 <unk> 模范 <misc> part of</s>
|
||
2025-06-11 10:59:50,213 - DEBUG - 处理后标记: ['<triplet>', '线性模', '<concept>', '型', '<unk>', '模范', '<misc>', 'part of']
|
||
2025-06-11 10:59:50,213 - DEBUG - 添加三元组: 线性模(concept) - 模范 - 型(unk)
|
||
2025-06-11 10:59:50,213 - DEBUG - 块 145 提取到 1 个三元组
|
||
2025-06-11 10:59:50,213 - DEBUG - 处理块 146/753: gr(h;t) = M⊤
|
||
r
|
||
(h
|
||
t
|
||
)
|
||
(31)
|
||
|
||
fr(h;t) = h⊤Mrt (32)
|
||
...
|
||
2025-06-11 10:59:50,674 - DEBUG - 块 146 生成文本: <triplet> 语义匹配能量模型 <concept> SME <misc> part of</s>
|
||
2025-06-11 10:59:50,674 - DEBUG - 原始生成文本: <triplet> 语义匹配能量模型 <concept> SME <misc> part of</s>
|
||
2025-06-11 10:59:50,674 - DEBUG - 处理后标记: ['<triplet>', '语义匹配能量模型', '<concept>', 'SME', '<misc>', 'part of']
|
||
2025-06-11 10:59:50,674 - DEBUG - 添加三元组: 语义匹配能量模型(concept) - part of - SME(misc)
|
||
2025-06-11 10:59:50,674 - DEBUG - 块 146 提取到 1 个三元组
|
||
2025-06-11 10:59:50,674 - DEBUG - 处理块 147/753: SME中, 实体和关系类型共享相同的表示形式, 将定义多关系图的所有符号嵌入到同一空间中(等价于删除...
|
||
2025-06-11 10:59:51,166 - DEBUG - 块 147 生成文本: <triplet> 能量函数 <concept> 神 经网络架构 <misc> part of</s>
|
||
2025-06-11 10:59:51,166 - DEBUG - 原始生成文本: <triplet> 能量函数 <concept> 神 经网络架构 <misc> part of</s>
|
||
2025-06-11 10:59:51,166 - DEBUG - 处理后标记: ['<triplet>', '能量函数', '<concept>', '神 经网络架构', '<misc>', 'part of']
|
||
2025-06-11 10:59:51,166 - DEBUG - 添加三元组: 能量函数(concept) - part of - 神 经网络架构(misc)
|
||
2025-06-11 10:59:51,166 - DEBUG - 块 147 提取到 1 个三元组
|
||
2025-06-11 10:59:51,166 - DEBUG - 处理块 148/753: fr (h,t)=gu (h, t) gv(t, r)
|
||
⊥
|
||
h(.)
|
||
gu (h, r) gv (...
|
||
2025-06-11 10:59:51,582 - DEBUG - 块 148 生成文本: <triplet> 匹配能量函数 <concept> <unk> 能量 <misc> part of</s>
|
||
2025-06-11 10:59:51,582 - DEBUG - 原始生成文本: <triplet> 匹配能量函数 <concept> <unk> 能量 <misc> part of</s>
|
||
2025-06-11 10:59:51,582 - DEBUG - 处理后标记: ['<triplet>', '匹配能量函数', '<concept>', '<unk>', '能量', '<misc>', 'part of']
|
||
2025-06-11 10:59:51,582 - DEBUG - 处理块 149/753: gu(;)
|
||
h
|
||
gu(h;r)
|
||
gv(;)
|
||
t
|
||
gv(t;r)
|
||
gu(h;r)
|
||
gv(t;r)
|
||
如图...
|
||
2025-06-11 10:59:52,041 - DEBUG - 块 149 生成文本: <triplet> 函数 <concept> SME <misc> part of</s>
|
||
2025-06-11 10:59:52,042 - DEBUG - 原始生成文本: <triplet> 函数 <concept> SME <misc> part of</s>
|
||
2025-06-11 10:59:52,042 - DEBUG - 处理后标记: ['<triplet>', '函数', '<concept>', 'SME', '<misc>', 'part of']
|
||
2025-06-11 10:59:52,042 - DEBUG - 添加三元组: 函数(concept) - part of - SME(misc)
|
||
2025-06-11 10:59:52,042 - DEBUG - 块 149 提取到 1 个三元组
|
||
2025-06-11 10:59:52,042 - DEBUG - 处理块 150/753: 与头实体嵌入 组合, 得到 ; 并通过函数 与尾实体嵌入 组合, 得到 . ...
|
||
2025-06-11 10:59:52,351 - DEBUG - 块 150 生成文本: <triplet> 点积匹配 <concept> 评分函 数 <misc> <unk>gv(t;r) <dis> based on</s>
|
||
2025-06-11 10:59:52,351 - DEBUG - 原始生成文本: <triplet> 点积匹配 <concept> 评分函 数 <misc> <unk>gv(t;r) <dis> based on</s>
|
||
2025-06-11 10:59:52,351 - DEBUG - 处理后标记: ['<triplet>', '点积匹配', '<concept>', '评分函 数', '<misc>', '<unk>', 'gv(t;r)', '<dis>', 'based on']
|
||
2025-06-11 10:59:52,351 - DEBUG - 添加三元组: 点积匹配(concept) - <unk> - 评分函 数(misc)
|
||
2025-06-11 10:59:52,351 - DEBUG - 块 150 提取到 1 个三元组
|
||
2025-06-11 10:59:52,351 - DEBUG - 处理块 151/753: SME为语义匹配的能量函数定义了线性形式、双线性形式两个版本, 定义如下:
|
||
SME线性形式:
|
||
{ g...
|
||
2025-06-11 10:59:52,789 - DEBUG - 块 151 生成文本: <triplet> ◦ <concept> 能量函数 <misc> part of</s>
|
||
2025-06-11 10:59:52,789 - DEBUG - 原始生成文本: <triplet> ◦ <concept> 能量函数 <misc> part of</s>
|
||
2025-06-11 10:59:52,789 - DEBUG - 处理后标记: ['<triplet>', '◦', '<concept>', '能量函数', '<misc>', 'part of']
|
||
2025-06-11 10:59:52,789 - DEBUG - 添加三元组: ◦(concept) - part of - 能量函数(misc)
|
||
2025-06-11 10:59:52,789 - DEBUG - 块 151 提取到 1 个三元组
|
||
2025-06-11 10:59:52,789 - DEBUG - 处理块 152/753: M2
|
||
ur
|
||
)
|
||
+bu
|
||
gv(t;r) =
|
||
(
|
||
M1
|
||
vt
|
||
)
|
||
◦
|
||
(
|
||
M2
|
||
vr
|
||
)
|
||
+bv
|
||
(3...
|
||
2025-06-11 10:59:53,345 - DEBUG - 块 152 生成文本: <triplet> 投影矩阵 <concept> 偏置向量 <unk> <misc> <dis> <per> 符号</s>
|
||
2025-06-11 10:59:53,345 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> 偏置向量 <unk> <misc> <dis> <per> 符号</s>
|
||
2025-06-11 10:59:53,345 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', '偏置向量', '<unk>', '<misc>', '<dis>', '<per>', '符号']
|
||
2025-06-11 10:59:53,345 - DEBUG - 添加三元组: 投影矩阵(concept) - <misc> - 偏置向量(unk)
|
||
2025-06-11 10:59:53,345 - DEBUG - 块 152 提取到 1 个三元组
|
||
2025-06-11 10:59:53,345 - DEBUG - 处理块 153/753: SME进一步扩展了它的双线性形式, 用三阶张量代替它的矩阵, 以提高其建模能力.
|
||
● LFM: 隐变...
|
||
2025-06-11 10:59:54,103 - DEBUG - 块 153 生成文本: <triplet> 隐变量模型 <concept> 软件学报 2023年 第 34卷 第 1期 (h;r;t) <dis> <misc> 关系特定双线性变换考虑实体和关系之间的相关性, 286 <media> part of</s>
|
||
2025-06-11 10:59:54,103 - DEBUG - 原始生成文本: <triplet> 隐变量模型 <concept> 软件学报 2023年 第 34卷 第 1期 (h;r;t) <dis> <misc> 关系特定双线性变换考虑实体和关系之间的相关性, 286 <media> part of</s>
|
||
2025-06-11 10:59:54,104 - DEBUG - 处理后标记: ['<triplet>', '隐变量模型', '<concept>', '软件学报 2023年 第 34卷 第 1期 (h;r;t)', '<dis>', '<misc>', '关系特定双线性变换考虑实体和关系之间的相关性, 286', '<media>', 'part of']
|
||
2025-06-11 10:59:54,104 - DEBUG - 添加三元组: 隐变量模型(concept) - <misc> - 软件学报 2023年 第 34卷 第 1期 (h;r;t)(dis)
|
||
2025-06-11 10:59:54,104 - DEBUG - 块 153 提取到 1 个三元组
|
||
2025-06-11 10:59:54,104 - DEBUG - 处理块 154/753: LFM为每个三元组 定义评分函数为:
|
||
fr (h;t) = h⊤Mrt (36)
|
||
|
||
Mr ∈ ...
|
||
2025-06-11 10:59:54,830 - DEBUG - 块 154 生成文本: <triplet> 双线性变换矩阵 <concept> LFM <misc> 三元组 <dis> <media> <cel> <per> 定义评分函数 <unk> <org> <eve> <triplet> fr(h;t) = h<unk>Mrt (36) Mr ∈ Rd×d <loc> <time> part of</s>
|
||
2025-06-11 10:59:54,830 - DEBUG - 原始生成文本: <triplet> 双线性变换矩阵 <concept> LFM <misc> 三元组 <dis> <media> <cel> <per> 定义评分函数 <unk> <org> <eve> <triplet> fr(h;t) = h<unk>Mrt (36) Mr ∈ Rd×d <loc> <time> part of</s>
|
||
2025-06-11 10:59:54,830 - DEBUG - 处理后标记: ['<triplet>', '双线性变换矩阵', '<concept>', 'LFM', '<misc>', '三元组', '<dis>', '<media>', '<cel>', '<per>', '定义评分函数', '<unk>', '<org>', '<eve>', '<triplet>', 'fr(h;t) = h', '<unk>', 'Mrt (36) Mr ∈ Rd×d', '<loc>', '<time>', 'part of']
|
||
2025-06-11 10:59:54,830 - DEBUG - 添加三元组: 双线性变换矩阵(concept) - 三元组 - LFM(misc)
|
||
2025-06-11 10:59:54,830 - DEBUG - 添加三元组: fr(h;t) = h(unk) - <time> - Mrt (36) Mr ∈ Rd×d(loc)
|
||
2025-06-11 10:59:54,830 - DEBUG - 块 154 提取到 2 个三元组
|
||
2025-06-11 10:59:54,830 - DEBUG - 处理块 155/753: Mr
|
||
● DistMult: DistMult[38]限制 为对角矩阵减少了LFM中关系参数的数...
|
||
2025-06-11 10:59:54,979 - DEBUG - 块 155 生成文本: <triplet> <misc> 对角矩阵 <concept> subclass of</s>
|
||
2025-06-11 10:59:54,980 - DEBUG - 原始生成文本: <triplet> <misc> 对角矩阵 <concept> subclass of</s>
|
||
2025-06-11 10:59:54,980 - DEBUG - 处理后标记: ['<triplet>', '<misc>', '对角矩阵', '<concept>', 'subclass of']
|
||
2025-06-11 10:59:54,980 - DEBUG - 处理块 156/753: 对于每个关系 , DistMult引入一个向量嵌入 , 并要求 , 评分函数定义为:
|
||
f...
|
||
2025-06-11 10:59:55,246 - DEBUG - 块 156 生成文本: <triplet> <concept> DistMult <media> used by</s>
|
||
2025-06-11 10:59:55,246 - DEBUG - 原始生成文本: <triplet> <concept> DistMult <media> used by</s>
|
||
2025-06-11 10:59:55,246 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'DistMult', '<media>', 'used by']
|
||
2025-06-11 10:59:55,246 - DEBUG - 处理块 157/753: 该分数仅捕获沿相同维度h和t分量之间的成对交互作用, 减少了每个关系的参数数量. 对于任何h和t, ...
|
||
2025-06-11 10:59:55,405 - DEBUG - 块 157 生成文本: <triplet> 张量分解 <concept> INDSCAL <media> part of</s>
|
||
2025-06-11 10:59:55,405 - DEBUG - 原始生成文本: <triplet> 张量分解 <concept> INDSCAL <media> part of</s>
|
||
2025-06-11 10:59:55,405 - DEBUG - 处理后标记: ['<triplet>', '张量分解', '<concept>', 'INDSCAL', '<media>', 'part of']
|
||
2025-06-11 10:59:55,405 - DEBUG - 添加三元组: 张量分解(concept) - part of - INDSCAL(media)
|
||
2025-06-11 10:59:55,405 - DEBUG - 块 157 提取到 1 个三元组
|
||
2025-06-11 10:59:55,405 - DEBUG - 处理块 158/753: 分量之间的成对交互作用, 减少了每个关系的参数数量. 对于任何h和t, 满足 . 因此, 这种
|
||
...
|
||
2025-06-11 10:59:55,565 - DEBUG - 块 158 生成文本: <triplet> 张量分解 <concept> INDSCAL <media> instance of</s>
|
||
2025-06-11 10:59:55,565 - DEBUG - 原始生成文本: <triplet> 张量分解 <concept> INDSCAL <media> instance of</s>
|
||
2025-06-11 10:59:55,565 - DEBUG - 处理后标记: ['<triplet>', '张量分解', '<concept>', 'INDSCAL', '<media>', 'instance of']
|
||
2025-06-11 10:59:55,565 - DEBUG - 添加三元组: 张量分解(concept) - instance of - INDSCAL(media)
|
||
2025-06-11 10:59:55,565 - DEBUG - 块 158 提取到 1 个三元组
|
||
2025-06-11 10:59:55,565 - DEBUG - 处理块 159/753: ● HolE: 为了捕获关系数据中的丰富交互并有效地进行计算, Nickel等人提出了全息嵌入(ho...
|
||
2025-06-11 10:59:55,703 - DEBUG - 块 159 生成文本: <triplet> 嵌入 <concept> Nickel <per> developer</s>
|
||
2025-06-11 10:59:55,703 - DEBUG - 原始生成文本: <triplet> 嵌入 <concept> Nickel <per> developer</s>
|
||
2025-06-11 10:59:55,703 - DEBUG - 处理后标记: ['<triplet>', '嵌入', '<concept>', 'Nickel', '<per>', 'developer']
|
||
2025-06-11 10:59:55,703 - DEBUG - 添加三元组: 嵌入(concept) - developer - Nickel(per)
|
||
2025-06-11 10:59:55,703 - DEBUG - 块 159 提取到 1 个三元组
|
||
2025-06-11 10:59:55,703 - DEBUG - 处理块 160/753: 性和简单性相结合, HolE使用头、尾实体向量的循环相关性表示实体对, 即使用组合运算符: , ...
|
||
2025-06-11 10:59:56,322 - DEBUG - 块 160 生成文本: <triplet> 循环相关性 <concept> 张量乘法 <misc> instance of</s>
|
||
2025-06-11 10:59:56,322 - DEBUG - 原始生成文本: <triplet> 循环相关性 <concept> 张量乘法 <misc> instance of</s>
|
||
2025-06-11 10:59:56,322 - DEBUG - 处理后标记: ['<triplet>', '循环相关性', '<concept>', '张量乘法', '<misc>', 'instance of']
|
||
2025-06-11 10:59:56,322 - DEBUG - 添加三元组: 循环相关性(concept) - instance of - 张量乘法(misc)
|
||
2025-06-11 10:59:56,322 - DEBUG - 块 160 提取到 1 个三元组
|
||
2025-06-11 10:59:56,322 - DEBUG - 处理块 161/753: 通过在语义上匹配循环相关性与关系嵌入, HolE模型的评分函数定义为:
|
||
fr (h;t) = r⊤ ...
|
||
2025-06-11 10:59:56,471 - DEBUG - 块 161 生成文本: <triplet> 循环相关性 <concept>RESCAL <media> based on</s>
|
||
2025-06-11 10:59:56,472 - DEBUG - 原始生成文本: <triplet> 循环相关性 <concept>RESCAL <media> based on</s>
|
||
2025-06-11 10:59:56,472 - DEBUG - 处理后标记: ['<triplet>', '循环相关性', '<concept>', 'RESCAL', '<media>', 'based on']
|
||
2025-06-11 10:59:56,472 - DEBUG - 添加三元组: 循环相关性(concept) - based on - RESCAL(media)
|
||
2025-06-11 10:59:56,472 - DEBUG - 块 161 提取到 1 个三元组
|
||
2025-06-11 10:59:56,472 - DEBUG - 处理块 162/753: (b) HolE(a) RESCAL
|
||
fr (h,t) fr (h,t)
|
||
h t
|
||
r
|
||
h t
|
||
Mr
|
||
...
|
||
2025-06-11 10:59:56,984 - DEBUG - 块 162 生成文本: <triplet> 图 7 <concept> RESCAL <misc> <unk> REScal <media> <dis> <cel> 神经网络 <org> <eve> <triplet>RESCAL和HolE <loc> <time> 实体 <per> instance of</s>
|
||
2025-06-11 10:59:56,984 - DEBUG - 原始生成文本: <triplet> 图 7 <concept> RESCAL <misc> <unk> REScal <media> <dis> <cel> 神经网络 <org> <eve> <triplet>RESCAL和HolE <loc> <time> 实体 <per> instance of</s>
|
||
2025-06-11 10:59:56,984 - DEBUG - 处理后标记: ['<triplet>', '图 7', '<concept>', 'RESCAL', '<misc>', '<unk>', 'REScal', '<media>', '<dis>', '<cel>', '神经网络', '<org>', '<eve>', '<triplet>', 'RESCAL和HolE', '<loc>', '<time>', '实体', '<per>', 'instance of']
|
||
2025-06-11 10:59:56,984 - DEBUG - 添加三元组: 图 7(concept) - <unk> - RESCAL(misc)
|
||
2025-06-11 10:59:56,984 - DEBUG - 块 162 提取到 1 个三元组
|
||
2025-06-11 10:59:56,985 - DEBUG - 处理块 163/753: ● ComplEx: 由于DistMult模型过于简化, 只能处理对称关系, 复数嵌入(comple...
|
||
2025-06-11 10:59:57,145 - DEBUG - 块 163 生成文本: <triplet> 复数嵌入 <concept> ComplEx <media> used by</s>
|
||
2025-06-11 10:59:57,145 - DEBUG - 原始生成文本: <triplet> 复数嵌入 <concept> ComplEx <media> used by</s>
|
||
2025-06-11 10:59:57,145 - DEBUG - 处理后标记: ['<triplet>', '复数嵌入', '<concept>', 'ComplEx', '<media>', 'used by']
|
||
2025-06-11 10:59:57,145 - DEBUG - 添加三元组: 复数嵌入(concept) - used by - ComplEx(media)
|
||
2025-06-11 10:59:57,145 - DEBUG - 块 163 提取到 1 个三元组
|
||
2025-06-11 10:59:57,145 - DEBUG - 处理块 164/753: 系, 完善了DistMult模型.
|
||
h;r;t
|
||
h;t;r ∈ Cd
|
||
(h;r;t)
|
||
在ComplE...
|
||
2025-06-11 10:59:57,316 - DEBUG - 块 164 生成文本: <triplet> 实值空间 <concept> ComplEx <media> part of</s>
|
||
2025-06-11 10:59:57,316 - DEBUG - 原始生成文本: <triplet> 实值空间 <concept> ComplEx <media> part of</s>
|
||
2025-06-11 10:59:57,316 - DEBUG - 处理后标记: ['<triplet>', '实值空间', '<concept>', 'ComplEx', '<media>', 'part of']
|
||
2025-06-11 10:59:57,316 - DEBUG - 添加三元组: 实值空间(concept) - part of - ComplEx(media)
|
||
2025-06-11 10:59:57,316 - DEBUG - 块 164 提取到 1 个三元组
|
||
2025-06-11 10:59:57,316 - DEBUG - 处理块 165/753: fr (h;t) = Re
|
||
(
|
||
h⊤diag(r)t
|
||
)
|
||
(40)
|
||
|
||
t
|
||
t
|
||
Re(·)
|
||
其中, ...
|
||
2025-06-11 10:59:57,977 - DEBUG - 块 165 生成文本: <triplet> 实部 <concept> Re(h;t) = Re (h<unk>diag(r)t <misc> Re <loc> part of <dis> <unk> <cel> Re{t} <per> t <media> part</s>
|
||
2025-06-11 10:59:57,977 - DEBUG - 原始生成文本: <triplet> 实部 <concept> Re(h;t) = Re (h<unk>diag(r)t <misc> Re <loc> part of <dis> <unk> <cel> Re{t} <per> t <media> part</s>
|
||
2025-06-11 10:59:57,977 - DEBUG - 处理后标记: ['<triplet>', '实部', '<concept>', 'Re(h;t) = Re (h', '<unk>', 'diag(r)t', '<misc>', 'Re', '<loc>', 'part of', '<dis>', '<unk>', '<cel>', 'Re{t}', '<per>', 't', '<media>', 'part']
|
||
2025-06-11 10:59:57,978 - DEBUG - 添加三元组: 实部(concept) - diag(r)t - Re(h;t) = Re (h(unk)
|
||
2025-06-11 10:59:57,978 - DEBUG - 块 165 提取到 1 个三元组
|
||
2025-06-11 10:59:57,978 - DEBUG - 处理块 166/753: 文献[67]已经证明ComplEx在数学上等效于HolE, 并且ComplEx将HolE归类为对嵌入...
|
||
2025-06-11 10:59:58,115 - DEBUG - 块 166 生成文本: <triplet> 实体 <concept>RESCAL <media> part of</s>
|
||
2025-06-11 10:59:58,116 - DEBUG - 原始生成文本: <triplet> 实体 <concept>RESCAL <media> part of</s>
|
||
2025-06-11 10:59:58,116 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', 'RESCAL', '<media>', 'part of']
|
||
2025-06-11 10:59:58,116 - DEBUG - 添加三元组: 实体(concept) - part of - RESCAL(media)
|
||
2025-06-11 10:59:58,116 - DEBUG - 块 166 提取到 1 个三元组
|
||
2025-06-11 10:59:58,116 - DEBUG - 处理块 167/753: ● ANALOGY: ANALOGY[68]侧重于多关系推理, 对关系数据的类比结构进行建模. AN...
|
||
2025-06-11 10:59:58,820 - DEBUG - 块 167 生成文本: <triplet> 张天成 <per> 知识图谱嵌入技术研究综述 <concept> <media> <unk> 等 <org> 编译本 <loc> published in</s>
|
||
2025-06-11 10:59:58,820 - DEBUG - 原始生成文本: <triplet> 张天成 <per> 知识图谱嵌入技术研究综述 <concept> <media> <unk> 等 <org> 编译本 <loc> published in</s>
|
||
2025-06-11 10:59:58,820 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<per>', '知识图谱嵌入技术研究综述', '<concept>', '<media>', '<unk>', '等', '<org>', '编译本', '<loc>', 'published in']
|
||
2025-06-11 10:59:58,820 - DEBUG - 添加三元组: 张天成(per) - <media> - 知识图谱嵌入技术研究综述(concept)
|
||
2025-06-11 10:59:58,820 - DEBUG - 块 167 提取到 1 个三元组
|
||
2025-06-11 10:59:58,820 - DEBUG - 处理块 168/753: h;t ∈ Rd
|
||
Mr ∈ Rd×d
|
||
其中, 是头、尾实体的向量嵌入, 是与关系相关联的...
|
||
2025-06-11 10:59:59,268 - DEBUG - 块 168 生成文本: <triplet> <unk> 线性映射 <concept> subclass of</s>
|
||
2025-06-11 10:59:59,268 - DEBUG - 原始生成文本: <triplet> <unk> 线性映射 <concept> subclass of</s>
|
||
2025-06-11 10:59:59,268 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '线性映射', '<concept>', 'subclass of']
|
||
2025-06-11 10:59:59,268 - DEBUG - 处理块 169/753: commutativity:MrMr′ = Mr′ Mr;∀r;r′ ∈ R (42)
|
||
|
||
虽然AN...
|
||
2025-06-11 10:59:59,618 - DEBUG - 块 169 生成文本: <triplet> <concept> ANALOGY <misc> part of</s>
|
||
2025-06-11 10:59:59,618 - DEBUG - 原始生成文本: <triplet> <concept> ANALOGY <misc> part of</s>
|
||
2025-06-11 10:59:59,618 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ANALOGY', '<misc>', 'part of']
|
||
2025-06-11 10:59:59,619 - DEBUG - 处理块 170/753: ● SimplE: CP分解(canonical Polyadic decomposition)[6...
|
||
2025-06-11 11:00:00,270 - DEBUG - 块 170 生成文本: <triplet> 头实体嵌入 <concept> 张量分解 <misc> <media> 关系学习 <unk> <dis> <org> 尾实体 <cel> part of</s>
|
||
2025-06-11 11:00:00,270 - DEBUG - 原始生成文本: <triplet> 头实体嵌入 <concept> 张量分解 <misc> <media> 关系学习 <unk> <dis> <org> 尾实体 <cel> part of</s>
|
||
2025-06-11 11:00:00,270 - DEBUG - 处理后标记: ['<triplet>', '头实体嵌入', '<concept>', '张量分解', '<misc>', '<media>', '关系学习', '<unk>', '<dis>', '<org>', '尾实体', '<cel>', 'part of']
|
||
2025-06-11 11:00:00,270 - DEBUG - 添加三元组: 头实体嵌入(concept) - <media> - 张量分解(misc)
|
||
2025-06-11 11:00:00,270 - DEBUG - 块 170 提取到 1 个三元组
|
||
2025-06-11 11:00:00,270 - DEBUG - 处理块 171/753: 嵌入的学习是独立的, 这导致了CP方法在知识图谱补全上性能较差. SimplE[70]是基于CP的张...
|
||
2025-06-11 11:00:00,750 - DEBUG - 块 171 生成文本: <triplet> 张量分量分解 <concept> CP <media> <misc> 知识图谱补全</s>
|
||
2025-06-11 11:00:00,750 - DEBUG - 原始生成文本: <triplet> 张量分量分解 <concept> CP <media> <misc> 知识图谱补全</s>
|
||
2025-06-11 11:00:00,750 - DEBUG - 处理后标记: ['<triplet>', '张量分量分解', '<concept>', 'CP', '<media>', '<misc>', '知识图谱补全']
|
||
2025-06-11 11:00:00,750 - DEBUG - 添加三元组: 张量分量分解(concept) - <misc> - CP(media)
|
||
2025-06-11 11:00:00,750 - DEBUG - 块 171 提取到 1 个三元组
|
||
2025-06-11 11:00:00,750 - DEBUG - 处理块 172/753: SimplE可以被看成是一种可解释的且具有完全表达能力的双线性模型, 与其他模型相比, 它具有完全表...
|
||
2025-06-11 11:00:00,888 - DEBUG - 块 172 生成文本: <triplet> <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:00:00,888 - DEBUG - 原始生成文本: <triplet> <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:00:00,888 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 11:00:00,888 - DEBUG - 处理块 173/753: fr (h;t)= 1
|
||
2(h ◦rt +t ◦r′t) (43)
|
||
|
||
◦
|
||
其中, r'是关系的逆的...
|
||
2025-06-11 11:00:01,154 - DEBUG - 块 173 生成文本: <triplet> <misc> 矩阵分解模型 <concept> instance of</s>
|
||
2025-06-11 11:00:01,154 - DEBUG - 原始生成文本: <triplet> <misc> 矩阵分解模型 <concept> instance of</s>
|
||
2025-06-11 11:00:01,154 - DEBUG - 处理后标记: ['<triplet>', '<misc>', '矩阵分解模型', '<concept>', 'instance of']
|
||
2025-06-11 11:00:01,154 - DEBUG - 处理块 174/753: hMrt
|
||
(h;r;t)
|
||
矩阵分解是获得低维向量表示的一项重要技术, 在利用矩阵分解进行知识表示学习...
|
||
2025-06-11 11:00:01,817 - DEBUG - 块 174 生成文本: <triplet> 矩阵分解 <concept> 三向张量分解的新型关系学习方法 <media> 知识表示学习中的一个典型模型 <misc> 关系学 <eve> <triplet> RESCAL[17,18,它是一种 <per> 的一种 <org> notable work or inventor</s>
|
||
2025-06-11 11:00:01,817 - DEBUG - 原始生成文本: <triplet> 矩阵分解 <concept> 三向张量分解的新型关系学习方法 <media> 知识表示学习中的一个典型模型 <misc> 关系学 <eve> <triplet> RESCAL[17,18,它是一种 <per> 的一种 <org> notable work or inventor</s>
|
||
2025-06-11 11:00:01,817 - DEBUG - 处理后标记: ['<triplet>', '矩阵分解', '<concept>', '三向张量分解的新型关系学习方法', '<media>', '知识表示学习中的一个典型模型', '<misc>', '关系学', '<eve>', '<triplet>', 'RESCAL[17,18,它是一种', '<per>', '的一种', '<org>', 'notable work or inventor']
|
||
2025-06-11 11:00:01,817 - DEBUG - 添加三元组: 矩阵分解(concept) - 知识表示学习中的一个典型模型 - 三向张量分解的新型关系学习方法(media)
|
||
2025-06-11 11:00:01,817 - DEBUG - 添加三元组: RESCAL[17,18,它是一种(per) - notable work or inventor - 的一种(org)
|
||
2025-06-11 11:00:01,818 - DEBUG - 块 174 提取到 2 个三元组
|
||
2025-06-11 11:00:01,818 - DEBUG - 处理块 175/753: 量分解操作, 在RESCAL中, KG中的三元组 形成一个大的张量X, 如果三元组存在, 则 ...
|
||
2025-06-11 11:00:02,136 - DEBUG - 块 175 生成文本: <triplet> 张 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:00:02,137 - DEBUG - 原始生成文本: <triplet> 张 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:00:02,137 - DEBUG - 处理后标记: ['<triplet>', '张', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:00:02,137 - DEBUG - 添加三元组: 张(concept) - part of - KG(misc)
|
||
2025-06-11 11:00:02,137 - DEBUG - 块 175 提取到 1 个三元组
|
||
2025-06-11 11:00:02,137 - DEBUG - 处理块 176/753: ∑d−1
|
||
j=0
|
||
[Mr]i j·[h]i ·[t]j (44)
|
||
|
||
h;t ∈ Rd
|
||
[h]i
|
||
[...
|
||
2025-06-11 11:00:02,584 - DEBUG - 块 176 生成文本: <triplet> 向量 <concept> 关系相 <misc> <unk> 方程 <dis> part of</s>
|
||
2025-06-11 11:00:02,584 - DEBUG - 原始生成文本: <triplet> 向量 <concept> 关系相 <misc> <unk> 方程 <dis> part of</s>
|
||
2025-06-11 11:00:02,584 - DEBUG - 处理后标记: ['<triplet>', '向量', '<concept>', '关系相', '<misc>', '<unk>', '方程', '<dis>', 'part of']
|
||
2025-06-11 11:00:02,584 - DEBUG - 添加三元组: 向量(concept) - <unk> - 关系相(misc)
|
||
2025-06-11 11:00:02,584 - DEBUG - 块 176 提取到 1 个三元组
|
||
2025-06-11 11:00:02,584 - DEBUG - 处理块 177/753: 关联的矩阵. 该分数捕获了h和t的所有分量之间的成对交互作用(见图7(a)), 表示矩阵 ...
|
||
2025-06-11 11:00:03,052 - DEBUG - 块 177 生成文本: <triplet> 关联的矩阵 <concept> LFM模型 <misc> LMF <media> part of</s>
|
||
2025-06-11 11:00:03,053 - DEBUG - 原始生成文本: <triplet> 关联的矩阵 <concept> LFM模型 <misc> LMF <media> part of</s>
|
||
2025-06-11 11:00:03,053 - DEBUG - 处理后标记: ['<triplet>', '关联的矩阵', '<concept>', 'LFM模型', '<misc>', 'LMF', '<media>', 'part of']
|
||
2025-06-11 11:00:03,053 - DEBUG - 添加三元组: 关联的矩阵(concept) - LMF - LFM模型(misc)
|
||
2025-06-11 11:00:03,053 - DEBUG - 块 177 提取到 1 个三元组
|
||
2025-06-11 11:00:03,053 - DEBUG - 处理块 178/753: TATEC[71]模型不仅对三向交互 进行建模, 而且还建模双向交互, 例如实体与关系之间的交互...
|
||
2025-06-11 11:00:03,213 - DEBUG - 块 178 生成文本: <triplet> 对角矩阵 <concept> part of</s>
|
||
2025-06-11 11:00:03,213 - DEBUG - 原始生成文本: <triplet> 对角矩阵 <concept> part of</s>
|
||
2025-06-11 11:00:03,213 - DEBUG - 处理后标记: ['<triplet>', '对角矩阵', '<concept>', 'part of']
|
||
2025-06-11 11:00:03,213 - DEBUG - 处理块 179/753: 通过引入三阶Tucker张量分解, TuckER[72]通过输出一个核心张量以及实体和关系的嵌入向量...
|
||
2025-06-11 11:00:04,089 - DEBUG - 块 179 生成文本: <triplet> 张量分解 <concept> 三阶Tucker <per> TuckER[72] <misc> 学习嵌入向量 <media> <unk> 函数 <org> <eve> 演化 <dis> <time> part of</s>
|
||
2025-06-11 11:00:04,089 - DEBUG - 原始生成文本: <triplet> 张量分解 <concept> 三阶Tucker <per> TuckER[72] <misc> 学习嵌入向量 <media> <unk> 函数 <org> <eve> 演化 <dis> <time> part of</s>
|
||
2025-06-11 11:00:04,089 - DEBUG - 处理后标记: ['<triplet>', '张量分解', '<concept>', '三阶Tucker', '<per>', 'TuckER[72]', '<misc>', '学习嵌入向量', '<media>', '<unk>', '函数', '<org>', '<eve>', '演化', '<dis>', '<time>', 'part of']
|
||
2025-06-11 11:00:04,089 - DEBUG - 添加三元组: 张量分解(concept) - TuckER[72] - 三阶Tucker(per)
|
||
2025-06-11 11:00:04,089 - DEBUG - 块 179 提取到 1 个三元组
|
||
2025-06-11 11:00:04,089 - DEBUG - 处理块 180/753: 其中, 是Tucker分解得到的核心张量, 和 分别表示实体和关系的向量维数, ...
|
||
2025-06-11 11:00:04,697 - DEBUG - 块 180 生成文本: <triplet> 向量维数 <concept> 张量乘法 <misc> Tucker <per> <org> 的核心 <dis> <eve> 函数 <media> 法理查 <loc> <triplet> 第几维的 <unk> 方程 <time> part of</s>
|
||
2025-06-11 11:00:04,697 - DEBUG - 原始生成文本: <triplet> 向量维数 <concept> 张量乘法 <misc> Tucker <per> <org> 的核心 <dis> <eve> 函数 <media> 法理查 <loc> <triplet> 第几维的 <unk> 方程 <time> part of</s>
|
||
2025-06-11 11:00:04,697 - DEBUG - 处理后标记: ['<triplet>', '向量维数', '<concept>', '张量乘法', '<misc>', 'Tucker', '<per>', '<org>', '的核心', '<dis>', '<eve>', '函数', '<media>', '法理查', '<loc>', '<triplet>', '第几维的', '<unk>', '方程', '<time>', 'part of']
|
||
2025-06-11 11:00:04,697 - DEBUG - 添加三元组: 向量维数(concept) - Tucker - 张量乘法(misc)
|
||
2025-06-11 11:00:04,697 - DEBUG - 添加三元组: 第几维的(unk) - part of - 方程(time)
|
||
2025-06-11 11:00:04,697 - DEBUG - 块 180 提取到 2 个三元组
|
||
2025-06-11 11:00:04,697 - DEBUG - 处理块 181/753: 除了RESCAL模型, 在知识图谱嵌入中还有其他的利用矩阵分解的研究工作. 文献[17,73]学习头...
|
||
2025-06-11 11:00:05,155 - DEBUG - 块 181 生成文本: <triplet> 学习头尾实体 <concept> 实体-关系矩阵Y <misc> part of</s>
|
||
2025-06-11 11:00:05,155 - DEBUG - 原始生成文本: <triplet> 学习头尾实体 <concept> 实体-关系矩阵Y <misc> part of</s>
|
||
2025-06-11 11:00:05,155 - DEBUG - 处理后标记: ['<triplet>', '学习头尾实体', '<concept>', '实体-关系矩阵Y', '<misc>', 'part of']
|
||
2025-06-11 11:00:05,155 - DEBUG - 添加三元组: 学习头尾实体(concept) - part of - 实体-关系矩阵Y(misc)
|
||
2025-06-11 11:00:05,155 - DEBUG - 块 181 提取到 1 个三元组
|
||
2025-06-11 11:00:05,155 - DEBUG - 处理块 182/753: 将Y分解为实体对 嵌入 和关系嵌入 , 事实的合理性通过P与r的内积衡量. 类似地, 文...
|
||
2025-06-11 11:00:05,571 - DEBUG - 块 182 生成文本: <triplet> 实体建模 <concept> <unk> 向量对头实体 <misc> subclass of</s>
|
||
2025-06-11 11:00:05,571 - DEBUG - 原始生成文本: <triplet> 实体建模 <concept> <unk> 向量对头实体 <misc> subclass of</s>
|
||
2025-06-11 11:00:05,571 - DEBUG - 处理后标记: ['<triplet>', '实体建模', '<concept>', '<unk>', '向量对头实体', '<misc>', 'subclass of']
|
||
2025-06-11 11:00:05,571 - DEBUG - 处理块 183/753: 关系-尾实体对 建模为另一个向量 . 然而, 这样的成对建模不能捕获成对的交互, 并且更容易...
|
||
2025-06-11 11:00:05,879 - DEBUG - 块 183 生成文本: <triplet> 关系-尾实体对建模 <concept> 神经网络模型 <misc> part of</s>
|
||
2025-06-11 11:00:05,880 - DEBUG - 原始生成文本: <triplet> 关系-尾实体对建模 <concept> 神经网络模型 <misc> part of</s>
|
||
2025-06-11 11:00:05,880 - DEBUG - 处理后标记: ['<triplet>', '关系-尾实体对建模', '<concept>', '神经网络模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:05,880 - DEBUG - 添加三元组: 关系-尾实体对建模(concept) - part of - 神经网络模型(misc)
|
||
2025-06-11 11:00:05,880 - DEBUG - 块 183 提取到 1 个三元组
|
||
2025-06-11 11:00:05,880 - DEBUG - 处理块 184/753: 神经网络模型旨在以实体和关系的嵌入为输入, 通过神经网络输出事实三元组的概率. 神经网络用非线性神
|
||
...
|
||
2025-06-11 11:00:06,209 - DEBUG - 块 184 生成文本: <triplet> 神经网络 <concept> 编码语义匹配 <misc> part of</s>
|
||
2025-06-11 11:00:06,209 - DEBUG - 原始生成文本: <triplet> 神经网络 <concept> 编码语义匹配 <misc> part of</s>
|
||
2025-06-11 11:00:06,209 - DEBUG - 处理后标记: ['<triplet>', '神经网络', '<concept>', '编码语义匹配', '<misc>', 'part of']
|
||
2025-06-11 11:00:06,209 - DEBUG - 添加三元组: 神经网络(concept) - part of - 编码语义匹配(misc)
|
||
2025-06-11 11:00:06,209 - DEBUG - 块 184 提取到 1 个三元组
|
||
2025-06-11 11:00:06,209 - DEBUG - 处理块 185/753: 预测性能. 具有线性/双线性块的编码模型也可以使用神经网络进行建模, 例如: SME模型(具体介绍见...
|
||
2025-06-11 11:00:06,571 - DEBUG - 块 185 生成文本: <triplet> 神经网络模型 <concept> 编码模型也可以 <misc> subclass of</s>
|
||
2025-06-11 11:00:06,571 - DEBUG - 原始生成文本: <triplet> 神经网络模型 <concept> 编码模型也可以 <misc> subclass of</s>
|
||
2025-06-11 11:00:06,571 - DEBUG - 处理后标记: ['<triplet>', '神经网络模型', '<concept>', '编码模型也可以', '<misc>', 'subclass of']
|
||
2025-06-11 11:00:06,571 - DEBUG - 添加三元组: 神经网络模型(concept) - subclass of - 编码模型也可以(misc)
|
||
2025-06-11 11:00:06,571 - DEBUG - 块 185 提取到 1 个三元组
|
||
2025-06-11 11:00:06,571 - DEBUG - 处理块 186/753: (a) MLP (b) NTN
|
||
(c) NAM (DNN) (d) NAM (RMNN)
|
||
fr (...
|
||
2025-06-11 11:00:06,922 - DEBUG - 块 186 生成文本: <triplet> <concept> NTN <media> part of <triplet> NCT <org> NNN <loc> part <per> N <misc> N N</s>
|
||
2025-06-11 11:00:06,922 - DEBUG - 原始生成文本: <triplet> <concept> NTN <media> part of <triplet> NCT <org> NNN <loc> part <per> N <misc> N N</s>
|
||
2025-06-11 11:00:06,922 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'NTN', '<media>', 'part of', '<triplet>', 'NCT', '<org>', 'NNN', '<loc>', 'part', '<per>', 'N', '<misc>', 'N N']
|
||
2025-06-11 11:00:06,922 - DEBUG - 处理块 187/753: h r t
|
||
r
|
||
Mr
|
||
M2
|
||
rM1
|
||
r
|
||
h t
|
||
t
|
||
W(L)
|
||
W(2)
|
||
W(1)
|
||
r h
|
||
W(L)
|
||
...
|
||
2025-06-11 11:00:07,262 - DEBUG - 块 187 生成文本: <triplet> <concept> W(L) <misc> part of</s>
|
||
2025-06-11 11:00:07,263 - DEBUG - 原始生成文本: <triplet> <concept> W(L) <misc> part of</s>
|
||
2025-06-11 11:00:07,263 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'W(L)', '<misc>', 'part of']
|
||
2025-06-11 11:00:07,263 - DEBUG - 处理块 188/753: out: z(2)
|
||
In: a(1)
|
||
out: z(1)
|
||
B(L+1)
|
||
B(L)
|
||
B(2)
|
||
B(1)...
|
||
2025-06-11 11:00:07,668 - DEBUG - 块 188 生成文本: <triplet> 图 8 <concept> MLP <misc> anatomical location</s>
|
||
2025-06-11 11:00:07,668 - DEBUG - 原始生成文本: <triplet> 图 8 <concept> MLP <misc> anatomical location</s>
|
||
2025-06-11 11:00:07,669 - DEBUG - 处理后标记: ['<triplet>', '图 8', '<concept>', 'MLP', '<misc>', 'anatomical location']
|
||
2025-06-11 11:00:07,669 - DEBUG - 添加三元组: 图 8(concept) - anatomical location - MLP(misc)
|
||
2025-06-11 11:00:07,669 - DEBUG - 块 188 提取到 1 个三元组
|
||
2025-06-11 11:00:07,669 - DEBUG - 处理块 189/753: ● MLP: 多层感知机(multi-layer perceptron, MLP)[76]也被称为多...
|
||
2025-06-11 11:00:08,030 - DEBUG - 块 189 生成文本: <triplet> 多层感知机 <misc> 人工神经网络 <concept> subclass of</s>
|
||
2025-06-11 11:00:08,030 - DEBUG - 原始生成文本: <triplet> 多层感知机 <misc> 人工神经网络 <concept> subclass of</s>
|
||
2025-06-11 11:00:08,030 - DEBUG - 处理后标记: ['<triplet>', '多层感知机', '<misc>', '人工神经网络', '<concept>', 'subclass of']
|
||
2025-06-11 11:00:08,030 - DEBUG - 添加三元组: 多层感知机(misc) - subclass of - 人工神经网络(concept)
|
||
2025-06-11 11:00:08,030 - DEBUG - 块 189 提取到 1 个三元组
|
||
2025-06-11 11:00:08,030 - DEBUG - 处理块 190/753: fr (h;t)= w⊤ tanh(M1h+M2r+M3t) (47)
|
||
|
||
M1;M2;M3∈ Rd...
|
||
2025-06-11 11:00:09,025 - DEBUG - 块 190 生成文本: <triplet> 单层神经网络模型 <concept> SLM <misc> <media> <per> <org> <unk> <eve> <dis> <loc> <cel> <time> <date> point</s>
|
||
2025-06-11 11:00:09,025 - DEBUG - 原始生成文本: <triplet> 单层神经网络模型 <concept> SLM <misc> <media> <per> <org> <unk> <eve> <dis> <loc> <cel> <time> <date> point</s>
|
||
2025-06-11 11:00:09,025 - DEBUG - 处理后标记: ['<triplet>', '单层神经网络模型', '<concept>', 'SLM', '<misc>', '<media>', '<per>', '<org>', '<unk>', '<eve>', '<dis>', '<loc>', '<cel>', '<time>', '<date>', 'point']
|
||
2025-06-11 11:00:09,025 - DEBUG - 添加三元组: 单层神经网络模型(concept) - <media> - SLM(misc)
|
||
2025-06-11 11:00:09,025 - DEBUG - 块 190 提取到 1 个三元组
|
||
2025-06-11 11:00:09,025 - DEBUG - 处理块 191/753: 非线性操作隐式的连接实体与关系嵌入, 以减轻基本距离模型(SE)无法协同精确刻画实体与关系的语义联系...
|
||
2025-06-11 11:00:09,785 - DEBUG - 块 191 生成文本: <triplet> 连接实体与关系嵌入 <concept> 语义联系问 题 <media> SLM模型 <misc> part of</s>
|
||
2025-06-11 11:00:09,785 - DEBUG - 原始生成文本: <triplet> 连接实体与关系嵌入 <concept> 语义联系问 题 <media> SLM模型 <misc> part of</s>
|
||
2025-06-11 11:00:09,785 - DEBUG - 处理后标记: ['<triplet>', '连接实体与关系嵌入', '<concept>', '语义联系问 题', '<media>', 'SLM模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:09,785 - DEBUG - 添加三元组: 连接实体与关系嵌入(concept) - SLM模型 - 语义联系问 题(media)
|
||
2025-06-11 11:00:09,785 - DEBUG - 块 191 提取到 1 个三元组
|
||
2025-06-11 11:00:09,785 - DEBUG - 处理块 192/753: 其中, 是投影矩阵. 虽然SLM模型对基本距离模型(SE)进行了改进, 但是非线性操作是以一个...
|
||
2025-06-11 11:00:10,512 - DEBUG - 块 192 生成文本: <triplet> 投影矩阵 <concept> SLM模型 <misc> 基本距离模型(SE) <media> <time> 实体向量 <dis> <cel> <org> <eve> 的一种 <per> part of</s>
|
||
2025-06-11 11:00:10,512 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> SLM模型 <misc> 基本距离模型(SE) <media> <time> 实体向量 <dis> <cel> <org> <eve> 的一种 <per> part of</s>
|
||
2025-06-11 11:00:10,512 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', 'SLM模型', '<misc>', '基本距离模型(SE)', '<media>', '<time>', '实体向量', '<dis>', '<cel>', '<org>', '<eve>', '的一种', '<per>', 'part of']
|
||
2025-06-11 11:00:10,512 - DEBUG - 添加三元组: 投影矩阵(concept) - 基本距离模型(SE) - SLM模型(misc)
|
||
2025-06-11 11:00:10,512 - DEBUG - 块 192 提取到 1 个三元组
|
||
2025-06-11 11:00:10,512 - DEBUG - 处理块 193/753: ● NTN: 张量神经网络模型(neural tensor network, NTN)[77]利用双...
|
||
2025-06-11 11:00:11,013 - DEBUG - 块 193 生成文本: <triplet> 张量神经网络模型 <concept> NTN <misc> part of</s>
|
||
2025-06-11 11:00:11,013 - DEBUG - 原始生成文本: <triplet> 张量神经网络模型 <concept> NTN <misc> part of</s>
|
||
2025-06-11 11:00:11,013 - DEBUG - 处理后标记: ['<triplet>', '张量神经网络模型', '<concept>', 'NTN', '<misc>', 'part of']
|
||
2025-06-11 11:00:11,013 - DEBUG - 添加三元组: 张量神经网络模型(concept) - part of - NTN(misc)
|
||
2025-06-11 11:00:11,013 - DEBUG - 块 193 提取到 1 个三元组
|
||
2025-06-11 11:00:11,013 - DEBUG - 处理块 194/753: fr (h;t) = r⊤tanh
|
||
(
|
||
h⊤Mr t+M1
|
||
r h+M2
|
||
r t+br
|
||
)
|
||
(49)...
|
||
2025-06-11 11:00:11,547 - DEBUG - 块 194 生成文本: <triplet> <concept> 三阶张量 <misc> subclass of</s>
|
||
2025-06-11 11:00:11,548 - DEBUG - 原始生成文本: <triplet> <concept> 三阶张量 <misc> subclass of</s>
|
||
2025-06-11 11:00:11,548 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '三阶张量', '<misc>', 'subclass of']
|
||
2025-06-11 11:00:11,548 - DEBUG - 处理块 195/753: 出, SLM是NTN将张量层数设置为0时的特殊情况, 同时它还可以看作是MLP和双线性模型的组合.
|
||
...
|
||
2025-06-11 11:00:11,931 - DEBUG - 块 195 生成文本: <triplet> 单词向量 <concept> NTN <misc> part of</s>
|
||
2025-06-11 11:00:11,931 - DEBUG - 原始生成文本: <triplet> 单词向量 <concept> NTN <misc> part of</s>
|
||
2025-06-11 11:00:11,931 - DEBUG - 处理后标记: ['<triplet>', '单词向量', '<concept>', 'NTN', '<misc>', 'part of']
|
||
2025-06-11 11:00:11,931 - DEBUG - 添加三元组: 单词向量(concept) - part of - NTN(misc)
|
||
2025-06-11 11:00:11,931 - DEBUG - 块 195 提取到 1 个三元组
|
||
2025-06-11 11:00:11,931 - DEBUG - 处理块 196/753: NTN中的张量运算可以更明确地描述实体与关系之间的复杂关系语义关联, 但NTN的高复杂性限制了其在大...
|
||
2025-06-11 11:00:12,336 - DEBUG - 块 196 生成文本: <triplet> 神经网络 <concept> Liu <per> discoverer or inventor</s>
|
||
2025-06-11 11:00:12,337 - DEBUG - 原始生成文本: <triplet> 神经网络 <concept> Liu <per> discoverer or inventor</s>
|
||
2025-06-11 11:00:12,337 - DEBUG - 处理后标记: ['<triplet>', '神经网络', '<concept>', 'Liu', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:00:12,337 - DEBUG - 添加三元组: 神经网络(concept) - discoverer or inventor - Liu(per)
|
||
2025-06-11 11:00:12,337 - DEBUG - 块 196 提取到 1 个三元组
|
||
2025-06-11 11:00:12,337 - DEBUG - 处理块 197/753: 智能中的概率推理. 该模型利用深度神经网络中的多层非线性激活函数建模头、尾实体之间的条件概率, 文
|
||
...
|
||
2025-06-11 11:00:12,666 - DEBUG - 块 197 生成文本: <triplet> 智能中的概率推理 <concept>NAM <media> 深度神经网络 <misc> モデル结构 <org> 文 献 <per> author</s>
|
||
2025-06-11 11:00:12,666 - DEBUG - 原始生成文本: <triplet> 智能中的概率推理 <concept>NAM <media> 深度神经网络 <misc> モデル结构 <org> 文 献 <per> author</s>
|
||
2025-06-11 11:00:12,666 - DEBUG - 处理后标记: ['<triplet>', '智能中的概率推理', '<concept>', 'NAM', '<media>', '深度神经网络', '<misc>', 'モデル结构', '<org>', '文 献', '<per>', 'author']
|
||
2025-06-11 11:00:12,666 - DEBUG - 添加三元组: 智能中的概率推理(concept) - 深度神经网络 - NAM(media)
|
||
2025-06-11 11:00:12,666 - DEBUG - 块 197 提取到 1 个三元组
|
||
2025-06-11 11:00:12,666 - DEBUG - 处理块 198/753: 称为关系调制神经网络的结构(relation-modulated neural nets, RMNN...
|
||
2025-06-11 11:00:12,868 - DEBUG - 块 198 生成文本: <triplet> 连接头实体 <concept> 事实三元组 <misc> part of</s>
|
||
2025-06-11 11:00:12,868 - DEBUG - 原始生成文本: <triplet> 连接头实体 <concept> 事实三元组 <misc> part of</s>
|
||
2025-06-11 11:00:12,868 - DEBUG - 处理后标记: ['<triplet>', '连接头实体', '<concept>', '事实三元组', '<misc>', 'part of']
|
||
2025-06-11 11:00:12,868 - DEBUG - 添加三元组: 连接头实体(concept) - part of - 事实三元组(misc)
|
||
2025-06-11 11:00:12,868 - DEBUG - 块 198 提取到 1 个三元组
|
||
2025-06-11 11:00:12,868 - DEBUG - 处理块 199/753: 量, 得到 , 并将 作为输入馈送到一个由L个整流线性隐层组成的深度神经网络, 使得:
|
||
{ ...
|
||
2025-06-11 11:00:13,401 - DEBUG - 块 199 生成文本: <triplet> 隐层 <concept> 深度神经网络 <misc> 网络</s>
|
||
2025-06-11 11:00:13,401 - DEBUG - 原始生成文本: <triplet> 隐层 <concept> 深度神经网络 <misc> 网络</s>
|
||
2025-06-11 11:00:13,401 - DEBUG - 处理后标记: ['<triplet>', '隐层', '<concept>', '深度神经网络', '<misc>', '网络']
|
||
2025-06-11 11:00:13,401 - DEBUG - 添加三元组: 隐层(concept) - 网络 - 深度神经网络(misc)
|
||
2025-06-11 11:00:13,401 - DEBUG - 块 199 提取到 1 个三元组
|
||
2025-06-11 11:00:13,401 - DEBUG - 处理块 200/753: 其中, 和 分别表示第l层的权重矩阵和偏置.
|
||
通过利用最后一个隐层输出与尾实体嵌入计算每个...
|
||
2025-06-11 11:00:13,571 - DEBUG - 块 200 生成文本: <triplet> 隐层 <concept> Sigmoid <misc> part of</s>
|
||
2025-06-11 11:00:13,571 - DEBUG - 原始生成文本: <triplet> 隐层 <concept> Sigmoid <misc> part of</s>
|
||
2025-06-11 11:00:13,572 - DEBUG - 处理后标记: ['<triplet>', '隐层', '<concept>', 'Sigmoid', '<misc>', 'part of']
|
||
2025-06-11 11:00:13,572 - DEBUG - 添加三元组: 隐层(concept) - part of - Sigmoid(misc)
|
||
2025-06-11 11:00:13,572 - DEBUG - 块 200 提取到 1 个三元组
|
||
2025-06-11 11:00:13,572 - DEBUG - 处理块 201/753: 与NAM-DNN不同, 如图8(d)所示, NAM-RMNN将关系嵌入r连接到深度神经网络中的所有隐...
|
||
2025-06-11 11:00:15,516 - DEBUG - 块 201 生成文本: <triplet> 隐藏层 <concept> 深度神经网络 <misc> part of</s>
|
||
2025-06-11 11:00:15,516 - DEBUG - 原始生成文本: <triplet> 隐藏层 <concept> 深度神经网络 <misc> part of</s>
|
||
2025-06-11 11:00:15,516 - DEBUG - 处理后标记: ['<triplet>', '隐藏层', '<concept>', '深度神经网络', '<misc>', 'part of']
|
||
2025-06-11 11:00:15,516 - DEBUG - 添加三元组: 隐藏层(concept) - part of - 深度神经网络(misc)
|
||
2025-06-11 11:00:15,516 - DEBUG - 块 201 提取到 1 个三元组
|
||
2025-06-11 11:00:15,516 - DEBUG - 处理块 202/753: 其中, 和 分别表示第 层的权重矩阵和关系特定权重矩阵. 并且NAM-RMNN在最上层...
|
||
2025-06-11 11:00:16,264 - DEBUG - 块 202 生成文本: <triplet> 权重矩阵 <concept>NAM-RMNN <misc> 模型总结 <org>NAM <media> <per> <eve> <loc> <time> <cel> 层 <unk>z(L) <dis> follows</s>
|
||
2025-06-11 11:00:16,264 - DEBUG - 原始生成文本: <triplet> 权重矩阵 <concept>NAM-RMNN <misc> 模型总结 <org>NAM <media> <per> <eve> <loc> <time> <cel> 层 <unk>z(L) <dis> follows</s>
|
||
2025-06-11 11:00:16,264 - DEBUG - 处理后标记: ['<triplet>', '权重矩阵', '<concept>', 'NAM-RMNN', '<misc>', '模型总结', '<org>', 'NAM', '<media>', '<per>', '<eve>', '<loc>', '<time>', '<cel>', '层', '<unk>', 'z(L)', '<dis>', 'follows']
|
||
2025-06-11 11:00:16,264 - DEBUG - 添加三元组: 权重矩阵(concept) - 模型总结 - NAM-RMNN(misc)
|
||
2025-06-11 11:00:16,264 - DEBUG - 块 202 提取到 1 个三元组
|
||
2025-06-11 11:00:16,264 - DEBUG - 处理块 203/753: 本节介绍了基于相似性评分函数的语义匹配模型, 并按照对实体和关系的交互进行编码的不同模型体系结构
|
||
进...
|
||
2025-06-11 11:00:16,722 - DEBUG - 块 203 生成文本: <triplet> 语义匹配模型 <concept> 相似性评分函数 <misc> 神经网络模型3个部分 <unk> 模型体系结构 <media> part of</s>
|
||
2025-06-11 11:00:16,723 - DEBUG - 原始生成文本: <triplet> 语义匹配模型 <concept> 相似性评分函数 <misc> 神经网络模型3个部分 <unk> 模型体系结构 <media> part of</s>
|
||
2025-06-11 11:00:16,723 - DEBUG - 处理后标记: ['<triplet>', '语义匹配模型', '<concept>', '相似性评分函数', '<misc>', '神经网络模型3个部分', '<unk>', '模型体系结构', '<media>', 'part of']
|
||
2025-06-11 11:00:16,723 - DEBUG - 添加三元组: 语义匹配模型(concept) - 神经网络模型3个部分 - 相似性评分函数(misc)
|
||
2025-06-11 11:00:16,723 - DEBUG - 块 203 提取到 1 个三元组
|
||
2025-06-11 11:00:16,723 - DEBUG - 处理块 204/753: 大多数翻译模型和双线性模型是2016年之前提出的方法, 而最近几年研究KGE的方法众多. 本小节简要...
|
||
2025-06-11 11:00:16,924 - DEBUG - 块 204 生成文本: <triplet> 旋转模型 <concept> 卷积神经网络 <misc> subclass of</s>
|
||
2025-06-11 11:00:16,924 - DEBUG - 原始生成文本: <triplet> 旋转模型 <concept> 卷积神经网络 <misc> subclass of</s>
|
||
2025-06-11 11:00:16,924 - DEBUG - 处理后标记: ['<triplet>', '旋转模型', '<concept>', '卷积神经网络', '<misc>', 'subclass of']
|
||
2025-06-11 11:00:16,924 - DEBUG - 添加三元组: 旋转模型(concept) - subclass of - 卷积神经网络(misc)
|
||
2025-06-11 11:00:16,924 - DEBUG - 块 204 提取到 1 个三元组
|
||
2025-06-11 11:00:16,924 - DEBUG - 处理块 205/753: 卷积神经网络(convolutional neural networks, CNNs)在自然语言处理...
|
||
2025-06-11 11:00:17,544 - DEBUG - 块 205 生成文本: <triplet> 卷积神经网络 <concept> 自然语言处理领域 <media> 全连接神经 <misc> 学习非线性特征 <unk> <per> <eve> 神经科学 <loc> part of</s>
|
||
2025-06-11 11:00:17,544 - DEBUG - 原始生成文本: <triplet> 卷积神经网络 <concept> 自然语言处理领域 <media> 全连接神经 <misc> 学习非线性特征 <unk> <per> <eve> 神经科学 <loc> part of</s>
|
||
2025-06-11 11:00:17,544 - DEBUG - 处理后标记: ['<triplet>', '卷积神经网络', '<concept>', '自然语言处理领域', '<media>', '全连接神经', '<misc>', '学习非线性特征', '<unk>', '<per>', '<eve>', '神经科学', '<loc>', 'part of']
|
||
2025-06-11 11:00:17,544 - DEBUG - 添加三元组: 卷积神经网络(concept) - 全连接神经 - 自然语言处理领域(media)
|
||
2025-06-11 11:00:17,544 - DEBUG - 块 205 提取到 1 个三元组
|
||
2025-06-11 11:00:17,544 - DEBUG - 处理块 206/753: 是第一个使用二维卷积层的神经链接预测模型, 其中输入实体和关系之间的交互由卷积层和全连接层建模, 图...
|
||
2025-06-11 11:00:18,281 - DEBUG - 块 206 生成文本: <triplet> 卷积层 <concept> ConvE模型 <misc> part of</s>
|
||
2025-06-11 11:00:18,281 - DEBUG - 原始生成文本: <triplet> 卷积层 <concept> ConvE模型 <misc> part of</s>
|
||
2025-06-11 11:00:18,282 - DEBUG - 处理后标记: ['<triplet>', '卷积层', '<concept>', 'ConvE模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:18,282 - DEBUG - 添加三元组: 卷积层(concept) - part of - ConvE模型(misc)
|
||
2025-06-11 11:00:18,282 - DEBUG - 块 206 提取到 1 个三元组
|
||
2025-06-11 11:00:18,282 - DEBUG - 处理块 207/753: 矩阵被用作卷积层的输入(步骤③); 将得到的特征映射张量向量化并投影到k维空间中(步骤④), 并与所...
|
||
2025-06-11 11:00:18,633 - DEBUG - 块 207 生成文本: <triplet> 头实体 <concept> 二维矩阵 <misc> part of</s>
|
||
2025-06-11 11:00:18,633 - DEBUG - 原始生成文本: <triplet> 头实体 <concept> 二维矩阵 <misc> part of</s>
|
||
2025-06-11 11:00:18,633 - DEBUG - 处理后标记: ['<triplet>', '头实体', '<concept>', '二维矩阵', '<misc>', 'part of']
|
||
2025-06-11 11:00:18,633 - DEBUG - 添加三元组: 头实体(concept) - part of - 二维矩阵(misc)
|
||
2025-06-11 11:00:18,633 - DEBUG - 块 207 提取到 1 个三元组
|
||
2025-06-11 11:00:18,633 - DEBUG - 处理块 208/753: 阵W和尾实体进行计算, 判断当前事实三元组的可信度. 形式上, ConvE的评分函数定义如下:
|
||
fr...
|
||
2025-06-11 11:00:19,208 - DEBUG - 块 208 生成文本: <triplet> 阵W和尾实体 <concept> 可信度 <misc> ConvE的评分函数 <media> <unk> <eve> <per> <dis> <cel> <triplet> Rdw×dh d = dwdh <loc> <time> <date> point in time</s>
|
||
2025-06-11 11:00:19,208 - DEBUG - 原始生成文本: <triplet> 阵W和尾实体 <concept> 可信度 <misc> ConvE的评分函数 <media> <unk> <eve> <per> <dis> <cel> <triplet> Rdw×dh d = dwdh <loc> <time> <date> point in time</s>
|
||
2025-06-11 11:00:19,208 - DEBUG - 处理后标记: ['<triplet>', '阵W和尾实体', '<concept>', '可信度', '<misc>', 'ConvE的评分函数', '<media>', '<unk>', '<eve>', '<per>', '<dis>', '<cel>', '<triplet>', 'Rdw×dh d = dwdh', '<loc>', '<time>', '<date>', 'point in time']
|
||
2025-06-11 11:00:19,208 - DEBUG - 添加三元组: 阵W和尾实体(concept) - ConvE的评分函数 - 可信度(misc)
|
||
2025-06-11 11:00:19,208 - DEBUG - 添加三元组: Rdw×dh d = dwdh(loc) - point in time - <time>(date)
|
||
2025-06-11 11:00:19,208 - DEBUG - 块 208 提取到 2 个三元组
|
||
2025-06-11 11:00:19,208 - DEBUG - 处理块 209/753: 其中, 分别表示头实体嵌入h和关系嵌入r的二维矩阵, 如果 , 则 , 其中 ,
|
||
...
|
||
2025-06-11 11:00:19,410 - DEBUG - 块 209 生成文本: <triplet> 向量化 <concept> 张量重构 <misc> subclass of</s>
|
||
2025-06-11 11:00:19,410 - DEBUG - 原始生成文本: <triplet> 向量化 <concept> 张量重构 <misc> subclass of</s>
|
||
2025-06-11 11:00:19,410 - DEBUG - 处理后标记: ['<triplet>', '向量化', '<concept>', '张量重构', '<misc>', 'subclass of']
|
||
2025-06-11 11:00:19,411 - DEBUG - 添加三元组: 向量化(concept) - subclass of - 张量重构(misc)
|
||
2025-06-11 11:00:19,411 - DEBUG - 块 209 提取到 1 个三元组
|
||
2025-06-11 11:00:19,411 - DEBUG - 处理块 210/753: ConvE是用于链接预测最简单的多层卷积体系结构, 可以通过多层非线性特征学习表达语义信息, 并且该...
|
||
2025-06-11 11:00:20,094 - DEBUG - 块 210 生成文本: <triplet> 模 型 <concept> 多层非线性特征学习 <misc> ConvE <org> <media> <eve> <per> <triplet> R-GCN[80]模型 <loc> <dis> <date> <cel> 特征 <time> instance</s>
|
||
2025-06-11 11:00:20,095 - DEBUG - 原始生成文本: <triplet> 模 型 <concept> 多层非线性特征学习 <misc> ConvE <org> <media> <eve> <per> <triplet> R-GCN[80]模型 <loc> <dis> <date> <cel> 特征 <time> instance</s>
|
||
2025-06-11 11:00:20,095 - DEBUG - 处理后标记: ['<triplet>', '模 型', '<concept>', '多层非线性特征学习', '<misc>', 'ConvE', '<org>', '<media>', '<eve>', '<per>', '<triplet>', 'R-GCN[80]模型', '<loc>', '<dis>', '<date>', '<cel>', '特征', '<time>', 'instance']
|
||
2025-06-11 11:00:20,095 - DEBUG - 添加三元组: 模 型(concept) - ConvE - 多层非线性特征学习(misc)
|
||
2025-06-11 11:00:20,095 - DEBUG - 添加三元组: R-GCN[80]模型(loc) - <cel> - <dis>(date)
|
||
2025-06-11 11:00:20,095 - DEBUG - 块 210 提取到 2 个三元组
|
||
2025-06-11 11:00:20,095 - DEBUG - 处理块 211/753: 类别 模型 实体嵌入 关系嵌入
|
||
fr (h;t) 评分函数
|
||
线性/双线性模型
|
||
SME[20]
|
||
h...
|
||
2025-06-11 11:00:20,563 - DEBUG - 块 211 生成文本: <triplet> 线性模型 <concept> 实体嵌入 <unk> <misc> <media> <loc> <dis> <org> <eve> <per> <time> <cel> <triplet> R ca_XX <date> point</s>
|
||
2025-06-11 11:00:20,563 - DEBUG - 原始生成文本: <triplet> 线性模型 <concept> 实体嵌入 <unk> <misc> <media> <loc> <dis> <org> <eve> <per> <time> <cel> <triplet> R ca_XX <date> point</s>
|
||
2025-06-11 11:00:20,563 - DEBUG - 处理后标记: ['<triplet>', '线性模型', '<concept>', '实体嵌入', '<unk>', '<misc>', '<media>', '<loc>', '<dis>', '<org>', '<eve>', '<per>', '<time>', '<cel>', '<triplet>', 'R ca_XX', '<date>', 'point']
|
||
2025-06-11 11:00:20,563 - DEBUG - 添加三元组: 线性模型(concept) - <misc> - 实体嵌入(unk)
|
||
2025-06-11 11:00:20,563 - DEBUG - 块 211 提取到 1 个三元组
|
||
2025-06-11 11:00:20,563 - DEBUG - 处理块 212/753:
|
||
DistMult[38]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
h⊤diag(r)t ...
|
||
2025-06-11 11:00:20,733 - DEBUG - 块 212 生成文本: <triplet> <concept> DistMult <misc> part of</s>
|
||
2025-06-11 11:00:20,733 - DEBUG - 原始生成文本: <triplet> <concept> DistMult <misc> part of</s>
|
||
2025-06-11 11:00:20,733 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'DistMult', '<misc>', 'part of']
|
||
2025-06-11 11:00:20,733 - DEBUG - 处理块 213/753: )
|
||
ANALOGY[68]
|
||
h;t ∈ Rd
|
||
Mr ∈ Rd×d
|
||
h⊤Mrt ...
|
||
2025-06-11 11:00:21,169 - DEBUG - 块 213 生成文本: <triplet> <concept> RESCAL <media> part of the series <triplet> REScal <misc> 矩阵分解模型</s>
|
||
2025-06-11 11:00:21,170 - DEBUG - 原始生成文本: <triplet> <concept> RESCAL <media> part of the series <triplet> REScal <misc> 矩阵分解模型</s>
|
||
2025-06-11 11:00:21,170 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'RESCAL', '<media>', 'part of the series', '<triplet>', 'REScal', '<misc>', '矩阵分解模型']
|
||
2025-06-11 11:00:21,170 - DEBUG - 处理块 214/753: h⊤Mrt
|
||
TATEC[71]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
Mr ∈ Rd×d ...
|
||
2025-06-11 11:00:21,734 - DEBUG - 块 214 生成文本: <triplet> <concept> TATEC <misc> part of the series</s>
|
||
2025-06-11 11:00:21,734 - DEBUG - 原始生成文本: <triplet> <concept> TATEC <misc> part of the series</s>
|
||
2025-06-11 11:00:21,734 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TATEC', '<misc>', 'part of the series']
|
||
2025-06-11 11:00:21,734 - DEBUG - 处理块 215/753: h;t ∈ Rd
|
||
r ∈ Rd
|
||
w⊤ tanh(M1h+M2r+M3t)
|
||
SLM[...
|
||
2025-06-11 11:00:22,117 - DEBUG - 块 215 生成文本: <triplet> <unk> tanh <concept> subclass of</s>
|
||
2025-06-11 11:00:22,117 - DEBUG - 原始生成文本: <triplet> <unk> tanh <concept> subclass of</s>
|
||
2025-06-11 11:00:22,117 - DEBUG - 处理后标记: ['<triplet>', '<unk>', 'tanh', '<concept>', 'subclass of']
|
||
2025-06-11 11:00:22,117 - DEBUG - 处理块 216/753: r;br ∈ Rk
|
||
Mr ∈ Rd×d×k
|
||
M1
|
||
r ;M2
|
||
r ∈ Rk×d , ...
|
||
2025-06-11 11:00:22,533 - DEBUG - 块 216 生成文本: <triplet> <unk> Sigmoid <concept> part of</s>
|
||
2025-06-11 11:00:22,533 - DEBUG - 原始生成文本: <triplet> <unk> Sigmoid <concept> part of</s>
|
||
2025-06-11 11:00:22,533 - DEBUG - 处理后标记: ['<triplet>', '<unk>', 'Sigmoid', '<concept>', 'part of']
|
||
2025-06-11 11:00:22,533 - DEBUG - 处理块 217/753:
|
||
0.9
|
||
0.2
|
||
0.1
|
||
0.6
|
||
0.2
|
||
0.3
|
||
0.0
|
||
0.7
|
||
0.1
|
||
0.4
|
||
0.4
|
||
0.4...
|
||
2025-06-11 11:00:23,206 - DEBUG - 块 217 生成文本: <triplet> 隐层 dropout <concept> 矩阵乘法 <misc> 预测 <media> Logits <per> <org> 嵌入 “图” 特征映射 <eve> 投影到 <cel> 偏向 <dis> part of</s>
|
||
2025-06-11 11:00:23,206 - DEBUG - 原始生成文本: <triplet> 隐层 dropout <concept> 矩阵乘法 <misc> 预测 <media> Logits <per> <org> 嵌入 “图” 特征映射 <eve> 投影到 <cel> 偏向 <dis> part of</s>
|
||
2025-06-11 11:00:23,206 - DEBUG - 处理后标记: ['<triplet>', '隐层 dropout', '<concept>', '矩阵乘法', '<misc>', '预测', '<media>', 'Logits', '<per>', '<org>', '嵌入 “图” 特征映射', '<eve>', '投影到', '<cel>', '偏向', '<dis>', 'part of']
|
||
2025-06-11 11:00:23,207 - DEBUG - 添加三元组: 隐层 dropout(concept) - 预测 - 矩阵乘法(misc)
|
||
2025-06-11 11:00:23,207 - DEBUG - 块 217 提取到 1 个三元组
|
||
2025-06-11 11:00:23,207 - DEBUG - 处理块 218/753: ① 连接 ② 卷积 ③ 全连接投影
|
||
④与实体矩阵 êLogistic
|
||
Sigmoid
|
||
|
||
图 9 C...
|
||
2025-06-11 11:00:23,922 - DEBUG - 块 218 生成文本: <triplet> 卷积 <concept> 实体矩阵 <misc> part of</s>
|
||
2025-06-11 11:00:23,923 - DEBUG - 原始生成文本: <triplet> 卷积 <concept> 实体矩阵 <misc> part of</s>
|
||
2025-06-11 11:00:23,923 - DEBUG - 处理后标记: ['<triplet>', '卷积', '<concept>', '实体矩阵', '<misc>', 'part of']
|
||
2025-06-11 11:00:23,923 - DEBUG - 添加三元组: 卷积(concept) - part of - 实体矩阵(misc)
|
||
2025-06-11 11:00:23,923 - DEBUG - 块 218 提取到 1 个三元组
|
||
2025-06-11 11:00:23,923 - DEBUG - 处理块 219/753: 有考虑嵌入三元组 中相同维度条目之间的全局关系, 忽略了过渡特征. 针对这个问题, Nguyen...
|
||
2025-06-11 11:00:24,082 - DEBUG - 块 219 生成文本: <triplet> 嵌入模型 <concept> ConvKB <misc> used by</s>
|
||
2025-06-11 11:00:24,082 - DEBUG - 原始生成文本: <triplet> 嵌入模型 <concept> ConvKB <misc> used by</s>
|
||
2025-06-11 11:00:24,082 - DEBUG - 处理后标记: ['<triplet>', '嵌入模型', '<concept>', 'ConvKB', '<misc>', 'used by']
|
||
2025-06-11 11:00:24,083 - DEBUG - 添加三元组: 嵌入模型(concept) - used by - ConvKB(misc)
|
||
2025-06-11 11:00:24,083 - DEBUG - 块 219 提取到 1 个三元组
|
||
2025-06-11 11:00:24,083 - DEBUG - 处理块 220/753: (h;r;t)
|
||
(h;r;t)
|
||
k ×3
|
||
1×3
|
||
!
|
||
|
||
图10显示了ConvKB的计算过程(嵌入大...
|
||
2025-06-11 11:00:24,359 - DEBUG - 块 220 生成文本: <triplet> 实体 <concept> ConvKB <misc> part of</s>
|
||
2025-06-11 11:00:24,359 - DEBUG - 原始生成文本: <triplet> 实体 <concept> ConvKB <misc> part of</s>
|
||
2025-06-11 11:00:24,359 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', 'ConvKB', '<misc>', 'part of']
|
||
2025-06-11 11:00:24,359 - DEBUG - 添加三元组: 实体(concept) - part of - ConvKB(misc)
|
||
2025-06-11 11:00:24,359 - DEBUG - 块 220 提取到 1 个三元组
|
||
2025-06-11 11:00:24,359 - DEBUG - 处理块 221/753: 的输入矩阵, 将该输入矩阵馈送到卷积层, 在卷积层中使用对应 形状的不同过滤器提取嵌入三元组的相...
|
||
2025-06-11 11:00:24,678 - DEBUG - 块 221 生成文本: <triplet> 卷积层 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:00:24,678 - DEBUG - 原始生成文本: <triplet> 卷积层 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:00:24,678 - DEBUG - 处理后标记: ['<triplet>', '卷积层', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 11:00:24,678 - DEBUG - 添加三元组: 卷积层(concept) - part of - 三元组(misc)
|
||
2025-06-11 11:00:24,678 - DEBUG - 块 221 提取到 1 个三元组
|
||
2025-06-11 11:00:24,678 - DEBUG - 处理块 222/753: w
|
||
(
|
||
w ∈ Rk×1
|
||
)
|
||
(h;r;t)
|
||
过滤器的集合和过滤器的数目, 即: , 则得到 ...
|
||
2025-06-11 11:00:25,008 - DEBUG - 块 222 生成文本: <triplet> 过滤器 <concept> ConvKB模型 <misc> part of</s>
|
||
2025-06-11 11:00:25,008 - DEBUG - 原始生成文本: <triplet> 过滤器 <concept> ConvKB模型 <misc> part of</s>
|
||
2025-06-11 11:00:25,008 - DEBUG - 处理后标记: ['<triplet>', '过滤器', '<concept>', 'ConvKB模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:25,008 - DEBUG - 添加三元组: 过滤器(concept) - part of - ConvKB模型(misc)
|
||
2025-06-11 11:00:25,008 - DEBUG - 块 222 提取到 1 个三元组
|
||
2025-06-11 11:00:25,008 - DEBUG - 处理块 223/753: fr (h;t) = concat(g( [h;r;t] ∗!)) ·w (55)
|
||
|
||
ConvKB...
|
||
2025-06-11 11:00:25,189 - DEBUG - 块 223 生成文本: <triplet> 卷积 <concept> ReLU <misc> part of</s>
|
||
2025-06-11 11:00:25,189 - DEBUG - 原始生成文本: <triplet> 卷积 <concept> ReLU <misc> part of</s>
|
||
2025-06-11 11:00:25,189 - DEBUG - 处理后标记: ['<triplet>', '卷积', '<concept>', 'ReLU', '<misc>', 'part of']
|
||
2025-06-11 11:00:25,189 - DEBUG - 添加三元组: 卷积(concept) - part of - ReLU(misc)
|
||
2025-06-11 11:00:25,189 - DEBUG - 块 223 提取到 1 个三元组
|
||
2025-06-11 11:00:25,189 - DEBUG - 处理块 224/753: 点积
|
||
k=4
|
||
h r t
|
||
|
||
图 10 ConvKB涉及的计算过程
|
||
● HypER: HypER[...
|
||
2025-06-11 11:00:25,862 - DEBUG - 块 224 生成文本: <triplet> 卷积过滤器 <concept> HypER <media> <org> 超网络 <misc> <eve> 知识图谱 <unk> <loc> <per> 务知识共享 <dis> <time> 图 <cel> 的关系 <triplet> 一维关系特定的 <date> <num> width</s>
|
||
2025-06-11 11:00:25,862 - DEBUG - 原始生成文本: <triplet> 卷积过滤器 <concept> HypER <media> <org> 超网络 <misc> <eve> 知识图谱 <unk> <loc> <per> 务知识共享 <dis> <time> 图 <cel> 的关系 <triplet> 一维关系特定的 <date> <num> width</s>
|
||
2025-06-11 11:00:25,862 - DEBUG - 处理后标记: ['<triplet>', '卷积过滤器', '<concept>', 'HypER', '<media>', '<org>', '超网络', '<misc>', '<eve>', '知识图谱', '<unk>', '<loc>', '<per>', '务知识共享', '<dis>', '<time>', '图', '<cel>', '的关系', '<triplet>', '一维关系特定的', '<date>', '<num>', 'width']
|
||
2025-06-11 11:00:25,862 - DEBUG - 添加三元组: 卷积过滤器(concept) - <org> - HypER(media)
|
||
2025-06-11 11:00:25,862 - DEBUG - 块 224 提取到 1 个三元组
|
||
2025-06-11 11:00:25,862 - DEBUG - 处理块 225/753: 维ConvE模型引入的实体和关系嵌入之间的交互. 此外, HypER模型使用超网络生成的关系特定卷积...
|
||
2025-06-11 11:00:26,396 - DEBUG - 块 225 生成文本: <triplet> 卷积过滤器 <concept> 超网络生成的关系特定 <media> HypER模型 <misc> <org> 维度 <unk> <per> <triplet> Fr Mr de t ∈ T <dis> <eve> part of</s>
|
||
2025-06-11 11:00:26,396 - DEBUG - 原始生成文本: <triplet> 卷积过滤器 <concept> 超网络生成的关系特定 <media> HypER模型 <misc> <org> 维度 <unk> <per> <triplet> Fr Mr de t ∈ T <dis> <eve> part of</s>
|
||
2025-06-11 11:00:26,396 - DEBUG - 处理后标记: ['<triplet>', '卷积过滤器', '<concept>', '超网络生成的关系特定', '<media>', 'HypER模型', '<misc>', '<org>', '维度', '<unk>', '<per>', '<triplet>', 'Fr Mr de t ∈ T', '<dis>', '<eve>', 'part of']
|
||
2025-06-11 11:00:26,396 - DEBUG - 添加三元组: 卷积过滤器(concept) - HypER模型 - 超网络生成的关系特定(media)
|
||
2025-06-11 11:00:26,396 - DEBUG - 块 225 提取到 1 个三元组
|
||
2025-06-11 11:00:26,396 - DEBUG - 处理块 226/753: HypER的可视化如图11所示, 头实体嵌入h与由超网络H根据关系嵌入r创建的滤波器器 进行卷积...
|
||
2025-06-11 11:00:26,566 - DEBUG - 块 226 生成文本: <triplet> 滤波器器 <concept> HypER <misc> used by</s>
|
||
2025-06-11 11:00:26,567 - DEBUG - 原始生成文本: <triplet> 滤波器器 <concept> HypER <misc> used by</s>
|
||
2025-06-11 11:00:26,567 - DEBUG - 处理后标记: ['<triplet>', '滤波器器', '<concept>', 'HypER', '<misc>', 'used by']
|
||
2025-06-11 11:00:26,567 - DEBUG - 添加三元组: 滤波器器(concept) - used by - HypER(misc)
|
||
2025-06-11 11:00:26,567 - DEBUG - 块 226 提取到 1 个三元组
|
||
2025-06-11 11:00:26,567 - DEBUG - 处理块 227/753: 组合, 为每个三元组提供分数, 最后应用Sigmoid函数预测分数. HypER的关系特定评分函数定...
|
||
2025-06-11 11:00:26,853 - DEBUG - 块 227 生成文本: <triplet> <concept> HypER <media> part of</s>
|
||
2025-06-11 11:00:26,853 - DEBUG - 原始生成文本: <triplet> <concept> HypER <media> part of</s>
|
||
2025-06-11 11:00:26,854 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'HypER', '<media>', 'part of']
|
||
2025-06-11 11:00:26,854 - DEBUG - 处理块 228/753: r ∈ Rdr
|
||
Fr = vec−1 (rH) ∈ Rlf nf
|
||
Mr ∈ Rlmnf
|
||
lm = d...
|
||
2025-06-11 11:00:27,504 - DEBUG - 块 228 生成文本: <triplet> 超网络 <concept> ReLU <misc> <dis> 滤波器长度 <unk> Rlmnf lmf <loc> part of <triplet> Rlf <media> 矩阵 <org> Rdr <per> named after</s>
|
||
2025-06-11 11:00:27,504 - DEBUG - 原始生成文本: <triplet> 超网络 <concept> ReLU <misc> <dis> 滤波器长度 <unk> Rlmnf lmf <loc> part of <triplet> Rlf <media> 矩阵 <org> Rdr <per> named after</s>
|
||
2025-06-11 11:00:27,504 - DEBUG - 处理后标记: ['<triplet>', '超网络', '<concept>', 'ReLU', '<misc>', '<dis>', '滤波器长度', '<unk>', 'Rlmnf lmf', '<loc>', 'part of', '<triplet>', 'Rlf', '<media>', '矩阵', '<org>', 'Rdr', '<per>', 'named after']
|
||
2025-06-11 11:00:27,504 - DEBUG - 添加三元组: 超网络(concept) - <dis> - ReLU(misc)
|
||
2025-06-11 11:00:27,504 - DEBUG - 添加三元组: Rlf(media) - Rdr - 矩阵(org)
|
||
2025-06-11 11:00:27,504 - DEBUG - 块 228 提取到 2 个三元组
|
||
2025-06-11 11:00:27,504 - DEBUG - 处理块 229/753: 为每个关系的滤波器数量. 关系嵌入 , 滤波器 . 特征映射 , 其中特征映射长
|
||
度 ...
|
||
2025-06-11 11:00:27,845 - DEBUG - 块 229 生成文本: <triplet> 滤波器 <concept> Sigmoid <misc> part of</s>
|
||
2025-06-11 11:00:27,845 - DEBUG - 原始生成文本: <triplet> 滤波器 <concept> Sigmoid <misc> part of</s>
|
||
2025-06-11 11:00:27,845 - DEBUG - 处理后标记: ['<triplet>', '滤波器', '<concept>', 'Sigmoid', '<misc>', 'part of']
|
||
2025-06-11 11:00:27,845 - DEBUG - 添加三元组: 滤波器(concept) - part of - Sigmoid(misc)
|
||
2025-06-11 11:00:27,845 - DEBUG - 块 229 提取到 1 个三元组
|
||
2025-06-11 11:00:27,845 - DEBUG - 处理块 230/753: 图 11 HypER模型结构的可视化
|
||
HypER是第一个通过将关系特定过滤器与实体嵌入卷积以非线性...
|
||
2025-06-11 11:00:28,004 - DEBUG - 块 230 生成文本: <triplet> 旋转模型 <concept> HypER <misc> used by</s>
|
||
2025-06-11 11:00:28,004 - DEBUG - 原始生成文本: <triplet> 旋转模型 <concept> HypER <misc> used by</s>
|
||
2025-06-11 11:00:28,004 - DEBUG - 处理后标记: ['<triplet>', '旋转模型', '<concept>', 'HypER', '<misc>', 'used by']
|
||
2025-06-11 11:00:28,004 - DEBUG - 添加三元组: 旋转模型(concept) - used by - HypER(misc)
|
||
2025-06-11 11:00:28,004 - DEBUG - 块 230 提取到 1 个三元组
|
||
2025-06-11 11:00:28,004 - DEBUG - 处理块 231/753: 现实世界中的KG通常是不完整的, 因此, 预测缺少的链接是知识图谱面临的一个首要问题. 为了预测缺失...
|
||
2025-06-11 11:00:28,302 - DEBUG - 块 231 生成文本: <triplet> 预测缺失链 <concept> 关系模式 <misc> instance of</s>
|
||
2025-06-11 11:00:28,302 - DEBUG - 原始生成文本: <triplet> 预测缺失链 <concept> 关系模式 <misc> instance of</s>
|
||
2025-06-11 11:00:28,302 - DEBUG - 处理后标记: ['<triplet>', '预测缺失链', '<concept>', '关系模式', '<misc>', 'instance of']
|
||
2025-06-11 11:00:28,302 - DEBUG - 添加三元组: 预测缺失链(concept) - instance of - 关系模式(misc)
|
||
2025-06-11 11:00:28,302 - DEBUG - 块 231 提取到 1 个三元组
|
||
2025-06-11 11:00:28,302 - DEBUG - 处理块 232/753: 292 软件学报 202 3 年 第 3 4 卷 第 1 期
|
||
部分. 例如: TransE模...
|
||
2025-06-11 11:00:28,590 - DEBUG - 块 232 生成文本: <triplet> 软件学报 <media> TransE模型 <concept> part of</s>
|
||
2025-06-11 11:00:28,590 - DEBUG - 原始生成文本: <triplet> 软件学报 <media> TransE模型 <concept> part of</s>
|
||
2025-06-11 11:00:28,590 - DEBUG - 处理后标记: ['<triplet>', '软件学报', '<media>', 'TransE模型', '<concept>', 'part of']
|
||
2025-06-11 11:00:28,590 - DEBUG - 添加三元组: 软件学报(media) - part of - TransE模型(concept)
|
||
2025-06-11 11:00:28,590 - DEBUG - 块 232 提取到 1 个三元组
|
||
2025-06-11 11:00:28,590 - DEBUG - 处理块 233/753: 模反对称关系; ComplEx通过引入复杂的嵌入扩展DisMult, 以更好地对反对称关系进行建模,...
|
||
2025-06-11 11:00:28,792 - DEBUG - 块 233 生成文本: <triplet> 欧拉公式 <concept> Sun <org> developer</s>
|
||
2025-06-11 11:00:28,792 - DEBUG - 原始生成文本: <triplet> 欧拉公式 <concept> Sun <org> developer</s>
|
||
2025-06-11 11:00:28,792 - DEBUG - 处理后标记: ['<triplet>', '欧拉公式', '<concept>', 'Sun', '<org>', 'developer']
|
||
2025-06-11 11:00:28,792 - DEBUG - 添加三元组: 欧拉公式(concept) - developer - Sun(org)
|
||
2025-06-11 11:00:28,792 - DEBUG - 块 233 提取到 1 个三元组
|
||
2025-06-11 11:00:28,792 - DEBUG - 处理块 234/753: 图谱嵌入方法RotatE[84], 该方法能够同时对反转, 对称/反对称和合成等关系模式进行建模和推...
|
||
2025-06-11 11:00:29,282 - DEBUG - 块 234 生成文本: <triplet> 图谱嵌入方法 <concept> <media> <unk> <misc> <eve> <dis> <org> <triplet> hi <loc> ∈ Cd <time> <cel> part of</s>
|
||
2025-06-11 11:00:29,282 - DEBUG - 原始生成文本: <triplet> 图谱嵌入方法 <concept> <media> <unk> <misc> <eve> <dis> <org> <triplet> hi <loc> ∈ Cd <time> <cel> part of</s>
|
||
2025-06-11 11:00:29,282 - DEBUG - 处理后标记: ['<triplet>', '图谱嵌入方法', '<concept>', '<media>', '<unk>', '<misc>', '<eve>', '<dis>', '<org>', '<triplet>', 'hi', '<loc>', '∈ Cd', '<time>', '<cel>', 'part of']
|
||
2025-06-11 11:00:29,282 - DEBUG - 添加三元组: 图谱嵌入方法(concept) - <misc> - <media>(unk)
|
||
2025-06-11 11:00:29,282 - DEBUG - 添加三元组: hi(loc) - <cel> - ∈ Cd(time)
|
||
2025-06-11 11:00:29,282 - DEBUG - 块 234 提取到 2 个三元组
|
||
2025-06-11 11:00:29,282 - DEBUG - 处理块 235/753: RotatE模型将实体和关系映射到复数向量空间, 并将每个关系定义为从头实体到尾实体的旋转. 即给定...
|
||
2025-06-11 11:00:29,441 - DEBUG - 块 235 生成文本: <triplet> 模长 <concept> 三元 <misc> part of</s>
|
||
2025-06-11 11:00:29,442 - DEBUG - 原始生成文本: <triplet> 模长 <concept> 三元 <misc> part of</s>
|
||
2025-06-11 11:00:29,442 - DEBUG - 处理后标记: ['<triplet>', '模长', '<concept>', '三元', '<misc>', 'part of']
|
||
2025-06-11 11:00:29,442 - DEBUG - 添加三元组: 模长(concept) - part of - 三元(misc)
|
||
2025-06-11 11:00:29,442 - DEBUG - 块 235 提取到 1 个三元组
|
||
2025-06-11 11:00:29,442 - DEBUG - 处理块 236/753: 按照上述定义, 对于每个三元组, 将RotatE的评分函数定义如下:
|
||
fr (h;t)= ∥h◦r−...
|
||
2025-06-11 11:00:29,654 - DEBUG - 块 236 生成文本: <triplet> 旋转 <concept> 3种类型的关系模式 <misc> instance of</s>
|
||
2025-06-11 11:00:29,654 - DEBUG - 原始生成文本: <triplet> 旋转 <concept> 3种类型的关系模式 <misc> instance of</s>
|
||
2025-06-11 11:00:29,654 - DEBUG - 处理后标记: ['<triplet>', '旋转', '<concept>', '3种类型的关系模式', '<misc>', 'instance of']
|
||
2025-06-11 11:00:29,654 - DEBUG - 添加三元组: 旋转(concept) - instance of - 3种类型的关系模式(misc)
|
||
2025-06-11 11:00:29,654 - DEBUG - 块 236 提取到 1 个三元组
|
||
2025-06-11 11:00:29,654 - DEBUG - 处理块 237/753: 且由于RotatE模型在时间和内存上都保持线性, 因此易于扩展到大型知识图谱. 此外, 2018年提...
|
||
2025-06-11 11:00:29,781 - DEBUG - 块 237 生成文本: <triplet> <concept> TorusE模型 <misc> used by</s>
|
||
2025-06-11 11:00:29,781 - DEBUG - 原始生成文本: <triplet> <concept> TorusE模型 <misc> used by</s>
|
||
2025-06-11 11:00:29,781 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TorusE模型', '<misc>', 'used by']
|
||
2025-06-11 11:00:29,782 - DEBUG - 处理块 238/753: QuatE[85]扩展了复值空间, 引入更有表现力的超复数表示来建模实体和关系, 在提供几何解释的同...
|
||
2025-06-11 11:00:29,941 - DEBUG - 块 238 生成文本: <triplet> 复值空间 <concept> QuatE <media> part of</s>
|
||
2025-06-11 11:00:29,941 - DEBUG - 原始生成文本: <triplet> 复值空间 <concept> QuatE <media> part of</s>
|
||
2025-06-11 11:00:29,941 - DEBUG - 处理后标记: ['<triplet>', '复值空间', '<concept>', 'QuatE', '<media>', 'part of']
|
||
2025-06-11 11:00:29,941 - DEBUG - 添加三元组: 复值空间(concept) - part of - QuatE(media)
|
||
2025-06-11 11:00:29,941 - DEBUG - 块 238 提取到 1 个三元组
|
||
2025-06-11 11:00:29,941 - DEBUG - 处理块 239/753: 入是超复数空间 中的一个向量, 它具有3个虚分量 , , , 则四元数可以表示为...
|
||
2025-06-11 11:00:30,367 - DEBUG - 块 239 生成文本: <triplet> 超复数空间 <concept> 向量 <misc> 四元数 <dis> <cel> part of</s>
|
||
2025-06-11 11:00:30,367 - DEBUG - 原始生成文本: <triplet> 超复数空间 <concept> 向量 <misc> 四元数 <dis> <cel> part of</s>
|
||
2025-06-11 11:00:30,367 - DEBUG - 处理后标记: ['<triplet>', '超复数空间', '<concept>', '向量', '<misc>', '四元数', '<dis>', '<cel>', 'part of']
|
||
2025-06-11 11:00:30,367 - DEBUG - 添加三元组: 超复数空间(concept) - 四元数 - 向量(misc)
|
||
2025-06-11 11:00:30,367 - DEBUG - 块 239 提取到 1 个三元组
|
||
2025-06-11 11:00:30,367 - DEBUG - 处理块 240/753: 其中, , 表示内积. QuatE利用四元数表示的优势, 实现了头、尾实体之间丰富且富有...
|
||
2025-06-11 11:00:30,997 - DEBUG - 块 240 生成文本: <triplet> 旋转矩阵 <concept> 欧拉角 <misc> 四元数 <dis> QuatE <org> <media> <unk> <per> <loc> <eve> <time> <date> point in time</s>
|
||
2025-06-11 11:00:30,997 - DEBUG - 原始生成文本: <triplet> 旋转矩阵 <concept> 欧拉角 <misc> 四元数 <dis> QuatE <org> <media> <unk> <per> <loc> <eve> <time> <date> point in time</s>
|
||
2025-06-11 11:00:30,997 - DEBUG - 处理后标记: ['<triplet>', '旋转矩阵', '<concept>', '欧拉角', '<misc>', '四元数', '<dis>', 'QuatE', '<org>', '<media>', '<unk>', '<per>', '<loc>', '<eve>', '<time>', '<date>', 'point in time']
|
||
2025-06-11 11:00:30,997 - DEBUG - 添加三元组: 旋转矩阵(concept) - 四元数 - 欧拉角(misc)
|
||
2025-06-11 11:00:30,997 - DEBUG - 块 240 提取到 1 个三元组
|
||
2025-06-11 11:00:30,997 - DEBUG - 处理块 241/753: 除了RotatE和QuatE利用复数空间解决关系模式的建模外, DihEdral模型[86]利用群论...
|
||
2025-06-11 11:00:31,841 - DEBUG - 块 241 生成文本: <triplet> 群论 <concept> DihEdral模型 <media> Xu等人提出的Dihral <misc> part of the series <eve> Xu <per> participant</s>
|
||
2025-06-11 11:00:31,841 - DEBUG - 原始生成文本: <triplet> 群论 <concept> DihEdral模型 <media> Xu等人提出的Dihral <misc> part of the series <eve> Xu <per> participant</s>
|
||
2025-06-11 11:00:31,841 - DEBUG - 处理后标记: ['<triplet>', '群论', '<concept>', 'DihEdral模型', '<media>', 'Xu等人提出的Dihral', '<misc>', 'part of the series', '<eve>', 'Xu', '<per>', 'participant']
|
||
2025-06-11 11:00:31,841 - DEBUG - 添加三元组: 群论(concept) - Xu等人提出的Dihral - DihEdral模型(media)
|
||
2025-06-11 11:00:31,841 - DEBUG - 块 241 提取到 1 个三元组
|
||
2025-06-11 11:00:31,841 - DEBUG - 处理块 242/753: (k ∈ Z+)
|
||
Dk
|
||
Dk
|
||
Ok
|
||
Fk
|
||
O(K=4)
|
||
K
|
||
O(3K=4)
|
||
K
|
||
F(m)
|
||
K
|
||
O(0...
|
||
2025-06-11 11:00:32,353 - DEBUG - 块 242 生成文本: <triplet> 多边形 <concept> 二面体群 <misc> <dis> <cel> <media> <unk> <per> 边 <loc> part of <triplet> 2 <time> <eve> 邊 <org> <date> point</s>
|
||
2025-06-11 11:00:32,353 - DEBUG - 原始生成文本: <triplet> 多边形 <concept> 二面体群 <misc> <dis> <cel> <media> <unk> <per> 边 <loc> part of <triplet> 2 <time> <eve> 邊 <org> <date> point</s>
|
||
2025-06-11 11:00:32,353 - DEBUG - 处理后标记: ['<triplet>', '多边形', '<concept>', '二面体群', '<misc>', '<dis>', '<cel>', '<media>', '<unk>', '<per>', '边', '<loc>', 'part of', '<triplet>', '2', '<time>', '<eve>', '邊', '<org>', '<date>', 'point']
|
||
2025-06-11 11:00:32,353 - DEBUG - 添加三元组: 多边形(concept) - <dis> - 二面体群(misc)
|
||
2025-06-11 11:00:32,353 - DEBUG - 块 242 提取到 1 个三元组
|
||
2025-06-11 11:00:32,353 - DEBUG - 处理块 243/753: 和K个反射操作 . 需要注意的是, 当k可以被4整除时, 旋转矩阵 和 是反对称的, 反...
|
||
2025-06-11 11:00:32,673 - DEBUG - 块 243 生成文本: <triplet> 旋转矩阵 <concept> 反射操作</s>
|
||
2025-06-11 11:00:32,673 - DEBUG - 原始生成文本: <triplet> 旋转矩阵 <concept> 反射操作</s>
|
||
2025-06-11 11:00:32,673 - DEBUG - 处理后标记: ['<triplet>', '旋转矩阵', '<concept>', '反射操作']
|
||
2025-06-11 11:00:32,673 - DEBUG - 处理块 244/753: 应操作后的结果, 上面一行对应旋转操作, 下面一行对应反射操作.
|
||
|
||
ACL
|
||
ACL
|
||
ACLACL...
|
||
2025-06-11 11:00:32,949 - DEBUG - 块 244 生成文本: <triplet> 应操作 <concept> 旋转 <media> follows</s>
|
||
2025-06-11 11:00:32,950 - DEBUG - 原始生成文本: <triplet> 应操作 <concept> 旋转 <media> follows</s>
|
||
2025-06-11 11:00:32,950 - DEBUG - 处理后标记: ['<triplet>', '应操作', '<concept>', '旋转', '<media>', 'follows']
|
||
2025-06-11 11:00:32,950 - DEBUG - 添加三元组: 应操作(concept) - follows - 旋转(media)
|
||
2025-06-11 11:00:32,950 - DEBUG - 块 244 提取到 1 个三元组
|
||
2025-06-11 11:00:32,950 - DEBUG - 处理块 245/753: (3)=[−1 0]−1 0
|
||
F 4
|
||
(1)=[1
|
||
0 0]1 F 4
|
||
(2)=[0 −1 ...
|
||
2025-06-11 11:00:33,526 - DEBUG - 块 245 生成文本: <triplet> <unk> 元素 <concept> subclass of</s>
|
||
2025-06-11 11:00:33,526 - DEBUG - 原始生成文本: <triplet> <unk> 元素 <concept> subclass of</s>
|
||
2025-06-11 11:00:33,526 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '元素', '<concept>', 'subclass of']
|
||
2025-06-11 11:00:33,526 - DEBUG - 处理块 246/753: l ∈ 1;2;:::;L
|
||
h ∈ R2L
|
||
t ∈ R2L
|
||
[h(1);h(2);:::;h(L)]...
|
||
2025-06-11 11:00:34,059 - DEBUG - 块 246 生成文本: <triplet> 群元素建模关系 <concept> DihEdral模型 <misc> <media> 块对角形式 <unk> <loc> <dis> <org> 关系矩阵 <per> part of</s>
|
||
2025-06-11 11:00:34,060 - DEBUG - 原始生成文本: <triplet> 群元素建模关系 <concept> DihEdral模型 <misc> <media> 块对角形式 <unk> <loc> <dis> <org> 关系矩阵 <per> part of</s>
|
||
2025-06-11 11:00:34,060 - DEBUG - 处理后标记: ['<triplet>', '群元素建模关系', '<concept>', 'DihEdral模型', '<misc>', '<media>', '块对角形式', '<unk>', '<loc>', '<dis>', '<org>', '关系矩阵', '<per>', 'part of']
|
||
2025-06-11 11:00:34,060 - DEBUG - 添加三元组: 群元素建模关系(concept) - <media> - DihEdral模型(misc)
|
||
2025-06-11 11:00:34,060 - DEBUG - 块 246 提取到 1 个三元组
|
||
2025-06-11 11:00:34,060 - DEBUG - 处理块 247/753: 且 . 对应的嵌入向量 和 的形式分别为 和 , 其中
|
||
. 因此, 双线...
|
||
2025-06-11 11:00:34,764 - DEBUG - 块 247 生成文本: <triplet> 张天成 <per> 知识图谱嵌入技术研究综述 293 h<unk>Rt = <unk> ∑L l=1 h(l)<unk> R(ls)t(59) <concept> part of</s>
|
||
2025-06-11 11:00:34,764 - DEBUG - 原始生成文本: <triplet> 张天成 <per> 知识图谱嵌入技术研究综述 293 h<unk>Rt = <unk> ∑L l=1 h(l)<unk> R(ls)t(59) <concept> part of</s>
|
||
2025-06-11 11:00:34,764 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<per>', '知识图谱嵌入技术研究综述 293 h', '<unk>', 'Rt =', '<unk>', '∑L l=1 h(l)', '<unk>', 'R(ls)t(59)', '<concept>', 'part of']
|
||
2025-06-11 11:00:34,764 - DEBUG - 添加三元组: 张天成(per) - Rt = - 知识图谱嵌入技术研究综述 293 h(unk)
|
||
2025-06-11 11:00:34,764 - DEBUG - 块 247 提取到 1 个三元组
|
||
2025-06-11 11:00:34,764 - DEBUG - 处理块 248/753: R( l )
|
||
其中, 每个分量 都是一个二面体群元素的表示矩阵.
|
||
2.3.3 双曲几何模...
|
||
2025-06-11 11:00:35,169 - DEBUG - 块 248 生成文本: <triplet> 双曲几何模型 <concept> 二面体群元素的表示矩阵.2 <dis> <misc> part of</s>
|
||
2025-06-11 11:00:35,169 - DEBUG - 原始生成文本: <triplet> 双曲几何模型 <concept> 二面体群元素的表示矩阵.2 <dis> <misc> part of</s>
|
||
2025-06-11 11:00:35,169 - DEBUG - 处理后标记: ['<triplet>', '双曲几何模型', '<concept>', '二面体群元素的表示矩阵.2', '<dis>', '<misc>', 'part of']
|
||
2025-06-11 11:00:35,169 - DEBUG - 添加三元组: 双曲几何模型(concept) - <misc> - 二面体群元素的表示矩阵.2(dis)
|
||
2025-06-11 11:00:35,169 - DEBUG - 块 248 提取到 1 个三元组
|
||
2025-06-11 11:00:35,169 - DEBUG - 处理块 249/753: 本质上受到嵌入空间维数的限制. 目前还没有一种方法能够在不丢失信息的情况下计算大型图结构数据的嵌入....
|
||
2025-06-11 11:00:35,597 - DEBUG - 块 249 生成文本: <triplet> 实证分析 <concept> Adcock等人 <per> author</s>
|
||
2025-06-11 11:00:35,597 - DEBUG - 原始生成文本: <triplet> 实证分析 <concept> Adcock等人 <per> author</s>
|
||
2025-06-11 11:00:35,597 - DEBUG - 处理后标记: ['<triplet>', '实证分析', '<concept>', 'Adcock等人', '<per>', 'author']
|
||
2025-06-11 11:00:35,597 - DEBUG - 添加三元组: 实证分析(concept) - author - Adcock等人(per)
|
||
2025-06-11 11:00:35,597 - DEBUG - 块 249 提取到 1 个三元组
|
||
2025-06-11 11:00:35,597 - DEBUG - 处理块 250/753: 效的表示方法, Nickel等人[88]提出在双曲空间(具有常负曲率的空间)中计算嵌入, 这是因为双...
|
||
2025-06-11 11:00:35,916 - DEBUG - 块 250 生成文本: <triplet> 双曲空间 <concept> 欧式空间(零曲率空间)</s>
|
||
2025-06-11 11:00:35,916 - DEBUG - 原始生成文本: <triplet> 双曲空间 <concept> 欧式空间(零曲率空间)</s>
|
||
2025-06-11 11:00:35,916 - DEBUG - 处理后标记: ['<triplet>', '双曲空间', '<concept>', '欧式空间(零曲率空间)']
|
||
2025-06-11 11:00:35,916 - DEBUG - 处理块 251/753: 表示分层数据. Nickel等人[88]提出了基于双曲空间Poincare ball模型的Poinc...
|
||
2025-06-11 11:00:36,656 - DEBUG - 块 251 生成文本: <triplet> <triplet> Poincare ball模型 <concept> Nickel <per> named after a <misc> <media> Nickels <org> 双曲空间 <loc> <dis> <cel> 模型的Poincate方法 <eve> <time> 基于梯度的优化.H <unk> <num> 그래于优化。</s>
|
||
2025-06-11 11:00:36,656 - DEBUG - 原始生成文本: <triplet> <triplet> Poincare ball模型 <concept> Nickel <per> named after a <misc> <media> Nickels <org> 双曲空间 <loc> <dis> <cel> 模型的Poincate方法 <eve> <time> 基于梯度的优化.H <unk> <num> 그래于优化。</s>
|
||
2025-06-11 11:00:36,656 - DEBUG - 处理后标记: ['<triplet>', '<triplet>', 'Poincare ball模型', '<concept>', 'Nickel', '<per>', 'named after a', '<misc>', '<media>', 'Nickels', '<org>', '双曲空间', '<loc>', '<dis>', '<cel>', '模型的Poincate方法', '<eve>', '<time>', '基于梯度的优化.H', '<unk>', '<num>', '그래于优化。']
|
||
2025-06-11 11:00:36,656 - DEBUG - 处理块 252/753: Nickel等人[88]将符号数据嵌入到双曲空间 中, 设 是开放的d维单位球, 其中 ...
|
||
2025-06-11 11:00:37,371 - DEBUG - 块 252 生成文本: <triplet> 欧几里德范数 <concept> 黎曼流形 <misc> 双曲空间 <dis> d维单位球 <cel> <unk> <per> 开放的d维 <triplet> Poincare ball模型 <loc> 符号数据 <media> Nickel等人 <org> discoverer or inventor</s>
|
||
2025-06-11 11:00:37,372 - DEBUG - 原始生成文本: <triplet> 欧几里德范数 <concept> 黎曼流形 <misc> 双曲空间 <dis> d维单位球 <cel> <unk> <per> 开放的d维 <triplet> Poincare ball模型 <loc> 符号数据 <media> Nickel等人 <org> discoverer or inventor</s>
|
||
2025-06-11 11:00:37,372 - DEBUG - 处理后标记: ['<triplet>', '欧几里德范数', '<concept>', '黎曼流形', '<misc>', '双曲空间', '<dis>', 'd维单位球', '<cel>', '<unk>', '<per>', '开放的d维', '<triplet>', 'Poincare ball模型', '<loc>', '符号数据', '<media>', 'Nickel等人', '<org>', 'discoverer or inventor']
|
||
2025-06-11 11:00:37,372 - DEBUG - 添加三元组: 欧几里德范数(concept) - 双曲空间 - 黎曼流形(misc)
|
||
2025-06-11 11:00:37,372 - DEBUG - 添加三元组: Poincare ball模型(loc) - Nickel等人 - 符号数据(media)
|
||
2025-06-11 11:00:37,372 - DEBUG - 块 252 提取到 2 个三元组
|
||
2025-06-11 11:00:37,372 - DEBUG - 处理块 253/753: 其中, 且 表示欧几里德度量张量.
|
||
D = {(h;t)}
|
||
Poincare模型能够学习符...
|
||
2025-06-11 11:00:38,044 - DEBUG - 块 253 生成文本: <triplet> 欧几里德度量张量 <concept> Poincare模型 <misc> 评分函数 <media> <unk> <loc> <dis> <eve> <num> <time> <cel> <date> point in time</s>
|
||
2025-06-11 11:00:38,044 - DEBUG - 原始生成文本: <triplet> 欧几里德度量张量 <concept> Poincare模型 <misc> 评分函数 <media> <unk> <loc> <dis> <eve> <num> <time> <cel> <date> point in time</s>
|
||
2025-06-11 11:00:38,044 - DEBUG - 处理后标记: ['<triplet>', '欧几里德度量张量', '<concept>', 'Poincare模型', '<misc>', '评分函数', '<media>', '<unk>', '<loc>', '<dis>', '<eve>', '<num>', '<time>', '<cel>', '<date>', 'point in time']
|
||
2025-06-11 11:00:38,044 - DEBUG - 添加三元组: 欧几里德度量张量(concept) - 评分函数 - Poincare模型(misc)
|
||
2025-06-11 11:00:38,044 - DEBUG - 块 253 提取到 1 个三元组
|
||
2025-06-11 11:00:38,044 - DEBUG - 处理块 254/753: (h;t)∈D
|
||
log e−d(h;t)
|
||
∑
|
||
t′∈N(h)
|
||
e−d(h;t′)
|
||
(61)
|
||
|
||
N ...
|
||
2025-06-11 11:00:38,331 - DEBUG - 块 254 生成文本: <triplet> <concept> 负例集 <misc> subclass of</s>
|
||
2025-06-11 11:00:38,332 - DEBUG - 原始生成文本: <triplet> <concept> 负例集 <misc> subclass of</s>
|
||
2025-06-11 11:00:38,332 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '负例集', '<misc>', 'subclass of']
|
||
2025-06-11 11:00:38,332 - DEBUG - 处理块 255/753: 实际上, 多关系知识图谱往往表现出多个层次结构, 为了解决这一问题, 提出了MuRP模型[89]. ...
|
||
2025-06-11 11:00:38,523 - DEBUG - 块 255 生成文本: <triplet> 多关系 <concept> Poincare模型 <media> part of</s>
|
||
2025-06-11 11:00:38,523 - DEBUG - 原始生成文本: <triplet> 多关系 <concept> Poincare模型 <media> part of</s>
|
||
2025-06-11 11:00:38,523 - DEBUG - 处理后标记: ['<triplet>', '多关系', '<concept>', 'Poincare模型', '<media>', 'part of']
|
||
2025-06-11 11:00:38,523 - DEBUG - 添加三元组: 多关系(concept) - part of - Poincare模型(media)
|
||
2025-06-11 11:00:38,523 - DEBUG - 块 255 提取到 1 个三元组
|
||
2025-06-11 11:00:38,523 - DEBUG - 处理块 256/753: 矩阵-向量乘法和 加法学习关系特定参数来转换实体嵌入.
|
||
一组实体可以在不同的关系下形成不同的...
|
||
2025-06-11 11:00:39,187 - DEBUG - 块 256 生成文本: <triplet> 类比结构 <concept> 多关系图嵌入的评分函数 <misc> MuRP <media> <org> Word2Vec词 <eve> <per> <loc> <unk> <dis> <time> 层次结构模型 <triplet> Word3 <cel> 结构的分类表</s>
|
||
2025-06-11 11:00:39,188 - DEBUG - 原始生成文本: <triplet> 类比结构 <concept> 多关系图嵌入的评分函数 <misc> MuRP <media> <org> Word2Vec词 <eve> <per> <loc> <unk> <dis> <time> 层次结构模型 <triplet> Word3 <cel> 结构的分类表</s>
|
||
2025-06-11 11:00:39,188 - DEBUG - 处理后标记: ['<triplet>', '类比结构', '<concept>', '多关系图嵌入的评分函数', '<misc>', 'MuRP', '<media>', '<org>', 'Word2Vec词', '<eve>', '<per>', '<loc>', '<unk>', '<dis>', '<time>', '层次结构模型', '<triplet>', 'Word3', '<cel>', '结构的分类表']
|
||
2025-06-11 11:00:39,188 - DEBUG - 添加三元组: 类比结构(concept) - MuRP - 多关系图嵌入的评分函数(misc)
|
||
2025-06-11 11:00:39,188 - DEBUG - 块 256 提取到 1 个三元组
|
||
2025-06-11 11:00:39,188 - DEBUG - 处理块 257/753: +bh +bt = −d(Rh;t+r)2 +bh +bt (62)
|
||
|
||
d : " ×R ×" →...
|
||
2025-06-11 11:00:39,486 - DEBUG - 块 257 生成文本: <triplet> <unk> 距离函数 <concept> subclass of</s>
|
||
2025-06-11 11:00:39,486 - DEBUG - 原始生成文本: <triplet> <unk> 距离函数 <concept> subclass of</s>
|
||
2025-06-11 11:00:39,486 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '距离函数', '<concept>', 'subclass of']
|
||
2025-06-11 11:00:39,486 - DEBUG - 处理块 258/753: 和 表示在应用相应的关系特定变换后的头部和尾部实体嵌入.
|
||
将该评分函数与双曲几何相结合, M...
|
||
2025-06-11 11:00:40,281 - DEBUG - 块 258 生成文本: <triplet> 双曲几何 <concept> MuRP模型 <media> <misc> 评分函数 <unk> <per> <eve> <dis> <triplet> Rlogc 0 (hh) <loc> <time> time period</s>
|
||
2025-06-11 11:00:40,281 - DEBUG - 原始生成文本: <triplet> 双曲几何 <concept> MuRP模型 <media> <misc> 评分函数 <unk> <per> <eve> <dis> <triplet> Rlogc 0 (hh) <loc> <time> time period</s>
|
||
2025-06-11 11:00:40,281 - DEBUG - 处理后标记: ['<triplet>', '双曲几何', '<concept>', 'MuRP模型', '<media>', '<misc>', '评分函数', '<unk>', '<per>', '<eve>', '<dis>', '<triplet>', 'Rlogc 0 (hh)', '<loc>', '<time>', 'time period']
|
||
2025-06-11 11:00:40,281 - DEBUG - 添加三元组: 双曲几何(concept) - <misc> - MuRP模型(media)
|
||
2025-06-11 11:00:40,281 - DEBUG - 块 258 提取到 1 个三元组
|
||
2025-06-11 11:00:40,281 - DEBUG - 处理块 259/753: )2
|
||
+bh +bt (63)
|
||
|
||
hh;ht ∈ Bd
|
||
c
|
||
h
|
||
t
|
||
rh ∈ Bd
|
||
c
|
||
h(r)
|
||
...
|
||
2025-06-11 11:00:40,814 - DEBUG - 块 259 生成文本: <triplet> ⊕c M ̈obius <concept> Bd c h t rh <unk> <misc> part of</s>
|
||
2025-06-11 11:00:40,815 - DEBUG - 原始生成文本: <triplet> ⊕c M ̈obius <concept> Bd c h t rh <unk> <misc> part of</s>
|
||
2025-06-11 11:00:40,815 - DEBUG - 处理后标记: ['<triplet>', '⊕c M ̈obius', '<concept>', 'Bd c h t rh', '<unk>', '<misc>', 'part of']
|
||
2025-06-11 11:00:40,815 - DEBUG - 添加三元组: ⊕c M ̈obius(concept) - <misc> - Bd c h t rh(unk)
|
||
2025-06-11 11:00:40,815 - DEBUG - 块 259 提取到 1 个三元组
|
||
2025-06-11 11:00:40,815 - DEBUG - 处理块 260/753: 其中, 分别表示头、尾实体 和 的双曲嵌入, log表示的是对数映射, 0表示的是庞加...
|
||
2025-06-11 11:00:41,369 - DEBUG - 块 260 生成文本: <triplet> 庞加莱球 <concept> 矩阵-向量乘法 <misc> 映射 <media> 双曲嵌入 <unk> <per> 参数 <dis> part of</s>
|
||
2025-06-11 11:00:41,369 - DEBUG - 原始生成文本: <triplet> 庞加莱球 <concept> 矩阵-向量乘法 <misc> 映射 <media> 双曲嵌入 <unk> <per> 参数 <dis> part of</s>
|
||
2025-06-11 11:00:41,369 - DEBUG - 处理后标记: ['<triplet>', '庞加莱球', '<concept>', '矩阵-向量乘法', '<misc>', '映射', '<media>', '双曲嵌入', '<unk>', '<per>', '参数', '<dis>', 'part of']
|
||
2025-06-11 11:00:41,369 - DEBUG - 添加三元组: 庞加莱球(concept) - 映射 - 矩阵-向量乘法(misc)
|
||
2025-06-11 11:00:41,369 - DEBUG - 块 260 提取到 1 个三元组
|
||
2025-06-11 11:00:41,370 - DEBUG - 处理块 261/753: 而关系调整的尾实体嵌入 是通过将关系向量 与尾实体嵌入 进行 加法得到的, 表...
|
||
2025-06-11 11:00:41,518 - DEBUG - 块 261 生成文本: <triplet> 关系矩阵 <concept> MuRP <misc> part of</s>
|
||
2025-06-11 11:00:41,518 - DEBUG - 原始生成文本: <triplet> 关系矩阵 <concept> MuRP <misc> part of</s>
|
||
2025-06-11 11:00:41,518 - DEBUG - 处理后标记: ['<triplet>', '关系矩阵', '<concept>', 'MuRP', '<misc>', 'part of']
|
||
2025-06-11 11:00:41,518 - DEBUG - 添加三元组: 关系矩阵(concept) - part of - MuRP(misc)
|
||
2025-06-11 11:00:41,518 - DEBUG - 块 261 提取到 1 个三元组
|
||
2025-06-11 11:00:41,518 - DEBUG - 处理块 262/753: 除了利用卷积神经网络对KGE进行建模的方法, 最近也有研究将胶囊网络应用于解决KGE问题. 例如:
|
||
...
|
||
2025-06-11 11:00:41,699 - DEBUG - 块 262 生成文本: <triplet> 卷积提取特征 <concept> KGE <misc> facet of</s>
|
||
2025-06-11 11:00:41,699 - DEBUG - 原始生成文本: <triplet> 卷积提取特征 <concept> KGE <misc> facet of</s>
|
||
2025-06-11 11:00:41,699 - DEBUG - 处理后标记: ['<triplet>', '卷积提取特征', '<concept>', 'KGE', '<misc>', 'facet of']
|
||
2025-06-11 11:00:41,699 - DEBUG - 添加三元组: 卷积提取特征(concept) - facet of - KGE(misc)
|
||
2025-06-11 11:00:41,699 - DEBUG - 块 262 提取到 1 个三元组
|
||
2025-06-11 11:00:41,699 - DEBUG - 处理块 263/753: 映射后加入两个胶囊层, 在第一层中, 构造k个胶囊, 其中来自所有特征映射相同维度的条目被封装到一个...
|
||
2025-06-11 11:00:42,160 - DEBUG - 块 263 生成文本: <triplet> 嵌入三元组 <concept> 维度条目 <unk> <misc> 映射 <media> <eve> <dis> <per> <time> <cel> 視 <date> point in time</s>
|
||
2025-06-11 11:00:42,161 - DEBUG - 原始生成文本: <triplet> 嵌入三元组 <concept> 维度条目 <unk> <misc> 映射 <media> <eve> <dis> <per> <time> <cel> 視 <date> point in time</s>
|
||
2025-06-11 11:00:42,161 - DEBUG - 处理后标记: ['<triplet>', '嵌入三元组', '<concept>', '维度条目', '<unk>', '<misc>', '映射', '<media>', '<eve>', '<dis>', '<per>', '<time>', '<cel>', '視', '<date>', 'point in time']
|
||
2025-06-11 11:00:42,161 - DEBUG - 添加三元组: 嵌入三元组(concept) - <misc> - 维度条目(unk)
|
||
2025-06-11 11:00:42,161 - DEBUG - 块 263 提取到 1 个三元组
|
||
2025-06-11 11:00:42,161 - DEBUG - 处理块 264/753: 中, 该胶囊产生一个向量输出, 其长度用作三元组的分数. CapsE的评分函数定义如下:
|
||
294 ...
|
||
2025-06-11 11:00:42,706 - DEBUG - 块 264 生成文本: <triplet> 软件学报 2023年 第 34卷 第 1期 <concept> 评分函数定义如下 <misc> <media> <unk> <dis> <eve> <date> point in time</s>
|
||
2025-06-11 11:00:42,707 - DEBUG - 原始生成文本: <triplet> 软件学报 2023年 第 34卷 第 1期 <concept> 评分函数定义如下 <misc> <media> <unk> <dis> <eve> <date> point in time</s>
|
||
2025-06-11 11:00:42,707 - DEBUG - 处理后标记: ['<triplet>', '软件学报 2023年 第 34卷 第 1期', '<concept>', '评分函数定义如下', '<misc>', '<media>', '<unk>', '<dis>', '<eve>', '<date>', 'point in time']
|
||
2025-06-11 11:00:42,707 - DEBUG - 添加三元组: 软件学报 2023年 第 34卷 第 1期(concept) - <media> - 评分函数定义如下(misc)
|
||
2025-06-11 11:00:42,707 - DEBUG - 块 264 提取到 1 个三元组
|
||
2025-06-11 11:00:42,707 - DEBUG - 处理块 265/753: 其中, 表示胶囊网络运算. CapsE是首个考虑将胶囊网络用于知识图谱补全的方法.
|
||
h
|
||
hI
|
||
...
|
||
2025-06-11 11:00:42,973 - DEBUG - 块 265 生成文本: <triplet> 显式地建模交叉交互 <concept> Cross模型 <misc> part of</s>
|
||
2025-06-11 11:00:42,973 - DEBUG - 原始生成文本: <triplet> 显式地建模交叉交互 <concept> Cross模型 <misc> part of</s>
|
||
2025-06-11 11:00:42,973 - DEBUG - 处理后标记: ['<triplet>', '显式地建模交叉交互', '<concept>', 'Cross模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:42,973 - DEBUG - 添加三元组: 显式地建模交叉交互(concept) - part of - Cross模型(misc)
|
||
2025-06-11 11:00:42,973 - DEBUG - 块 265 提取到 1 个三元组
|
||
2025-06-11 11:00:42,973 - DEBUG - 处理块 266/753: 个步骤: (1)为头实体 生成交互嵌入 ; (2)生成关系 的交互嵌入 ; (3)结...
|
||
2025-06-11 11:00:43,937 - DEBUG - 块 266 生成文本: <triplet> 交互嵌入 <concept> CrossE <misc> part of</s>
|
||
2025-06-11 11:00:43,937 - DEBUG - 原始生成文本: <triplet> 交互嵌入 <concept> CrossE <misc> part of</s>
|
||
2025-06-11 11:00:43,937 - DEBUG - 处理后标记: ['<triplet>', '交互嵌入', '<concept>', 'CrossE', '<misc>', 'part of']
|
||
2025-06-11 11:00:43,937 - DEBUG - 添加三元组: 交互嵌入(concept) - part of - CrossE(misc)
|
||
2025-06-11 11:00:43,937 - DEBUG - 块 266 提取到 1 个三元组
|
||
2025-06-11 11:00:43,937 - DEBUG - 处理块 267/753:
|
||
cr ◦h = hI;cr ◦h◦r = rI
|
||
b ∈ R1×d
|
||
其中, , 且 是全...
|
||
2025-06-11 11:00:44,086 - DEBUG - 块 267 生成文本: <triplet> <concept> CrossE模型 <misc> part of</s>
|
||
2025-06-11 11:00:44,086 - DEBUG - 原始生成文本: <triplet> <concept> CrossE模型 <misc> part of</s>
|
||
2025-06-11 11:00:44,086 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'CrossE模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:44,086 - DEBUG - 处理块 268/753: 本节归纳总结了最新的知识图谱嵌入方法, 由卷积神经网络模型, 旋转模型, 双曲几何模型和其他模型4个...
|
||
2025-06-11 11:00:44,523 - DEBUG - 块 268 生成文本: <triplet> 卷积神经网络模型 <concept> 实体嵌入 <misc> part of</s>
|
||
2025-06-11 11:00:44,523 - DEBUG - 原始生成文本: <triplet> 卷积神经网络模型 <concept> 实体嵌入 <misc> part of</s>
|
||
2025-06-11 11:00:44,523 - DEBUG - 处理后标记: ['<triplet>', '卷积神经网络模型', '<concept>', '实体嵌入', '<misc>', 'part of']
|
||
2025-06-11 11:00:44,523 - DEBUG - 添加三元组: 卷积神经网络模型(concept) - part of - 实体嵌入(misc)
|
||
2025-06-11 11:00:44,523 - DEBUG - 块 268 提取到 1 个三元组
|
||
2025-06-11 11:00:44,523 - DEBUG - 处理块 269/753: ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
Mr ∈ Rdw×dh ...
|
||
2025-06-11 11:00:45,110 - DEBUG - 块 269 生成文本: <triplet> <concept> concat(g([h;r;t)∗!)w ∗ <misc> concate <triplet> r <unk> conca <dis> concase <cel> part of</s>
|
||
2025-06-11 11:00:45,110 - DEBUG - 原始生成文本: <triplet> <concept> concat(g([h;r;t)∗!)w ∗ <misc> concate <triplet> r <unk> conca <dis> concase <cel> part of</s>
|
||
2025-06-11 11:00:45,110 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'concat(g([h;r;t)∗!)w ∗', '<misc>', 'concate', '<triplet>', 'r', '<unk>', 'conca', '<dis>', 'concase', '<cel>', 'part of']
|
||
2025-06-11 11:00:45,110 - DEBUG - 处理块 270/753: HypER [ 82 ]
|
||
h;t ∈ Rd
|
||
r ∈ Rdr
|
||
f
|
||
(
|
||
vec
|
||
(
|
||
h∗ve...
|
||
2025-06-11 11:00:45,473 - DEBUG - 块 270 生成文本: <triplet> <concept> HypER <misc> part of</s>
|
||
2025-06-11 11:00:45,473 - DEBUG - 原始生成文本: <triplet> <concept> HypER <misc> part of</s>
|
||
2025-06-11 11:00:45,473 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'HypER', '<misc>', 'part of']
|
||
2025-06-11 11:00:45,473 - DEBUG - 处理块 271/753: r ∈ Hd
|
||
h⊗ r
|
||
|r| ·t
|
||
DihEdral[ 86]
|
||
h(1);t(1) ∈...
|
||
2025-06-11 11:00:46,008 - DEBUG - 块 271 生成文本: <triplet> <concept> 双曲几何模型 Poincare <misc> part of</s>
|
||
2025-06-11 11:00:46,008 - DEBUG - 原始生成文本: <triplet> <concept> 双曲几何模型 Poincare <misc> part of</s>
|
||
2025-06-11 11:00:46,008 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '双曲几何模型 Poincare', '<misc>', 'part of']
|
||
2025-06-11 11:00:46,008 - DEBUG - 处理块 272/753: (h;t)∈D log e−d(h;t)
|
||
∑
|
||
t′∈N(h) e−d(h;t′)
|
||
|
||
MuRP [...
|
||
2025-06-11 11:00:46,573 - DEBUG - 块 272 生成文本: <triplet> <concept> MuRP <misc> part of <triplet> expc 0 (Rlogc0 (hh) <unk> <dis> <media> ht⊕crh <per> named</s>
|
||
2025-06-11 11:00:46,573 - DEBUG - 原始生成文本: <triplet> <concept> MuRP <misc> part of <triplet> expc 0 (Rlogc0 (hh) <unk> <dis> <media> ht⊕crh <per> named</s>
|
||
2025-06-11 11:00:46,573 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'MuRP', '<misc>', 'part of', '<triplet>', 'expc 0 (Rlogc0 (hh)', '<unk>', '<dis>', '<media>', 'ht⊕crh', '<per>', 'named']
|
||
2025-06-11 11:00:46,573 - DEBUG - 处理块 273/753: CapsE [ 90 ]
|
||
h;t ∈ Rd
|
||
r ∈ Rdr
|
||
∥capsnet (g([h...
|
||
2025-06-11 11:00:46,839 - DEBUG - 块 273 生成文本: <triplet> <unk> 小 结 <concept> instance of</s>
|
||
2025-06-11 11:00:46,840 - DEBUG - 原始生成文本: <triplet> <unk> 小 结 <concept> instance of</s>
|
||
2025-06-11 11:00:46,840 - DEBUG - 处理后标记: ['<triplet>', '<unk>', '小 结', '<concept>', 'instance of']
|
||
2025-06-11 11:00:46,840 - DEBUG - 处理块 274/753: 第2节主要介绍了3大类知识图谱嵌入方法, 即: 基于距离的模型, 语义匹配模型与最新的KGE模型, ...
|
||
2025-06-11 11:00:47,032 - DEBUG - 块 274 生成文本: <triplet> 动态知识图谱嵌入 <media> 知识 <concept> subclass of</s>
|
||
2025-06-11 11:00:47,032 - DEBUG - 原始生成文本: <triplet> 动态知识图谱嵌入 <media> 知识 <concept> subclass of</s>
|
||
2025-06-11 11:00:47,032 - DEBUG - 处理后标记: ['<triplet>', '动态知识图谱嵌入', '<media>', '知识', '<concept>', 'subclass of']
|
||
2025-06-11 11:00:47,032 - DEBUG - 添加三元组: 动态知识图谱嵌入(media) - subclass of - 知识(concept)
|
||
2025-06-11 11:00:47,032 - DEBUG - 块 274 提取到 1 个三元组
|
||
2025-06-11 11:00:47,032 - DEBUG - 处理块 275/753: 当前KGE的研究主要集中于静态知识图谱, 其中事实不会随时间发生变化, 例如: TransE, Tr...
|
||
2025-06-11 11:00:47,321 - DEBUG - 块 275 生成文本: <triplet> 社交知识图 <concept> Twitter <media> use</s>
|
||
2025-06-11 11:00:47,321 - DEBUG - 原始生成文本: <triplet> 社交知识图 <concept> Twitter <media> use</s>
|
||
2025-06-11 11:00:47,321 - DEBUG - 处理后标记: ['<triplet>', '社交知识图', '<concept>', 'Twitter', '<media>', 'use']
|
||
2025-06-11 11:00:47,321 - DEBUG - 添加三元组: 社交知识图(concept) - use - Twitter(media)
|
||
2025-06-11 11:00:47,321 - DEBUG - 块 275 提取到 1 个三元组
|
||
2025-06-11 11:00:47,321 - DEBUG - 处理块 276/753: 等, 其中事实随时间演变, 仅在特定时间段内有效. 以往的静态KGE方法完全忽略了时间信息, 这使得...
|
||
2025-06-11 11:00:47,716 - DEBUG - 块 276 生成文本: <triplet> 静态KGE <misc> <media> <org> <concept> <eve> <time> <date> point in time period</s>
|
||
2025-06-11 11:00:47,716 - DEBUG - 原始生成文本: <triplet> 静态KGE <misc> <media> <org> <concept> <eve> <time> <date> point in time period</s>
|
||
2025-06-11 11:00:47,716 - DEBUG - 处理后标记: ['<triplet>', '静态KGE', '<misc>', '<media>', '<org>', '<concept>', '<eve>', '<time>', '<date>', 'point in time period']
|
||
2025-06-11 11:00:47,716 - DEBUG - 添加三元组: 静态KGE(misc) - <concept> - <media>(org)
|
||
2025-06-11 11:00:47,716 - DEBUG - 块 276 提取到 1 个三元组
|
||
2025-06-11 11:00:47,716 - DEBUG - 处理块 277/753: t-TransE[92]是第一个考虑将时间信息用于KGE的方法, 使用时间顺序约束建模中时间敏感关系...
|
||
2025-06-11 11:00:48,228 - DEBUG - 块 277 生成文本: <triplet> 知识图谱嵌入技术研究综述 <media> 张天成 <per> <concept> 等 <loc> <org> 编码 <eve> <unk> <dis> <date> point in time</s>
|
||
2025-06-11 11:00:48,228 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术研究综述 <media> 张天成 <per> <concept> 等 <loc> <org> 编码 <eve> <unk> <dis> <date> point in time</s>
|
||
2025-06-11 11:00:48,229 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术研究综述', '<media>', '张天成', '<per>', '<concept>', '等', '<loc>', '<org>', '编码', '<eve>', '<unk>', '<dis>', '<date>', 'point in time']
|
||
2025-06-11 11:00:48,229 - DEBUG - 添加三元组: 知识图谱嵌入技术研究综述(media) - <concept> - 张天成(per)
|
||
2025-06-11 11:00:48,229 - DEBUG - 块 277 提取到 1 个三元组
|
||
2025-06-11 11:00:48,229 - DEBUG - 处理块 278/753: 顺序. 因此, t-TransE是一个结合时间顺序信息而提出来的时间感知链接预测模型.
|
||
(ei;r;...
|
||
2025-06-11 11:00:48,527 - DEBUG - 块 278 生成文本: <triplet> 感知链接预测模型 <concept> time period</s>
|
||
2025-06-11 11:00:48,527 - DEBUG - 原始生成文本: <triplet> 感知链接预测模型 <concept> time period</s>
|
||
2025-06-11 11:00:48,527 - DEBUG - 处理后标记: ['<triplet>', '感知链接预测模型', '<concept>', 'time period']
|
||
2025-06-11 11:00:48,527 - DEBUG - 处理块 279/753: 具体来说, t-TransE在事实三元组中添加时间维度, 表示为四元组: , 其中 表示事实...
|
||
2025-06-11 11:00:48,697 - DEBUG - 块 279 生成文本: <triplet> 维度 <concept> 事实三元组 <misc> part of</s>
|
||
2025-06-11 11:00:48,697 - DEBUG - 原始生成文本: <triplet> 维度 <concept> 事实三元组 <misc> part of</s>
|
||
2025-06-11 11:00:48,698 - DEBUG - 处理后标记: ['<triplet>', '维度', '<concept>', '事实三元组', '<misc>', 'part of']
|
||
2025-06-11 11:00:48,698 - DEBUG - 添加三元组: 维度(concept) - part of - 事实三元组(misc)
|
||
2025-06-11 11:00:48,698 - DEBUG - 块 279 提取到 1 个三元组
|
||
2025-06-11 11:00:48,698 - DEBUG - 处理块 280/753: 向量. 例如, 有两个共享同一头实体的时间事实: 和 , 且时序约束为 , 那么可以假设...
|
||
2025-06-11 11:00:49,136 - DEBUG - 块 280 生成文本: <triplet> 矩阵M <misc> 向量 <concept> KGE模型对比 <media> 类别 方法 提出年份 优缺点</s>
|
||
2025-06-11 11:00:49,136 - DEBUG - 原始生成文本: <triplet> 矩阵M <misc> 向量 <concept> KGE模型对比 <media> 类别 方法 提出年份 优缺点</s>
|
||
2025-06-11 11:00:49,137 - DEBUG - 处理后标记: ['<triplet>', '矩阵M', '<misc>', '向量', '<concept>', 'KGE模型对比', '<media>', '类别 方法 提出年份 优缺点']
|
||
2025-06-11 11:00:49,137 - DEBUG - 添加三元组: 矩阵M(misc) - KGE模型对比 - 向量(concept)
|
||
2025-06-11 11:00:49,137 - DEBUG - 块 280 提取到 1 个三元组
|
||
2025-06-11 11:00:49,137 - DEBUG - 处理块 281/753: TransE[15] 2013 优点: 第一个基于翻译的方法; 易于训练, 参数较少, 易于扩展到大...
|
||
2025-06-11 11:00:49,468 - DEBUG - 块 281 生成文本: <triplet> 复杂关系 <concept> part of <triplet> TransH[16] 2014 <media> 数据库 <misc> instance of</s>
|
||
2025-06-11 11:00:49,468 - DEBUG - 原始生成文本: <triplet> 复杂关系 <concept> part of <triplet> TransH[16] 2014 <media> 数据库 <misc> instance of</s>
|
||
2025-06-11 11:00:49,468 - DEBUG - 处理后标记: ['<triplet>', '复杂关系', '<concept>', 'part of', '<triplet>', 'TransH[16] 2014', '<media>', '数据库', '<misc>', 'instance of']
|
||
2025-06-11 11:00:49,468 - DEBUG - 添加三元组: 复杂关系(concept) - TransH[16] 2014 - part of(triplet)
|
||
2025-06-11 11:00:49,468 - DEBUG - 块 281 提取到 1 个三元组
|
||
2025-06-11 11:00:49,468 - DEBUG - 处理块 282/753: TransR[43] 2015 优点: 不仅考虑关系的多样性, 而且考虑实体;
|
||
缺点: 计算复杂, ...
|
||
2025-06-11 11:00:49,606 - DEBUG - 块 282 生成文本: <triplet> 实体 <concept> TransR <misc> used by</s>
|
||
2025-06-11 11:00:49,606 - DEBUG - 原始生成文本: <triplet> 实体 <concept> TransR <misc> used by</s>
|
||
2025-06-11 11:00:49,606 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', 'TransR', '<misc>', 'used by']
|
||
2025-06-11 11:00:49,606 - DEBUG - 添加三元组: 实体(concept) - used by - TransR(misc)
|
||
2025-06-11 11:00:49,607 - DEBUG - 块 282 提取到 1 个三元组
|
||
2025-06-11 11:00:49,607 - DEBUG - 处理块 283/753: STransE[45] 2016 优点: 对每个关系使用两个投影矩阵, 性能优于TransE;
|
||
缺点...
|
||
2025-06-11 11:00:50,119 - DEBUG - 块 283 生成文本: <triplet> 投影矩阵 <concept> TranSparse <misc> used by</s>
|
||
2025-06-11 11:00:50,119 - DEBUG - 原始生成文本: <triplet> 投影矩阵 <concept> TranSparse <misc> used by</s>
|
||
2025-06-11 11:00:50,119 - DEBUG - 处理后标记: ['<triplet>', '投影矩阵', '<concept>', 'TranSparse', '<misc>', 'used by']
|
||
2025-06-11 11:00:50,119 - DEBUG - 添加三元组: 投影矩阵(concept) - used by - TranSparse(misc)
|
||
2025-06-11 11:00:50,119 - DEBUG - 块 283 提取到 1 个三元组
|
||
2025-06-11 11:00:50,119 - DEBUG - 处理块 284/753: TorusE[56] 2018 优点: 第一个正式讨论TransE正则化问题的模型, 可扩展到大型K...
|
||
2025-06-11 11:00:50,610 - DEBUG - 块 284 生成文本: <triplet> 正则化 <concept> KG2E <misc> part of</s>
|
||
2025-06-11 11:00:50,610 - DEBUG - 原始生成文本: <triplet> 正则化 <concept> KG2E <misc> part of</s>
|
||
2025-06-11 11:00:50,610 - DEBUG - 处理后标记: ['<triplet>', '正则化', '<concept>', 'KG2E', '<misc>', 'part of']
|
||
2025-06-11 11:00:50,610 - DEBUG - 添加三元组: 正则化(concept) - part of - KG2E(misc)
|
||
2025-06-11 11:00:50,610 - DEBUG - 块 284 提取到 1 个三元组
|
||
2025-06-11 11:00:50,611 - DEBUG - 处理块 285/753: TransG[58] 2016 优点: 具有较高的实体区分度, 考虑KGE中的多重关系语义问题;
|
||
缺...
|
||
2025-06-11 11:00:51,026 - DEBUG - 块 285 生成文本: <triplet> 实体区分度 <concept> KGE <media> part of</s>
|
||
2025-06-11 11:00:51,026 - DEBUG - 原始生成文本: <triplet> 实体区分度 <concept> KGE <media> part of</s>
|
||
2025-06-11 11:00:51,026 - DEBUG - 处理后标记: ['<triplet>', '实体区分度', '<concept>', 'KGE', '<media>', 'part of']
|
||
2025-06-11 11:00:51,027 - DEBUG - 添加三元组: 实体区分度(concept) - part of - KGE(media)
|
||
2025-06-11 11:00:51,027 - DEBUG - 块 285 提取到 1 个三元组
|
||
2025-06-11 11:00:51,027 - DEBUG - 处理块 286/753: DistMult[38] 2015 优点: 限制关系特定双线性变换矩阵为对角矩阵, 减少关系参数数量...
|
||
2025-06-11 11:00:51,218 - DEBUG - 块 286 生成文本: <triplet> 对称关系 <concept> SLM[77] 2013 <misc> part of</s>
|
||
2025-06-11 11:00:51,218 - DEBUG - 原始生成文本: <triplet> 对称关系 <concept> SLM[77] 2013 <misc> part of</s>
|
||
2025-06-11 11:00:51,218 - DEBUG - 处理后标记: ['<triplet>', '对称关系', '<concept>', 'SLM[77] 2013', '<misc>', 'part of']
|
||
2025-06-11 11:00:51,218 - DEBUG - 添加三元组: 对称关系(concept) - part of - SLM[77] 2013(misc)
|
||
2025-06-11 11:00:51,218 - DEBUG - 块 286 提取到 1 个三元组
|
||
2025-06-11 11:00:51,218 - DEBUG - 处理块 287/753: NTN[77] 2013 优点: 明确地描述实体与关系之间的复杂语义关联;
|
||
缺点: 高复杂性限制了其...
|
||
2025-06-11 11:00:51,559 - DEBUG - 块 287 生成文本: <triplet> 多层非线性特征学习 <concept> KGE模型 <misc> part of</s>
|
||
2025-06-11 11:00:51,559 - DEBUG - 原始生成文本: <triplet> 多层非线性特征学习 <concept> KGE模型 <misc> part of</s>
|
||
2025-06-11 11:00:51,559 - DEBUG - 处理后标记: ['<triplet>', '多层非线性特征学习', '<concept>', 'KGE模型', '<misc>', 'part of']
|
||
2025-06-11 11:00:51,559 - DEBUG - 添加三元组: 多层非线性特征学习(concept) - part of - KGE模型(misc)
|
||
2025-06-11 11:00:51,560 - DEBUG - 块 287 提取到 1 个三元组
|
||
2025-06-11 11:00:51,560 - DEBUG - 处理块 288/753: 缺点: 没有考虑嵌入三元组中相同维度条目之间的全局关系, 忽略了过渡特征
|
||
RotatE[84] 20...
|
||
2025-06-11 11:00:52,051 - DEBUG - 块 288 生成文本: <triplet> 旋转平面 <concept> 欧拉角 <misc> part of</s>
|
||
2025-06-11 11:00:52,051 - DEBUG - 原始生成文本: <triplet> 旋转平面 <concept> 欧拉角 <misc> part of</s>
|
||
2025-06-11 11:00:52,051 - DEBUG - 处理后标记: ['<triplet>', '旋转平面', '<concept>', '欧拉角', '<misc>', 'part of']
|
||
2025-06-11 11:00:52,051 - DEBUG - 添加三元组: 旋转平面(concept) - part of - 欧拉角(misc)
|
||
2025-06-11 11:00:52,051 - DEBUG - 块 288 提取到 1 个三元组
|
||
2025-06-11 11:00:52,051 - DEBUG - 处理块 289/753: Poincare[88] 2017 优点: 在双曲空间中计算嵌入, 适合基于梯度的优化;
|
||
缺点: 多...
|
||
2025-06-11 11:00:52,692 - DEBUG - 块 289 生成文本: <triplet> 多关系知识图 <concept> Poincare[88] 2017 <misc> <media> <dis> <cel> 双曲空间 <unk> <org> <eve> <per> <triplet> t-TransE将时间顺序约束 <loc> <time> 函数 <date> point in time</s>
|
||
2025-06-11 11:00:52,692 - DEBUG - 原始生成文本: <triplet> 多关系知识图 <concept> Poincare[88] 2017 <misc> <media> <dis> <cel> 双曲空间 <unk> <org> <eve> <per> <triplet> t-TransE将时间顺序约束 <loc> <time> 函数 <date> point in time</s>
|
||
2025-06-11 11:00:52,692 - DEBUG - 处理后标记: ['<triplet>', '多关系知识图', '<concept>', 'Poincare[88] 2017', '<misc>', '<media>', '<dis>', '<cel>', '双曲空间', '<unk>', '<org>', '<eve>', '<per>', '<triplet>', 't-TransE将时间顺序约束', '<loc>', '<time>', '函数', '<date>', 'point in time']
|
||
2025-06-11 11:00:52,692 - DEBUG - 添加三元组: 多关系知识图(concept) - <media> - Poincare[88] 2017(misc)
|
||
2025-06-11 11:00:52,692 - DEBUG - 块 289 提取到 1 个三元组
|
||
2025-06-11 11:00:52,692 - DEBUG - 处理块 290/753: ‖‖‖riM−rj
|
||
‖‖‖1 (66)
|
||
|
||
M ∈ Rn×n
|
||
(ri;rj)
|
||
其中, 是成对时...
|
||
2025-06-11 11:00:53,397 - DEBUG - 块 290 生成文本: <triplet> <concept> Rn×n(ri;rj) <misc> <dis> <unk> <media> 转换矩阵 <loc> part of the series <org> <eve> 1 <num> quantity</s>
|
||
2025-06-11 11:00:53,397 - DEBUG - 原始生成文本: <triplet> <concept> Rn×n(ri;rj) <misc> <dis> <unk> <media> 转换矩阵 <loc> part of the series <org> <eve> 1 <num> quantity</s>
|
||
2025-06-11 11:00:53,397 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Rn×n(ri;rj)', '<misc>', '<dis>', '<unk>', '<media>', '转换矩阵', '<loc>', 'part of the series', '<org>', '<eve>', '1', '<num>', 'quantity']
|
||
2025-06-11 11:00:53,397 - DEBUG - 处理块 291/753: 然而, t-TransE不是直接将时间整合到学习的嵌入中, 而是首先学习关系之间的时间顺序. 然后在...
|
||
2025-06-11 11:00:53,792 - DEBUG - 块 291 生成文本: <triplet> 嵌入 <concept> 学习 <media> part of</s>
|
||
2025-06-11 11:00:53,792 - DEBUG - 原始生成文本: <triplet> 嵌入 <concept> 学习 <media> part of</s>
|
||
2025-06-11 11:00:53,792 - DEBUG - 处理后标记: ['<triplet>', '嵌入', '<concept>', '学习', '<media>', 'part of']
|
||
2025-06-11 11:00:53,792 - DEBUG - 添加三元组: 嵌入(concept) - part of - 学习(media)
|
||
2025-06-11 11:00:53,792 - DEBUG - 块 291 提取到 1 个三元组
|
||
2025-06-11 11:00:53,792 - DEBUG - 处理块 292/753: Know-Evolve[93]使用双线性嵌入学习方法对KG元素的非线性时间演化进行建模. 然而, 它...
|
||
2025-06-11 11:00:54,496 - DEBUG - 块 292 生成文本: <triplet> 双线性嵌入学习方法 <concept> Know-Evolve <media> <misc> 软件学报 2023年第 34卷第 1期 <dis> <loc> 296 <per> 期刊 <org> programm <eve> <time> part of</s>
|
||
2025-06-11 11:00:54,496 - DEBUG - 原始生成文本: <triplet> 双线性嵌入学习方法 <concept> Know-Evolve <media> <misc> 软件学报 2023年第 34卷第 1期 <dis> <loc> 296 <per> 期刊 <org> programm <eve> <time> part of</s>
|
||
2025-06-11 11:00:54,496 - DEBUG - 处理后标记: ['<triplet>', '双线性嵌入学习方法', '<concept>', 'Know-Evolve', '<media>', '<misc>', '软件学报 2023年第 34卷第 1期', '<dis>', '<loc>', '296', '<per>', '期刊', '<org>', 'programm', '<eve>', '<time>', 'part of']
|
||
2025-06-11 11:00:54,496 - DEBUG - 添加三元组: 双线性嵌入学习方法(concept) - <misc> - Know-Evolve(media)
|
||
2025-06-11 11:00:54,496 - DEBUG - 块 292 提取到 1 个三元组
|
||
2025-06-11 11:00:54,496 - DEBUG - 处理块 293/753: 关系嵌入向量相结合的各种方法, 例如连接, 求和或点积运算. 文献[95]将时间戳视为一个(从0到9...
|
||
2025-06-11 11:00:54,858 - DEBUG - 块 293 生成文本: <triplet> 关系向量和时间数字 <concept> LTM <misc> part of</s>
|
||
2025-06-11 11:00:54,859 - DEBUG - 原始生成文本: <triplet> 关系向量和时间数字 <concept> LTM <misc> part of</s>
|
||
2025-06-11 11:00:54,859 - DEBUG - 处理后标记: ['<triplet>', '关系向量和时间数字', '<concept>', 'LTM', '<misc>', 'part of']
|
||
2025-06-11 11:00:54,859 - DEBUG - 添加三元组: 关系向量和时间数字(concept) - part of - LTM(misc)
|
||
2025-06-11 11:00:54,859 - DEBUG - 块 293 提取到 1 个三元组
|
||
2025-06-11 11:00:54,859 - DEBUG - 处理块 294/753: 感知知识图谱嵌入方法, 该方法将每个时间戳与相应的超平面相关联, 将时间显式的合并到实体关系空间中....
|
||
2025-06-11 11:00:55,585 - DEBUG - 块 294 生成文本: <triplet> 感知知识图谱嵌入方法 <concept> (h;r;t){s;e)s <misc> follows</s>
|
||
2025-06-11 11:00:55,586 - DEBUG - 原始生成文本: <triplet> 感知知识图谱嵌入方法 <concept> (h;r;t){s;e)s <misc> follows</s>
|
||
2025-06-11 11:00:55,586 - DEBUG - 处理后标记: ['<triplet>', '感知知识图谱嵌入方法', '<concept>', '(h;r;t){s;e)s', '<misc>', 'follows']
|
||
2025-06-11 11:00:55,586 - DEBUG - 添加三元组: 感知知识图谱嵌入方法(concept) - follows - (h;r;t){s;e)s(misc)
|
||
2025-06-11 11:00:55,586 - DEBUG - 块 294 提取到 1 个三元组
|
||
2025-06-11 11:00:55,586 - DEBUG - 处理块 295/753: HyTE首先为 形式的三元组组成的静态知识图谱添加单独的时间维度. 考虑四元组 , 其
|
||
中 ...
|
||
2025-06-11 11:00:56,131 - DEBUG - 块 295 生成文本: <triplet> 静态知识图谱 <concept> 形式的三元组 <misc> <media> <unk> <org> 维度度 <dis> <loc> part of</s>
|
||
2025-06-11 11:00:56,131 - DEBUG - 原始生成文本: <triplet> 静态知识图谱 <concept> 形式的三元组 <misc> <media> <unk> <org> 维度度 <dis> <loc> part of</s>
|
||
2025-06-11 11:00:56,131 - DEBUG - 处理后标记: ['<triplet>', '静态知识图谱', '<concept>', '形式的三元组', '<misc>', '<media>', '<unk>', '<org>', '维度度', '<dis>', '<loc>', 'part of']
|
||
2025-06-11 11:00:56,131 - DEBUG - 添加三元组: 静态知识图谱(concept) - <media> - 形式的三元组(misc)
|
||
2025-06-11 11:00:56,131 - DEBUG - 块 295 提取到 1 个三元组
|
||
2025-06-11 11:00:56,131 - DEBUG - 处理块 296/753: wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中...
|
||
2025-06-11 11:00:56,559 - DEBUG - 块 296 生成文本: <triplet> <concept> HyTE <misc> part of <triplet> G <media> 法向量 <dis> <time> <cel> <eve> 超平面</s>
|
||
2025-06-11 11:00:56,559 - DEBUG - 原始生成文本: <triplet> <concept> HyTE <misc> part of <triplet> G <media> 法向量 <dis> <time> <cel> <eve> 超平面</s>
|
||
2025-06-11 11:00:56,559 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'HyTE', '<misc>', 'part of', '<triplet>', 'G', '<media>', '法向量', '<dis>', '<time>', '<cel>', '<eve>', '超平面']
|
||
2025-06-11 11:00:56,559 - DEBUG - 处理块 297/753: P (h)+ P (r)≈ P (t)
|
||
与transH类似, HyTE期望在时间 处有效的...
|
||
2025-06-11 11:00:56,932 - DEBUG - 块 297 生成文本: <triplet> <concept> 评分函数 <misc> instance of</s>
|
||
2025-06-11 11:00:56,932 - DEBUG - 原始生成文本: <triplet> <concept> 评分函数 <misc> instance of</s>
|
||
2025-06-11 11:00:56,932 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '评分函数', '<misc>', 'instance of']
|
||
2025-06-11 11:00:56,932 - DEBUG - 处理块 298/753: 为了在保持动态KG固有结构的同时, 在学习的嵌入中结合时间信息. 一种通常的做法是将动态KG分割成
|
||
...
|
||
2025-06-11 11:00:57,102 - DEBUG - 块 298 生成文本: <triplet> 学习嵌入 <media> 动态KG <misc> used by</s>
|
||
2025-06-11 11:00:57,103 - DEBUG - 原始生成文本: <triplet> 学习嵌入 <media> 动态KG <misc> used by</s>
|
||
2025-06-11 11:00:57,103 - DEBUG - 处理后标记: ['<triplet>', '学习嵌入', '<media>', '动态KG', '<misc>', 'used by']
|
||
2025-06-11 11:00:57,103 - DEBUG - 添加三元组: 学习嵌入(media) - used by - 动态KG(misc)
|
||
2025-06-11 11:00:57,103 - DEBUG - 块 298 提取到 1 个三元组
|
||
2025-06-11 11:00:57,103 - DEBUG - 处理块 299/753: 用了这种做法). 这类模型虽然在嵌入过程中考虑了KG的时间信息, 但不能显式地建模动态KG的演化过程...
|
||
2025-06-11 11:00:57,561 - DEBUG - 块 299 生成文本: <triplet> 可感知时间间隔的动态知识图谱嵌入方法 <concept> Tang <per> discoverer</s>
|
||
2025-06-11 11:00:57,561 - DEBUG - 原始生成文本: <triplet> 可感知时间间隔的动态知识图谱嵌入方法 <concept> Tang <per> discoverer</s>
|
||
2025-06-11 11:00:57,562 - DEBUG - 处理后标记: ['<triplet>', '可感知时间间隔的动态知识图谱嵌入方法', '<concept>', 'Tang', '<per>', 'discoverer']
|
||
2025-06-11 11:00:57,562 - DEBUG - 添加三元组: 可感知时间间隔的动态知识图谱嵌入方法(concept) - discoverer - Tang(per)
|
||
2025-06-11 11:00:57,562 - DEBUG - 块 299 提取到 1 个三元组
|
||
2025-06-11 11:00:57,562 - DEBUG - 处理块 300/753: TDG2E既保留了当前子KG的结构信息, 又能同时保留动态KG的演化模式. 它首先将时间范围内的输入...
|
||
2025-06-11 11:00:58,030 - DEBUG - 块 300 生成文本: <triplet> 静态子 <concept> 时间感知超平 <misc> <unk> <dis> TDG2E <media> follows</s>
|
||
2025-06-11 11:00:58,030 - DEBUG - 原始生成文本: <triplet> 静态子 <concept> 时间感知超平 <misc> <unk> <dis> TDG2E <media> follows</s>
|
||
2025-06-11 11:00:58,030 - DEBUG - 处理后标记: ['<triplet>', '静态子', '<concept>', '时间感知超平', '<misc>', '<unk>', '<dis>', 'TDG2E', '<media>', 'follows']
|
||
2025-06-11 11:00:58,030 - DEBUG - 添加三元组: 静态子(concept) - <unk> - 时间感知超平(misc)
|
||
2025-06-11 11:00:58,030 - DEBUG - 块 300 提取到 1 个三元组
|
||
2025-06-11 11:00:58,030 - DEBUG - 处理块 301/753: 面中. 然后利用基于GRU的模型处理动态知识图谱嵌入的学习过程中涉及到的子KG之间的依赖关系. 此外...
|
||
2025-06-11 11:00:58,832 - DEBUG - 块 301 生成文本: <triplet> 动态知识图谱嵌入的学习过程 <concept> GRU的模型 <media> 考 虑累积的结构信息 <misc> 隐藏状态 <eve> 结构 <dis> part of</s>
|
||
2025-06-11 11:00:58,832 - DEBUG - 原始生成文本: <triplet> 动态知识图谱嵌入的学习过程 <concept> GRU的模型 <media> 考 虑累积的结构信息 <misc> 隐藏状态 <eve> 结构 <dis> part of</s>
|
||
2025-06-11 11:00:58,832 - DEBUG - 处理后标记: ['<triplet>', '动态知识图谱嵌入的学习过程', '<concept>', 'GRU的模型', '<media>', '考 虑累积的结构信息', '<misc>', '隐藏状态', '<eve>', '结构', '<dis>', 'part of']
|
||
2025-06-11 11:00:58,832 - DEBUG - 添加三元组: 动态知识图谱嵌入的学习过程(concept) - 考 虑累积的结构信息 - GRU的模型(media)
|
||
2025-06-11 11:00:58,832 - DEBUG - 块 301 提取到 1 个三元组
|
||
2025-06-11 11:00:58,832 - DEBUG - 处理块 302/753: )
|
||
=
|
||
T−1∑
|
||
=1
|
||
∥p −w+1∥2 (68)
|
||
|
||
Laux
|
||
p
|
||
w+1
|
||
辅助损失 ...
|
||
2025-06-11 11:00:59,312 - DEBUG - 块 302 生成文本: <triplet> 引入辅助损失 <concept> 隐状态 <media> 监督超平面 <misc> 的学习 <org> <unk> 学习 <loc> part of</s>
|
||
2025-06-11 11:00:59,312 - DEBUG - 原始生成文本: <triplet> 引入辅助损失 <concept> 隐状态 <media> 监督超平面 <misc> 的学习 <org> <unk> 学习 <loc> part of</s>
|
||
2025-06-11 11:00:59,312 - DEBUG - 处理后标记: ['<triplet>', '引入辅助损失', '<concept>', '隐状态', '<media>', '监督超平面', '<misc>', '的学习', '<org>', '<unk>', '学习', '<loc>', 'part of']
|
||
2025-06-11 11:00:59,312 - DEBUG - 添加三元组: 引入辅助损失(concept) - 监督超平面 - 隐状态(media)
|
||
2025-06-11 11:00:59,312 - DEBUG - 块 302 提取到 1 个三元组
|
||
2025-06-11 11:00:59,312 - DEBUG - 处理块 303/753: 结构信息的同时保留动态知识图的演化模式. 当GRU处理大量的子KG时, 辅助损失减小了反向传播的难度...
|
||
2025-06-11 11:00:59,493 - DEBUG - 块 303 生成文本: <triplet> 更新门 <concept> TDG2E <misc> part of</s>
|
||
2025-06-11 11:00:59,493 - DEBUG - 原始生成文本: <triplet> 更新门 <concept> TDG2E <misc> part of</s>
|
||
2025-06-11 11:00:59,493 - DEBUG - 处理后标记: ['<triplet>', '更新门', '<concept>', 'TDG2E', '<misc>', 'part of']
|
||
2025-06-11 11:00:59,493 - DEBUG - 添加三元组: 更新门(concept) - part of - TDG2E(misc)
|
||
2025-06-11 11:00:59,494 - DEBUG - 块 303 提取到 1 个三元组
|
||
2025-06-11 11:00:59,494 - DEBUG - 处理块 304/753: 入相邻子KG之间的时间间隔以更有效地建模动态KG的演化模式. 如图13是提出改编的GRU图, 标记为...
|
||
2025-06-11 11:01:00,555 - DEBUG - 块 304 生成文本: <triplet> 动态KG <concept> 入相邻子KG之间的时间间隔 <misc> GRU图 <dis> TDG2E提出的改编GRU的图 13 <media> 演化模式 <eve> 改 <org> <per> 图13 <loc> part of</s>
|
||
2025-06-11 11:01:00,555 - DEBUG - 原始生成文本: <triplet> 动态KG <concept> 入相邻子KG之间的时间间隔 <misc> GRU图 <dis> TDG2E提出的改编GRU的图 13 <media> 演化模式 <eve> 改 <org> <per> 图13 <loc> part of</s>
|
||
2025-06-11 11:01:00,555 - DEBUG - 处理后标记: ['<triplet>', '动态KG', '<concept>', '入相邻子KG之间的时间间隔', '<misc>', 'GRU图', '<dis>', 'TDG2E提出的改编GRU的图 13', '<media>', '演化模式', '<eve>', '改', '<org>', '<per>', '图13', '<loc>', 'part of']
|
||
2025-06-11 11:01:00,555 - DEBUG - 添加三元组: 动态KG(concept) - GRU图 - 入相邻子KG之间的时间间隔(misc)
|
||
2025-06-11 11:01:00,555 - DEBUG - 块 304 提取到 1 个三元组
|
||
2025-06-11 11:01:00,555 - DEBUG - 处理块 305/753: T
|
||
时间间隔门 的计算公式为:
|
||
T = (RT w + (△ tRt)+bt) (...
|
||
2025-06-11 11:01:00,992 - DEBUG - 块 305 生成文本: <triplet> 张天成 <per> 知识图谱嵌入技术研究综述 <media> 297 RT <misc> studies</s>
|
||
2025-06-11 11:01:00,992 - DEBUG - 原始生成文本: <triplet> 张天成 <per> 知识图谱嵌入技术研究综述 <media> 297 RT <misc> studies</s>
|
||
2025-06-11 11:01:00,992 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<per>', '知识图谱嵌入技术研究综述', '<media>', '297 RT', '<misc>', 'studies']
|
||
2025-06-11 11:01:00,992 - DEBUG - 添加三元组: 张天成(per) - 297 RT - 知识图谱嵌入技术研究综述(media)
|
||
2025-06-11 11:01:00,992 - DEBUG - 块 305 提取到 1 个三元组
|
||
2025-06-11 11:01:00,992 - DEBUG - 处理块 306/753: 其中, , 是权重矩阵, 是偏差, 表示第 个时间段和第 个时间段之...
|
||
2025-06-11 11:01:01,557 - DEBUG - 块 306 生成文本: <triplet> 偏差 <concept> 权重矩阵 <misc> <media> <unk> 义 <triplet> t+1 s (70) <loc> 矩 <dis> <time> 位 <per> <cel> part of</s>
|
||
2025-06-11 11:01:01,557 - DEBUG - 原始生成文本: <triplet> 偏差 <concept> 权重矩阵 <misc> <media> <unk> 义 <triplet> t+1 s (70) <loc> 矩 <dis> <time> 位 <per> <cel> part of</s>
|
||
2025-06-11 11:01:01,557 - DEBUG - 处理后标记: ['<triplet>', '偏差', '<concept>', '权重矩阵', '<misc>', '<media>', '<unk>', '义', '<triplet>', 't+1 s (70)', '<loc>', '矩', '<dis>', '<time>', '位', '<per>', '<cel>', 'part of']
|
||
2025-06-11 11:01:01,557 - DEBUG - 添加三元组: 偏差(concept) - <media> - 权重矩阵(misc)
|
||
2025-06-11 11:01:01,557 - DEBUG - 添加三元组: t+1 s (70)(loc) - <time> - 矩(dis)
|
||
2025-06-11 11:01:01,557 - DEBUG - 块 306 提取到 2 个三元组
|
||
2025-06-11 11:01:01,557 - DEBUG - 处理块 307/753: TDG2E方法与其他现有的静态/动态嵌入方法相比, 它不仅可以保留当前子KG的结构信息, 而且可以保...
|
||
2025-06-11 11:01:01,791 - DEBUG - 块 307 生成文本: <triplet> 态KG <concept> 动态嵌入方法 <misc> TDG2E <media> used by</s>
|
||
2025-06-11 11:01:01,791 - DEBUG - 原始生成文本: <triplet> 态KG <concept> 动态嵌入方法 <misc> TDG2E <media> used by</s>
|
||
2025-06-11 11:01:01,791 - DEBUG - 处理后标记: ['<triplet>', '态KG', '<concept>', '动态嵌入方法', '<misc>', 'TDG2E', '<media>', 'used by']
|
||
2025-06-11 11:01:01,791 - DEBUG - 添加三元组: 态KG(concept) - TDG2E - 动态嵌入方法(misc)
|
||
2025-06-11 11:01:01,792 - DEBUG - 块 307 提取到 1 个三元组
|
||
2025-06-11 11:01:01,792 - DEBUG - 处理块 308/753: 本节介绍了典型的动态知识图谱嵌入方法, 其中分析了t-TransE, Know-Evolve, Hy...
|
||
2025-06-11 11:01:02,261 - DEBUG - 块 308 生成文本: <triplet> <concept> TDG2E <misc> part of</s>
|
||
2025-06-11 11:01:02,261 - DEBUG - 原始生成文本: <triplet> <concept> TDG2E <misc> part of</s>
|
||
2025-06-11 11:01:02,261 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TDG2E', '<misc>', 'part of']
|
||
2025-06-11 11:01:02,261 - DEBUG - 处理块 309/753: 以得出结论: 现有的大多数知识图谱嵌入方法仍然关注于静态知识图谱, 忽略了知识图谱中时间范围信息的可...
|
||
2025-06-11 11:01:02,774 - DEBUG - 块 309 生成文本: <triplet> 知识图谱嵌入 <concept> 静态知识 <media> <misc> 的知识 <unk> <org> <time> <eve> <date> point in time</s>
|
||
2025-06-11 11:01:02,774 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <concept> 静态知识 <media> <misc> 的知识 <unk> <org> <time> <eve> <date> point in time</s>
|
||
2025-06-11 11:01:02,774 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<concept>', '静态知识', '<media>', '<misc>', '的知识', '<unk>', '<org>', '<time>', '<eve>', '<date>', 'point in time']
|
||
2025-06-11 11:01:02,774 - DEBUG - 添加三元组: 知识图谱嵌入(concept) - <misc> - 静态知识(media)
|
||
2025-06-11 11:01:02,774 - DEBUG - 块 309 提取到 1 个三元组
|
||
2025-06-11 11:01:02,774 - DEBUG - 处理块 310/753: 表 6 TDG2E模型与其他动态KGE方法对比
|
||
比较方法 存在的问题 TDG2E 优势 TDG...
|
||
2025-06-11 11:01:03,104 - DEBUG - 块 310 生成文本: <triplet> 演化过程 <concept> TDG2E <misc> used by</s>
|
||
2025-06-11 11:01:03,104 - DEBUG - 原始生成文本: <triplet> 演化过程 <concept> TDG2E <misc> used by</s>
|
||
2025-06-11 11:01:03,105 - DEBUG - 处理后标记: ['<triplet>', '演化过程', '<concept>', 'TDG2E', '<misc>', 'used by']
|
||
2025-06-11 11:01:03,105 - DEBUG - 添加三元组: 演化过程(concept) - used by - TDG2E(misc)
|
||
2025-06-11 11:01:03,105 - DEBUG - 块 310 提取到 1 个三元组
|
||
2025-06-11 11:01:03,105 - DEBUG - 处理块 311/753: 信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG ...
|
||
2025-06-11 11:01:03,768 - DEBUG - 块 311 生成文本: <triplet> 信息与动态 KG <misc> 捕获动态 <concept> GRU <media> 子 <dis> 依赖关系 <unk> <org> 结构信息监督后续超平面的学习过程 <eve> 模式 <loc> instance of</s>
|
||
2025-06-11 11:01:03,768 - DEBUG - 原始生成文本: <triplet> 信息与动态 KG <misc> 捕获动态 <concept> GRU <media> 子 <dis> 依赖关系 <unk> <org> 结构信息监督后续超平面的学习过程 <eve> 模式 <loc> instance of</s>
|
||
2025-06-11 11:01:03,768 - DEBUG - 处理后标记: ['<triplet>', '信息与动态 KG', '<misc>', '捕获动态', '<concept>', 'GRU', '<media>', '子', '<dis>', '依赖关系', '<unk>', '<org>', '结构信息监督后续超平面的学习过程', '<eve>', '模式', '<loc>', 'instance of']
|
||
2025-06-11 11:01:03,768 - DEBUG - 添加三元组: 信息与动态 KG(misc) - GRU - 捕获动态(concept)
|
||
2025-06-11 11:01:03,768 - DEBUG - 块 311 提取到 1 个三元组
|
||
2025-06-11 11:01:03,768 - DEBUG - 处理块 312/753: 分布不平衡的问题
|
||
解决了动态 KG 面临的时间
|
||
不平衡问题
|
||
在 GRU 中设计时间间隔门 , ...
|
||
2025-06-11 11:01:04,387 - DEBUG - 块 312 生成文本: <triplet> 融合多源信息的知识图谱嵌入 <concept> GRU <media> 分布不平衡问题 <misc> 设计时间间隔门 <eve> 时间 <org> 知识 <per> instance of</s>
|
||
2025-06-11 11:01:04,387 - DEBUG - 原始生成文本: <triplet> 融合多源信息的知识图谱嵌入 <concept> GRU <media> 分布不平衡问题 <misc> 设计时间间隔门 <eve> 时间 <org> 知识 <per> instance of</s>
|
||
2025-06-11 11:01:04,387 - DEBUG - 处理后标记: ['<triplet>', '融合多源信息的知识图谱嵌入', '<concept>', 'GRU', '<media>', '分布不平衡问题', '<misc>', '设计时间间隔门', '<eve>', '时间', '<org>', '知识', '<per>', 'instance of']
|
||
2025-06-11 11:01:04,388 - DEBUG - 添加三元组: 融合多源信息的知识图谱嵌入(concept) - 分布不平衡问题 - GRU(media)
|
||
2025-06-11 11:01:04,388 - DEBUG - 块 312 提取到 1 个三元组
|
||
2025-06-11 11:01:04,388 - DEBUG - 处理块 313/753: 识图谱嵌入的方法忽略了蕴含在多源信息中的丰富知识, 例如: 实体类别信息、文本描述信息、关系路径等....
|
||
2025-06-11 11:01:05,049 - DEBUG - 块 313 生成文本: <triplet> 识图谱嵌入的方法 <concept> 实体类别信息 <misc> 多源信息的 <loc> <media> 信息量子 <dis> <org> <per> part of</s>
|
||
2025-06-11 11:01:05,050 - DEBUG - 原始生成文本: <triplet> 识图谱嵌入的方法 <concept> 实体类别信息 <misc> 多源信息的 <loc> <media> 信息量子 <dis> <org> <per> part of</s>
|
||
2025-06-11 11:01:05,050 - DEBUG - 处理后标记: ['<triplet>', '识图谱嵌入的方法', '<concept>', '实体类别信息', '<misc>', '多源信息的', '<loc>', '<media>', '信息量子', '<dis>', '<org>', '<per>', 'part of']
|
||
2025-06-11 11:01:05,050 - DEBUG - 添加三元组: 识图谱嵌入的方法(concept) - 多源信息的 - 实体类别信息(misc)
|
||
2025-06-11 11:01:05,050 - DEBUG - 块 313 提取到 1 个三元组
|
||
2025-06-11 11:01:05,050 - DEBUG - 处理块 314/753: 实体类别包含实体结构化的先验知识, 这些先验知识是由人工构建的, 能够在知识图谱三元组的结构信息上
|
||
...
|
||
2025-06-11 11:01:05,476 - DEBUG - 块 314 生成文本: <triplet> 结构化 <concept> 知识图谱三元组的结构信息 <misc> 加深模型 <media> 实体类别 <loc> part of</s>
|
||
2025-06-11 11:01:05,476 - DEBUG - 原始生成文本: <triplet> 结构化 <concept> 知识图谱三元组的结构信息 <misc> 加深模型 <media> 实体类别 <loc> part of</s>
|
||
2025-06-11 11:01:05,476 - DEBUG - 处理后标记: ['<triplet>', '结构化', '<concept>', '知识图谱三元组的结构信息', '<misc>', '加深模型', '<media>', '实体类别', '<loc>', 'part of']
|
||
2025-06-11 11:01:05,477 - DEBUG - 添加三元组: 结构化(concept) - 加深模型 - 知识图谱三元组的结构信息(misc)
|
||
2025-06-11 11:01:05,477 - DEBUG - 块 314 提取到 1 个三元组
|
||
2025-06-11 11:01:05,477 - DEBUG - 处理块 315/753: 应该比较接近. SSE利用流行学算法来约束这种平滑性假设, 将两种算法的约束条件加到最大间隔方法里作...
|
||
2025-06-11 11:01:05,646 - DEBUG - 块 315 生成文本: <triplet> 正则化项 <concept> SSE模型 <misc> part of</s>
|
||
2025-06-11 11:01:05,646 - DEBUG - 原始生成文本: <triplet> 正则化项 <concept> SSE模型 <misc> part of</s>
|
||
2025-06-11 11:01:05,646 - DEBUG - 处理后标记: ['<triplet>', '正则化项', '<concept>', 'SSE模型', '<misc>', 'part of']
|
||
2025-06-11 11:01:05,646 - DEBUG - 添加三元组: 正则化项(concept) - part of - SSE模型(misc)
|
||
2025-06-11 11:01:05,647 - DEBUG - 块 315 提取到 1 个三元组
|
||
2025-06-11 11:01:05,647 - DEBUG - 处理块 316/753: 系. 实体类型可以作为不同关系的头实体与尾实体的约束, 例如关系DirectorOf的头实体的类型应...
|
||
2025-06-11 11:01:05,987 - DEBUG - 块 316 生成文本: <triplet> 人 <concept> 关系 <media> <org> instance of</s>
|
||
2025-06-11 11:01:05,987 - DEBUG - 原始生成文本: <triplet> 人 <concept> 关系 <media> <org> instance of</s>
|
||
2025-06-11 11:01:05,987 - DEBUG - 处理后标记: ['<triplet>', '人', '<concept>', '关系', '<media>', '<org>', 'instance of']
|
||
2025-06-11 11:01:05,987 - DEBUG - 添加三元组: 人(concept) - <org> - 关系(media)
|
||
2025-06-11 11:01:05,987 - DEBUG - 块 316 提取到 1 个三元组
|
||
2025-06-11 11:01:05,987 - DEBUG - 处理块 317/753: representation learning, TKRL), 引入具有层次结构的实体类别信息以及与...
|
||
2025-06-11 11:01:06,296 - DEBUG - 块 317 生成文本: <triplet> 类别 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:01:06,296 - DEBUG - 原始生成文本: <triplet> 类别 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:01:06,296 - DEBUG - 处理后标记: ['<triplet>', '类别', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 11:01:06,296 - DEBUG - 添加三元组: 类别(concept) - part of - 三元组(misc)
|
||
2025-06-11 11:01:06,296 - DEBUG - 块 317 提取到 1 个三元组
|
||
2025-06-11 11:01:06,296 - DEBUG - 处理块 318/753: 不同类别对某种特定关系的不同重要程度, 解决了其他模型在使用实体类别信息时需要引入额外规则的问题. ...
|
||
2025-06-11 11:01:06,744 - DEBUG - 块 318 生成文本: <triplet> 结构化信息 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-11 11:01:06,744 - DEBUG - 原始生成文本: <triplet> 结构化信息 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-11 11:01:06,744 - DEBUG - 处理后标记: ['<triplet>', '结构化信息', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-11 11:01:06,744 - DEBUG - 添加三元组: 结构化信息(concept) - part of - 知识图谱(media)
|
||
2025-06-11 11:01:06,744 - DEBUG - 块 318 提取到 1 个三元组
|
||
2025-06-11 11:01:06,744 - DEBUG - 处理块 319/753: 准的知识表示. 知识库的构建资源也往往从文本中获取, 因此实体描述文本能天然地与知识空间进行交互. ...
|
||
2025-06-11 11:01:06,935 - DEBUG - 块 319 生成文本: <triplet> 结构化信息的知识表示模型 <concept> 知识库 <media> part of</s>
|
||
2025-06-11 11:01:06,936 - DEBUG - 原始生成文本: <triplet> 结构化信息的知识表示模型 <concept> 知识库 <media> part of</s>
|
||
2025-06-11 11:01:06,936 - DEBUG - 处理后标记: ['<triplet>', '结构化信息的知识表示模型', '<concept>', '知识库', '<media>', 'part of']
|
||
2025-06-11 11:01:06,936 - DEBUG - 添加三元组: 结构化信息的知识表示模型(concept) - part of - 知识库(media)
|
||
2025-06-11 11:01:06,936 - DEBUG - 块 319 提取到 1 个三元组
|
||
2025-06-11 11:01:06,936 - DEBUG - 处理块 320/753: Wang等人[25]首先提出联合知识图谱和实体描述文本的知识表示学习模型, 该模型基于TransE[...
|
||
2025-06-11 11:01:07,599 - DEBUG - 块 320 生成文本: <triplet> 知识图谱 <concept> 的知识表示学习模型 <media> TransE[15] <misc> <org> 维基百科锚文本 <unk> <per> <eve> 实体名称歧义性 <dis> <cel> 学习 <time> facet of</s>
|
||
2025-06-11 11:01:07,599 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 的知识表示学习模型 <media> TransE[15] <misc> <org> 维基百科锚文本 <unk> <per> <eve> 实体名称歧义性 <dis> <cel> 学习 <time> facet of</s>
|
||
2025-06-11 11:01:07,599 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '的知识表示学习模型', '<media>', 'TransE[15]', '<misc>', '<org>', '维基百科锚文本', '<unk>', '<per>', '<eve>', '实体名称歧义性', '<dis>', '<cel>', '学习', '<time>', 'facet of']
|
||
2025-06-11 11:01:07,599 - DEBUG - 添加三元组: 知识图谱(concept) - TransE[15] - 的知识表示学习模型(media)
|
||
2025-06-11 11:01:07,599 - DEBUG - 块 320 提取到 1 个三元组
|
||
2025-06-11 11:01:07,599 - DEBUG - 处理块 321/753: 较大, 利用实体名称对齐的原则会打乱文本原有的语义空间, 而利用维基百科锚文本对齐的原则过于依赖特定...
|
||
2025-06-11 11:01:08,068 - DEBUG - 块 321 生成文本: <triplet> 词向量 <concept> 对齐原则 <media> part of</s>
|
||
2025-06-11 11:01:08,069 - DEBUG - 原始生成文本: <triplet> 词向量 <concept> 对齐原则 <media> part of</s>
|
||
2025-06-11 11:01:08,069 - DEBUG - 处理后标记: ['<triplet>', '词向量', '<concept>', '对齐原则', '<media>', 'part of']
|
||
2025-06-11 11:01:08,069 - DEBUG - 添加三元组: 词向量(concept) - part of - 对齐原则(media)
|
||
2025-06-11 11:01:08,069 - DEBUG - 块 321 提取到 1 个三元组
|
||
2025-06-11 11:01:08,069 - DEBUG - 处理块 322/753: 为了利用整个文本的语序语义信息, Xie等人[27]提出一种融合实体描述的知识表示模型(descri...
|
||
2025-06-11 11:01:08,602 - DEBUG - 块 322 生成文本: <triplet> 融合实体描述的知识表示模型 <concept> 文本信息 <media> 语序语义信息, <org> 知识描述 <misc> 的信息 <loc> subclass of</s>
|
||
2025-06-11 11:01:08,602 - DEBUG - 原始生成文本: <triplet> 融合实体描述的知识表示模型 <concept> 文本信息 <media> 语序语义信息, <org> 知识描述 <misc> 的信息 <loc> subclass of</s>
|
||
2025-06-11 11:01:08,602 - DEBUG - 处理后标记: ['<triplet>', '融合实体描述的知识表示模型', '<concept>', '文本信息', '<media>', '语序语义信息,', '<org>', '知识描述', '<misc>', '的信息', '<loc>', 'subclass of']
|
||
2025-06-11 11:01:08,602 - DEBUG - 添加三元组: 融合实体描述的知识表示模型(concept) - 语序语义信息, - 文本信息(media)
|
||
2025-06-11 11:01:08,602 - DEBUG - 块 322 提取到 1 个三元组
|
||
2025-06-11 11:01:08,602 - DEBUG - 处理块 323/753: 实体设置两种知识表示. 然而DKRL是一种弱关联建模, 在融合实体基于结构的表示和基于文本的表示时没...
|
||
2025-06-11 11:01:09,072 - DEBUG - 块 323 生成文本: <triplet> 语义子空间 <concept> SSP模型 <misc> Xiao等人 <per> developer</s>
|
||
2025-06-11 11:01:09,072 - DEBUG - 原始生成文本: <triplet> 语义子空间 <concept> SSP模型 <misc> Xiao等人 <per> developer</s>
|
||
2025-06-11 11:01:09,072 - DEBUG - 处理后标记: ['<triplet>', '语义子空间', '<concept>', 'SSP模型', '<misc>', 'Xiao等人', '<per>', 'developer']
|
||
2025-06-11 11:01:09,072 - DEBUG - 添加三元组: 语义子空间(concept) - Xiao等人 - SSP模型(misc)
|
||
2025-06-11 11:01:09,072 - DEBUG - 块 323 提取到 1 个三元组
|
||
2025-06-11 11:01:09,072 - DEBUG - 处理块 324/753: 的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[...
|
||
2025-06-11 11:01:09,498 - DEBUG - 块 324 生成文本: <triplet> ∀x;y:HasWi f <concept> HasSpouse <misc> follows</s>
|
||
2025-06-11 11:01:09,498 - DEBUG - 原始生成文本: <triplet> ∀x;y:HasWi f <concept> HasSpouse <misc> follows</s>
|
||
2025-06-11 11:01:09,498 - DEBUG - 处理后标记: ['<triplet>', '∀x;y:HasWi f', '<concept>', 'HasSpouse', '<misc>', 'follows']
|
||
2025-06-11 11:01:09,498 - DEBUG - 添加三元组: ∀x;y:HasWi f(concept) - follows - HasSpouse(misc)
|
||
2025-06-11 11:01:09,498 - DEBUG - 块 324 提取到 1 个三元组
|
||
2025-06-11 11:01:09,498 - DEBUG - 处理块 325/753: 逻辑规则(这里所说的逻辑规则主要指一阶Horn子句, 例如: , 表明任
|
||
何有两个HasWif...
|
||
2025-06-11 11:01:09,806 - DEBUG - 块 325 生成文本: <triplet> 阶Horn子句 <concept> 逻辑规则 <misc> 规则挖掘方法 <media> KG <org> part of</s>
|
||
2025-06-11 11:01:09,806 - DEBUG - 原始生成文本: <triplet> 阶Horn子句 <concept> 逻辑规则 <misc> 规则挖掘方法 <media> KG <org> part of</s>
|
||
2025-06-11 11:01:09,806 - DEBUG - 处理后标记: ['<triplet>', '阶Horn子句', '<concept>', '逻辑规则', '<misc>', '规则挖掘方法', '<media>', 'KG', '<org>', 'part of']
|
||
2025-06-11 11:01:09,806 - DEBUG - 添加三元组: 阶Horn子句(concept) - 规则挖掘方法 - 逻辑规则(misc)
|
||
2025-06-11 11:01:09,807 - DEBUG - 块 325 提取到 1 个三元组
|
||
2025-06-11 11:01:09,807 - DEBUG - 处理块 326/753: Guo等人将三元组看做原子, 提出了KALE[32]方法. 给定一个逻辑规则, KALE利用实体集合...
|
||
2025-06-11 11:01:10,072 - DEBUG - 块 326 生成文本: <triplet> <concept> 逻辑规则 <misc> subclass of</s>
|
||
2025-06-11 11:01:10,073 - DEBUG - 原始生成文本: <triplet> <concept> 逻辑规则 <misc> subclass of</s>
|
||
2025-06-11 11:01:10,073 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '逻辑规则', '<misc>', 'subclass of']
|
||
2025-06-11 11:01:10,073 - DEBUG - 处理块 327/753: 由于硬规则依赖于手工设计与验证, 而某些文本信息可以提取出来作为软规则. 基于这个思想, Guo等人...
|
||
2025-06-11 11:01:10,339 - DEBUG - 块 327 生成文本: <triplet> 软规则 <concept> RUGE <media> used by</s>
|
||
2025-06-11 11:01:10,339 - DEBUG - 原始生成文本: <triplet> 软规则 <concept> RUGE <media> used by</s>
|
||
2025-06-11 11:01:10,339 - DEBUG - 处理后标记: ['<triplet>', '软规则', '<concept>', 'RUGE', '<media>', 'used by']
|
||
2025-06-11 11:01:10,339 - DEBUG - 添加三元组: 软规则(concept) - used by - RUGE(media)
|
||
2025-06-11 11:01:10,339 - DEBUG - 块 327 提取到 1 个三元组
|
||
2025-06-11 11:01:10,339 - DEBUG - 处理块 328/753: 知识表示预测无标签三元组的标签, 然后利用预测的软标签和KG中已有标签的三元组重新完善知识表示.
|
||
...
|
||
2025-06-11 11:01:10,520 - DEBUG - 块 328 生成文本: <triplet> 关系 <concept> 多步推理 <misc> part of</s>
|
||
2025-06-11 11:01:10,520 - DEBUG - 原始生成文本: <triplet> 关系 <concept> 多步推理 <misc> part of</s>
|
||
2025-06-11 11:01:10,520 - DEBUG - 处理后标记: ['<triplet>', '关系', '<concept>', '多步推理', '<misc>', 'part of']
|
||
2025-06-11 11:01:10,520 - DEBUG - 添加三元组: 关系(concept) - part of - 多步推理(misc)
|
||
2025-06-11 11:01:10,520 - DEBUG - 块 328 提取到 1 个三元组
|
||
2025-06-11 11:01:10,520 - DEBUG - 处理块 329/753: Lin等人[29]在TransE模型的基础上将两个实体之间的多步关系路径看作两个实体之间相连的关系,...
|
||
2025-06-11 11:01:10,786 - DEBUG - 块 329 生成文本: <triplet> <media> 学习模型 <concept> instance of</s>
|
||
2025-06-11 11:01:10,786 - DEBUG - 原始生成文本: <triplet> <media> 学习模型 <concept> instance of</s>
|
||
2025-06-11 11:01:10,786 - DEBUG - 处理后标记: ['<triplet>', '<media>', '学习模型', '<concept>', 'instance of']
|
||
2025-06-11 11:01:10,786 - DEBUG - 处理块 330/753: Niu等人[106]认为目前基于关系路径的表示学习模型仅利用路径上关系或实体表示的数值计算结果作为关...
|
||
2025-06-11 11:01:11,127 - DEBUG - 块 330 生成文本: <triplet> 表示学习模型 <concept> Niu <per> discoverer</s>
|
||
2025-06-11 11:01:11,127 - DEBUG - 原始生成文本: <triplet> 表示学习模型 <concept> Niu <per> discoverer</s>
|
||
2025-06-11 11:01:11,127 - DEBUG - 处理后标记: ['<triplet>', '表示学习模型', '<concept>', 'Niu', '<per>', 'discoverer']
|
||
2025-06-11 11:01:11,127 - DEBUG - 添加三元组: 表示学习模型(concept) - discoverer - Niu(per)
|
||
2025-06-11 11:01:11,127 - DEBUG - 块 330 提取到 1 个三元组
|
||
2025-06-11 11:01:11,127 - DEBUG - 处理块 331/753: 合路径和规则的知识表示学习模型RPJE, 利用Horn规则组合多步关系路径, 并且关联组合后的路径与...
|
||
2025-06-11 11:01:11,329 - DEBUG - 块 331 生成文本: <triplet> 知识图谱 <concept> 学习模型RPJE <media> part of</s>
|
||
2025-06-11 11:01:11,329 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 学习模型RPJE <media> part of</s>
|
||
2025-06-11 11:01:11,329 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '学习模型RPJE', '<media>', 'part of']
|
||
2025-06-11 11:01:11,329 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 学习模型RPJE(media)
|
||
2025-06-11 11:01:11,329 - DEBUG - 块 331 提取到 1 个三元组
|
||
2025-06-11 11:01:11,329 - DEBUG - 处理块 332/753: 识的语义表示. 例如Xie等人[107]尝试融合实体图像信息学习实体跨模态的知识表示, 提出了(im...
|
||
2025-06-11 11:01:11,520 - DEBUG - 块 332 生成文本: <triplet> 识的语义表示 <concept> AlexNet <media> part of</s>
|
||
2025-06-11 11:01:11,521 - DEBUG - 原始生成文本: <triplet> 识的语义表示 <concept> AlexNet <media> part of</s>
|
||
2025-06-11 11:01:11,521 - DEBUG - 处理后标记: ['<triplet>', '识的语义表示', '<concept>', 'AlexNet', '<media>', 'part of']
|
||
2025-06-11 11:01:11,521 - DEBUG - 添加三元组: 识的语义表示(concept) - part of - AlexNet(media)
|
||
2025-06-11 11:01:11,521 - DEBUG - 块 332 提取到 1 个三元组
|
||
2025-06-11 11:01:11,521 - DEBUG - 处理块 333/753: 像的特征提取器.
|
||
尽管融合多步关系路径的模型引入了其他的实体和关系, 但是绝大部分模型只是将关系路径...
|
||
2025-06-11 11:01:11,946 - DEBUG - 块 333 生成文本: <triplet> 图谱嵌入技术研究综述 299 <concept> 张天成 <per> author</s>
|
||
2025-06-11 11:01:11,946 - DEBUG - 原始生成文本: <triplet> 图谱嵌入技术研究综述 299 <concept> 张天成 <per> author</s>
|
||
2025-06-11 11:01:11,946 - DEBUG - 处理后标记: ['<triplet>', '图谱嵌入技术研究综述 299', '<concept>', '张天成', '<per>', 'author']
|
||
2025-06-11 11:01:11,946 - DEBUG - 添加三元组: 图谱嵌入技术研究综述 299(concept) - author - 张天成(per)
|
||
2025-06-11 11:01:11,946 - DEBUG - 块 333 提取到 1 个三元组
|
||
2025-06-11 11:01:11,946 - DEBUG - 处理块 334/753: aware knowledge embedding, GAKE), 由于不同的实体和关系对于一个实体...
|
||
2025-06-11 11:01:12,106 - DEBUG - 块 334 生成文本: <triplet> 链接预测 <concept> GAKE <media> used by</s>
|
||
2025-06-11 11:01:12,106 - DEBUG - 原始生成文本: <triplet> 链接预测 <concept> GAKE <media> used by</s>
|
||
2025-06-11 11:01:12,106 - DEBUG - 处理后标记: ['<triplet>', '链接预测', '<concept>', 'GAKE', '<media>', 'used by']
|
||
2025-06-11 11:01:12,106 - DEBUG - 添加三元组: 链接预测(concept) - used by - GAKE(media)
|
||
2025-06-11 11:01:12,106 - DEBUG - 块 334 提取到 1 个三元组
|
||
2025-06-11 11:01:12,106 - DEBUG - 处理块 335/753: 目前有一些嵌入模型融合上述两种或多种信息来丰富实体和关系的语义信息, 如Du等人[110]提出一种融...
|
||
2025-06-11 11:01:12,607 - DEBUG - 块 335 生成文本: <triplet> 实体描述信息 <concept> Du等人 <per> discoverer</s>
|
||
2025-06-11 11:01:12,607 - DEBUG - 原始生成文本: <triplet> 实体描述信息 <concept> Du等人 <per> discoverer</s>
|
||
2025-06-11 11:01:12,607 - DEBUG - 处理后标记: ['<triplet>', '实体描述信息', '<concept>', 'Du等人', '<per>', 'discoverer']
|
||
2025-06-11 11:01:12,607 - DEBUG - 添加三元组: 实体描述信息(concept) - discoverer - Du等人(per)
|
||
2025-06-11 11:01:12,607 - DEBUG - 块 335 提取到 1 个三元组
|
||
2025-06-11 11:01:12,607 - DEBUG - 处理块 336/753: 本节主要介绍了在基于KG自身固有结构信息的基础上融合其他信息源的知识图谱嵌入模型, 信息源大致分
|
||
为...
|
||
2025-06-11 11:01:13,214 - DEBUG - 块 336 生成文本: <triplet> 结构信息 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:01:13,214 - DEBUG - 原始生成文本: <triplet> 结构信息 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:01:13,214 - DEBUG - 处理后标记: ['<triplet>', '结构信息', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:01:13,214 - DEBUG - 添加三元组: 结构信息(concept) - part of - KG(misc)
|
||
2025-06-11 11:01:13,214 - DEBUG - 块 336 提取到 1 个三元组
|
||
2025-06-11 11:01:13,215 - DEBUG - 处理块 337/753: 5 知识图谱嵌入的应用
|
||
近年来, 知识驱动的应用在信息检索和问答等领域取得了巨大成功, 这些应用...
|
||
2025-06-11 11:01:13,480 - DEBUG - 块 337 生成文本: <triplet> 知识图谱嵌入的应用 <concept> 5 <num> quantity</s>
|
||
2025-06-11 11:01:13,480 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入的应用 <concept> 5 <num> quantity</s>
|
||
2025-06-11 11:01:13,480 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入的应用', '<concept>', '5', '<num>', 'quantity']
|
||
2025-06-11 11:01:13,480 - DEBUG - 添加三元组: 知识图谱嵌入的应用(concept) - quantity - 5(num)
|
||
2025-06-11 11:01:13,481 - DEBUG - 块 337 提取到 1 个三元组
|
||
2025-06-11 11:01:13,481 - DEBUG - 处理块 338/753: 关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图...
|
||
2025-06-11 11:01:13,736 - DEBUG - 块 338 生成文本: <triplet> 基于知识图谱嵌入的问答 <concept> 关系 <media> KGE <misc> part of</s>
|
||
2025-06-11 11:01:13,736 - DEBUG - 原始生成文本: <triplet> 基于知识图谱嵌入的问答 <concept> 关系 <media> KGE <misc> part of</s>
|
||
2025-06-11 11:01:13,736 - DEBUG - 处理后标记: ['<triplet>', '基于知识图谱嵌入的问答', '<concept>', '关系', '<media>', 'KGE', '<misc>', 'part of']
|
||
2025-06-11 11:01:13,736 - DEBUG - 添加三元组: 基于知识图谱嵌入的问答(concept) - KGE - 关系(media)
|
||
2025-06-11 11:01:13,736 - DEBUG - 块 338 提取到 1 个三元组
|
||
2025-06-11 11:01:13,736 - DEBUG - 处理块 339/753: 世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据结构使得用户很难访问其中有价值...
|
||
2025-06-11 11:01:14,132 - DEBUG - 块 339 生成文本: <triplet> 基于知识图谱的问答 <media> QA-KG <misc> part of</s>
|
||
2025-06-11 11:01:14,132 - DEBUG - 原始生成文本: <triplet> 基于知识图谱的问答 <media> QA-KG <misc> part of</s>
|
||
2025-06-11 11:01:14,132 - DEBUG - 处理后标记: ['<triplet>', '基于知识图谱的问答', '<media>', 'QA-KG', '<misc>', 'part of']
|
||
2025-06-11 11:01:14,132 - DEBUG - 添加三元组: 基于知识图谱的问答(media) - part of - QA-KG(misc)
|
||
2025-06-11 11:01:14,132 - DEBUG - 块 339 提取到 1 个三元组
|
||
2025-06-11 11:01:14,132 - DEBUG - 处理块 340/753: 下, 高效地访问KG中对自己有价值的知识. 然而, 由于涉及到语义分析[112]和实体链接[113,...
|
||
2025-06-11 11:01:14,483 - DEBUG - 块 340 生成文本: <triplet> QA-KG <media> <misc> <eve> <per> <concept> <org> <loc> instance of quality controls <unk> <time> instance</s>
|
||
2025-06-11 11:01:14,483 - DEBUG - 原始生成文本: <triplet> QA-KG <media> <misc> <eve> <per> <concept> <org> <loc> instance of quality controls <unk> <time> instance</s>
|
||
2025-06-11 11:01:14,483 - DEBUG - 处理后标记: ['<triplet>', 'QA-KG', '<media>', '<misc>', '<eve>', '<per>', '<concept>', '<org>', '<loc>', 'instance of quality controls', '<unk>', '<time>', 'instance']
|
||
2025-06-11 11:01:14,483 - DEBUG - 添加三元组: QA-KG(media) - <per> - <misc>(eve)
|
||
2025-06-11 11:01:14,483 - DEBUG - 块 340 提取到 1 个三元组
|
||
2025-06-11 11:01:14,483 - DEBUG - 处理块 341/753: Bordes等人[115]基于训练问题和问题释义学习单词, 关系和实体的低维表示, 以便将新问题和候...
|
||
2025-06-11 11:01:14,813 - DEBUG - 块 341 生成文本: <triplet> 关系 <concept> Bordes等人 <per> creator</s>
|
||
2025-06-11 11:01:14,813 - DEBUG - 原始生成文本: <triplet> 关系 <concept> Bordes等人 <per> creator</s>
|
||
2025-06-11 11:01:14,813 - DEBUG - 处理后标记: ['<triplet>', '关系', '<concept>', 'Bordes等人', '<per>', 'creator']
|
||
2025-06-11 11:01:14,813 - DEBUG - 添加三元组: 关系(concept) - creator - Bordes等人(per)
|
||
2025-06-11 11:01:14,814 - DEBUG - 块 341 提取到 1 个三元组
|
||
2025-06-11 11:01:14,814 - DEBUG - 处理块 342/753: 空间中. 还有一些基于深度学习的模型[118−122]通过将问题中的单词输入神经网络来实现这种投影....
|
||
2025-06-11 11:01:15,314 - DEBUG - 块 342 生成文本: <triplet> 单词输入神经网络 <concept> 基于知识图谱嵌入的问答框架 <media> KEQA <misc> used by</s>
|
||
2025-06-11 11:01:15,314 - DEBUG - 原始生成文本: <triplet> 单词输入神经网络 <concept> 基于知识图谱嵌入的问答框架 <media> KEQA <misc> used by</s>
|
||
2025-06-11 11:01:15,315 - DEBUG - 处理后标记: ['<triplet>', '单词输入神经网络', '<concept>', '基于知识图谱嵌入的问答框架', '<media>', 'KEQA', '<misc>', 'used by']
|
||
2025-06-11 11:01:15,315 - DEBUG - 添加三元组: 单词输入神经网络(concept) - KEQA - 基于知识图谱嵌入的问答框架(media)
|
||
2025-06-11 11:01:15,315 - DEBUG - 块 342 提取到 1 个三元组
|
||
2025-06-11 11:01:15,315 - DEBUG - 处理块 343/753: 简单问题, 即QA-KG中最常见的问题类型. KEQA不是直接推断问题的头实体和谓词, 而是在KGE...
|
||
2025-06-11 11:01:15,485 - DEBUG - 块 343 生成文本: <triplet> 简单问题 <concept> QA-KG <media> part of</s>
|
||
2025-06-11 11:01:15,485 - DEBUG - 原始生成文本: <triplet> 简单问题 <concept> QA-KG <media> part of</s>
|
||
2025-06-11 11:01:15,485 - DEBUG - 处理后标记: ['<triplet>', '简单问题', '<concept>', 'QA-KG', '<media>', 'part of']
|
||
2025-06-11 11:01:15,485 - DEBUG - 添加三元组: 简单问题(concept) - part of - QA-KG(media)
|
||
2025-06-11 11:01:15,485 - DEBUG - 块 343 提取到 1 个三元组
|
||
2025-06-11 11:01:15,485 - DEBUG - 处理块 344/753: 数据集SimpleQuestions[115]进行实验, 通过与7个最新提出的QA-KG算法进行对比...
|
||
2025-06-11 11:01:15,975 - DEBUG - 块 344 生成文本: <triplet> QA-KG <misc> KEQA <media> <concept> <eve> <per> <org> <unk> <loc> <time> <dis> <date> point in time</s>
|
||
2025-06-11 11:01:15,975 - DEBUG - 原始生成文本: <triplet> QA-KG <misc> KEQA <media> <concept> <eve> <per> <org> <unk> <loc> <time> <dis> <date> point in time</s>
|
||
2025-06-11 11:01:15,975 - DEBUG - 处理后标记: ['<triplet>', 'QA-KG', '<misc>', 'KEQA', '<media>', '<concept>', '<eve>', '<per>', '<org>', '<unk>', '<loc>', '<time>', '<dis>', '<date>', 'point in time']
|
||
2025-06-11 11:01:15,975 - DEBUG - 添加三元组: QA-KG(misc) - <concept> - KEQA(media)
|
||
2025-06-11 11:01:15,975 - DEBUG - 块 344 提取到 1 个三元组
|
||
2025-06-11 11:01:15,975 - DEBUG - 处理块 345/753: 性, 分别使用TransE[15]、TransH[16]、TransR[43]执行知识图谱嵌入, 实...
|
||
2025-06-11 11:01:16,123 - DEBUG - 块 345 生成文本: <triplet> <concept> 知识图谱嵌入 <media> use</s>
|
||
2025-06-11 11:01:16,124 - DEBUG - 原始生成文本: <triplet> <concept> 知识图谱嵌入 <media> use</s>
|
||
2025-06-11 11:01:16,124 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '知识图谱嵌入', '<media>', 'use']
|
||
2025-06-11 11:01:16,124 - DEBUG - 处理块 346/753: 使用不同的KGE算法时性能相近, 证明了KEQA的通用性, 此外, 即使不使用KGE, KEQA仍然...
|
||
2025-06-11 11:01:16,828 - DEBUG - 块 346 生成文本: <triplet> 推荐系统 <concept> QA-KG <misc> <media> <eve> <org> <per> <loc> 算法 <unk> KGE <dis> part of</s>
|
||
2025-06-11 11:01:16,828 - DEBUG - 原始生成文本: <triplet> 推荐系统 <concept> QA-KG <misc> <media> <eve> <org> <per> <loc> 算法 <unk> KGE <dis> part of</s>
|
||
2025-06-11 11:01:16,828 - DEBUG - 处理后标记: ['<triplet>', '推荐系统', '<concept>', 'QA-KG', '<misc>', '<media>', '<eve>', '<org>', '<per>', '<loc>', '算法', '<unk>', 'KGE', '<dis>', 'part of']
|
||
2025-06-11 11:01:16,829 - DEBUG - 添加三元组: 推荐系统(concept) - <media> - QA-KG(misc)
|
||
2025-06-11 11:01:16,829 - DEBUG - 块 346 提取到 1 个三元组
|
||
2025-06-11 11:01:16,829 - DEBUG - 处理块 347/753: 项目和数据稀疏性等问题[124−128]. 最近, KGE的流行促进了利用KGE捕获实体语义进行推荐...
|
||
2025-06-11 11:01:17,094 - DEBUG - 块 347 生成文本: <triplet> 项目和数据稀疏性等问题 <concept> KGE <misc> facet of</s>
|
||
2025-06-11 11:01:17,095 - DEBUG - 原始生成文本: <triplet> 项目和数据稀疏性等问题 <concept> KGE <misc> facet of</s>
|
||
2025-06-11 11:01:17,095 - DEBUG - 处理后标记: ['<triplet>', '项目和数据稀疏性等问题', '<concept>', 'KGE', '<misc>', 'facet of']
|
||
2025-06-11 11:01:17,095 - DEBUG - 添加三元组: 项目和数据稀疏性等问题(concept) - facet of - KGE(misc)
|
||
2025-06-11 11:01:17,095 - DEBUG - 块 347 提取到 1 个三元组
|
||
2025-06-11 11:01:17,095 - DEBUG - 处理块 348/753: Zhang等人提出使用TransR的协作知识图嵌入(collaborative knowledge ...
|
||
2025-06-11 11:01:17,265 - DEBUG - 块 348 生成文本: <triplet> 协作知识图嵌入 <concept> TransR <media> used by</s>
|
||
2025-06-11 11:01:17,265 - DEBUG - 原始生成文本: <triplet> 协作知识图嵌入 <concept> TransR <media> used by</s>
|
||
2025-06-11 11:01:17,265 - DEBUG - 处理后标记: ['<triplet>', '协作知识图嵌入', '<concept>', 'TransR', '<media>', 'used by']
|
||
2025-06-11 11:01:17,265 - DEBUG - 添加三元组: 协作知识图嵌入(concept) - used by - TransR(media)
|
||
2025-06-11 11:01:17,265 - DEBUG - 块 348 提取到 1 个三元组
|
||
2025-06-11 11:01:17,265 - DEBUG - 处理块 349/753: 合视觉和文本嵌入的项目结构表示. 深度知识感知网络(deep knowledge-aware net...
|
||
2025-06-11 11:01:17,615 - DEBUG - 块 349 生成文本: <triplet> 深度知识感知网络 <concept> TransD学 300 软件学报 2023年第 34卷第 1期 <unk> <media> is a list of</s>
|
||
2025-06-11 11:01:17,616 - DEBUG - 原始生成文本: <triplet> 深度知识感知网络 <concept> TransD学 300 软件学报 2023年第 34卷第 1期 <unk> <media> is a list of</s>
|
||
2025-06-11 11:01:17,616 - DEBUG - 处理后标记: ['<triplet>', '深度知识感知网络', '<concept>', 'TransD学 300 软件学报 2023年第 34卷第 1期', '<unk>', '<media>', 'is a list of']
|
||
2025-06-11 11:01:17,616 - DEBUG - 添加三元组: 深度知识感知网络(concept) - <media> - TransD学 300 软件学报 2023年第 34卷第 1期(unk)
|
||
2025-06-11 11:01:17,616 - DEBUG - 块 349 提取到 1 个三元组
|
||
2025-06-11 11:01:17,616 - DEBUG - 处理块 350/753: 习实体嵌入, 并通过将它们与词嵌入相结合来设计CNN框架, 用于新闻推荐. 但是, 由于需要提前学习...
|
||
2025-06-11 11:01:17,788 - DEBUG - 块 350 生成文本: <triplet> 实体嵌入 <concept> CNN框架 <media> part of</s>
|
||
2025-06-11 11:01:17,788 - DEBUG - 原始生成文本: <triplet> 实体嵌入 <concept> CNN框架 <media> part of</s>
|
||
2025-06-11 11:01:17,788 - DEBUG - 处理后标记: ['<triplet>', '实体嵌入', '<concept>', 'CNN框架', '<media>', 'part of']
|
||
2025-06-11 11:01:17,788 - DEBUG - 添加三元组: 实体嵌入(concept) - part of - CNN框架(media)
|
||
2025-06-11 11:01:17,788 - DEBUG - 块 350 提取到 1 个三元组
|
||
2025-06-11 11:01:17,788 - DEBUG - 处理块 351/753: knowledge graph)[131]通过共享潜在特征和建模高阶项-实体交互, 将多任务知识图谱...
|
||
2025-06-11 11:01:18,129 - DEBUG - 块 351 生成文本: <triplet> <concept> TransE <media> used by <triplet> Transe <misc> 项目相似度评分</s>
|
||
2025-06-11 11:01:18,130 - DEBUG - 原始生成文本: <triplet> <concept> TransE <media> used by <triplet> Transe <misc> 项目相似度评分</s>
|
||
2025-06-11 11:01:18,130 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'TransE', '<media>', 'used by', '<triplet>', 'Transe', '<misc>', '项目相似度评分']
|
||
2025-06-11 11:01:18,130 - DEBUG - 处理块 352/753: 优惠推荐任务提出了一个神经分解(neural factorization, NF)模型, 以KG的形...
|
||
2025-06-11 11:01:18,609 - DEBUG - 块 352 生成文本: <triplet> 优惠推荐任务 <concept> TransE学习实体 <misc> NF <media> <eve> <per> 神经分解 <unk> <org> 模型 <loc> subclass of</s>
|
||
2025-06-11 11:01:18,609 - DEBUG - 原始生成文本: <triplet> 优惠推荐任务 <concept> TransE学习实体 <misc> NF <media> <eve> <per> 神经分解 <unk> <org> 模型 <loc> subclass of</s>
|
||
2025-06-11 11:01:18,609 - DEBUG - 处理后标记: ['<triplet>', '优惠推荐任务', '<concept>', 'TransE学习实体', '<misc>', 'NF', '<media>', '<eve>', '<per>', '神经分解', '<unk>', '<org>', '模型', '<loc>', 'subclass of']
|
||
2025-06-11 11:01:18,609 - DEBUG - 添加三元组: 优惠推荐任务(concept) - NF - TransE学习实体(misc)
|
||
2025-06-11 11:01:18,609 - DEBUG - 块 352 提取到 1 个三元组
|
||
2025-06-11 11:01:18,609 - DEBUG - 处理块 353/753: 最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge gra...
|
||
2025-06-11 11:01:18,864 - DEBUG - 块 353 生成文本: <triplet> 图谱嵌入 <concept> Sha <per> discoverer</s>
|
||
2025-06-11 11:01:18,864 - DEBUG - 原始生成文本: <triplet> 图谱嵌入 <concept> Sha <per> discoverer</s>
|
||
2025-06-11 11:01:18,865 - DEBUG - 处理后标记: ['<triplet>', '图谱嵌入', '<concept>', 'Sha', '<per>', 'discoverer']
|
||
2025-06-11 11:01:18,865 - DEBUG - 添加三元组: 图谱嵌入(concept) - discoverer - Sha(per)
|
||
2025-06-11 11:01:18,865 - DEBUG - 块 353 提取到 1 个三元组
|
||
2025-06-11 11:01:18,865 - DEBUG - 处理块 354/753: 供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135],...
|
||
2025-06-11 11:01:19,184 - DEBUG - 块 354 生成文本: <triplet> 实体推荐框架 <concept> Wikipedia组织 <media> Wikipedia <org> Wikipedia的 <unk> Wikipedia组织的 <loc> is a list of</s>
|
||
2025-06-11 11:01:19,184 - DEBUG - 原始生成文本: <triplet> 实体推荐框架 <concept> Wikipedia组织 <media> Wikipedia <org> Wikipedia的 <unk> Wikipedia组织的 <loc> is a list of</s>
|
||
2025-06-11 11:01:19,184 - DEBUG - 处理后标记: ['<triplet>', '实体推荐框架', '<concept>', 'Wikipedia组织', '<media>', 'Wikipedia', '<org>', 'Wikipedia的', '<unk>', 'Wikipedia组织的', '<loc>', 'is a list of']
|
||
2025-06-11 11:01:19,184 - DEBUG - 添加三元组: 实体推荐框架(concept) - Wikipedia - Wikipedia组织(media)
|
||
2025-06-11 11:01:19,184 - DEBUG - 块 354 提取到 1 个三元组
|
||
2025-06-11 11:01:19,184 - DEBUG - 处理块 355/753: 推荐Wikipedia上的相关实体. 通过使用Wikipedia作为框架的输入, 两个实体推荐数据集...
|
||
2025-06-11 11:01:19,621 - DEBUG - 块 355 生成文本: <triplet> 推荐数据集 <concept> Yahoo! <org> owned by</s>
|
||
2025-06-11 11:01:19,621 - DEBUG - 原始生成文本: <triplet> 推荐数据集 <concept> Yahoo! <org> owned by</s>
|
||
2025-06-11 11:01:19,621 - DEBUG - 处理后标记: ['<triplet>', '推荐数据集', '<concept>', 'Yahoo!', '<org>', 'owned by']
|
||
2025-06-11 11:01:19,621 - DEBUG - 添加三元组: 推荐数据集(concept) - owned by - Yahoo!(org)
|
||
2025-06-11 11:01:19,621 - DEBUG - 块 355 提取到 1 个三元组
|
||
2025-06-11 11:01:19,621 - DEBUG - 处理块 356/753: 关系提取(relation extraction, RE)是信息提取中的一项重要任务, 旨在根据两个...
|
||
2025-06-11 11:01:20,293 - DEBUG - 块 356 生成文本: <triplet> 对话生成 <media> 自然语言处理 <concept> <org> 文本信息的能力 <misc> <unk> 信息检索 <eve> <per> <loc> 关系提取</s>
|
||
2025-06-11 11:01:20,293 - DEBUG - 原始生成文本: <triplet> 对话生成 <media> 自然语言处理 <concept> <org> 文本信息的能力 <misc> <unk> 信息检索 <eve> <per> <loc> 关系提取</s>
|
||
2025-06-11 11:01:20,294 - DEBUG - 处理后标记: ['<triplet>', '对话生成', '<media>', '自然语言处理', '<concept>', '<org>', '文本信息的能力', '<misc>', '<unk>', '信息检索', '<eve>', '<per>', '<loc>', '关系提取']
|
||
2025-06-11 11:01:20,294 - DEBUG - 添加三元组: 对话生成(media) - <org> - 自然语言处理(concept)
|
||
2025-06-11 11:01:20,294 - DEBUG - 块 356 提取到 1 个三元组
|
||
2025-06-11 11:01:20,294 - DEBUG - 处理块 357/753: 常规的监督模型已经在关系提取任务中得到深入研究, 但是, 它们的性能在很大程度上依赖于训练数据的规
|
||
...
|
||
2025-06-11 11:01:20,645 - DEBUG - 块 357 生成文本: <triplet> 远程监督 <concept> Mintz <per> developer</s>
|
||
2025-06-11 11:01:20,645 - DEBUG - 原始生成文本: <triplet> 远程监督 <concept> Mintz <per> developer</s>
|
||
2025-06-11 11:01:20,645 - DEBUG - 处理后标记: ['<triplet>', '远程监督', '<concept>', 'Mintz', '<per>', 'developer']
|
||
2025-06-11 11:01:20,645 - DEBUG - 添加三元组: 远程监督(concept) - developer - Mintz(per)
|
||
2025-06-11 11:01:20,645 - DEBUG - 块 357 提取到 1 个三元组
|
||
2025-06-11 11:01:20,645 - DEBUG - 处理块 358/753: 现有知识图谱与文本对齐来自动标记训练实例.DS使RE模型能够在大规模的训练语料库上工作, 因此远程监...
|
||
2025-06-11 11:01:21,200 - DEBUG - 块 358 生成文本: <triplet> 文本对齐来自动标记训练实例.DS <media> 训练语料库 <concept> <misc> 信 息 <org> <eve> <per> مية <triplet> KG结构 <loc> wiedzy <dis> part of</s>
|
||
2025-06-11 11:01:21,200 - DEBUG - 原始生成文本: <triplet> 文本对齐来自动标记训练实例.DS <media> 训练语料库 <concept> <misc> 信 息 <org> <eve> <per> مية <triplet> KG结构 <loc> wiedzy <dis> part of</s>
|
||
2025-06-11 11:01:21,200 - DEBUG - 处理后标记: ['<triplet>', '文本对齐来自动标记训练实例.DS', '<media>', '训练语料库', '<concept>', '<misc>', '信 息', '<org>', '<eve>', '<per>', 'مية', '<triplet>', 'KG结构', '<loc>', 'wiedzy', '<dis>', 'part of']
|
||
2025-06-11 11:01:21,200 - DEBUG - 添加三元组: 文本对齐来自动标记训练实例.DS(media) - <misc> - 训练语料库(concept)
|
||
2025-06-11 11:01:21,200 - DEBUG - 添加三元组: KG结构(loc) - part of - wiedzy(dis)
|
||
2025-06-11 11:01:21,200 - DEBUG - 块 358 提取到 2 个三元组
|
||
2025-06-11 11:01:21,200 - DEBUG - 处理块 359/753: 受KG丰富的知识启发, 很多研究工作在KG的指导下扩展了DS模型. Weston等人[140]提出将...
|
||
2025-06-11 11:01:21,510 - DEBUG - 块 359 生成文本: <triplet> 远程监督 <concept> RE模型 <misc> TransE <media> replaces</s>
|
||
2025-06-11 11:01:21,511 - DEBUG - 原始生成文本: <triplet> 远程监督 <concept> RE模型 <misc> TransE <media> replaces</s>
|
||
2025-06-11 11:01:21,511 - DEBUG - 处理后标记: ['<triplet>', '远程监督', '<concept>', 'RE模型', '<misc>', 'TransE', '<media>', 'replaces']
|
||
2025-06-11 11:01:21,511 - DEBUG - 添加三元组: 远程监督(concept) - TransE - RE模型(misc)
|
||
2025-06-11 11:01:21,511 - DEBUG - 块 359 提取到 1 个三元组
|
||
2025-06-11 11:01:21,511 - DEBUG - 处理块 360/753: 和RE的联合表示学习框架, 文献[37]证实了现有的KRL模型可以有效增强远程监督的RE模型. 最近...
|
||
2025-06-11 11:01:21,862 - DEBUG - 块 360 生成文本: <triplet> <media> 知识图谱补全 <concept> use</s>
|
||
2025-06-11 11:01:21,862 - DEBUG - 原始生成文本: <triplet> <media> 知识图谱补全 <concept> use</s>
|
||
2025-06-11 11:01:21,862 - DEBUG - 处理后标记: ['<triplet>', '<media>', '知识图谱补全', '<concept>', 'use']
|
||
2025-06-11 11:01:21,862 - DEBUG - 处理块 361/753: 取关系(relation extraction, RE)两个任务, 该框架适用于非严格对齐的数据. ...
|
||
2025-06-11 11:01:22,160 - DEBUG - 块 361 生成文本: <triplet> 神经关系提取框架 <concept> 远程监督关系 <media> Lei等人 <per> author</s>
|
||
2025-06-11 11:01:22,161 - DEBUG - 原始生成文本: <triplet> 神经关系提取框架 <concept> 远程监督关系 <media> Lei等人 <per> author</s>
|
||
2025-06-11 11:01:22,161 - DEBUG - 处理后标记: ['<triplet>', '神经关系提取框架', '<concept>', '远程监督关系', '<media>', 'Lei等人', '<per>', 'author']
|
||
2025-06-11 11:01:22,161 - DEBUG - 添加三元组: 神经关系提取框架(concept) - Lei等人 - 远程监督关系(media)
|
||
2025-06-11 11:01:22,161 - DEBUG - 块 361 提取到 1 个三元组
|
||
2025-06-11 11:01:22,161 - DEBUG - 处理块 362/753: 这些工作忽略了关系之间的丰富关联. Zhang等人[144]提出KG中的关系符合三层层次关系结构(h...
|
||
2025-06-11 11:01:22,299 - DEBUG - 块 362 生成文本: <triplet> <concept> KGE模型 <media> part of</s>
|
||
2025-06-11 11:01:22,299 - DEBUG - 原始生成文本: <triplet> <concept> KGE模型 <media> part of</s>
|
||
2025-06-11 11:01:22,299 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KGE模型', '<media>', 'part of']
|
||
2025-06-11 11:01:22,299 - DEBUG - 处理块 363/753: 示. Zhang等人在FB15k[15]、FB15k237[145]、FB13[77]、WN18[1...
|
||
2025-06-11 11:01:22,607 - DEBUG - 块 363 生成文本: <triplet> 扩展模型 <concept> TransE <misc> based on</s>
|
||
2025-06-11 11:01:22,607 - DEBUG - 原始生成文本: <triplet> 扩展模型 <concept> TransE <misc> based on</s>
|
||
2025-06-11 11:01:22,607 - DEBUG - 处理后标记: ['<triplet>', '扩展模型', '<concept>', 'TransE', '<misc>', 'based on']
|
||
2025-06-11 11:01:22,607 - DEBUG - 添加三元组: 扩展模型(concept) - based on - TransE(misc)
|
||
2025-06-11 11:01:22,607 - DEBUG - 块 363 提取到 1 个三元组
|
||
2025-06-11 11:01:22,607 - DEBUG - 处理块 364/753: HRS、TransH-HRS、DistMult-HRS)始终获得最佳性能, 验证了模型的有效性, 同...
|
||
2025-06-11 11:01:22,756 - DEBUG - 块 364 生成文本: <triplet> <concept> KG补全 <media> use <misc> use</s>
|
||
2025-06-11 11:01:22,756 - DEBUG - 原始生成文本: <triplet> <concept> KG补全 <media> use <misc> use</s>
|
||
2025-06-11 11:01:22,756 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KG补全', '<media>', 'use', '<misc>', 'use']
|
||
2025-06-11 11:01:22,756 - DEBUG - 处理块 365/753: 技术编码到其他任务中, 例如对话系统[146,147]、实体消歧[148,149]、实体分类[150...
|
||
2025-06-11 11:01:22,894 - DEBUG - 块 365 生成文本: <triplet> 对话系统 <media> 任务 <concept> instance of</s>
|
||
2025-06-11 11:01:22,894 - DEBUG - 原始生成文本: <triplet> 对话系统 <media> 任务 <concept> instance of</s>
|
||
2025-06-11 11:01:22,894 - DEBUG - 处理后标记: ['<triplet>', '对话系统', '<media>', '任务', '<concept>', 'instance of']
|
||
2025-06-11 11:01:22,894 - DEBUG - 添加三元组: 对话系统(media) - instance of - 任务(concept)
|
||
2025-06-11 11:01:22,894 - DEBUG - 块 365 提取到 1 个三元组
|
||
2025-06-11 11:01:22,894 - DEBUG - 处理块 366/753: 目前, KGE作为处理大型知识图谱的一种方便有效的工具, 被广泛探索并应用于多种知识驱动型任务, 极...
|
||
2025-06-11 11:01:23,363 - DEBUG - 块 366 生成文本: <triplet> 张天成 <per> 知识图谱 <concept> field of work</s>
|
||
2025-06-11 11:01:23,363 - DEBUG - 原始生成文本: <triplet> 张天成 <per> 知识图谱 <concept> field of work</s>
|
||
2025-06-11 11:01:23,363 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<per>', '知识图谱', '<concept>', 'field of work']
|
||
2025-06-11 11:01:23,363 - DEBUG - 添加三元组: 张天成(per) - field of work - 知识图谱(concept)
|
||
2025-06-11 11:01:23,363 - DEBUG - 块 366 提取到 1 个三元组
|
||
2025-06-11 11:01:23,363 - DEBUG - 处理块 367/753: 6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特...
|
||
2025-06-11 11:01:23,512 - DEBUG - 块 367 生成文本: <triplet> 面临的挑战 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:01:23,512 - DEBUG - 原始生成文本: <triplet> 面临的挑战 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:01:23,512 - DEBUG - 处理后标记: ['<triplet>', '面临的挑战', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:01:23,512 - DEBUG - 添加三元组: 面临的挑战(concept) - part of - KG(misc)
|
||
2025-06-11 11:01:23,512 - DEBUG - 块 367 提取到 1 个三元组
|
||
2025-06-11 11:01:23,512 - DEBUG - 处理块 368/753: ● 知识类型: 不同的KGE方法在处理1-1, 1-N, N-1和N-N关系时具有不同的性能, 这表...
|
||
2025-06-11 11:01:23,671 - DEBUG - 块 368 生成文本: <triplet> 知识类型 <concept> KGE <misc> part of</s>
|
||
2025-06-11 11:01:23,671 - DEBUG - 原始生成文本: <triplet> 知识类型 <concept> KGE <misc> part of</s>
|
||
2025-06-11 11:01:23,671 - DEBUG - 处理后标记: ['<triplet>', '知识类型', '<concept>', 'KGE', '<misc>', 'part of']
|
||
2025-06-11 11:01:23,672 - DEBUG - 添加三元组: 知识类型(concept) - part of - KGE(misc)
|
||
2025-06-11 11:01:23,672 - DEBUG - 块 368 提取到 1 个三元组
|
||
2025-06-11 11:01:23,672 - DEBUG - 处理块 369/753: 不能有效地描述知识的特征. 根据知识的认知和计算特性, 现有知识可分为以下几种类型: (1)表示实体...
|
||
2025-06-11 11:01:24,215 - DEBUG - 块 369 生成文本: <triplet> 现有知识 <concept> 知识的特征 <misc> <media> 类 型的关系 <unk> <org> <per> 类型 <loc> instance of <triplet> from <time> <date> point in <eve> 分类 <dis> subclass of</s>
|
||
2025-06-11 11:01:24,216 - DEBUG - 原始生成文本: <triplet> 现有知识 <concept> 知识的特征 <misc> <media> 类 型的关系 <unk> <org> <per> 类型 <loc> instance of <triplet> from <time> <date> point in <eve> 分类 <dis> subclass of</s>
|
||
2025-06-11 11:01:24,216 - DEBUG - 处理后标记: ['<triplet>', '现有知识', '<concept>', '知识的特征', '<misc>', '<media>', '类 型的关系', '<unk>', '<org>', '<per>', '类型', '<loc>', 'instance of', '<triplet>', 'from', '<time>', '<date>', 'point in', '<eve>', '分类', '<dis>', 'subclass of']
|
||
2025-06-11 11:01:24,216 - DEBUG - 添加三元组: 现有知识(concept) - <media> - 知识的特征(misc)
|
||
2025-06-11 11:01:24,216 - DEBUG - 块 369 提取到 1 个三元组
|
||
2025-06-11 11:01:24,216 - DEBUG - 处理块 370/753: ● 多语言嵌入: 文献[40]观察到不同语言的向量空间之间对应概念的几何排列具有很强的相似性, 并提...
|
||
2025-06-11 11:01:24,460 - DEBUG - 块 370 生成文本: <triplet> 多语言KG <misc> <concept> subclass of</s>
|
||
2025-06-11 11:01:24,460 - DEBUG - 原始生成文本: <triplet> 多语言KG <misc> <concept> subclass of</s>
|
||
2025-06-11 11:01:24,460 - DEBUG - 处理后标记: ['<triplet>', '多语言KG', '<misc>', '<concept>', 'subclass of']
|
||
2025-06-11 11:01:24,460 - DEBUG - 处理块 371/753: 索, 机器翻译, 问答等领域发挥着重要作用. 然而, 现有的关于多语言KG嵌入的研究很少, 因此多语...
|
||
2025-06-11 11:01:24,897 - DEBUG - 块 371 生成文本: <triplet> 索 <concept> 多源信息学习 <media> 网络技术 <org> الإنترنت <misc> インターネット <loc> part of</s>
|
||
2025-06-11 11:01:24,897 - DEBUG - 原始生成文本: <triplet> 索 <concept> 多源信息学习 <media> 网络技术 <org> الإنترنت <misc> インターネット <loc> part of</s>
|
||
2025-06-11 11:01:24,897 - DEBUG - 处理后标记: ['<triplet>', '索', '<concept>', '多源信息学习', '<media>', '网络技术', '<org>', 'الإنترنت', '<misc>', 'インターネット', '<loc>', 'part of']
|
||
2025-06-11 11:01:24,897 - DEBUG - 添加三元组: 索(concept) - 网络技术 - 多源信息学习(media)
|
||
2025-06-11 11:01:24,897 - DEBUG - 块 371 提取到 1 个三元组
|
||
2025-06-11 11:01:24,897 - DEBUG - 处理块 372/753: 信息也越来越多地出现在网络上. 因此, 如何高效地利用从文本到视频的多源信息已成为KGE中的一个关键...
|
||
2025-06-11 11:01:25,057 - DEBUG - 块 372 生成文本: <triplet> 多源信息 <concept> KGE <media> part of</s>
|
||
2025-06-11 11:01:25,057 - DEBUG - 原始生成文本: <triplet> 多源信息 <concept> KGE <media> part of</s>
|
||
2025-06-11 11:01:25,057 - DEBUG - 处理后标记: ['<triplet>', '多源信息', '<concept>', 'KGE', '<media>', 'part of']
|
||
2025-06-11 11:01:25,057 - DEBUG - 添加三元组: 多源信息(concept) - part of - KGE(media)
|
||
2025-06-11 11:01:25,057 - DEBUG - 块 372 提取到 1 个三元组
|
||
2025-06-11 11:01:25,057 - DEBUG - 处理块 373/753: ● One-shot/Zero-shot学习: 近年来, One-shot/Zero-shot学习在...
|
||
2025-06-11 11:01:25,195 - DEBUG - 块 373 生成文本: <triplet> 类 <concept> 知识图 <misc> part of</s>
|
||
2025-06-11 11:01:25,195 - DEBUG - 原始生成文本: <triplet> 类 <concept> 知识图 <misc> part of</s>
|
||
2025-06-11 11:01:25,195 - DEBUG - 处理后标记: ['<triplet>', '类', '<concept>', '知识图', '<misc>', 'part of']
|
||
2025-06-11 11:01:25,195 - DEBUG - 添加三元组: 类(concept) - part of - 知识图(misc)
|
||
2025-06-11 11:01:25,195 - DEBUG - 块 373 提取到 1 个三元组
|
||
2025-06-11 11:01:25,195 - DEBUG - 处理块 374/753: 谱表示中, 一个实际的问题是低频实体和关系的学习比高频实体和关系的学习更差. 然而, 借助实体和关系...
|
||
2025-06-11 11:01:25,706 - DEBUG - 块 374 生成文本: <triplet> 谱表示 <concept> 多语 言和多模态 <misc> 实体和关系的 <media> <org> 低频 <dis> part of</s>
|
||
2025-06-11 11:01:25,707 - DEBUG - 原始生成文本: <triplet> 谱表示 <concept> 多语 言和多模态 <misc> 实体和关系的 <media> <org> 低频 <dis> part of</s>
|
||
2025-06-11 11:01:25,707 - DEBUG - 处理后标记: ['<triplet>', '谱表示', '<concept>', '多语 言和多模态', '<misc>', '实体和关系的', '<media>', '<org>', '低频', '<dis>', 'part of']
|
||
2025-06-11 11:01:25,707 - DEBUG - 添加三元组: 谱表示(concept) - 实体和关系的 - 多语 言和多模态(misc)
|
||
2025-06-11 11:01:25,707 - DEBUG - 块 374 提取到 1 个三元组
|
||
2025-06-11 11:01:25,707 - DEBUG - 处理块 375/753: KG在各种应用中发挥着重要的作用, 例如Web搜索, 知识推理和问答. 但是, 由于现实世界中知识应...
|
||
2025-06-11 11:01:26,050 - DEBUG - 块 375 生成文本: <triplet> 知识推理 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:01:26,050 - DEBUG - 原始生成文本: <triplet> 知识推理 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:01:26,050 - DEBUG - 处理后标记: ['<triplet>', '知识推理', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:01:26,050 - DEBUG - 添加三元组: 知识推理(concept) - part of - KG(misc)
|
||
2025-06-11 11:01:26,050 - DEBUG - 块 375 提取到 1 个三元组
|
||
2025-06-11 11:01:26,050 - DEBUG - 处理块 376/753: ● KG质量低: 知识应用的主要挑战之一是大型KG本身的质量问题. Freebase, DBpedi...
|
||
2025-06-11 11:01:26,285 - DEBUG - 块 376 生成文本: <triplet> 典 <concept> KG <org> subclass of</s>
|
||
2025-06-11 11:01:26,286 - DEBUG - 原始生成文本: <triplet> 典 <concept> KG <org> subclass of</s>
|
||
2025-06-11 11:01:26,286 - DEBUG - 处理后标记: ['<triplet>', '典', '<concept>', 'KG', '<org>', 'subclass of']
|
||
2025-06-11 11:01:26,286 - DEBUG - 添加三元组: 典(concept) - subclass of - KG(org)
|
||
2025-06-11 11:01:26,286 - DEBUG - 块 376 提取到 1 个三元组
|
||
2025-06-11 11:01:26,286 - DEBUG - 处理块 377/753: 噪音和矛盾的问题. 当涉及到实际应用时, 这些噪音和矛盾将导致错误传播. 因此, 如何自动检测现有K...
|
||
2025-06-11 11:01:26,477 - DEBUG - 块 377 生成文本: <triplet> 噪音和矛盾的问题 <concept> KG <misc> facet of</s>
|
||
2025-06-11 11:01:26,477 - DEBUG - 原始生成文本: <triplet> 噪音和矛盾的问题 <concept> KG <misc> facet of</s>
|
||
2025-06-11 11:01:26,478 - DEBUG - 处理后标记: ['<triplet>', '噪音和矛盾的问题', '<concept>', 'KG', '<misc>', 'facet of']
|
||
2025-06-11 11:01:26,478 - DEBUG - 添加三元组: 噪音和矛盾的问题(concept) - facet of - KG(misc)
|
||
2025-06-11 11:01:26,478 - DEBUG - 块 377 提取到 1 个三元组
|
||
2025-06-11 11:01:26,478 - DEBUG - 处理块 378/753: 些方法由于计算复杂度的问题也并不实用. 因此, 有必要在现有的方法上进行改进.
|
||
● KG不断变化: ...
|
||
2025-06-11 11:01:26,828 - DEBUG - 块 378 生成文本: <triplet> 优化目标 <concept> KG <media> part of the series</s>
|
||
2025-06-11 11:01:26,829 - DEBUG - 原始生成文本: <triplet> 优化目标 <concept> KG <media> part of the series</s>
|
||
2025-06-11 11:01:26,829 - DEBUG - 处理后标记: ['<triplet>', '优化目标', '<concept>', 'KG', '<media>', 'part of the series']
|
||
2025-06-11 11:01:26,829 - DEBUG - 添加三元组: 优化目标(concept) - part of the series - KG(media)
|
||
2025-06-11 11:01:26,829 - DEBUG - 块 378 提取到 1 个三元组
|
||
2025-06-11 11:01:26,829 - DEBUG - 处理块 379/753: 又不实用. 因此, 设计一种可以进行在线学习并逐步更新模型参数的KGE框架对KG的应用至关重要.
|
||
...
|
||
2025-06-11 11:01:27,180 - DEBUG - 块 379 生成文本: <triplet> 未来方向 <concept> 统一框架 <misc> instance of</s>
|
||
2025-06-11 11:01:27,180 - DEBUG - 原始生成文本: <triplet> 未来方向 <concept> 统一框架 <misc> instance of</s>
|
||
2025-06-11 11:01:27,180 - DEBUG - 处理后标记: ['<triplet>', '未来方向', '<concept>', '统一框架', '<misc>', 'instance of']
|
||
2025-06-11 11:01:27,181 - DEBUG - 添加三元组: 未来方向(concept) - instance of - 统一框架(misc)
|
||
2025-06-11 11:01:27,181 - DEBUG - 块 379 提取到 1 个三元组
|
||
2025-06-11 11:01:27,181 - DEBUG - 处理块 380/753: 有某些约束的链接预测. ANALOGY[68]提供了包括DistMult, ComplEx和HolE...
|
||
2025-06-11 11:01:27,372 - DEBUG - 块 380 生成文本: <triplet> 加法 <concept> KGE模型 <misc> part of</s>
|
||
2025-06-11 11:01:27,373 - DEBUG - 原始生成文本: <triplet> 加法 <concept> KGE模型 <misc> part of</s>
|
||
2025-06-11 11:01:27,373 - DEBUG - 处理后标记: ['<triplet>', '加法', '<concept>', 'KGE模型', '<misc>', 'part of']
|
||
2025-06-11 11:01:27,373 - DEBUG - 添加三元组: 加法(concept) - part of - KGE模型(misc)
|
||
2025-06-11 11:01:27,373 - DEBUG - 块 380 提取到 1 个三元组
|
||
2025-06-11 11:01:27,373 - DEBUG - 处理块 381/753: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关...
|
||
2025-06-11 11:01:27,575 - DEBUG - 块 381 生成文本: <triplet> 软件学报 2023年第 34卷 <unk> 2023年 <date> publication date</s>
|
||
2025-06-11 11:01:27,575 - DEBUG - 原始生成文本: <triplet> 软件学报 2023年第 34卷 <unk> 2023年 <date> publication date</s>
|
||
2025-06-11 11:01:27,575 - DEBUG - 处理后标记: ['<triplet>', '软件学报 2023年第 34卷', '<unk>', '2023年', '<date>', 'publication date']
|
||
2025-06-11 11:01:27,575 - DEBUG - 添加三元组: 软件学报 2023年第 34卷(unk) - publication date - 2023年(date)
|
||
2025-06-11 11:01:27,575 - DEBUG - 块 381 提取到 1 个三元组
|
||
2025-06-11 11:01:27,575 - DEBUG - 处理块 382/753: 知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITra...
|
||
2025-06-11 11:01:28,065 - DEBUG - 块 382 生成文本: <triplet> 知识迁移 <concept> 注意力可视化 <media> ITransF[51] <org> 稀疏向量 <misc> 结构化对链 <unk> 路径搜索生成 <eve> subclass of</s>
|
||
2025-06-11 11:01:28,065 - DEBUG - 原始生成文本: <triplet> 知识迁移 <concept> 注意力可视化 <media> ITransF[51] <org> 稀疏向量 <misc> 结构化对链 <unk> 路径搜索生成 <eve> subclass of</s>
|
||
2025-06-11 11:01:28,065 - DEBUG - 处理后标记: ['<triplet>', '知识迁移', '<concept>', '注意力可视化', '<media>', 'ITransF[51]', '<org>', '稀疏向量', '<misc>', '结构化对链', '<unk>', '路径搜索生成', '<eve>', 'subclass of']
|
||
2025-06-11 11:01:28,065 - DEBUG - 添加三元组: 知识迁移(concept) - ITransF[51] - 注意力可视化(media)
|
||
2025-06-11 11:01:28,065 - DEBUG - 块 382 提取到 1 个三元组
|
||
2025-06-11 11:01:28,065 - DEBUG - 处理块 383/753: 接预测的解释, 探索了知识图谱的解释方案. 然而, 这些神经模型在透明度和可解释性方面受到了限制, ...
|
||
2025-06-11 11:01:28,470 - DEBUG - 块 383 生成文本: <triplet> 黑盒神经模型 <concept> 可解释性 <misc> .6 <org> described <media> described</s>
|
||
2025-06-11 11:01:28,470 - DEBUG - 原始生成文本: <triplet> 黑盒神经模型 <concept> 可解释性 <misc> .6 <org> described <media> described</s>
|
||
2025-06-11 11:01:28,470 - DEBUG - 处理后标记: ['<triplet>', '黑盒神经模型', '<concept>', '可解释性', '<misc>', '.6', '<org>', 'described', '<media>', 'described']
|
||
2025-06-11 11:01:28,470 - DEBUG - 添加三元组: 黑盒神经模型(concept) - .6 - 可解释性(misc)
|
||
2025-06-11 11:01:28,470 - DEBUG - 块 383 提取到 1 个三元组
|
||
2025-06-11 11:01:28,470 - DEBUG - 处理块 384/753: 在大规模知识图谱中, 可扩展性非常重要. 几种嵌入方法利用简化来降低计算代价, 例如, 通过循环相关...
|
||
2025-06-11 11:01:28,960 - DEBUG - 块 384 生成文本: <triplet> 可扩展性 <concept> 大规模知识图谱中 <media> 神经逻辑模型 <misc> 规则 <unk> <eve> 逻辑 <org> <per> studies</s>
|
||
2025-06-11 11:01:28,960 - DEBUG - 原始生成文本: <triplet> 可扩展性 <concept> 大规模知识图谱中 <media> 神经逻辑模型 <misc> 规则 <unk> <eve> 逻辑 <org> <per> studies</s>
|
||
2025-06-11 11:01:28,960 - DEBUG - 处理后标记: ['<triplet>', '可扩展性', '<concept>', '大规模知识图谱中', '<media>', '神经逻辑模型', '<misc>', '规则', '<unk>', '<eve>', '逻辑', '<org>', '<per>', 'studies']
|
||
2025-06-11 11:01:28,960 - DEBUG - 添加三元组: 可扩展性(concept) - 神经逻辑模型 - 大规模知识图谱中(media)
|
||
2025-06-11 11:01:28,960 - DEBUG - 块 384 提取到 1 个三元组
|
||
2025-06-11 11:01:28,960 - DEBUG - 处理块 385/753: 是由简单的蛮力搜索产生的, 这使得它们在大规模知识图上表现不足. ExpressGNN[162]试图...
|
||
2025-06-11 11:01:29,322 - DEBUG - 块 385 生成文本: <triplet> 蛮力搜索 <concept> <media> <eve> 大规模知识图 <misc> <org> <per> <unk> <date> point in time period</s>
|
||
2025-06-11 11:01:29,322 - DEBUG - 原始生成文本: <triplet> 蛮力搜索 <concept> <media> <eve> 大规模知识图 <misc> <org> <per> <unk> <date> point in time period</s>
|
||
2025-06-11 11:01:29,322 - DEBUG - 处理后标记: ['<triplet>', '蛮力搜索', '<concept>', '<media>', '<eve>', '大规模知识图', '<misc>', '<org>', '<per>', '<unk>', '<date>', 'point in time period']
|
||
2025-06-11 11:01:29,323 - DEBUG - 添加三元组: 蛮力搜索(concept) - 大规模知识图 - <media>(eve)
|
||
2025-06-11 11:01:29,323 - DEBUG - 块 385 提取到 1 个三元组
|
||
2025-06-11 11:01:29,323 - DEBUG - 处理块 386/753: 当前的KG高度依赖于人工构建, 这是劳动密集且昂贵的. 知识图谱在不同认知智能领域的广泛应用需要从
|
||
...
|
||
2025-06-11 11:01:29,641 - DEBUG - 块 386 生成文本: <triplet> 认知智能 <concept> 知识图谱 <media> aggregator</s>
|
||
2025-06-11 11:01:29,641 - DEBUG - 原始生成文本: <triplet> 认知智能 <concept> 知识图谱 <media> aggregator</s>
|
||
2025-06-11 11:01:29,641 - DEBUG - 处理后标记: ['<triplet>', '认知智能', '<concept>', '知识图谱', '<media>', 'aggregator']
|
||
2025-06-11 11:01:29,641 - DEBUG - 添加三元组: 认知智能(concept) - aggregator - 知识图谱(media)
|
||
2025-06-11 11:01:29,642 - DEBUG - 块 386 提取到 1 个三元组
|
||
2025-06-11 11:01:29,642 - DEBUG - 处理块 387/753: 知识图谱作为一种语义网络拥有极强的表达能力和建模灵活性, 可以对现实世界中的实体、概念、属性以及
|
||
它...
|
||
2025-06-11 11:01:29,897 - DEBUG - 块 387 生成文本: <triplet> 知识图谱 <concept> 语义网络 <misc> instance of</s>
|
||
2025-06-11 11:01:29,897 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 语义网络 <misc> instance of</s>
|
||
2025-06-11 11:01:29,897 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '语义网络', '<misc>', 'instance of']
|
||
2025-06-11 11:01:29,897 - DEBUG - 添加三元组: 知识图谱(concept) - instance of - 语义网络(misc)
|
||
2025-06-11 11:01:29,897 - DEBUG - 块 387 提取到 1 个三元组
|
||
2025-06-11 11:01:29,897 - DEBUG - 处理块 388/753: 越来越多的研究关注. 知识图谱嵌入旨在将实体和关系嵌入到连续向量空间中, 在各种面向实体的任务中得到...
|
||
2025-06-11 11:01:30,366 - DEBUG - 块 388 生成文本: <triplet> 知识图谱嵌入技术 <concept> 连续向量空间 <misc> 实体和关系 <org> <media> 面向实体的任务 <eve> 结构</s>
|
||
2025-06-11 11:01:30,366 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术 <concept> 连续向量空间 <misc> 实体和关系 <org> <media> 面向实体的任务 <eve> 结构</s>
|
||
2025-06-11 11:01:30,366 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术', '<concept>', '连续向量空间', '<misc>', '实体和关系', '<org>', '<media>', '面向实体的任务', '<eve>', '结构']
|
||
2025-06-11 11:01:30,366 - DEBUG - 添加三元组: 知识图谱嵌入技术(concept) - 实体和关系 - 连续向量空间(misc)
|
||
2025-06-11 11:01:30,366 - DEBUG - 块 388 提取到 1 个三元组
|
||
2025-06-11 11:01:30,366 - DEBUG - 处理块 389/753: 度的动态 KGE方法以及融合多源信息的 KGE技术介绍了现有的知识图谱嵌入技术. 并简要讨论了KGE...
|
||
2025-06-11 11:01:30,558 - DEBUG - 块 389 生成文本: <triplet> 知识图谱嵌入 <concept> KGE <misc> studies</s>
|
||
2025-06-11 11:01:30,558 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <concept> KGE <misc> studies</s>
|
||
2025-06-11 11:01:30,558 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<concept>', 'KGE', '<misc>', 'studies']
|
||
2025-06-11 11:01:30,558 - DEBUG - 添加三元组: 知识图谱嵌入(concept) - studies - KGE(misc)
|
||
2025-06-11 11:01:30,558 - DEBUG - 块 389 提取到 1 个三元组
|
||
2025-06-11 11:01:30,558 - DEBUG - 处理块 390/753: 调查的目的是对当前KGE的代表性研究工作进行总结, 并且希望这一探索可以为KGE的未来研究提供帮助....
|
||
2025-06-11 11:01:30,697 - DEBUG - 块 390 生成文本: <triplet> 调查 <concept> KGE <org> facet of</s>
|
||
2025-06-11 11:01:30,698 - DEBUG - 原始生成文本: <triplet> 调查 <concept> KGE <org> facet of</s>
|
||
2025-06-11 11:01:30,698 - DEBUG - 处理后标记: ['<triplet>', '调查', '<concept>', 'KGE', '<org>', 'facet of']
|
||
2025-06-11 11:01:30,698 - DEBUG - 添加三元组: 调查(concept) - facet of - KGE(org)
|
||
2025-06-11 11:01:30,698 - DEBUG - 块 390 提取到 1 个三元组
|
||
2025-06-11 11:01:30,698 - DEBUG - 处理块 391/753: Bollacker KD, Evans C, Paritosh P, Sturge T, Taylo...
|
||
2025-06-11 11:01:31,349 - DEBUG - 块 391 生成文本: <triplet> graph database <concept> Bollacker KD <media> based on</s>
|
||
2025-06-11 11:01:31,350 - DEBUG - 原始生成文本: <triplet> graph database <concept> Bollacker KD <media> based on</s>
|
||
2025-06-11 11:01:31,350 - DEBUG - 处理后标记: ['<triplet>', 'graph database', '<concept>', 'Bollacker KD', '<media>', 'based on']
|
||
2025-06-11 11:01:31,350 - DEBUG - 添加三元组: graph database(concept) - based on - Bollacker KD(media)
|
||
2025-06-11 11:01:31,350 - DEBUG - 块 391 提取到 1 个三元组
|
||
2025-06-11 11:01:31,350 - DEBUG - 处理块 392/753: knowledge. In: Proc. of the 2008 ACM SIGMOD Int’l ...
|
||
2025-06-11 11:01:31,498 - DEBUG - 块 392 生成文本: <triplet> <media> Association for Computing <org> publisher</s>
|
||
2025-06-11 11:01:31,499 - DEBUG - 原始生成文本: <triplet> <media> Association for Computing <org> publisher</s>
|
||
2025-06-11 11:01:31,499 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computing', '<org>', 'publisher']
|
||
2025-06-11 11:01:31,499 - DEBUG - 处理块 393/753: Machinery, 2008. 1247–1250. [doi: 10.1145/1376616....
|
||
2025-06-11 11:01:31,743 - DEBUG - 块 393 生成文本: <triplet> <concept> 1247 <date> date of birth</s>
|
||
2025-06-11 11:01:31,743 - DEBUG - 原始生成文本: <triplet> <concept> 1247 <date> date of birth</s>
|
||
2025-06-11 11:01:31,743 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1247', '<date>', 'date of birth']
|
||
2025-06-11 11:01:31,743 - DEBUG - 处理块 394/753: Auer S, Bizer C, Kobilarov G, Lehmann J, Cyganiak ...
|
||
2025-06-11 11:01:31,891 - DEBUG - 块 394 生成文本: <triplet> <concept> 6th Int’l <misc> part of</s>
|
||
2025-06-11 11:01:31,891 - DEBUG - 原始生成文本: <triplet> <concept> 6th Int’l <misc> part of</s>
|
||
2025-06-11 11:01:31,891 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '6th Int’l', '<misc>', 'part of']
|
||
2025-06-11 11:01:31,891 - DEBUG - 处理块 395/753: Semantic Web Conf. and the 2nd Asian Semantic Web ...
|
||
2025-06-11 11:01:32,008 - DEBUG - 块 395 生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:01:32,009 - DEBUG - 原始生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:01:32,009 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:01:32,009 - DEBUG - 处理块 396/753: Suchanek FM, Kasneci G, Weikum G. Yago: A core of ...
|
||
2025-06-11 11:01:32,178 - DEBUG - 块 396 生成文本: <triplet> <loc> World Wide Web <concept> part of</s>
|
||
2025-06-11 11:01:32,178 - DEBUG - 原始生成文本: <triplet> <loc> World Wide Web <concept> part of</s>
|
||
2025-06-11 11:01:32,178 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'World Wide Web', '<concept>', 'part of']
|
||
2025-06-11 11:01:32,178 - DEBUG - 处理块 397/753: Banff: Association for Computing Machinery, 2007. ...
|
||
2025-06-11 11:01:32,369 - DEBUG - 块 397 生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:32,369 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:32,369 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'member of']
|
||
2025-06-11 11:01:32,369 - DEBUG - 处理块 398/753: Carlson A, Betteridge J, Kisiel B, Settles B, Hrus...
|
||
2025-06-11 11:01:32,902 - DEBUG - 块 398 生成文本: <triplet> architecture for never-ending language learning <concept> Carlson A, Betteridge J, Kisiel B, Settles B <per> participant</s>
|
||
2025-06-11 11:01:32,902 - DEBUG - 原始生成文本: <triplet> architecture for never-ending language learning <concept> Carlson A, Betteridge J, Kisiel B, Settles B <per> participant</s>
|
||
2025-06-11 11:01:32,903 - DEBUG - 处理后标记: ['<triplet>', 'architecture for never-ending language learning', '<concept>', 'Carlson A, Betteridge J, Kisiel B, Settles B', '<per>', 'participant']
|
||
2025-06-11 11:01:32,903 - DEBUG - 添加三元组: architecture for never-ending language learning(concept) - participant - Carlson A, Betteridge J, Kisiel B, Settles B(per)
|
||
2025-06-11 11:01:32,903 - DEBUG - 块 398 提取到 1 个三元组
|
||
2025-06-11 11:01:32,903 - DEBUG - 处理块 399/753: Proc. of the 24th AAAI Conf. on Artificial Intelli...
|
||
2025-06-11 11:01:33,254 - DEBUG - 块 399 生成文本: <triplet> <media> AAAI <org> part of <triplet> AAAi <loc> AAAIA Press <concept> instance of</s>
|
||
2025-06-11 11:01:33,254 - DEBUG - 原始生成文本: <triplet> <media> AAAI <org> part of <triplet> AAAi <loc> AAAIA Press <concept> instance of</s>
|
||
2025-06-11 11:01:33,254 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'AAAI', '<org>', 'part of', '<triplet>', 'AAAi', '<loc>', 'AAAIA Press', '<concept>', 'instance of']
|
||
2025-06-11 11:01:33,254 - DEBUG - 处理块 400/753: Vrandečić D, Krötzsch M. Wikidata: A free collabor...
|
||
2025-06-11 11:01:33,552 - DEBUG - 块 400 生成文本: <triplet> <loc> knowledgebase <concept> subclass of</s>
|
||
2025-06-11 11:01:33,552 - DEBUG - 原始生成文本: <triplet> <loc> knowledgebase <concept> subclass of</s>
|
||
2025-06-11 11:01:33,552 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'knowledgebase', '<concept>', 'subclass of']
|
||
2025-06-11 11:01:33,552 - DEBUG - 处理块 401/753: Berant J, Chou A, Frostig R, Liang P. Semantic par...
|
||
2025-06-11 11:01:33,904 - DEBUG - 块 401 生成文本: <triplet> <concept> Semantic parsing on freebase from question-answer pairs <media> part of the 2013 Conf. <eve> 2013 <date> publication date</s>
|
||
2025-06-11 11:01:33,904 - DEBUG - 原始生成文本: <triplet> <concept> Semantic parsing on freebase from question-answer pairs <media> part of the 2013 Conf. <eve> 2013 <date> publication date</s>
|
||
2025-06-11 11:01:33,904 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic parsing on freebase from question-answer pairs', '<media>', 'part of the 2013 Conf.', '<eve>', '2013', '<date>', 'publication date']
|
||
2025-06-11 11:01:33,904 - DEBUG - 处理块 402/753: Empirical Methods in Natural Language Processing (...
|
||
2025-06-11 11:01:34,193 - DEBUG - 块 402 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:34,194 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:34,194 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:34,194 - DEBUG - 处理块 403/753: Heck LP, Hakkani-Tür D, Tür G. Leveraging knowledg...
|
||
2025-06-11 11:01:34,493 - DEBUG - 块 403 生成文本: <triplet> graphs <concept> Heck LP <per> discoverer or inventor</s>
|
||
2025-06-11 11:01:34,494 - DEBUG - 原始生成文本: <triplet> graphs <concept> Heck LP <per> discoverer or inventor</s>
|
||
2025-06-11 11:01:34,494 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Heck LP', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:01:34,494 - DEBUG - 添加三元组: graphs(concept) - discoverer or inventor - Heck LP(per)
|
||
2025-06-11 11:01:34,494 - DEBUG - 块 403 提取到 1 个三元组
|
||
2025-06-11 11:01:34,494 - DEBUG - 处理块 404/753: Annual Conf. of the Int ’l Speech Communicat...
|
||
2025-06-11 11:01:34,803 - DEBUG - 块 404 生成文本: <triplet> ’l Speech Communication Association <org> Lyon <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:01:34,803 - DEBUG - 原始生成文本: <triplet> ’l Speech Communication Association <org> Lyon <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:01:34,803 - DEBUG - 处理后标记: ['<triplet>', '’l Speech Communication Association', '<org>', 'Lyon', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:01:34,803 - DEBUG - 添加三元组: ’l Speech Communication Association(org) - located in the administrative territorial entity - Lyon(loc)
|
||
2025-06-11 11:01:34,804 - DEBUG - 块 404 提取到 1 个三元组
|
||
2025-06-11 11:01:34,804 - DEBUG - 处理块 405/753: 张天成 等: 知识图谱嵌入技术研究综述 303
|
||
...
|
||
2025-06-11 11:01:35,101 - DEBUG - 块 405 生成文本: <triplet> 知识图谱嵌入技术研究综述 <concept> 张天成 <per> author</s>
|
||
2025-06-11 11:01:35,101 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术研究综述 <concept> 张天成 <per> author</s>
|
||
2025-06-11 11:01:35,101 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术研究综述', '<concept>', '张天成', '<per>', 'author']
|
||
2025-06-11 11:01:35,101 - DEBUG - 添加三元组: 知识图谱嵌入技术研究综述(concept) - author - 张天成(per)
|
||
2025-06-11 11:01:35,101 - DEBUG - 块 405 提取到 1 个三元组
|
||
2025-06-11 11:01:35,101 - DEBUG - 处理块 406/753: Damljanovic D, Bontcheva K. Named entity disambigu...
|
||
2025-06-11 11:01:35,229 - DEBUG - 块 406 生成文本: <triplet> <concept> Semantic Web <misc> part of</s>
|
||
2025-06-11 11:01:35,229 - DEBUG - 原始生成文本: <triplet> <concept> Semantic Web <misc> part of</s>
|
||
2025-06-11 11:01:35,229 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic Web', '<misc>', 'part of']
|
||
2025-06-11 11:01:35,229 - DEBUG - 处理块 407/753: York: Association for Computing Machinery, 2012. 2...
|
||
2025-06-11 11:01:35,410 - DEBUG - 块 407 生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:35,410 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:35,410 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'member of']
|
||
2025-06-11 11:01:35,410 - DEBUG - 处理块 408/753: Zheng ZC, Si XC, Li FT, Chang EY, Zhu XY. Entity d...
|
||
2025-06-11 11:01:35,696 - DEBUG - 块 408 生成文本: <triplet> <concept> IEEE <org> standards body</s>
|
||
2025-06-11 11:01:35,697 - DEBUG - 原始生成文本: <triplet> <concept> IEEE <org> standards body</s>
|
||
2025-06-11 11:01:35,697 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'IEEE', '<org>', 'standards body']
|
||
2025-06-11 11:01:35,697 - DEBUG - 处理块 409/753: on Web Intelligence and Intelligent Agent Technolo...
|
||
2025-06-11 11:01:35,835 - DEBUG - 块 409 生成文本: <triplet> <concept> IEEE Computer Society <org> publisher</s>
|
||
2025-06-11 11:01:35,835 - DEBUG - 原始生成文本: <triplet> <concept> IEEE Computer Society <org> publisher</s>
|
||
2025-06-11 11:01:35,835 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'IEEE Computer Society', '<org>', 'publisher']
|
||
2025-06-11 11:01:35,835 - DEBUG - 处理块 410/753: Hoffmann R, Zhang CL, Ling X, Zettlemoyer L...
|
||
2025-06-11 11:01:36,058 - DEBUG - 块 410 生成文本: <triplet> <concept> Knowledge-based weak supervision for information extraction of</s>
|
||
2025-06-11 11:01:36,058 - DEBUG - 原始生成文本: <triplet> <concept> Knowledge-based weak supervision for information extraction of</s>
|
||
2025-06-11 11:01:36,058 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Knowledge-based weak supervision for information extraction of']
|
||
2025-06-11 11:01:36,058 - DEBUG - 处理块 411/753: overlapping relations. In: Proc. of the 49th Annua...
|
||
2025-06-11 11:01:36,441 - DEBUG - 块 411 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:01:36,442 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:01:36,442 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:01:36,442 - DEBUG - 处理块 412/753: Association for Computational Linguistics (ACL), 2...
|
||
2025-06-11 11:01:36,750 - DEBUG - 块 412 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:01:36,750 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:01:36,750 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:01:36,750 - DEBUG - 处理块 413/753: Daiber J, Jakob M, Hokamp C, Mendes PN. Improving ...
|
||
2025-06-11 11:01:37,166 - DEBUG - 块 413 生成文本: <triplet> PN. Improving efficiency and accuracy in multilingual entity extraction <concept> Daiber J, Jakob M <per> author</s>
|
||
2025-06-11 11:01:37,166 - DEBUG - 原始生成文本: <triplet> PN. Improving efficiency and accuracy in multilingual entity extraction <concept> Daiber J, Jakob M <per> author</s>
|
||
2025-06-11 11:01:37,166 - DEBUG - 处理后标记: ['<triplet>', 'PN. Improving efficiency and accuracy in multilingual entity extraction', '<concept>', 'Daiber J, Jakob M', '<per>', 'author']
|
||
2025-06-11 11:01:37,166 - DEBUG - 添加三元组: PN. Improving efficiency and accuracy in multilingual entity extraction(concept) - author - Daiber J, Jakob M(per)
|
||
2025-06-11 11:01:37,166 - DEBUG - 块 413 提取到 1 个三元组
|
||
2025-06-11 11:01:37,166 - DEBUG - 处理块 414/753: Conf. on Semantic Systems. Graz: Association for C...
|
||
2025-06-11 11:01:37,357 - DEBUG - 块 414 生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:37,357 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:37,357 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'member of']
|
||
2025-06-11 11:01:37,357 - DEBUG - 处理块 415/753: Bordes A, Weston J, Usunier N. Open question answe...
|
||
2025-06-11 11:01:37,591 - DEBUG - 块 415 生成文本: <triplet> embedding model <concept> subclass of</s>
|
||
2025-06-11 11:01:37,591 - DEBUG - 原始生成文本: <triplet> embedding model <concept> subclass of</s>
|
||
2025-06-11 11:01:37,591 - DEBUG - 处理后标记: ['<triplet>', 'embedding model', '<concept>', 'subclass of']
|
||
2025-06-11 11:01:37,591 - DEBUG - 处理块 416/753: Conf. on Machine Learning and Knowledge Discovery ...
|
||
2025-06-11 11:01:37,932 - DEBUG - 块 416 生成文本: <triplet> <concept> Machine Learning and Knowledge Discovery in Databases <media> main subject has quality</s>
|
||
2025-06-11 11:01:37,932 - DEBUG - 原始生成文本: <triplet> <concept> Machine Learning and Knowledge Discovery in Databases <media> main subject has quality</s>
|
||
2025-06-11 11:01:37,932 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Machine Learning and Knowledge Discovery in Databases', '<media>', 'main subject has quality']
|
||
2025-06-11 11:01:37,932 - DEBUG - 处理块 417/753: Bordes A, Chopra S, Weston J. Question answering w...
|
||
2025-06-11 11:01:38,390 - DEBUG - 块 417 生成文本: <triplet> embeddings <concept> subgraph <misc> instance of</s>
|
||
2025-06-11 11:01:38,391 - DEBUG - 原始生成文本: <triplet> embeddings <concept> subgraph <misc> instance of</s>
|
||
2025-06-11 11:01:38,391 - DEBUG - 处理后标记: ['<triplet>', 'embeddings', '<concept>', 'subgraph', '<misc>', 'instance of']
|
||
2025-06-11 11:01:38,391 - DEBUG - 添加三元组: embeddings(concept) - instance of - subgraph(misc)
|
||
2025-06-11 11:01:38,391 - DEBUG - 块 417 提取到 1 个三元组
|
||
2025-06-11 11:01:38,391 - DEBUG - 处理块 418/753: Natural Language Processing (EMNLP). Doha: Associa...
|
||
2025-06-11 11:01:38,603 - DEBUG - 块 418 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:38,603 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:38,603 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:38,603 - DEBUG - 处理块 419/753: Wang Q, Mao ZD, Wang B, Guo L. Knowledge graph emb...
|
||
2025-06-11 11:01:39,512 - DEBUG - 块 419 生成文本: <triplet> graph embedding <concept> Wang Q <per> named after a survey of approaches and applications <media> Wang B, Guo L.compendid Knowledge <misc> based on Knowledge. <loc> Wang ZD,Mao,GeoL,A survey andapplications andusage <triplet> applications.IEEE <org> Wang J, Mao Zd,Wang B <eve> item operated</s>
|
||
2025-06-11 11:01:39,513 - DEBUG - 原始生成文本: <triplet> graph embedding <concept> Wang Q <per> named after a survey of approaches and applications <media> Wang B, Guo L.compendid Knowledge <misc> based on Knowledge. <loc> Wang ZD,Mao,GeoL,A survey andapplications andusage <triplet> applications.IEEE <org> Wang J, Mao Zd,Wang B <eve> item operated</s>
|
||
2025-06-11 11:01:39,513 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding', '<concept>', 'Wang Q', '<per>', 'named after a survey of approaches and applications', '<media>', 'Wang B, Guo L.compendid Knowledge', '<misc>', 'based on Knowledge.', '<loc>', 'Wang ZD,Mao,GeoL,A survey andapplications andusage', '<triplet>', 'applications.IEEE', '<org>', 'Wang J, Mao Zd,Wang B', '<eve>', 'item operated']
|
||
2025-06-11 11:01:39,513 - DEBUG - 添加三元组: graph embedding(concept) - named after a survey of approaches and applications - Wang Q(per)
|
||
2025-06-11 11:01:39,513 - DEBUG - 添加三元组: applications.IEEE(org) - item operated - Wang J, Mao Zd,Wang B(eve)
|
||
2025-06-11 11:01:39,513 - DEBUG - 块 419 提取到 2 个三元组
|
||
2025-06-11 11:01:39,513 - DEBUG - 处理块 420/753: and Data Engineering, 2017, 29(12): 2724–2743. [do...
|
||
2025-06-11 11:01:39,746 - DEBUG - 块 420 生成文本: <triplet> <concept> 12 <num> number of parts of this work</s>
|
||
2025-06-11 11:01:39,747 - DEBUG - 原始生成文本: <triplet> <concept> 12 <num> number of parts of this work</s>
|
||
2025-06-11 11:01:39,747 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '12', '<num>', 'number of parts of this work']
|
||
2025-06-11 11:01:39,747 - DEBUG - 处理块 421/753: Bordes A, Usunier N, García-Durán A, Weston J, Yak...
|
||
2025-06-11 11:01:40,131 - DEBUG - 块 421 生成文本: <triplet> embeddings for modeling multi-relational data <concept> Usunier N <per> author</s>
|
||
2025-06-11 11:01:40,131 - DEBUG - 原始生成文本: <triplet> embeddings for modeling multi-relational data <concept> Usunier N <per> author</s>
|
||
2025-06-11 11:01:40,131 - DEBUG - 处理后标记: ['<triplet>', 'embeddings for modeling multi-relational data', '<concept>', 'Usunier N', '<per>', 'author']
|
||
2025-06-11 11:01:40,131 - DEBUG - 添加三元组: embeddings for modeling multi-relational data(concept) - author - Usunier N(per)
|
||
2025-06-11 11:01:40,131 - DEBUG - 块 421 提取到 1 个三元组
|
||
2025-06-11 11:01:40,131 - DEBUG - 处理块 422/753: the 26th Int’l Conf. on Neural Information Process...
|
||
2025-06-11 11:01:40,407 - DEBUG - 块 422 生成文本: <triplet> Associates Inc. <org> instance of</s>
|
||
2025-06-11 11:01:40,408 - DEBUG - 原始生成文本: <triplet> Associates Inc. <org> instance of</s>
|
||
2025-06-11 11:01:40,408 - DEBUG - 处理后标记: ['<triplet>', 'Associates Inc.', '<org>', 'instance of']
|
||
2025-06-11 11:01:40,408 - DEBUG - 处理块 423/753: Wang Z, Zhang JW, Feng JL, Chen Z. Knowledge graph...
|
||
2025-06-11 11:01:41,295 - DEBUG - 块 423 生成文本: <triplet> graph embedding by translating on hyperplanes <concept> Wang Z <per> author</s>
|
||
2025-06-11 11:01:41,295 - DEBUG - 原始生成文本: <triplet> graph embedding by translating on hyperplanes <concept> Wang Z <per> author</s>
|
||
2025-06-11 11:01:41,295 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding by translating on hyperplanes', '<concept>', 'Wang Z', '<per>', 'author']
|
||
2025-06-11 11:01:41,295 - DEBUG - 添加三元组: graph embedding by translating on hyperplanes(concept) - author - Wang Z(per)
|
||
2025-06-11 11:01:41,295 - DEBUG - 块 423 提取到 1 个三元组
|
||
2025-06-11 11:01:41,295 - DEBUG - 处理块 424/753: Artificial Intelligence (AAAI). Québec City: AAAI ...
|
||
2025-06-11 11:01:41,540 - DEBUG - 块 424 生成文本: <triplet> <eve> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:01:41,540 - DEBUG - 原始生成文本: <triplet> <eve> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:01:41,540 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'Artificial Intelligence', '<concept>', 'facet of']
|
||
2025-06-11 11:01:41,540 - DEBUG - 处理块 425/753: Riedel S, Yao LM, McCallum A, Marlin BM. Relation ...
|
||
2025-06-11 11:01:41,668 - DEBUG - 块 425 生成文本: <triplet> LM <media> 2013 <date> publication date</s>
|
||
2025-06-11 11:01:41,668 - DEBUG - 原始生成文本: <triplet> LM <media> 2013 <date> publication date</s>
|
||
2025-06-11 11:01:41,668 - DEBUG - 处理后标记: ['<triplet>', 'LM', '<media>', '2013', '<date>', 'publication date']
|
||
2025-06-11 11:01:41,668 - DEBUG - 添加三元组: LM(media) - publication date - 2013(date)
|
||
2025-06-11 11:01:41,668 - DEBUG - 块 425 提取到 1 个三元组
|
||
2025-06-11 11:01:41,668 - DEBUG - 处理块 426/753: Conf. of the North American Chapter of the ...
|
||
2025-06-11 11:01:41,954 - DEBUG - 块 426 生成文本: <triplet> <org> Atlanta <loc> headquarters location</s>
|
||
2025-06-11 11:01:41,954 - DEBUG - 原始生成文本: <triplet> <org> Atlanta <loc> headquarters location</s>
|
||
2025-06-11 11:01:41,954 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Atlanta', '<loc>', 'headquarters location']
|
||
2025-06-11 11:01:41,954 - DEBUG - 处理块 427/753: Computational Linguistics, 2013. 74–84.
|
||
[17]
|
||
...
|
||
2025-06-11 11:01:42,134 - DEBUG - 块 427 生成文本: <triplet> <concept> Computational Linguistics <media> part of</s>
|
||
2025-06-11 11:01:42,134 - DEBUG - 原始生成文本: <triplet> <concept> Computational Linguistics <media> part of</s>
|
||
2025-06-11 11:01:42,134 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Computational Linguistics', '<media>', 'part of']
|
||
2025-06-11 11:01:42,134 - DEBUG - 处理块 428/753: Nickel M, Tresp V, Kriegel HP. A three-way model f...
|
||
2025-06-11 11:01:42,283 - DEBUG - 块 428 生成文本: <triplet> <media> Int’l <concept> programming language</s>
|
||
2025-06-11 11:01:42,283 - DEBUG - 原始生成文本: <triplet> <media> Int’l <concept> programming language</s>
|
||
2025-06-11 11:01:42,283 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Int’l', '<concept>', 'programming language']
|
||
2025-06-11 11:01:42,283 - DEBUG - 处理块 429/753: Machine Learning (ICML). Bellevue: Omnipress, 2011...
|
||
2025-06-11 11:01:42,452 - DEBUG - 块 429 生成文本: <triplet> <concept> Machine Learning (ICML) <media> part of</s>
|
||
2025-06-11 11:01:42,452 - DEBUG - 原始生成文本: <triplet> <concept> Machine Learning (ICML) <media> part of</s>
|
||
2025-06-11 11:01:42,452 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Machine Learning (ICML)', '<media>', 'part of']
|
||
2025-06-11 11:01:42,452 - DEBUG - 处理块 430/753: Nickel M, Tresp V, Kriegel HP. Factorizing YAGO: S...
|
||
2025-06-11 11:01:42,643 - DEBUG - 块 430 生成文本: <triplet> <media> 21st Int’l Conf. on World <eve> follows</s>
|
||
2025-06-11 11:01:42,643 - DEBUG - 原始生成文本: <triplet> <media> 21st Int’l Conf. on World <eve> follows</s>
|
||
2025-06-11 11:01:42,643 - DEBUG - 处理后标记: ['<triplet>', '<media>', '21st Int’l Conf. on World', '<eve>', 'follows']
|
||
2025-06-11 11:01:42,643 - DEBUG - 处理块 431/753: Wide Web (WWW). Lyon: Association for Computing Ma...
|
||
2025-06-11 11:01:42,930 - DEBUG - 块 431 生成文本: <triplet> <media> Wide Web <concept> part of the series</s>
|
||
2025-06-11 11:01:42,930 - DEBUG - 原始生成文本: <triplet> <media> Wide Web <concept> part of the series</s>
|
||
2025-06-11 11:01:42,930 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Wide Web', '<concept>', 'part of the series']
|
||
2025-06-11 11:01:42,930 - DEBUG - 处理块 432/753: Bordes A, Glorot X, Weston J, Bengio Y. A semantic...
|
||
2025-06-11 11:01:43,303 - DEBUG - 块 432 生成文本: <triplet> <concept> semantic matching energy function for learning with multi-relational data: Application to <misc> studies <triplet> A <media> semant <per> studies</s>
|
||
2025-06-11 11:01:43,303 - DEBUG - 原始生成文本: <triplet> <concept> semantic matching energy function for learning with multi-relational data: Application to <misc> studies <triplet> A <media> semant <per> studies</s>
|
||
2025-06-11 11:01:43,303 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'semantic matching energy function for learning with multi-relational data: Application to', '<misc>', 'studies', '<triplet>', 'A', '<media>', 'semant', '<per>', 'studies']
|
||
2025-06-11 11:01:43,303 - DEBUG - 处理块 433/753: word-sense disambiguation. Machine Learning, 2014,...
|
||
2025-06-11 11:01:43,600 - DEBUG - 块 433 生成文本: <triplet> 233–259. <concept> Machine Learning, 2014 <date> publication date</s>
|
||
2025-06-11 11:01:43,600 - DEBUG - 原始生成文本: <triplet> 233–259. <concept> Machine Learning, 2014 <date> publication date</s>
|
||
2025-06-11 11:01:43,600 - DEBUG - 处理后标记: ['<triplet>', '233–259.', '<concept>', 'Machine Learning, 2014', '<date>', 'publication date']
|
||
2025-06-11 11:01:43,600 - DEBUG - 添加三元组: 233–259.(concept) - publication date - Machine Learning, 2014(date)
|
||
2025-06-11 11:01:43,600 - DEBUG - 块 433 提取到 1 个三元组
|
||
2025-06-11 11:01:43,600 - DEBUG - 处理块 434/753: Wang Q, Wang B, Guo L. Knowledge base completion u...
|
||
2025-06-11 11:01:44,036 - DEBUG - 块 434 生成文本: <triplet> embeddings and rules <concept> Knowledge base completion <media> studies</s>
|
||
2025-06-11 11:01:44,036 - DEBUG - 原始生成文本: <triplet> embeddings and rules <concept> Knowledge base completion <media> studies</s>
|
||
2025-06-11 11:01:44,036 - DEBUG - 处理后标记: ['<triplet>', 'embeddings and rules', '<concept>', 'Knowledge base completion', '<media>', 'studies']
|
||
2025-06-11 11:01:44,036 - DEBUG - 添加三元组: embeddings and rules(concept) - studies - Knowledge base completion(media)
|
||
2025-06-11 11:01:44,036 - DEBUG - 块 434 提取到 1 个三元组
|
||
2025-06-11 11:01:44,036 - DEBUG - 处理块 435/753: Intelligence (IJCAI). Buenos Aires: AAAI Press, 20...
|
||
2025-06-11 11:01:44,238 - DEBUG - 块 435 生成文本: <triplet> IJCAI <org> Buenos Aires <loc> headquarters location</s>
|
||
2025-06-11 11:01:44,238 - DEBUG - 原始生成文本: <triplet> IJCAI <org> Buenos Aires <loc> headquarters location</s>
|
||
2025-06-11 11:01:44,238 - DEBUG - 处理后标记: ['<triplet>', 'IJCAI', '<org>', 'Buenos Aires', '<loc>', 'headquarters location']
|
||
2025-06-11 11:01:44,238 - DEBUG - 添加三元组: IJCAI(org) - headquarters location - Buenos Aires(loc)
|
||
2025-06-11 11:01:44,238 - DEBUG - 块 435 提取到 1 个三元组
|
||
2025-06-11 11:01:44,238 - DEBUG - 处理块 436/753: Wei ZY, Zhao J, Liu K, Qi ZY, Sun ZY, Tian GH. Lar...
|
||
2025-06-11 11:01:44,461 - DEBUG - 块 436 生成文本: <triplet> <loc> Wei ZY <per> named <concept> significant name</s>
|
||
2025-06-11 11:01:44,461 - DEBUG - 原始生成文本: <triplet> <loc> Wei ZY <per> named <concept> significant name</s>
|
||
2025-06-11 11:01:44,461 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'Wei ZY', '<per>', 'named', '<concept>', 'significant name']
|
||
2025-06-11 11:01:44,461 - DEBUG - 处理块 437/753: over selected instances. In: Proc. of the 24th ACM...
|
||
2025-06-11 11:01:44,813 - DEBUG - 块 437 生成文本: <triplet> <org> Melbourne <loc> headquarters location</s>
|
||
2025-06-11 11:01:44,813 - DEBUG - 原始生成文本: <triplet> <org> Melbourne <loc> headquarters location</s>
|
||
2025-06-11 11:01:44,813 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Melbourne', '<loc>', 'headquarters location']
|
||
2025-06-11 11:01:44,813 - DEBUG - 处理块 438/753: Association for Computing Machinery, 2015. 1331–13...
|
||
2025-06-11 11:01:45,068 - DEBUG - 块 438 生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:45,068 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:01:45,068 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'member of']
|
||
2025-06-11 11:01:45,068 - DEBUG - 处理块 439/753: Guo S, Wang Q, Wang B, Wang LH, Guo L. Semanticall...
|
||
2025-06-11 11:01:45,751 - DEBUG - 块 439 生成文本: <triplet> graph embedding <concept> Guo S <per> named after assembly of the 53rd Annual knowledge <misc> Guop S. <media> based on <triplet> GuO S, <loc> Guopa SJ, Wang Q <org> follows</s>
|
||
2025-06-11 11:01:45,751 - DEBUG - 原始生成文本: <triplet> graph embedding <concept> Guo S <per> named after assembly of the 53rd Annual knowledge <misc> Guop S. <media> based on <triplet> GuO S, <loc> Guopa SJ, Wang Q <org> follows</s>
|
||
2025-06-11 11:01:45,751 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding', '<concept>', 'Guo S', '<per>', 'named after assembly of the 53rd Annual knowledge', '<misc>', 'Guop S.', '<media>', 'based on', '<triplet>', 'GuO S,', '<loc>', 'Guopa SJ, Wang Q', '<org>', 'follows']
|
||
2025-06-11 11:01:45,751 - DEBUG - 添加三元组: graph embedding(concept) - named after assembly of the 53rd Annual knowledge - Guo S(per)
|
||
2025-06-11 11:01:45,751 - DEBUG - 添加三元组: GuO S,(loc) - follows - Guopa SJ, Wang Q(org)
|
||
2025-06-11 11:01:45,752 - DEBUG - 块 439 提取到 2 个三元组
|
||
2025-06-11 11:01:45,752 - DEBUG - 处理块 440/753: of the Association for Computational Linguistics a...
|
||
2025-06-11 11:01:46,263 - DEBUG - 块 440 生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> 7th Int’l Joint Conf. on Natural Language Processing. Beijing <media> 7 <date> point in time</s>
|
||
2025-06-11 11:01:46,263 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> 7th Int’l Joint Conf. on Natural Language Processing. Beijing <media> 7 <date> point in time</s>
|
||
2025-06-11 11:01:46,263 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'part of', '<triplet>', '7th Int’l Joint Conf. on Natural Language Processing. Beijing', '<media>', '7', '<date>', 'point in time']
|
||
2025-06-11 11:01:46,263 - DEBUG - 处理块 441/753: Computational Linguistics (ACL), 2015. 84–94. [doi...
|
||
2025-06-11 11:01:46,454 - DEBUG - 块 441 生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:01:46,454 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:01:46,454 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:01:46,454 - DEBUG - 处理块 442/753: Xie RB, Liu ZY, Sun MS. Representation learning of...
|
||
2025-06-11 11:01:46,613 - DEBUG - 块 442 生成文本: <triplet> graphs <concept> hierarchical types <misc> studies</s>
|
||
2025-06-11 11:01:46,613 - DEBUG - 原始生成文本: <triplet> graphs <concept> hierarchical types <misc> studies</s>
|
||
2025-06-11 11:01:46,614 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'hierarchical types', '<misc>', 'studies']
|
||
2025-06-11 11:01:46,614 - DEBUG - 添加三元组: graphs(concept) - studies - hierarchical types(misc)
|
||
2025-06-11 11:01:46,614 - DEBUG - 块 442 提取到 1 个三元组
|
||
2025-06-11 11:01:46,614 - DEBUG - 处理块 443/753: Artificial Intelligence (IJCAI). New York: IJCAI/A...
|
||
2025-06-11 11:01:46,933 - DEBUG - 块 443 生成文本: <triplet> <media> Artificial Intelligence <concept> field of work</s>
|
||
2025-06-11 11:01:46,933 - DEBUG - 原始生成文本: <triplet> <media> Artificial Intelligence <concept> field of work</s>
|
||
2025-06-11 11:01:46,933 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Artificial Intelligence', '<concept>', 'field of work']
|
||
2025-06-11 11:01:46,933 - DEBUG - 处理块 444/753: Wang Z, Zhang JW, Feng JL, Chen Z. Knowledge graph...
|
||
2025-06-11 11:01:47,380 - DEBUG - 块 444 生成文本: <triplet> graph and text jointly embedding. <concept> Wang Z <per> author</s>
|
||
2025-06-11 11:01:47,380 - DEBUG - 原始生成文本: <triplet> graph and text jointly embedding. <concept> Wang Z <per> author</s>
|
||
2025-06-11 11:01:47,380 - DEBUG - 处理后标记: ['<triplet>', 'graph and text jointly embedding.', '<concept>', 'Wang Z', '<per>', 'author']
|
||
2025-06-11 11:01:47,380 - DEBUG - 添加三元组: graph and text jointly embedding.(concept) - author - Wang Z(per)
|
||
2025-06-11 11:01:47,380 - DEBUG - 块 444 提取到 1 个三元组
|
||
2025-06-11 11:01:47,380 - DEBUG - 处理块 445/753: in Natural Language Processing (EMNLP). Doha: Asso...
|
||
2025-06-11 11:01:47,688 - DEBUG - 块 445 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:47,688 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:47,688 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:47,688 - DEBUG - 处理块 446/753: Zhong HP, Zhang JW, Wang Z, Wan H, Chen Z. Alignin...
|
||
2025-06-11 11:01:47,964 - DEBUG - 块 446 生成文本: <triplet> embeddings by entity descriptions <concept> Zhong HP <per> author</s>
|
||
2025-06-11 11:01:47,964 - DEBUG - 原始生成文本: <triplet> embeddings by entity descriptions <concept> Zhong HP <per> author</s>
|
||
2025-06-11 11:01:47,965 - DEBUG - 处理后标记: ['<triplet>', 'embeddings by entity descriptions', '<concept>', 'Zhong HP', '<per>', 'author']
|
||
2025-06-11 11:01:47,965 - DEBUG - 添加三元组: embeddings by entity descriptions(concept) - author - Zhong HP(per)
|
||
2025-06-11 11:01:47,965 - DEBUG - 块 446 提取到 1 个三元组
|
||
2025-06-11 11:01:47,965 - DEBUG - 处理块 447/753: Conf. on Empirical Methods in Natural Langua...
|
||
2025-06-11 11:01:48,272 - DEBUG - 块 447 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:48,273 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:48,273 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:48,273 - DEBUG - 处理块 448/753: 267–272. [doi: 10.18653/v1/D15-1031]
|
||
[26]
|
||
...
|
||
2025-06-11 11:01:48,548 - DEBUG - 块 448 生成文本: <triplet> <concept> <media> part of <triplet> 267–27221 <eve> <date> point in time</s>
|
||
2025-06-11 11:01:48,548 - DEBUG - 原始生成文本: <triplet> <concept> <media> part of <triplet> 267–27221 <eve> <date> point in time</s>
|
||
2025-06-11 11:01:48,548 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '<media>', 'part of', '<triplet>', '267–27221', '<eve>', '<date>', 'point in time']
|
||
2025-06-11 11:01:48,548 - DEBUG - 添加三元组: <concept>(media) - 267–27221 - part of(triplet)
|
||
2025-06-11 11:01:48,548 - DEBUG - 块 448 提取到 1 个三元组
|
||
2025-06-11 11:01:48,549 - DEBUG - 处理块 449/753: Xie RB, Liu ZY, Jia J, Luan HB, Sun MS. Representa...
|
||
2025-06-11 11:01:48,878 - DEBUG - 块 449 生成文本: <triplet> graphs with entity descriptions <concept> Xie <misc> part of <triplet> Xia J <org> <eve> part</s>
|
||
2025-06-11 11:01:48,878 - DEBUG - 原始生成文本: <triplet> graphs with entity descriptions <concept> Xie <misc> part of <triplet> Xia J <org> <eve> part</s>
|
||
2025-06-11 11:01:48,878 - DEBUG - 处理后标记: ['<triplet>', 'graphs with entity descriptions', '<concept>', 'Xie', '<misc>', 'part of', '<triplet>', 'Xia J', '<org>', '<eve>', 'part']
|
||
2025-06-11 11:01:48,878 - DEBUG - 添加三元组: graphs with entity descriptions(concept) - part of - Xie(misc)
|
||
2025-06-11 11:01:48,878 - DEBUG - 块 449 提取到 1 个三元组
|
||
2025-06-11 11:01:48,878 - DEBUG - 处理块 450/753: AAAI Conf. on Artificial Intelligence (AAAI). Phoe...
|
||
2025-06-11 11:01:49,069 - DEBUG - 块 450 生成文本: <triplet> <concept> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:01:49,069 - DEBUG - 原始生成文本: <triplet> <concept> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:01:49,069 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'AAAI Press', '<org>', 'publisher']
|
||
2025-06-11 11:01:49,069 - DEBUG - 处理块 451/753: Wang ZG, Li JZ. Text-enhanced representation learn...
|
||
2025-06-11 11:01:49,271 - DEBUG - 块 451 生成文本: <triplet> graph <concept> Text-enhanced representation <misc> studies</s>
|
||
2025-06-11 11:01:49,271 - DEBUG - 原始生成文本: <triplet> graph <concept> Text-enhanced representation <misc> studies</s>
|
||
2025-06-11 11:01:49,271 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Text-enhanced representation', '<misc>', 'studies']
|
||
2025-06-11 11:01:49,271 - DEBUG - 添加三元组: graph(concept) - studies - Text-enhanced representation(misc)
|
||
2025-06-11 11:01:49,271 - DEBUG - 块 451 提取到 1 个三元组
|
||
2025-06-11 11:01:49,271 - DEBUG - 处理块 452/753: Intelligence (IJCAI). New York: AAAI Press, 2016. ...
|
||
2025-06-11 11:01:49,547 - DEBUG - 块 452 生成文本: <triplet> 软件学报 <media> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:01:49,547 - DEBUG - 原始生成文本: <triplet> 软件学报 <media> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:01:49,547 - DEBUG - 处理后标记: ['<triplet>', '软件学报', '<media>', 'AAAI Press', '<org>', 'publisher']
|
||
2025-06-11 11:01:49,547 - DEBUG - 添加三元组: 软件学报(media) - publisher - AAAI Press(org)
|
||
2025-06-11 11:01:49,547 - DEBUG - 块 452 提取到 1 个三元组
|
||
2025-06-11 11:01:49,547 - DEBUG - 处理块 453/753: Lin YK, Liu ZY, Luan HB, Sun MS, Rao SW, Liu S. Mo...
|
||
2025-06-11 11:01:49,759 - DEBUG - 块 453 生成文本: <triplet> ZY <per> Liu <loc> country of citizenship</s>
|
||
2025-06-11 11:01:49,760 - DEBUG - 原始生成文本: <triplet> ZY <per> Liu <loc> country of citizenship</s>
|
||
2025-06-11 11:01:49,760 - DEBUG - 处理后标记: ['<triplet>', 'ZY', '<per>', 'Liu', '<loc>', 'country of citizenship']
|
||
2025-06-11 11:01:49,760 - DEBUG - 添加三元组: ZY(per) - country of citizenship - Liu(loc)
|
||
2025-06-11 11:01:49,760 - DEBUG - 块 453 提取到 1 个三元组
|
||
2025-06-11 11:01:49,760 - DEBUG - 处理块 454/753: of the 2015 Conf. on Empirical Methods in Natural ...
|
||
2025-06-11 11:01:50,025 - DEBUG - 块 454 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:50,025 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:50,025 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:50,025 - DEBUG - 处理块 455/753: (ACL), 2015. 705–714. [doi: 10.18653/v1/D15-1082]
|
||
...
|
||
2025-06-11 11:01:50,195 - DEBUG - 块 455 生成文本: <triplet> 705–714. <concept> 2015 <date> publication date</s>
|
||
2025-06-11 11:01:50,195 - DEBUG - 原始生成文本: <triplet> 705–714. <concept> 2015 <date> publication date</s>
|
||
2025-06-11 11:01:50,195 - DEBUG - 处理后标记: ['<triplet>', '705–714.', '<concept>', '2015', '<date>', 'publication date']
|
||
2025-06-11 11:01:50,195 - DEBUG - 添加三元组: 705–714.(concept) - publication date - 2015(date)
|
||
2025-06-11 11:01:50,195 - DEBUG - 块 455 提取到 1 个三元组
|
||
2025-06-11 11:01:50,195 - DEBUG - 处理块 456/753: Guu K, Miller J, Liang P. Traversing knowledge gra...
|
||
2025-06-11 11:01:50,344 - DEBUG - 块 456 生成文本: <triplet> graphs <concept> vector space <misc> studies</s>
|
||
2025-06-11 11:01:50,344 - DEBUG - 原始生成文本: <triplet> graphs <concept> vector space <misc> studies</s>
|
||
2025-06-11 11:01:50,344 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'vector space', '<misc>', 'studies']
|
||
2025-06-11 11:01:50,344 - DEBUG - 添加三元组: graphs(concept) - studies - vector space(misc)
|
||
2025-06-11 11:01:50,344 - DEBUG - 块 456 提取到 1 个三元组
|
||
2025-06-11 11:01:50,344 - DEBUG - 处理块 457/753: Language Processing (EMNLP). Lisbon: Association f...
|
||
2025-06-11 11:01:50,578 - DEBUG - 块 457 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:50,578 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:50,578 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:50,579 - DEBUG - 处理块 458/753: Toutanova K, Lin V, Yih WT, Poon H, Quirk C. Compo...
|
||
2025-06-11 11:01:51,176 - DEBUG - 块 458 生成文本: <triplet> <concept> relation paths in knowledge base and text</s>
|
||
2025-06-11 11:01:51,176 - DEBUG - 原始生成文本: <triplet> <concept> relation paths in knowledge base and text</s>
|
||
2025-06-11 11:01:51,176 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'relation paths in knowledge base and text']
|
||
2025-06-11 11:01:51,176 - DEBUG - 处理块 459/753: In: Proc. of the 54th Annual Meeting of the Associ...
|
||
2025-06-11 11:01:51,452 - DEBUG - 块 459 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:51,453 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:51,453 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:51,453 - DEBUG - 处理块 460/753: Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653...
|
||
2025-06-11 11:01:51,633 - DEBUG - 块 460 生成文本: <triplet> <media> Linguistics <concept> part of</s>
|
||
2025-06-11 11:01:51,633 - DEBUG - 原始生成文本: <triplet> <media> Linguistics <concept> part of</s>
|
||
2025-06-11 11:01:51,633 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:01:51,633 - DEBUG - 处理块 461/753: Guo S, Wang Q, Wang LH, Wang B, Guo L. Jointly emb...
|
||
2025-06-11 11:01:52,048 - DEBUG - 块 461 生成文本: <triplet> graphs and logical rules <concept> Guo S <per> named after the 2016 Conf. on <unk> 2016 <date> publication date</s>
|
||
2025-06-11 11:01:52,048 - DEBUG - 原始生成文本: <triplet> graphs and logical rules <concept> Guo S <per> named after the 2016 Conf. on <unk> 2016 <date> publication date</s>
|
||
2025-06-11 11:01:52,048 - DEBUG - 处理后标记: ['<triplet>', 'graphs and logical rules', '<concept>', 'Guo S', '<per>', 'named after the 2016 Conf. on', '<unk>', '2016', '<date>', 'publication date']
|
||
2025-06-11 11:01:52,048 - DEBUG - 添加三元组: graphs and logical rules(concept) - named after the 2016 Conf. on - Guo S(per)
|
||
2025-06-11 11:01:52,048 - DEBUG - 块 461 提取到 1 个三元组
|
||
2025-06-11 11:01:52,049 - DEBUG - 处理块 462/753: Empirical Methods in Natural Language Processing (...
|
||
2025-06-11 11:01:52,356 - DEBUG - 块 462 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:52,356 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:01:52,356 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:01:52,356 - DEBUG - 处理块 463/753: 192–202. [doi: 10.18653/v1/D16-1019]
|
||
[32]
|
||
...
|
||
2025-06-11 11:01:52,653 - DEBUG - 块 463 生成文本: <triplet> <concept> <date> point in time <triplet></s>
|
||
2025-06-11 11:01:52,654 - DEBUG - 原始生成文本: <triplet> <concept> <date> point in time <triplet></s>
|
||
2025-06-11 11:01:52,654 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '<date>', 'point in time', '<triplet>']
|
||
2025-06-11 11:01:52,654 - DEBUG - 处理块 464/753: Rocktäschel T, Singh S, Riedel S. Injecting logica...
|
||
2025-06-11 11:01:53,208 - DEBUG - 块 464 生成文本: <triplet> embeddings <concept> relation extraction <media> use</s>
|
||
2025-06-11 11:01:53,208 - DEBUG - 原始生成文本: <triplet> embeddings <concept> relation extraction <media> use</s>
|
||
2025-06-11 11:01:53,208 - DEBUG - 处理后标记: ['<triplet>', 'embeddings', '<concept>', 'relation extraction', '<media>', 'use']
|
||
2025-06-11 11:01:53,208 - DEBUG - 添加三元组: embeddings(concept) - use - relation extraction(media)
|
||
2025-06-11 11:01:53,208 - DEBUG - 块 464 提取到 1 个三元组
|
||
2025-06-11 11:01:53,208 - DEBUG - 处理块 465/753: Conf. of the North American Chapter of the Associa...
|
||
2025-06-11 11:01:53,581 - DEBUG - 块 465 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of the North American <media> North America <loc> country</s>
|
||
2025-06-11 11:01:53,581 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of the North American <media> North America <loc> country</s>
|
||
2025-06-11 11:01:53,581 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of the North American', '<media>', 'North America', '<loc>', 'country']
|
||
2025-06-11 11:01:53,581 - DEBUG - 处理块 466/753: Denver: Association for Computational Linguistics ...
|
||
2025-06-11 11:01:53,879 - DEBUG - 块 466 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:01:53,880 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:01:53,880 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:01:53,880 - DEBUG - 处理块 467/753: Nickel M, Murphy K, Tresp V, Gabrilovich E. A revi...
|
||
2025-06-11 11:01:54,188 - DEBUG - 块 467 生成文本: <triplet> graphs <concept> relational machine learning</s>
|
||
2025-06-11 11:01:54,188 - DEBUG - 原始生成文本: <triplet> graphs <concept> relational machine learning</s>
|
||
2025-06-11 11:01:54,188 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'relational machine learning']
|
||
2025-06-11 11:01:54,188 - DEBUG - 处理块 468/753: 104(1): 11–33. [doi: 10.1109/JPROC.2015.2483592]
|
||
[...
|
||
2025-06-11 11:01:54,443 - DEBUG - 块 468 生成文本: <triplet> <concept> 11 <num> number of episodes</s>
|
||
2025-06-11 11:01:54,443 - DEBUG - 原始生成文本: <triplet> <concept> 11 <num> number of episodes</s>
|
||
2025-06-11 11:01:54,443 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '11', '<num>', 'number of episodes']
|
||
2025-06-11 11:01:54,443 - DEBUG - 处理块 469/753: Paulheim H. Knowledge graph refinement: A survey o...
|
||
2025-06-11 11:01:54,602 - DEBUG - 块 469 生成文本: <triplet> graph <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:01:54,602 - DEBUG - 原始生成文本: <triplet> graph <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:01:54,602 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:01:54,602 - DEBUG - 添加三元组: graph(concept) - used by - Semantic Web(misc)
|
||
2025-06-11 11:01:54,602 - DEBUG - 块 469 提取到 1 个三元组
|
||
2025-06-11 11:01:54,602 - DEBUG - 处理块 470/753: Wu TX, Qi GL, Li C, Wang M. A survey of ...
|
||
2025-06-11 11:01:55,060 - DEBUG - 块 470 生成文本: <triplet> TX, Qi GL, Li C, Wang M.A survey of techniques for constructing Chinese knowledge <concept> graphs and their applications <misc> studies</s>
|
||
2025-06-11 11:01:55,060 - DEBUG - 原始生成文本: <triplet> TX, Qi GL, Li C, Wang M.A survey of techniques for constructing Chinese knowledge <concept> graphs and their applications <misc> studies</s>
|
||
2025-06-11 11:01:55,061 - DEBUG - 处理后标记: ['<triplet>', 'TX, Qi GL, Li C, Wang M.A survey of techniques for constructing Chinese knowledge', '<concept>', 'graphs and their applications', '<misc>', 'studies']
|
||
2025-06-11 11:01:55,061 - DEBUG - 添加三元组: TX, Qi GL, Li C, Wang M.A survey of techniques for constructing Chinese knowledge(concept) - studies - graphs and their applications(misc)
|
||
2025-06-11 11:01:55,061 - DEBUG - 块 470 提取到 1 个三元组
|
||
2025-06-11 11:01:55,061 - DEBUG - 处理块 471/753: Sustainability, 2018, 10(9): 3245. [doi: 10.3390/s...
|
||
2025-06-11 11:01:55,187 - DEBUG - 块 471 生成文本: <triplet> <media> Sustainability <concept> main subject</s>
|
||
2025-06-11 11:01:55,187 - DEBUG - 原始生成文本: <triplet> <media> Sustainability <concept> main subject</s>
|
||
2025-06-11 11:01:55,188 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Sustainability', '<concept>', 'main subject']
|
||
2025-06-11 11:01:55,188 - DEBUG - 处理块 472/753: Lin YK, Han X, Xie RB, Liu ZY, Sun MS. Knowledge r...
|
||
2025-06-11 11:01:55,486 - DEBUG - 块 472 生成文本: <triplet> <per> Sun MS. <org> educated at</s>
|
||
2025-06-11 11:01:55,486 - DEBUG - 原始生成文本: <triplet> <per> Sun MS. <org> educated at</s>
|
||
2025-06-11 11:01:55,486 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'Sun MS.', '<org>', 'educated at']
|
||
2025-06-11 11:01:55,486 - DEBUG - 处理块 473/753: Yang BS, Yih WT, He XD, Gao JF, Deng L. Embedding ...
|
||
2025-06-11 11:01:55,901 - DEBUG - 块 473 生成文本: <triplet> WT <per> Embedding entities and relations for learning and inference <concept> studies</s>
|
||
2025-06-11 11:01:55,901 - DEBUG - 原始生成文本: <triplet> WT <per> Embedding entities and relations for learning and inference <concept> studies</s>
|
||
2025-06-11 11:01:55,901 - DEBUG - 处理后标记: ['<triplet>', 'WT', '<per>', 'Embedding entities and relations for learning and inference', '<concept>', 'studies']
|
||
2025-06-11 11:01:55,901 - DEBUG - 添加三元组: WT(per) - studies - Embedding entities and relations for learning and inference(concept)
|
||
2025-06-11 11:01:55,901 - DEBUG - 块 473 提取到 1 个三元组
|
||
2025-06-11 11:01:55,901 - DEBUG - 处理块 474/753: of the 3rd Int’l Conf. on Learning Representations...
|
||
2025-06-11 11:01:56,156 - DEBUG - 块 474 生成文本: <triplet> <concept> 3rd Int’l Conf. on Learning Representations <media> follows</s>
|
||
2025-06-11 11:01:56,156 - DEBUG - 原始生成文本: <triplet> <concept> 3rd Int’l Conf. on Learning Representations <media> follows</s>
|
||
2025-06-11 11:01:56,156 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '3rd Int’l Conf. on Learning Representations', '<media>', 'follows']
|
||
2025-06-11 11:01:56,156 - DEBUG - 处理块 475/753: Bordes A, Weston J, Collobert R, Bengio Y. Learnin...
|
||
2025-06-11 11:01:56,732 - DEBUG - 块 475 生成文本: <triplet> embeddings of knowledge bases <concept> Learning structured <media> part of the 25th AAAI Conf. <eve> instance of <date> point in time</s>
|
||
2025-06-11 11:01:56,732 - DEBUG - 原始生成文本: <triplet> embeddings of knowledge bases <concept> Learning structured <media> part of the 25th AAAI Conf. <eve> instance of <date> point in time</s>
|
||
2025-06-11 11:01:56,732 - DEBUG - 处理后标记: ['<triplet>', 'embeddings of knowledge bases', '<concept>', 'Learning structured', '<media>', 'part of the 25th AAAI Conf.', '<eve>', 'instance of', '<date>', 'point in time']
|
||
2025-06-11 11:01:56,732 - DEBUG - 添加三元组: embeddings of knowledge bases(concept) - part of the 25th AAAI Conf. - Learning structured(media)
|
||
2025-06-11 11:01:56,732 - DEBUG - 块 475 提取到 1 个三元组
|
||
2025-06-11 11:01:56,732 - DEBUG - 处理块 476/753: Artificial Intelligence (AAAI). San Francisco: AAA...
|
||
2025-06-11 11:01:56,976 - DEBUG - 块 476 生成文本: <triplet> <eve> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:01:56,976 - DEBUG - 原始生成文本: <triplet> <eve> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:01:56,976 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'Artificial Intelligence', '<concept>', 'facet of']
|
||
2025-06-11 11:01:56,976 - DEBUG - 处理块 477/753: Mikolov T, Sutskever I, Chen K, Corrado G, Dean J....
|
||
2025-06-11 11:01:57,392 - DEBUG - 块 477 生成文本: <triplet> <concept> representations of words and phrases and their compositionality <misc> instance of representation <triplet> of expressions of phrase</s>
|
||
2025-06-11 11:01:57,392 - DEBUG - 原始生成文本: <triplet> <concept> representations of words and phrases and their compositionality <misc> instance of representation <triplet> of expressions of phrase</s>
|
||
2025-06-11 11:01:57,392 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'representations of words and phrases and their compositionality', '<misc>', 'instance of representation', '<triplet>', 'of expressions of phrase']
|
||
2025-06-11 11:01:57,392 - DEBUG - 处理块 478/753: Proc. of the 26th Int’l Conf. on Neural Informatio...
|
||
2025-06-11 11:01:57,604 - DEBUG - 块 478 生成文本: <triplet> Associates Inc. <org> 2013 <date> inception</s>
|
||
2025-06-11 11:01:57,604 - DEBUG - 原始生成文本: <triplet> Associates Inc. <org> 2013 <date> inception</s>
|
||
2025-06-11 11:01:57,604 - DEBUG - 处理后标记: ['<triplet>', 'Associates Inc.', '<org>', '2013', '<date>', 'inception']
|
||
2025-06-11 11:01:57,605 - DEBUG - 添加三元组: Associates Inc.(org) - inception - 2013(date)
|
||
2025-06-11 11:01:57,605 - DEBUG - 块 478 提取到 1 个三元组
|
||
2025-06-11 11:01:57,605 - DEBUG - 处理块 479/753: Mikolov T, Chen K, Corrado G, Dean J. Efficient es...
|
||
2025-06-11 11:01:58,234 - DEBUG - 块 479 生成文本: <triplet> <concept> representations in vector space <misc> subclass of the 1st Int’l Conf. <media> part of <triplet> dean J. Efficient estimation of word <loc> representation in Vector <time> facet of</s>
|
||
2025-06-11 11:01:58,234 - DEBUG - 原始生成文本: <triplet> <concept> representations in vector space <misc> subclass of the 1st Int’l Conf. <media> part of <triplet> dean J. Efficient estimation of word <loc> representation in Vector <time> facet of</s>
|
||
2025-06-11 11:01:58,234 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'representations in vector space', '<misc>', 'subclass of the 1st Int’l Conf.', '<media>', 'part of', '<triplet>', 'dean J. Efficient estimation of word', '<loc>', 'representation in Vector', '<time>', 'facet of']
|
||
2025-06-11 11:01:58,234 - DEBUG - 添加三元组: dean J. Efficient estimation of word(loc) - facet of - representation in Vector(time)
|
||
2025-06-11 11:01:58,234 - DEBUG - 块 479 提取到 1 个三元组
|
||
2025-06-11 11:01:58,234 - DEBUG - 处理块 480/753: Learning Representations (ICLR). Scottsdale, 2013....
|
||
2025-06-11 11:01:58,488 - DEBUG - 块 480 生成文本: <triplet> <concept> Learning Representations <media> part of</s>
|
||
2025-06-11 11:01:58,489 - DEBUG - 原始生成文本: <triplet> <concept> Learning Representations <media> part of</s>
|
||
2025-06-11 11:01:58,489 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Learning Representations', '<media>', 'part of']
|
||
2025-06-11 11:01:58,489 - DEBUG - 处理块 481/753: Bordes A, Glorot X, Weston J, Bengio Y. Joint lear...
|
||
2025-06-11 11:01:58,711 - DEBUG - 块 481 生成文本: <triplet> <org> Bordes A, Glorot X, Weston J <per> author</s>
|
||
2025-06-11 11:01:58,711 - DEBUG - 原始生成文本: <triplet> <org> Bordes A, Glorot X, Weston J <per> author</s>
|
||
2025-06-11 11:01:58,711 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Bordes A, Glorot X, Weston J', '<per>', 'author']
|
||
2025-06-11 11:01:58,712 - DEBUG - 处理块 482/753: of the 15th Int’l Conf. on Artificial Intelligence...
|
||
2025-06-11 11:01:58,839 - DEBUG - 块 482 生成文本: <triplet> JMLR <media> La Palma <per> author</s>
|
||
2025-06-11 11:01:58,839 - DEBUG - 原始生成文本: <triplet> JMLR <media> La Palma <per> author</s>
|
||
2025-06-11 11:01:58,839 - DEBUG - 处理后标记: ['<triplet>', 'JMLR', '<media>', 'La Palma', '<per>', 'author']
|
||
2025-06-11 11:01:58,839 - DEBUG - 添加三元组: JMLR(media) - author - La Palma(per)
|
||
2025-06-11 11:01:58,839 - DEBUG - 块 482 提取到 1 个三元组
|
||
2025-06-11 11:01:58,839 - DEBUG - 处理块 483/753: Lin YK, Liu ZY, Sun MS, Liu Y, Zhu X. Learning ent...
|
||
2025-06-11 11:01:59,372 - DEBUG - 块 483 生成文本: <triplet> graph completion <concept> Learning entity and relation embeddings for knowledge <misc> Sun MS <media> Sun <org> <eve> <triplet> 29th.In <dis> <time> <per> part of</s>
|
||
2025-06-11 11:01:59,372 - DEBUG - 原始生成文本: <triplet> graph completion <concept> Learning entity and relation embeddings for knowledge <misc> Sun MS <media> Sun <org> <eve> <triplet> 29th.In <dis> <time> <per> part of</s>
|
||
2025-06-11 11:01:59,372 - DEBUG - 处理后标记: ['<triplet>', 'graph completion', '<concept>', 'Learning entity and relation embeddings for knowledge', '<misc>', 'Sun MS', '<media>', 'Sun', '<org>', '<eve>', '<triplet>', '29th.In', '<dis>', '<time>', '<per>', 'part of']
|
||
2025-06-11 11:01:59,372 - DEBUG - 添加三元组: graph completion(concept) - Sun MS - Learning entity and relation embeddings for knowledge(misc)
|
||
2025-06-11 11:01:59,372 - DEBUG - 添加三元组: 29th.In(dis) - part of - <time>(per)
|
||
2025-06-11 11:01:59,372 - DEBUG - 块 483 提取到 2 个三元组
|
||
2025-06-11 11:01:59,372 - DEBUG - 处理块 484/753: AAAI Conf. on Artificial Intelligence (AAAI). Aust...
|
||
2025-06-11 11:01:59,755 - DEBUG - 块 484 生成文本: <triplet> <concept> AAAI <org> standards body</s>
|
||
2025-06-11 11:01:59,755 - DEBUG - 原始生成文本: <triplet> <concept> AAAI <org> standards body</s>
|
||
2025-06-11 11:01:59,756 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'AAAI', '<org>', 'standards body']
|
||
2025-06-11 11:01:59,756 - DEBUG - 处理块 485/753: Ji GL, He SZ, Xu LH, Liu K, Zhao J. Knowledge grap...
|
||
2025-06-11 11:01:59,946 - DEBUG - 块 485 生成文本: <triplet> graph <concept> Ji GL <per> discoverer or inventor</s>
|
||
2025-06-11 11:01:59,946 - DEBUG - 原始生成文本: <triplet> graph <concept> Ji GL <per> discoverer or inventor</s>
|
||
2025-06-11 11:01:59,946 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Ji GL', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:01:59,947 - DEBUG - 添加三元组: graph(concept) - discoverer or inventor - Ji GL(per)
|
||
2025-06-11 11:01:59,947 - DEBUG - 块 485 提取到 1 个三元组
|
||
2025-06-11 11:01:59,947 - DEBUG - 处理块 486/753: of the Association for Computational Linguistics a...
|
||
2025-06-11 11:02:00,458 - DEBUG - 块 486 生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> 7th Int’l Joint Conf. on Natural Language Processing. Beijing <media> 7 <date> point in time</s>
|
||
2025-06-11 11:02:00,458 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> 7th Int’l Joint Conf. on Natural Language Processing. Beijing <media> 7 <date> point in time</s>
|
||
2025-06-11 11:02:00,458 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'part of', '<triplet>', '7th Int’l Joint Conf. on Natural Language Processing. Beijing', '<media>', '7', '<date>', 'point in time']
|
||
2025-06-11 11:02:00,458 - DEBUG - 处理块 487/753: Computational Linguistics (ACL), 2015. 687–696. [d...
|
||
2025-06-11 11:02:00,627 - DEBUG - 块 487 生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:02:00,627 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:02:00,627 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:02:00,627 - DEBUG - 处理块 488/753: Nguyen DQ, Sirts K, Qu LZ, Johnson M. STransE: A n...
|
||
2025-06-11 11:02:01,235 - DEBUG - 块 488 生成文本: <triplet> embedding model of entities and relationships in knowledge bases <concept> Nguyen DQ, Sirts K, Qu LZ, Johnson M. STransE <per> author</s>
|
||
2025-06-11 11:02:01,235 - DEBUG - 原始生成文本: <triplet> embedding model of entities and relationships in knowledge bases <concept> Nguyen DQ, Sirts K, Qu LZ, Johnson M. STransE <per> author</s>
|
||
2025-06-11 11:02:01,235 - DEBUG - 处理后标记: ['<triplet>', 'embedding model of entities and relationships in knowledge bases', '<concept>', 'Nguyen DQ, Sirts K, Qu LZ, Johnson M. STransE', '<per>', 'author']
|
||
2025-06-11 11:02:01,235 - DEBUG - 添加三元组: embedding model of entities and relationships in knowledge bases(concept) - author - Nguyen DQ, Sirts K, Qu LZ, Johnson M. STransE(per)
|
||
2025-06-11 11:02:01,235 - DEBUG - 块 488 提取到 1 个三元组
|
||
2025-06-11 11:02:01,235 - DEBUG - 处理块 489/753: of the 2016 Conf. of the North American Chapter of...
|
||
2025-06-11 11:02:01,682 - DEBUG - 块 489 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:01,682 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:01,682 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:01,682 - DEBUG - 处理块 490/753: for Computational Linguistics (ACL), 2016. 460–466...
|
||
2025-06-11 11:02:01,851 - DEBUG - 块 490 生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:02:01,851 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:02:01,851 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:02:01,851 - DEBUG - 处理块 491/753: Ji GL, Liu K, He SZ, Zhao J. Knowledge graph compl...
|
||
2025-06-11 11:02:02,611 - DEBUG - 块 491 生成文本: <triplet> graph completion with adaptive sparse transfer matrix <concept> Ji GL, Liu K, He SZ, Zhao J. Knowledge <media> Jiu <triplet> JiU,Liu J,Heat Hector K. <misc> JiGL <per> Ji <org> Ji, Sheet</s>
|
||
2025-06-11 11:02:02,611 - DEBUG - 原始生成文本: <triplet> graph completion with adaptive sparse transfer matrix <concept> Ji GL, Liu K, He SZ, Zhao J. Knowledge <media> Jiu <triplet> JiU,Liu J,Heat Hector K. <misc> JiGL <per> Ji <org> Ji, Sheet</s>
|
||
2025-06-11 11:02:02,611 - DEBUG - 处理后标记: ['<triplet>', 'graph completion with adaptive sparse transfer matrix', '<concept>', 'Ji GL, Liu K, He SZ, Zhao J. Knowledge', '<media>', 'Jiu', '<triplet>', 'JiU,Liu J,Heat Hector K.', '<misc>', 'JiGL', '<per>', 'Ji', '<org>', 'Ji, Sheet']
|
||
2025-06-11 11:02:02,611 - DEBUG - 添加三元组: graph completion with adaptive sparse transfer matrix(concept) - Jiu - Ji GL, Liu K, He SZ, Zhao J. Knowledge(media)
|
||
2025-06-11 11:02:02,611 - DEBUG - 添加三元组: JiU,Liu J,Heat Hector K.(misc) - Ji - JiGL(per)
|
||
2025-06-11 11:02:02,611 - DEBUG - 块 491 提取到 2 个三元组
|
||
2025-06-11 11:02:02,611 - DEBUG - 处理块 492/753: Artificial Intelligence (AAAI). Phoenix: AAAI Pres...
|
||
2025-06-11 11:02:02,909 - DEBUG - 块 492 生成文本: <triplet> <media> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:02:02,909 - DEBUG - 原始生成文本: <triplet> <media> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:02:02,909 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Artificial Intelligence', '<concept>', 'facet of']
|
||
2025-06-11 11:02:02,909 - DEBUG - 处理块 493/753: Fan M, Zhou Q, Chang E, Zheng TF. Transition-based...
|
||
2025-06-11 11:02:03,486 - DEBUG - 块 493 生成文本: <triplet> embedding with relational mapping properties <concept> Fan M, Zhou Q, Chang E <per> discoverer</s>
|
||
2025-06-11 11:02:03,486 - DEBUG - 原始生成文本: <triplet> embedding with relational mapping properties <concept> Fan M, Zhou Q, Chang E <per> discoverer</s>
|
||
2025-06-11 11:02:03,486 - DEBUG - 处理后标记: ['<triplet>', 'embedding with relational mapping properties', '<concept>', 'Fan M, Zhou Q, Chang E', '<per>', 'discoverer']
|
||
2025-06-11 11:02:03,486 - DEBUG - 添加三元组: embedding with relational mapping properties(concept) - discoverer - Fan M, Zhou Q, Chang E(per)
|
||
2025-06-11 11:02:03,486 - DEBUG - 块 493 提取到 1 个三元组
|
||
2025-06-11 11:02:03,486 - DEBUG - 处理块 494/753: 28th Pacific Asia Conf. on Language, Information a...
|
||
2025-06-11 11:02:03,720 - DEBUG - 块 494 生成文本: <triplet> PACLIC <org> Chulalongkorn University <loc> headquarters location</s>
|
||
2025-06-11 11:02:03,720 - DEBUG - 原始生成文本: <triplet> PACLIC <org> Chulalongkorn University <loc> headquarters location</s>
|
||
2025-06-11 11:02:03,720 - DEBUG - 处理后标记: ['<triplet>', 'PACLIC', '<org>', 'Chulalongkorn University', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:03,720 - DEBUG - 添加三元组: PACLIC(org) - headquarters location - Chulalongkorn University(loc)
|
||
2025-06-11 11:02:03,720 - DEBUG - 块 494 提取到 1 个三元组
|
||
2025-06-11 11:02:03,720 - DEBUG - 处理块 495/753: [47]
|
||
Xiao H, Huang ML, Hao Y, Zhu XY. TransA: An a...
|
||
2025-06-11 11:02:04,007 - DEBUG - 块 495 生成文本: <triplet> graph embedding <concept> TransA <misc> used</s>
|
||
2025-06-11 11:02:04,007 - DEBUG - 原始生成文本: <triplet> graph embedding <concept> TransA <misc> used</s>
|
||
2025-06-11 11:02:04,007 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding', '<concept>', 'TransA', '<misc>', 'used']
|
||
2025-06-11 11:02:04,007 - DEBUG - 添加三元组: graph embedding(concept) - used - TransA(misc)
|
||
2025-06-11 11:02:04,007 - DEBUG - 块 495 提取到 1 个三元组
|
||
2025-06-11 11:02:04,007 - DEBUG - 处理块 496/753: Wang F, Sun JM. Survey on distance metric learning...
|
||
2025-06-11 11:02:04,230 - DEBUG - 块 496 生成文本: <triplet> JM. <org> Wang F <per> author</s>
|
||
2025-06-11 11:02:04,230 - DEBUG - 原始生成文本: <triplet> JM. <org> Wang F <per> author</s>
|
||
2025-06-11 11:02:04,230 - DEBUG - 处理后标记: ['<triplet>', 'JM.', '<org>', 'Wang F', '<per>', 'author']
|
||
2025-06-11 11:02:04,230 - DEBUG - 添加三元组: JM.(org) - author - Wang F(per)
|
||
2025-06-11 11:02:04,230 - DEBUG - 块 496 提取到 1 个三元组
|
||
2025-06-11 11:02:04,230 - DEBUG - 处理块 497/753: Discovery, 2015, 29(2): 534–564. [doi: 10.1007/s10...
|
||
2025-06-11 11:02:04,548 - DEBUG - 块 497 生成文本: <triplet> 564 <num> population <triplet> 534 <concept> 592 <misc> follows</s>
|
||
2025-06-11 11:02:04,549 - DEBUG - 原始生成文本: <triplet> 564 <num> population <triplet> 534 <concept> 592 <misc> follows</s>
|
||
2025-06-11 11:02:04,549 - DEBUG - 处理后标记: ['<triplet>', '564', '<num>', 'population', '<triplet>', '534', '<concept>', '592', '<misc>', 'follows']
|
||
2025-06-11 11:02:04,549 - DEBUG - 添加三元组: 564(num) - 534 - population(triplet)
|
||
2025-06-11 11:02:04,549 - DEBUG - 块 497 提取到 1 个三元组
|
||
2025-06-11 11:02:04,549 - DEBUG - 处理块 498/753: Feng J, Huang ML, Wang MD, Zhou MT, Hao Y, Zhu XY....
|
||
2025-06-11 11:02:04,697 - DEBUG - 块 498 生成文本: <triplet> graph <concept> Feng J <per> developer</s>
|
||
2025-06-11 11:02:04,697 - DEBUG - 原始生成文本: <triplet> graph <concept> Feng J <per> developer</s>
|
||
2025-06-11 11:02:04,697 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Feng J', '<per>', 'developer']
|
||
2025-06-11 11:02:04,697 - DEBUG - 添加三元组: graph(concept) - developer - Feng J(per)
|
||
2025-06-11 11:02:04,697 - DEBUG - 块 498 提取到 1 个三元组
|
||
2025-06-11 11:02:04,697 - DEBUG - 处理块 499/753: Conf. on Principles of Knowledge Representation an...
|
||
2025-06-11 11:02:05,026 - DEBUG - 块 499 生成文本: <triplet> <media> Principles of Knowledge Representation and Reasoning <concept> studies</s>
|
||
2025-06-11 11:02:05,026 - DEBUG - 原始生成文本: <triplet> <media> Principles of Knowledge Representation and Reasoning <concept> studies</s>
|
||
2025-06-11 11:02:05,026 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Principles of Knowledge Representation and Reasoning', '<concept>', 'studies']
|
||
2025-06-11 11:02:05,026 - DEBUG - 处理块 500/753: Xie QZ, Ma XZ, Dai ZH, Hovy E. An interpretable kn...
|
||
2025-06-11 11:02:05,473 - DEBUG - 块 500 生成文本: <triplet> ZH, Hovy E. An interpretable knowledge transfer model for knowledge base completion <concept> Xie QZ, Ma XZ <per> discoverer</s>
|
||
2025-06-11 11:02:05,474 - DEBUG - 原始生成文本: <triplet> ZH, Hovy E. An interpretable knowledge transfer model for knowledge base completion <concept> Xie QZ, Ma XZ <per> discoverer</s>
|
||
2025-06-11 11:02:05,474 - DEBUG - 处理后标记: ['<triplet>', 'ZH, Hovy E. An interpretable knowledge transfer model for knowledge base completion', '<concept>', 'Xie QZ, Ma XZ', '<per>', 'discoverer']
|
||
2025-06-11 11:02:05,474 - DEBUG - 添加三元组: ZH, Hovy E. An interpretable knowledge transfer model for knowledge base completion(concept) - discoverer - Xie QZ, Ma XZ(per)
|
||
2025-06-11 11:02:05,474 - DEBUG - 块 500 提取到 1 个三元组
|
||
2025-06-11 11:02:05,474 - DEBUG - 处理块 501/753: 张天成 等: 知识图谱嵌入技术研究综述 305
|
||
...
|
||
2025-06-11 11:02:05,728 - DEBUG - 块 501 生成文本: <triplet> 知识图谱嵌入技术研究综述 <concept> 张天成 <per> author</s>
|
||
2025-06-11 11:02:05,728 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术研究综述 <concept> 张天成 <per> author</s>
|
||
2025-06-11 11:02:05,728 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术研究综述', '<concept>', '张天成', '<per>', 'author']
|
||
2025-06-11 11:02:05,728 - DEBUG - 添加三元组: 知识图谱嵌入技术研究综述(concept) - author - 张天成(per)
|
||
2025-06-11 11:02:05,728 - DEBUG - 块 501 提取到 1 个三元组
|
||
2025-06-11 11:02:05,728 - DEBUG - 处理块 502/753: Annual Meeting of the Association for Computationa...
|
||
2025-06-11 11:02:06,110 - DEBUG - 块 502 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:06,111 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:06,111 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:06,111 - DEBUG - 处理块 503/753: 2017. 950–962. [doi: 10.18653/v1/P17-1088]
|
||
...
|
||
2025-06-11 11:02:06,430 - DEBUG - 块 503 生成文本: <triplet> <concept> 1088 <date> point in time</s>
|
||
2025-06-11 11:02:06,430 - DEBUG - 原始生成文本: <triplet> <concept> 1088 <date> point in time</s>
|
||
2025-06-11 11:02:06,430 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1088', '<date>', 'point in time']
|
||
2025-06-11 11:02:06,430 - DEBUG - 处理块 504/753: Qian W, Fu C, Zhu Y, Cai D, He XF. Translating emb...
|
||
2025-06-11 11:02:07,113 - DEBUG - 块 504 生成文本: <triplet> graph completion with relation attention mechanism <concept> Qian W, Fu C, Zhu Y, He XF.Translating <media> <misc> <triplet> HeXF,Heat.Computer.In <unk> embeddings for knowledge <eve> <dis> <date> point in</s>
|
||
2025-06-11 11:02:07,113 - DEBUG - 原始生成文本: <triplet> graph completion with relation attention mechanism <concept> Qian W, Fu C, Zhu Y, He XF.Translating <media> <misc> <triplet> HeXF,Heat.Computer.In <unk> embeddings for knowledge <eve> <dis> <date> point in</s>
|
||
2025-06-11 11:02:07,113 - DEBUG - 处理后标记: ['<triplet>', 'graph completion with relation attention mechanism', '<concept>', 'Qian W, Fu C, Zhu Y, He XF.Translating', '<media>', '<misc>', '<triplet>', 'HeXF,Heat.Computer.In', '<unk>', 'embeddings for knowledge', '<eve>', '<dis>', '<date>', 'point in']
|
||
2025-06-11 11:02:07,113 - DEBUG - 添加三元组: graph completion with relation attention mechanism(concept) - <misc> - Qian W, Fu C, Zhu Y, He XF.Translating(media)
|
||
2025-06-11 11:02:07,113 - DEBUG - 添加三元组: HeXF,Heat.Computer.In(unk) - <dis> - embeddings for knowledge(eve)
|
||
2025-06-11 11:02:07,113 - DEBUG - 块 504 提取到 2 个三元组
|
||
2025-06-11 11:02:07,113 - DEBUG - 处理块 505/753: Proc. of the 27th Int’l Joint Conf. on Artificial ...
|
||
2025-06-11 11:02:07,474 - DEBUG - 块 505 生成文本: <triplet> IJCAI <media> Stockholm <loc> location</s>
|
||
2025-06-11 11:02:07,474 - DEBUG - 原始生成文本: <triplet> IJCAI <media> Stockholm <loc> location</s>
|
||
2025-06-11 11:02:07,474 - DEBUG - 处理后标记: ['<triplet>', 'IJCAI', '<media>', 'Stockholm', '<loc>', 'location']
|
||
2025-06-11 11:02:07,474 - DEBUG - 添加三元组: IJCAI(media) - location - Stockholm(loc)
|
||
2025-06-11 11:02:07,474 - DEBUG - 块 505 提取到 1 个三元组
|
||
2025-06-11 11:02:07,474 - DEBUG - 处理块 506/753: Yang SH, Tian JD, Zhang HL, Yan JC, He H, Jin YH. ...
|
||
2025-06-11 11:02:07,740 - DEBUG - 块 506 生成文本: <triplet> <media> TransMS <misc> part of <triplet> Transms <loc> graph embedding <concept> use</s>
|
||
2025-06-11 11:02:07,740 - DEBUG - 原始生成文本: <triplet> <media> TransMS <misc> part of <triplet> Transms <loc> graph embedding <concept> use</s>
|
||
2025-06-11 11:02:07,740 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'TransMS', '<misc>', 'part of', '<triplet>', 'Transms', '<loc>', 'graph embedding', '<concept>', 'use']
|
||
2025-06-11 11:02:07,740 - DEBUG - 处理块 507/753: semantics. In: Proc. of the 28th Int’l Joint Conf....
|
||
2025-06-11 11:02:07,901 - DEBUG - 块 507 生成文本: <triplet> IJCAI <media> Artificial Intelligence <concept> main subject</s>
|
||
2025-06-11 11:02:07,901 - DEBUG - 原始生成文本: <triplet> IJCAI <media> Artificial Intelligence <concept> main subject</s>
|
||
2025-06-11 11:02:07,901 - DEBUG - 处理后标记: ['<triplet>', 'IJCAI', '<media>', 'Artificial Intelligence', '<concept>', 'main subject']
|
||
2025-06-11 11:02:07,901 - DEBUG - 添加三元组: IJCAI(media) - main subject - Artificial Intelligence(concept)
|
||
2025-06-11 11:02:07,901 - DEBUG - 块 507 提取到 1 个三元组
|
||
2025-06-11 11:02:07,902 - DEBUG - 处理块 508/753: ijcai.2019/268]
|
||
[53]
|
||
Ji SX, Pan SR, Cambria E, Mar...
|
||
2025-06-11 11:02:08,051 - DEBUG - 块 508 生成文本: <triplet> graphs <concept> knowledge <misc> studies</s>
|
||
2025-06-11 11:02:08,051 - DEBUG - 原始生成文本: <triplet> graphs <concept> knowledge <misc> studies</s>
|
||
2025-06-11 11:02:08,051 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'knowledge', '<misc>', 'studies']
|
||
2025-06-11 11:02:08,051 - DEBUG - 添加三元组: graphs(concept) - studies - knowledge(misc)
|
||
2025-06-11 11:02:08,051 - DEBUG - 块 508 提取到 1 个三元组
|
||
2025-06-11 11:02:08,051 - DEBUG - 处理块 509/753: Trans. on Neural Networks and Learning Systems, 20...
|
||
2025-06-11 11:02:08,520 - DEBUG - 块 509 生成文本: <triplet> 494–514. <concept> Trans. on Neural Networks and Learning Systems <media> published in <triplet> 33(2): <misc> 트리.on <org> publisher</s>
|
||
2025-06-11 11:02:08,520 - DEBUG - 原始生成文本: <triplet> 494–514. <concept> Trans. on Neural Networks and Learning Systems <media> published in <triplet> 33(2): <misc> 트리.on <org> publisher</s>
|
||
2025-06-11 11:02:08,520 - DEBUG - 处理后标记: ['<triplet>', '494–514.', '<concept>', 'Trans. on Neural Networks and Learning Systems', '<media>', 'published in', '<triplet>', '33(2):', '<misc>', '트리.on', '<org>', 'publisher']
|
||
2025-06-11 11:02:08,520 - DEBUG - 添加三元组: 494–514.(concept) - published in - Trans. on Neural Networks and Learning Systems(media)
|
||
2025-06-11 11:02:08,521 - DEBUG - 添加三元组: 33(2):(misc) - publisher - 트리.on(org)
|
||
2025-06-11 11:02:08,521 - DEBUG - 块 509 提取到 2 个三元组
|
||
2025-06-11 11:02:08,521 - DEBUG - 处理块 510/753: Xiao H, Huang ML, Zhu XY. From one point to a mani...
|
||
2025-06-11 11:02:09,139 - DEBUG - 块 510 生成文本: <triplet> ML <per> Zhu <org> field of work</s>
|
||
2025-06-11 11:02:09,139 - DEBUG - 原始生成文本: <triplet> ML <per> Zhu <org> field of work</s>
|
||
2025-06-11 11:02:09,139 - DEBUG - 处理后标记: ['<triplet>', 'ML', '<per>', 'Zhu', '<org>', 'field of work']
|
||
2025-06-11 11:02:09,139 - DEBUG - 添加三元组: ML(per) - field of work - Zhu(org)
|
||
2025-06-11 11:02:09,139 - DEBUG - 块 510 提取到 1 个三元组
|
||
2025-06-11 11:02:09,139 - DEBUG - 处理块 511/753: 25th Int’l Joint Conf. on Artificial Intelligence....
|
||
2025-06-11 11:02:09,297 - DEBUG - 块 511 生成文本: <triplet> <eve> AAAI Press <org> organizer</s>
|
||
2025-06-11 11:02:09,298 - DEBUG - 原始生成文本: <triplet> <eve> AAAI Press <org> organizer</s>
|
||
2025-06-11 11:02:09,298 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'AAAI Press', '<org>', 'organizer']
|
||
2025-06-11 11:02:09,298 - DEBUG - 处理块 512/753: Ebisu T, Ichise R. TorusE: Knowledge graph embeddi...
|
||
2025-06-11 11:02:09,991 - DEBUG - 块 512 生成文本: <triplet> graph <concept> Ebisu T, Ichise R. TorusE: Knowledge embedding on a lie group. In: Proc. of the 32nd AAAI Conf. on Artificial Intelligence.In <media> 32th <date> publication date</s>
|
||
2025-06-11 11:02:09,991 - DEBUG - 原始生成文本: <triplet> graph <concept> Ebisu T, Ichise R. TorusE: Knowledge embedding on a lie group. In: Proc. of the 32nd AAAI Conf. on Artificial Intelligence.In <media> 32th <date> publication date</s>
|
||
2025-06-11 11:02:09,992 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Ebisu T, Ichise R. TorusE: Knowledge embedding on a lie group. In: Proc. of the 32nd AAAI Conf. on Artificial Intelligence.In', '<media>', '32th', '<date>', 'publication date']
|
||
2025-06-11 11:02:09,992 - DEBUG - 添加三元组: graph(concept) - 32th - Ebisu T, Ichise R. TorusE: Knowledge embedding on a lie group. In: Proc. of the 32nd AAAI Conf. on Artificial Intelligence.In(media)
|
||
2025-06-11 11:02:09,992 - DEBUG - 块 512 提取到 1 个三元组
|
||
2025-06-11 11:02:09,992 - DEBUG - 处理块 513/753: (AAAI). New Orleans: AAAI Press, 2018. 1819–1826.
|
||
...
|
||
2025-06-11 11:02:10,246 - DEBUG - 块 513 生成文本: <triplet> <loc> 1819 <date> inception <triplet> AAAI Press <media> AAAAI <org> owned by</s>
|
||
2025-06-11 11:02:10,246 - DEBUG - 原始生成文本: <triplet> <loc> 1819 <date> inception <triplet> AAAI Press <media> AAAAI <org> owned by</s>
|
||
2025-06-11 11:02:10,246 - DEBUG - 处理后标记: ['<triplet>', '<loc>', '1819', '<date>', 'inception', '<triplet>', 'AAAI Press', '<media>', 'AAAAI', '<org>', 'owned by']
|
||
2025-06-11 11:02:10,247 - DEBUG - 处理块 514/753: He SZ, Liu K, Ji GL, Zhao J. Learning to represent...
|
||
2025-06-11 11:02:10,501 - DEBUG - 块 514 生成文本: <triplet> graph <concept> He SZ <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:10,501 - DEBUG - 原始生成文本: <triplet> graph <concept> He SZ <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:10,502 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'He SZ', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:02:10,502 - DEBUG - 添加三元组: graph(concept) - discoverer or inventor - He SZ(per)
|
||
2025-06-11 11:02:10,502 - DEBUG - 块 514 提取到 1 个三元组
|
||
2025-06-11 11:02:10,502 - DEBUG - 处理块 515/753: on Information and Knowledge Management (CIKM). Me...
|
||
2025-06-11 11:02:10,725 - DEBUG - 块 515 生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:10,725 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:10,725 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:02:10,725 - DEBUG - 处理块 516/753: Xiao H, Huang ML, Zhu XY. TransG: A generative mod...
|
||
2025-06-11 11:02:11,150 - DEBUG - 块 516 生成文本: <triplet> XY.TransG <misc> generative model <concept> instance of the 54th Annual Meeting <eve> participant</s>
|
||
2025-06-11 11:02:11,150 - DEBUG - 原始生成文本: <triplet> XY.TransG <misc> generative model <concept> instance of the 54th Annual Meeting <eve> participant</s>
|
||
2025-06-11 11:02:11,150 - DEBUG - 处理后标记: ['<triplet>', 'XY.TransG', '<misc>', 'generative model', '<concept>', 'instance of the 54th Annual Meeting', '<eve>', 'participant']
|
||
2025-06-11 11:02:11,150 - DEBUG - 添加三元组: XY.TransG(misc) - instance of the 54th Annual Meeting - generative model(concept)
|
||
2025-06-11 11:02:11,151 - DEBUG - 块 516 提取到 1 个三元组
|
||
2025-06-11 11:02:11,151 - DEBUG - 处理块 517/753: Association for Computational Linguistics. Berlin:...
|
||
2025-06-11 11:02:11,330 - DEBUG - 块 517 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:11,331 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:11,331 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:11,331 - DEBUG - 处理块 518/753: [58]
|
||
Griffiths TL, Ghahramani Z. The Indian buffet...
|
||
2025-06-11 11:02:11,682 - DEBUG - 块 518 生成文本: <triplet> <concept> The Journal of Machine Learning Research <media> published in</s>
|
||
2025-06-11 11:02:11,682 - DEBUG - 原始生成文本: <triplet> <concept> The Journal of Machine Learning Research <media> published in</s>
|
||
2025-06-11 11:02:11,682 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'The Journal of Machine Learning Research', '<media>', 'published in']
|
||
2025-06-11 11:02:11,682 - DEBUG - 处理块 519/753: 12: 1185–1224.
|
||
[59]
|
||
...
|
||
2025-06-11 11:02:11,883 - DEBUG - 块 519 生成文本: <triplet> <loc> country <triplet> 1224 <time> 1223 <date> point in time</s>
|
||
2025-06-11 11:02:11,883 - DEBUG - 原始生成文本: <triplet> <loc> country <triplet> 1224 <time> 1223 <date> point in time</s>
|
||
2025-06-11 11:02:11,883 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'country', '<triplet>', '1224', '<time>', '1223', '<date>', 'point in time']
|
||
2025-06-11 11:02:11,883 - DEBUG - 处理块 520/753: Blei DM, Griffiths TL, Jordan MI. The nested Chine...
|
||
2025-06-11 11:02:12,160 - DEBUG - 块 520 生成文本: <triplet> <concept> Chinese restaurant process and bayesian nonparametric inference of topic hierarchies <media> subclass of</s>
|
||
2025-06-11 11:02:12,160 - DEBUG - 原始生成文本: <triplet> <concept> Chinese restaurant process and bayesian nonparametric inference of topic hierarchies <media> subclass of</s>
|
||
2025-06-11 11:02:12,160 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Chinese restaurant process and bayesian nonparametric inference of topic hierarchies', '<media>', 'subclass of']
|
||
2025-06-11 11:02:12,160 - DEBUG - 处理块 521/753: Journal of the ACM, 2010, 57(2): 7. [doi: 10.1145/...
|
||
2025-06-11 11:02:12,512 - DEBUG - 块 521 生成文本: <triplet> <concept> ACM <org> part of <triplet> Journal of the A CM <media> ALM <loc> publisher</s>
|
||
2025-06-11 11:02:12,513 - DEBUG - 原始生成文本: <triplet> <concept> ACM <org> part of <triplet> Journal of the A CM <media> ALM <loc> publisher</s>
|
||
2025-06-11 11:02:12,513 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM', '<org>', 'part of', '<triplet>', 'Journal of the A CM', '<media>', 'ALM', '<loc>', 'publisher']
|
||
2025-06-11 11:02:12,513 - DEBUG - 处理块 522/753: Aldous DJ. Exchangeability and related topics. In:...
|
||
2025-06-11 11:02:12,693 - DEBUG - 块 522 生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:02:12,693 - DEBUG - 原始生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:02:12,694 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Berlin', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:12,694 - DEBUG - 处理块 523/753: Springer, 1985. 1–198. [doi: 10.1007/BFb0099421]
|
||
[...
|
||
2025-06-11 11:02:12,842 - DEBUG - 块 523 生成文本: <triplet> <concept> BFb0099421 <dis> instance of</s>
|
||
2025-06-11 11:02:12,842 - DEBUG - 原始生成文本: <triplet> <concept> BFb0099421 <dis> instance of</s>
|
||
2025-06-11 11:02:12,842 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'BFb0099421', '<dis>', 'instance of']
|
||
2025-06-11 11:02:12,842 - DEBUG - 处理块 524/753: Sutskever I, Salakhutdinov R, Tenenbaum JB. Modell...
|
||
2025-06-11 11:02:13,215 - DEBUG - 块 524 生成文本: <triplet> <misc> relational data <concept> subclass of</s>
|
||
2025-06-11 11:02:13,215 - DEBUG - 原始生成文本: <triplet> <misc> relational data <concept> subclass of</s>
|
||
2025-06-11 11:02:13,215 - DEBUG - 处理后标记: ['<triplet>', '<misc>', 'relational data', '<concept>', 'subclass of']
|
||
2025-06-11 11:02:13,215 - DEBUG - 处理块 525/753: 22nd Int’l Conf. on Neural Information Processing ...
|
||
2025-06-11 11:02:13,406 - DEBUG - 块 525 生成文本: <triplet> Associates Inc. <org> Vancouver <loc> headquarters location</s>
|
||
2025-06-11 11:02:13,406 - DEBUG - 原始生成文本: <triplet> Associates Inc. <org> Vancouver <loc> headquarters location</s>
|
||
2025-06-11 11:02:13,406 - DEBUG - 处理后标记: ['<triplet>', 'Associates Inc.', '<org>', 'Vancouver', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:13,406 - DEBUG - 添加三元组: Associates Inc.(org) - headquarters location - Vancouver(loc)
|
||
2025-06-11 11:02:13,406 - DEBUG - 块 525 提取到 1 个三元组
|
||
2025-06-11 11:02:13,406 - DEBUG - 处理块 526/753: Jenatton R, Le Roux N, Bordes A, Obozinski G. A la...
|
||
2025-06-11 11:02:13,746 - DEBUG - 块 526 生成文本: <triplet> <per> Jenatton R, Le Roux N, Bordes A, Obozinski G. A latent factor model <concept> notable work</s>
|
||
2025-06-11 11:02:13,746 - DEBUG - 原始生成文本: <triplet> <per> Jenatton R, Le Roux N, Bordes A, Obozinski G. A latent factor model <concept> notable work</s>
|
||
2025-06-11 11:02:13,746 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'Jenatton R, Le Roux N, Bordes A, Obozinski G. A latent factor model', '<concept>', 'notable work']
|
||
2025-06-11 11:02:13,746 - DEBUG - 处理块 527/753: on Neural Information Processing Systems (NIPS). L...
|
||
2025-06-11 11:02:13,927 - DEBUG - 块 527 生成文本: <triplet> <concept> Neural Information Processing Systems <misc> studies</s>
|
||
2025-06-11 11:02:13,927 - DEBUG - 原始生成文本: <triplet> <concept> Neural Information Processing Systems <misc> studies</s>
|
||
2025-06-11 11:02:13,927 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Neural Information Processing Systems', '<misc>', 'studies']
|
||
2025-06-11 11:02:13,927 - DEBUG - 处理块 528/753: Carroll JD, Chang JJ. Analysis of individual diffe...
|
||
2025-06-11 11:02:14,087 - DEBUG - 块 528 生成文本: <triplet> JD <media> Chang JJ <org> award received</s>
|
||
2025-06-11 11:02:14,087 - DEBUG - 原始生成文本: <triplet> JD <media> Chang JJ <org> award received</s>
|
||
2025-06-11 11:02:14,087 - DEBUG - 处理后标记: ['<triplet>', 'JD', '<media>', 'Chang JJ', '<org>', 'award received']
|
||
2025-06-11 11:02:14,087 - DEBUG - 添加三元组: JD(media) - award received - Chang JJ(org)
|
||
2025-06-11 11:02:14,087 - DEBUG - 块 528 提取到 1 个三元组
|
||
2025-06-11 11:02:14,087 - DEBUG - 处理块 529/753: decomposition. Psychometrika, 1970, 35(3): 283–319...
|
||
2025-06-11 11:02:14,235 - DEBUG - 块 529 生成文本: <triplet> <concept> BF02310791 <misc> part of</s>
|
||
2025-06-11 11:02:14,235 - DEBUG - 原始生成文本: <triplet> <concept> BF02310791 <misc> part of</s>
|
||
2025-06-11 11:02:14,235 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'BF02310791', '<misc>', 'part of']
|
||
2025-06-11 11:02:14,235 - DEBUG - 处理块 530/753: Nickel M, Rosasco L, Poggio TA. Holographic embedd...
|
||
2025-06-11 11:02:14,929 - DEBUG - 块 530 生成文本: <triplet> graphs <concept> Holographic embeddings of knowledge <misc> part of</s>
|
||
2025-06-11 11:02:14,929 - DEBUG - 原始生成文本: <triplet> graphs <concept> Holographic embeddings of knowledge <misc> part of</s>
|
||
2025-06-11 11:02:14,929 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Holographic embeddings of knowledge', '<misc>', 'part of']
|
||
2025-06-11 11:02:14,929 - DEBUG - 添加三元组: graphs(concept) - part of - Holographic embeddings of knowledge(misc)
|
||
2025-06-11 11:02:14,929 - DEBUG - 块 530 提取到 1 个三元组
|
||
2025-06-11 11:02:14,929 - DEBUG - 处理块 531/753: Intelligence (AAAI). Phoenix: AAAI Press, 2016. 19...
|
||
2025-06-11 11:02:15,162 - DEBUG - 块 531 生成文本: <triplet> <concept> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:02:15,162 - DEBUG - 原始生成文本: <triplet> <concept> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:02:15,162 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'AAAI Press', '<org>', 'publisher']
|
||
2025-06-11 11:02:15,162 - DEBUG - 处理块 532/753: Trouillon T, Welbl J, Riedel S, Gaussier É, Boucha...
|
||
2025-06-11 11:02:15,535 - DEBUG - 块 532 生成文本: <triplet> embeddings for simple link prediction</s>
|
||
2025-06-11 11:02:15,535 - DEBUG - 原始生成文本: <triplet> embeddings for simple link prediction</s>
|
||
2025-06-11 11:02:15,535 - DEBUG - 处理后标记: ['<triplet>', 'embeddings for simple link prediction']
|
||
2025-06-11 11:02:15,535 - DEBUG - 处理块 533/753: Conf. on Machine Learning (ICML). New York: JMLR, ...
|
||
2025-06-11 11:02:15,918 - DEBUG - 块 533 生成文本: <triplet> JMLR <org> New York <loc> location</s>
|
||
2025-06-11 11:02:15,918 - DEBUG - 原始生成文本: <triplet> JMLR <org> New York <loc> location</s>
|
||
2025-06-11 11:02:15,918 - DEBUG - 处理后标记: ['<triplet>', 'JMLR', '<org>', 'New York', '<loc>', 'location']
|
||
2025-06-11 11:02:15,918 - DEBUG - 添加三元组: JMLR(org) - location - New York(loc)
|
||
2025-06-11 11:02:15,918 - DEBUG - 块 533 提取到 1 个三元组
|
||
2025-06-11 11:02:15,918 - DEBUG - 处理块 534/753: Hayashi K, Shimbo M. On the equivalence of hologra...
|
||
2025-06-11 11:02:16,173 - DEBUG - 块 534 生成文本: <triplet> <concept> Proc. <media> part of the series</s>
|
||
2025-06-11 11:02:16,173 - DEBUG - 原始生成文本: <triplet> <concept> Proc. <media> part of the series</s>
|
||
2025-06-11 11:02:16,173 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Proc.', '<media>', 'part of the series']
|
||
2025-06-11 11:02:16,173 - DEBUG - 处理块 535/753: Meeting of the Association for Computational Lingu...
|
||
2025-06-11 11:02:16,448 - DEBUG - 块 535 生成文本: <triplet> <media> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:02:16,449 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:02:16,449 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'main subject']
|
||
2025-06-11 11:02:16,449 - DEBUG - 处理块 536/753: 554–559. [doi: 10.18653/v1/P17-2088]
|
||
[67]
|
||
...
|
||
2025-06-11 11:02:16,735 - DEBUG - 块 536 生成文本: <triplet> 559. <concept> 1065 <date> point in time</s>
|
||
2025-06-11 11:02:16,735 - DEBUG - 原始生成文本: <triplet> 559. <concept> 1065 <date> point in time</s>
|
||
2025-06-11 11:02:16,735 - DEBUG - 处理后标记: ['<triplet>', '559.', '<concept>', '1065', '<date>', 'point in time']
|
||
2025-06-11 11:02:16,735 - DEBUG - 添加三元组: 559.(concept) - point in time - 1065(date)
|
||
2025-06-11 11:02:16,735 - DEBUG - 块 536 提取到 1 个三元组
|
||
2025-06-11 11:02:16,735 - DEBUG - 处理块 537/753: Liu HX, Wu YX, Yang YM. Analogical inference for m...
|
||
2025-06-11 11:02:16,969 - DEBUG - 块 537 生成文本: <triplet> YM. <org> Liu HX <per> author</s>
|
||
2025-06-11 11:02:16,969 - DEBUG - 原始生成文本: <triplet> YM. <org> Liu HX <per> author</s>
|
||
2025-06-11 11:02:16,969 - DEBUG - 处理后标记: ['<triplet>', 'YM.', '<org>', 'Liu HX', '<per>', 'author']
|
||
2025-06-11 11:02:16,969 - DEBUG - 添加三元组: YM.(org) - author - Liu HX(per)
|
||
2025-06-11 11:02:16,969 - DEBUG - 块 537 提取到 1 个三元组
|
||
2025-06-11 11:02:16,969 - DEBUG - 处理块 538/753: Learning (ICML). Sydney: PMLR, 2017. 2168–2178.
|
||
[6...
|
||
2025-06-11 11:02:17,106 - DEBUG - 块 538 生成文本: <triplet> <concept> Learning (ICML) <media> based on</s>
|
||
2025-06-11 11:02:17,106 - DEBUG - 原始生成文本: <triplet> <concept> Learning (ICML) <media> based on</s>
|
||
2025-06-11 11:02:17,106 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Learning (ICML)', '<media>', 'based on']
|
||
2025-06-11 11:02:17,107 - DEBUG - 处理块 539/753: Hitchcock FL. The expression of a tensor or a poly...
|
||
2025-06-11 11:02:17,503 - DEBUG - 块 539 生成文本: <triplet> <concept> sum of products. Journal of Mathematics and Physics, 1927 <media> part of product <triplet> sum <unk> sums <misc> subclass of quantity</s>
|
||
2025-06-11 11:02:17,503 - DEBUG - 原始生成文本: <triplet> <concept> sum of products. Journal of Mathematics and Physics, 1927 <media> part of product <triplet> sum <unk> sums <misc> subclass of quantity</s>
|
||
2025-06-11 11:02:17,503 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'sum of products. Journal of Mathematics and Physics, 1927', '<media>', 'part of product', '<triplet>', 'sum', '<unk>', 'sums', '<misc>', 'subclass of quantity']
|
||
2025-06-11 11:02:17,503 - DEBUG - 处理块 540/753: 164–189. [doi: 10.1002/sapm192761164]
|
||
[69]
|
||
...
|
||
2025-06-11 11:02:17,748 - DEBUG - 块 540 生成文本: <triplet> <concept> <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:17,748 - DEBUG - 原始生成文本: <triplet> <concept> <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:17,748 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:02:17,748 - DEBUG - 处理块 541/753: Kazemi SM, Poole D. SimplE embedding for link pred...
|
||
2025-06-11 11:02:18,078 - DEBUG - 块 541 生成文本: <triplet> embedding for link prediction in knowledge graphs <concept> Kazemi SM, Poole <per> author</s>
|
||
2025-06-11 11:02:18,078 - DEBUG - 原始生成文本: <triplet> embedding for link prediction in knowledge graphs <concept> Kazemi SM, Poole <per> author</s>
|
||
2025-06-11 11:02:18,078 - DEBUG - 处理后标记: ['<triplet>', 'embedding for link prediction in knowledge graphs', '<concept>', 'Kazemi SM, Poole', '<per>', 'author']
|
||
2025-06-11 11:02:18,078 - DEBUG - 添加三元组: embedding for link prediction in knowledge graphs(concept) - author - Kazemi SM, Poole(per)
|
||
2025-06-11 11:02:18,078 - DEBUG - 块 541 提取到 1 个三元组
|
||
2025-06-11 11:02:18,078 - DEBUG - 处理块 542/753: Information Processing Systems (NIPS). Montréal: C...
|
||
2025-06-11 11:02:18,226 - DEBUG - 块 542 生成文本: <triplet> Associates <org> Montréal <loc> headquarters location</s>
|
||
2025-06-11 11:02:18,226 - DEBUG - 原始生成文本: <triplet> Associates <org> Montréal <loc> headquarters location</s>
|
||
2025-06-11 11:02:18,226 - DEBUG - 处理后标记: ['<triplet>', 'Associates', '<org>', 'Montréal', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:18,226 - DEBUG - 添加三元组: Associates(org) - headquarters location - Montréal(loc)
|
||
2025-06-11 11:02:18,226 - DEBUG - 块 542 提取到 1 个三元组
|
||
2025-06-11 11:02:18,227 - DEBUG - 处理块 543/753: García-Durán A, Bordes A, Usunier N. Effective ble...
|
||
2025-06-11 11:02:18,407 - DEBUG - 块 543 生成文本: <triplet> <per> García-Durán A <org> notable work</s>
|
||
2025-06-11 11:02:18,407 - DEBUG - 原始生成文本: <triplet> <per> García-Durán A <org> notable work</s>
|
||
2025-06-11 11:02:18,407 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'García-Durán A', '<org>', 'notable work']
|
||
2025-06-11 11:02:18,407 - DEBUG - 处理块 544/753: of the 2014 European Conf. on Machine Learning and...
|
||
2025-06-11 11:02:18,853 - DEBUG - 块 544 生成文本: <triplet> 434–449. <concept> 2014 European Conf. on Machine Learning and Knowledge Discovery in Databases. Nancy <org> 2014 <date> publication date</s>
|
||
2025-06-11 11:02:18,854 - DEBUG - 原始生成文本: <triplet> 434–449. <concept> 2014 European Conf. on Machine Learning and Knowledge Discovery in Databases. Nancy <org> 2014 <date> publication date</s>
|
||
2025-06-11 11:02:18,854 - DEBUG - 处理后标记: ['<triplet>', '434–449.', '<concept>', '2014 European Conf. on Machine Learning and Knowledge Discovery in Databases. Nancy', '<org>', '2014', '<date>', 'publication date']
|
||
2025-06-11 11:02:18,854 - DEBUG - 添加三元组: 434–449.(concept) - 2014 - 2014 European Conf. on Machine Learning and Knowledge Discovery in Databases. Nancy(org)
|
||
2025-06-11 11:02:18,854 - DEBUG - 块 544 提取到 1 个三元组
|
||
2025-06-11 11:02:18,854 - DEBUG - 处理块 545/753: 1007/978-3-662-44848-9_28]
|
||
[71]
|
||
...
|
||
2025-06-11 11:02:19,044 - DEBUG - 块 545 生成文本: <triplet> 44848-9_28 <concept> 662 <num> number of participants</s>
|
||
2025-06-11 11:02:19,045 - DEBUG - 原始生成文本: <triplet> 44848-9_28 <concept> 662 <num> number of participants</s>
|
||
2025-06-11 11:02:19,045 - DEBUG - 处理后标记: ['<triplet>', '44848-9_28', '<concept>', '662', '<num>', 'number of participants']
|
||
2025-06-11 11:02:19,045 - DEBUG - 添加三元组: 44848-9_28(concept) - number of participants - 662(num)
|
||
2025-06-11 11:02:19,045 - DEBUG - 块 545 提取到 1 个三元组
|
||
2025-06-11 11:02:19,045 - DEBUG - 处理块 546/753: Balazevic I, Allen C, Hospedales T. TuckER: Tensor...
|
||
2025-06-11 11:02:19,673 - DEBUG - 块 546 生成文本: <triplet> graph completion <concept> Balazevic I, Allen C, Hospedales T. TuckER: Tensor factorization for knowledge <media> based on</s>
|
||
2025-06-11 11:02:19,673 - DEBUG - 原始生成文本: <triplet> graph completion <concept> Balazevic I, Allen C, Hospedales T. TuckER: Tensor factorization for knowledge <media> based on</s>
|
||
2025-06-11 11:02:19,673 - DEBUG - 处理后标记: ['<triplet>', 'graph completion', '<concept>', 'Balazevic I, Allen C, Hospedales T. TuckER: Tensor factorization for knowledge', '<media>', 'based on']
|
||
2025-06-11 11:02:19,674 - DEBUG - 添加三元组: graph completion(concept) - based on - Balazevic I, Allen C, Hospedales T. TuckER: Tensor factorization for knowledge(media)
|
||
2025-06-11 11:02:19,674 - DEBUG - 块 546 提取到 1 个三元组
|
||
2025-06-11 11:02:19,674 - DEBUG - 处理块 547/753: Empirical Methods in Natural Language Processing a...
|
||
2025-06-11 11:02:19,854 - DEBUG - 块 547 生成文本: <triplet> <concept> Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:02:19,854 - DEBUG - 原始生成文本: <triplet> <concept> Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:02:19,854 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Empirical Methods in Natural Language Processing', '<media>', 'studies']
|
||
2025-06-11 11:02:19,854 - DEBUG - 处理块 548/753: 306 软件学报 2023年第 34卷第 1期
|
||
Kong: Association for Co...
|
||
2025-06-11 11:02:20,364 - DEBUG - 块 548 生成文本: <triplet> 软件学报 2023年第 34卷 <unk> 期刊 <concept> instance of</s>
|
||
2025-06-11 11:02:20,364 - DEBUG - 原始生成文本: <triplet> 软件学报 2023年第 34卷 <unk> 期刊 <concept> instance of</s>
|
||
2025-06-11 11:02:20,365 - DEBUG - 处理后标记: ['<triplet>', '软件学报 2023年第 34卷', '<unk>', '期刊', '<concept>', 'instance of']
|
||
2025-06-11 11:02:20,365 - DEBUG - 添加三元组: 软件学报 2023年第 34卷(unk) - instance of - 期刊(concept)
|
||
2025-06-11 11:02:20,365 - DEBUG - 块 548 提取到 1 个三元组
|
||
2025-06-11 11:02:20,365 - DEBUG - 处理块 549/753: Fan M, Zhao DL, Zhou Q, Liu ZY, Zheng TF, Chang EY...
|
||
2025-06-11 11:02:20,588 - DEBUG - 块 549 生成文本: <triplet> <media> Proc. <concept> instance of <triplet> Proc <org> Procter <per> author</s>
|
||
2025-06-11 11:02:20,588 - DEBUG - 原始生成文本: <triplet> <media> Proc. <concept> instance of <triplet> Proc <org> Procter <per> author</s>
|
||
2025-06-11 11:02:20,588 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Proc.', '<concept>', 'instance of', '<triplet>', 'Proc', '<org>', 'Procter', '<per>', 'author']
|
||
2025-06-11 11:02:20,588 - DEBUG - 处理块 550/753: the 52nd Annual Meeting of the Association ...
|
||
2025-06-11 11:02:20,970 - DEBUG - 块 550 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:20,970 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:20,970 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:20,970 - DEBUG - 处理块 551/753: Linguistics (ACL), 2014. 839–849. [doi: 10.3115/v1...
|
||
2025-06-11 11:02:21,130 - DEBUG - 块 551 生成文本: <triplet> 849. <concept> ACL <org> publisher</s>
|
||
2025-06-11 11:02:21,130 - DEBUG - 原始生成文本: <triplet> 849. <concept> ACL <org> publisher</s>
|
||
2025-06-11 11:02:21,130 - DEBUG - 处理后标记: ['<triplet>', '849.', '<concept>', 'ACL', '<org>', 'publisher']
|
||
2025-06-11 11:02:21,130 - DEBUG - 添加三元组: 849.(concept) - publisher - ACL(org)
|
||
2025-06-11 11:02:21,130 - DEBUG - 块 551 提取到 1 个三元组
|
||
2025-06-11 11:02:21,130 - DEBUG - 处理块 552/753: Tresp V, Huang Y, Bundschus M, Rettinger A. Materi...
|
||
2025-06-11 11:02:21,428 - DEBUG - 块 552 生成文本: <triplet> <concept> ESWC Workshop on <media> part of</s>
|
||
2025-06-11 11:02:21,428 - DEBUG - 原始生成文本: <triplet> <concept> ESWC Workshop on <media> part of</s>
|
||
2025-06-11 11:02:21,428 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ESWC Workshop on', '<media>', 'part of']
|
||
2025-06-11 11:02:21,428 - DEBUG - 处理块 553/753: Inductive Reasoning and Machine Learning on the Se...
|
||
2025-06-11 11:02:21,705 - DEBUG - 块 553 生成文本: <triplet> <concept> CEUR-WS <org> publisher</s>
|
||
2025-06-11 11:02:21,705 - DEBUG - 原始生成文本: <triplet> <concept> CEUR-WS <org> publisher</s>
|
||
2025-06-11 11:02:21,705 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'CEUR-WS', '<org>', 'publisher']
|
||
2025-06-11 11:02:21,705 - DEBUG - 处理块 554/753: Huang Y, Tresp V, Nickel M, Rettinger A, Kriegel H...
|
||
2025-06-11 11:02:21,853 - DEBUG - 块 554 生成文本: <triplet> graph <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:02:21,853 - DEBUG - 原始生成文本: <triplet> graph <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:02:21,854 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:02:21,854 - DEBUG - 添加三元组: graph(concept) - used by - Semantic Web(misc)
|
||
2025-06-11 11:02:21,854 - DEBUG - 块 554 提取到 1 个三元组
|
||
2025-06-11 11:02:21,854 - DEBUG - 处理块 555/753: 2014, 5(1): 5–22. [doi: 10.3233/SW-130100]
|
||
[75]
|
||
...
|
||
2025-06-11 11:02:22,322 - DEBUG - 块 555 生成文本: <triplet> <org> 5 <num> number of parts of this work</s>
|
||
2025-06-11 11:02:22,322 - DEBUG - 原始生成文本: <triplet> <org> 5 <num> number of parts of this work</s>
|
||
2025-06-11 11:02:22,322 - DEBUG - 处理后标记: ['<triplet>', '<org>', '5', '<num>', 'number of parts of this work']
|
||
2025-06-11 11:02:22,322 - DEBUG - 处理块 556/753: Dong X, Gabrilovich E, Heitz G, Horn W, Lao N, Mur...
|
||
2025-06-11 11:02:22,953 - DEBUG - 块 556 生成文本: <triplet> <concept> Web-scale <misc> instance of</s>
|
||
2025-06-11 11:02:22,953 - DEBUG - 原始生成文本: <triplet> <concept> Web-scale <misc> instance of</s>
|
||
2025-06-11 11:02:22,953 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Web-scale', '<misc>', 'instance of']
|
||
2025-06-11 11:02:22,953 - DEBUG - 处理块 557/753: approach to probabilistic knowledge fusion. In: Pr...
|
||
2025-06-11 11:02:23,134 - DEBUG - 块 557 生成文本: <triplet> <concept> SIGKDD <org> part of</s>
|
||
2025-06-11 11:02:23,134 - DEBUG - 原始生成文本: <triplet> <concept> SIGKDD <org> part of</s>
|
||
2025-06-11 11:02:23,134 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'SIGKDD', '<org>', 'part of']
|
||
2025-06-11 11:02:23,134 - DEBUG - 处理块 558/753: (KDD). New York: Association for Computing Machine...
|
||
2025-06-11 11:02:23,314 - DEBUG - 块 558 生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:02:23,314 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> member of</s>
|
||
2025-06-11 11:02:23,314 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'member of']
|
||
2025-06-11 11:02:23,314 - DEBUG - 处理块 559/753: Socher R, Chen DQ, Manning CD, Ng AY. Reasoning wi...
|
||
2025-06-11 11:02:23,761 - DEBUG - 块 559 生成文本: <triplet> <per> AY <concept> part of the 26th <media> follows</s>
|
||
2025-06-11 11:02:23,761 - DEBUG - 原始生成文本: <triplet> <per> AY <concept> part of the 26th <media> follows</s>
|
||
2025-06-11 11:02:23,761 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'AY', '<concept>', 'part of the 26th', '<media>', 'follows']
|
||
2025-06-11 11:02:23,761 - DEBUG - 处理块 560/753: Int’l Conf. on Neural Information Processing Syste...
|
||
2025-06-11 11:02:23,941 - DEBUG - 块 560 生成文本: <triplet> <concept> Information Processing Systems <misc> studies</s>
|
||
2025-06-11 11:02:23,942 - DEBUG - 原始生成文本: <triplet> <concept> Information Processing Systems <misc> studies</s>
|
||
2025-06-11 11:02:23,942 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Information Processing Systems', '<misc>', 'studies']
|
||
2025-06-11 11:02:23,942 - DEBUG - 处理块 561/753: Liu Q, Jiang H, Evdokimov A, Ling ZH, Zhu XD, Wei ...
|
||
2025-06-11 11:02:24,346 - DEBUG - 块 561 生成文本: <triplet> ZH <per> Jiang H, Evdokimov A, Zhu XD, Wei S, Hu Y. Probabilistic reasoning via deep learning <concept> subclass of</s>
|
||
2025-06-11 11:02:24,346 - DEBUG - 原始生成文本: <triplet> ZH <per> Jiang H, Evdokimov A, Zhu XD, Wei S, Hu Y. Probabilistic reasoning via deep learning <concept> subclass of</s>
|
||
2025-06-11 11:02:24,346 - DEBUG - 处理后标记: ['<triplet>', 'ZH', '<per>', 'Jiang H, Evdokimov A, Zhu XD, Wei S, Hu Y. Probabilistic reasoning via deep learning', '<concept>', 'subclass of']
|
||
2025-06-11 11:02:24,346 - DEBUG - 添加三元组: ZH(per) - subclass of - Jiang H, Evdokimov A, Zhu XD, Wei S, Hu Y. Probabilistic reasoning via deep learning(concept)
|
||
2025-06-11 11:02:24,346 - DEBUG - 块 561 提取到 1 个三元组
|
||
2025-06-11 11:02:24,347 - DEBUG - 处理块 562/753: arXiv:1603.07704, 2016.
|
||
[78]
|
||
...
|
||
2025-06-11 11:02:24,580 - DEBUG - 块 562 生成文本: <triplet> <concept> 1605 <date> inception <triplet> 2016 <time> 1604 <eve> follows</s>
|
||
2025-06-11 11:02:24,580 - DEBUG - 原始生成文本: <triplet> <concept> 1605 <date> inception <triplet> 2016 <time> 1604 <eve> follows</s>
|
||
2025-06-11 11:02:24,580 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1605', '<date>', 'inception', '<triplet>', '2016', '<time>', '1604', '<eve>', 'follows']
|
||
2025-06-11 11:02:24,580 - DEBUG - 处理块 563/753: Dettmers T, Minervini P, Stenetorp P, Riedel S. Co...
|
||
2025-06-11 11:02:25,177 - DEBUG - 块 563 生成文本: <triplet> graph embeddings <concept> Dettmers T, Minervini P <misc> used</s>
|
||
2025-06-11 11:02:25,177 - DEBUG - 原始生成文本: <triplet> graph embeddings <concept> Dettmers T, Minervini P <misc> used</s>
|
||
2025-06-11 11:02:25,177 - DEBUG - 处理后标记: ['<triplet>', 'graph embeddings', '<concept>', 'Dettmers T, Minervini P', '<misc>', 'used']
|
||
2025-06-11 11:02:25,177 - DEBUG - 添加三元组: graph embeddings(concept) - used - Dettmers T, Minervini P(misc)
|
||
2025-06-11 11:02:25,177 - DEBUG - 块 563 提取到 1 个三元组
|
||
2025-06-11 11:02:25,177 - DEBUG - 处理块 564/753: Artificial Intelligence (AAAI). New Orleans: AAAI ...
|
||
2025-06-11 11:02:25,432 - DEBUG - 块 564 生成文本: <triplet> <media> Artificial Intelligence <concept> main subject has role</s>
|
||
2025-06-11 11:02:25,432 - DEBUG - 原始生成文本: <triplet> <media> Artificial Intelligence <concept> main subject has role</s>
|
||
2025-06-11 11:02:25,432 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Artificial Intelligence', '<concept>', 'main subject has role']
|
||
2025-06-11 11:02:25,432 - DEBUG - 处理块 565/753: Schlichtkrull M, Kipf TN, Bloem P, van den Berg R,...
|
||
2025-06-11 11:02:25,644 - DEBUG - 块 565 生成文本: <triplet> graph <concept> Schlichtkrull M <per> developer</s>
|
||
2025-06-11 11:02:25,644 - DEBUG - 原始生成文本: <triplet> graph <concept> Schlichtkrull M <per> developer</s>
|
||
2025-06-11 11:02:25,644 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Schlichtkrull M', '<per>', 'developer']
|
||
2025-06-11 11:02:25,644 - DEBUG - 添加三元组: graph(concept) - developer - Schlichtkrull M(per)
|
||
2025-06-11 11:02:25,644 - DEBUG - 块 565 提取到 1 个三元组
|
||
2025-06-11 11:02:25,644 - DEBUG - 处理块 566/753: In: Proc. of the 15th Int’l Conf. on Semantic Web....
|
||
2025-06-11 11:02:25,984 - DEBUG - 块 566 生成文本: <triplet> <org> 15th Int’l Conf. <media> follows</s>
|
||
2025-06-11 11:02:25,984 - DEBUG - 原始生成文本: <triplet> <org> 15th Int’l Conf. <media> follows</s>
|
||
2025-06-11 11:02:25,984 - DEBUG - 处理后标记: ['<triplet>', '<org>', '15th Int’l Conf.', '<media>', 'follows']
|
||
2025-06-11 11:02:25,984 - DEBUG - 处理块 567/753: [80]
|
||
Nguyen DQ, Nguyen TD, Nguyen DQ, Phung D. A n...
|
||
2025-06-11 11:02:26,517 - DEBUG - 块 567 生成文本: <triplet> embedding model for knowledge base completion based on convolutional <concept> Nguyen DQ <per> named after a novel <media> D. A <org> author</s>
|
||
2025-06-11 11:02:26,517 - DEBUG - 原始生成文本: <triplet> embedding model for knowledge base completion based on convolutional <concept> Nguyen DQ <per> named after a novel <media> D. A <org> author</s>
|
||
2025-06-11 11:02:26,517 - DEBUG - 处理后标记: ['<triplet>', 'embedding model for knowledge base completion based on convolutional', '<concept>', 'Nguyen DQ', '<per>', 'named after a novel', '<media>', 'D. A', '<org>', 'author']
|
||
2025-06-11 11:02:26,518 - DEBUG - 添加三元组: embedding model for knowledge base completion based on convolutional(concept) - named after a novel - Nguyen DQ(per)
|
||
2025-06-11 11:02:26,518 - DEBUG - 块 567 提取到 1 个三元组
|
||
2025-06-11 11:02:26,518 - DEBUG - 处理块 568/753: neural network. In: Proc. of the 2018 Conf. of the...
|
||
2025-06-11 11:02:26,943 - DEBUG - 块 568 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of the North American Chapter <media> Association <loc> member</s>
|
||
2025-06-11 11:02:26,943 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of the North American Chapter <media> Association <loc> member</s>
|
||
2025-06-11 11:02:26,943 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of the North American Chapter', '<media>', 'Association', '<loc>', 'member']
|
||
2025-06-11 11:02:26,943 - DEBUG - 处理块 569/753: Language Technologies (NAACL). New Orleans: Associ...
|
||
2025-06-11 11:02:27,231 - DEBUG - 块 569 生成文本: <triplet> <concept> Language Technologies <org> publisher</s>
|
||
2025-06-11 11:02:27,231 - DEBUG - 原始生成文本: <triplet> <concept> Language Technologies <org> publisher</s>
|
||
2025-06-11 11:02:27,231 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Language Technologies', '<org>', 'publisher']
|
||
2025-06-11 11:02:27,231 - DEBUG - 处理块 570/753: Balažević I, Allen C, Hospedales TM. Hypernetwork ...
|
||
2025-06-11 11:02:28,011 - DEBUG - 块 570 生成文本: <triplet> graph embeddings <concept> Hypernetwork knowledge <media> part of</s>
|
||
2025-06-11 11:02:28,011 - DEBUG - 原始生成文本: <triplet> graph embeddings <concept> Hypernetwork knowledge <media> part of</s>
|
||
2025-06-11 11:02:28,011 - DEBUG - 处理后标记: ['<triplet>', 'graph embeddings', '<concept>', 'Hypernetwork knowledge', '<media>', 'part of']
|
||
2025-06-11 11:02:28,011 - DEBUG - 添加三元组: graph embeddings(concept) - part of - Hypernetwork knowledge(media)
|
||
2025-06-11 11:02:28,011 - DEBUG - 块 570 提取到 1 个三元组
|
||
2025-06-11 11:02:28,012 - DEBUG - 处理块 571/753: Networks and Machine Learning (ICANN). Munich: Spr...
|
||
2025-06-11 11:02:28,204 - DEBUG - 块 571 生成文本: <triplet> ICANN <org> Munich <loc> headquarters location</s>
|
||
2025-06-11 11:02:28,204 - DEBUG - 原始生成文本: <triplet> ICANN <org> Munich <loc> headquarters location</s>
|
||
2025-06-11 11:02:28,204 - DEBUG - 处理后标记: ['<triplet>', 'ICANN', '<org>', 'Munich', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:28,204 - DEBUG - 添加三元组: ICANN(org) - headquarters location - Munich(loc)
|
||
2025-06-11 11:02:28,204 - DEBUG - 块 571 提取到 1 个三元组
|
||
2025-06-11 11:02:28,204 - DEBUG - 处理块 572/753: Ha D, Dai AM, Le QV. HyperNetworks. In: Proc. of t...
|
||
2025-06-11 11:02:28,460 - DEBUG - 块 572 生成文本: <triplet> <org> Toulon <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:28,461 - DEBUG - 原始生成文本: <triplet> <org> Toulon <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:28,461 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Toulon', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:02:28,461 - DEBUG - 处理块 573/753: Sun ZQ, Deng ZH, Nie JY, Tang J. RotatE: Knowledge...
|
||
2025-06-11 11:02:29,252 - DEBUG - 块 573 生成文本: <triplet> graph <concept> Sun ZQ <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:29,253 - DEBUG - 原始生成文本: <triplet> graph <concept> Sun ZQ <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:29,253 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Sun ZQ', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:02:29,253 - DEBUG - 添加三元组: graph(concept) - discoverer or inventor - Sun ZQ(per)
|
||
2025-06-11 11:02:29,253 - DEBUG - 块 573 提取到 1 个三元组
|
||
2025-06-11 11:02:29,253 - DEBUG - 处理块 574/753: Conf. on Learning Representations (ICLR). New Orle...
|
||
2025-06-11 11:02:29,583 - DEBUG - 块 574 生成文本: <triplet> <media> New Orleans <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:29,583 - DEBUG - 原始生成文本: <triplet> <media> New Orleans <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:29,583 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'New Orleans', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:02:29,583 - DEBUG - 处理块 575/753: Zhang S, Tay Y, Yao LN, Liu Q. Quaternion knowledg...
|
||
2025-06-11 11:02:29,988 - DEBUG - 块 575 生成文本: <triplet> graph <concept> Zhang S, Tay Y, Yao <misc> used</s>
|
||
2025-06-11 11:02:29,988 - DEBUG - 原始生成文本: <triplet> graph <concept> Zhang S, Tay Y, Yao <misc> used</s>
|
||
2025-06-11 11:02:29,988 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Zhang S, Tay Y, Yao', '<misc>', 'used']
|
||
2025-06-11 11:02:29,988 - DEBUG - 添加三元组: graph(concept) - used - Zhang S, Tay Y, Yao(misc)
|
||
2025-06-11 11:02:29,988 - DEBUG - 块 575 提取到 1 个三元组
|
||
2025-06-11 11:02:29,988 - DEBUG - 处理块 576/753: Processing Systems (NIPS). Vancouver: Curran Assoc...
|
||
2025-06-11 11:02:30,158 - DEBUG - 块 576 生成文本: <triplet> <concept> Processing Systems <org> manufacturer</s>
|
||
2025-06-11 11:02:30,158 - DEBUG - 原始生成文本: <triplet> <concept> Processing Systems <org> manufacturer</s>
|
||
2025-06-11 11:02:30,158 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Processing Systems', '<org>', 'manufacturer']
|
||
2025-06-11 11:02:30,158 - DEBUG - 处理块 577/753: Xu CR, Li RJ. Relation embedding with dihedral gro...
|
||
2025-06-11 11:02:30,562 - DEBUG - 块 577 生成文本: <triplet> RJ. Relation embedding with dihedral group in knowledge graph. In <media> Xu CR <per> author</s>
|
||
2025-06-11 11:02:30,562 - DEBUG - 原始生成文本: <triplet> RJ. Relation embedding with dihedral group in knowledge graph. In <media> Xu CR <per> author</s>
|
||
2025-06-11 11:02:30,562 - DEBUG - 处理后标记: ['<triplet>', 'RJ. Relation embedding with dihedral group in knowledge graph. In', '<media>', 'Xu CR', '<per>', 'author']
|
||
2025-06-11 11:02:30,562 - DEBUG - 添加三元组: RJ. Relation embedding with dihedral group in knowledge graph. In(media) - author - Xu CR(per)
|
||
2025-06-11 11:02:30,562 - DEBUG - 块 577 提取到 1 个三元组
|
||
2025-06-11 11:02:30,562 - DEBUG - 处理块 578/753: Computational Linguistics (ACL). Florence: Associa...
|
||
2025-06-11 11:02:30,785 - DEBUG - 块 578 生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:02:30,785 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:02:30,785 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:02:30,785 - DEBUG - 处理块 579/753: Adcock AB, Sullivan BD, Mahoney MW. Tree-like stru...
|
||
2025-06-11 11:02:31,030 - DEBUG - 块 579 生成文本: <triplet> Sullivan <per> AB <org> member of</s>
|
||
2025-06-11 11:02:31,030 - DEBUG - 原始生成文本: <triplet> Sullivan <per> AB <org> member of</s>
|
||
2025-06-11 11:02:31,030 - DEBUG - 处理后标记: ['<triplet>', 'Sullivan', '<per>', 'AB', '<org>', 'member of']
|
||
2025-06-11 11:02:31,030 - DEBUG - 添加三元组: Sullivan(per) - member of - AB(org)
|
||
2025-06-11 11:02:31,030 - DEBUG - 块 579 提取到 1 个三元组
|
||
2025-06-11 11:02:31,030 - DEBUG - 处理块 580/753: Conf. on Data Mining. Dallas: IEEE Computer Societ...
|
||
2025-06-11 11:02:31,167 - DEBUG - 块 580 生成文本: <triplet> <concept> IEEE Computer Society <org> publisher</s>
|
||
2025-06-11 11:02:31,167 - DEBUG - 原始生成文本: <triplet> <concept> IEEE Computer Society <org> publisher</s>
|
||
2025-06-11 11:02:31,167 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'IEEE Computer Society', '<org>', 'publisher']
|
||
2025-06-11 11:02:31,167 - DEBUG - 处理块 581/753: Nickel M, Kiela D. Poincaré embeddings for learnin...
|
||
2025-06-11 11:02:31,626 - DEBUG - 块 581 生成文本: <triplet> embeddings for learning hierarchical representations <concept> Nickel M, Kiela D. Poincaré <per> discoverer</s>
|
||
2025-06-11 11:02:31,626 - DEBUG - 原始生成文本: <triplet> embeddings for learning hierarchical representations <concept> Nickel M, Kiela D. Poincaré <per> discoverer</s>
|
||
2025-06-11 11:02:31,626 - DEBUG - 处理后标记: ['<triplet>', 'embeddings for learning hierarchical representations', '<concept>', 'Nickel M, Kiela D. Poincaré', '<per>', 'discoverer']
|
||
2025-06-11 11:02:31,626 - DEBUG - 添加三元组: embeddings for learning hierarchical representations(concept) - discoverer - Nickel M, Kiela D. Poincaré(per)
|
||
2025-06-11 11:02:31,626 - DEBUG - 块 581 提取到 1 个三元组
|
||
2025-06-11 11:02:31,626 - DEBUG - 处理块 582/753: Processing Systems (NIPS). Long Beach: Curran Asso...
|
||
2025-06-11 11:02:31,806 - DEBUG - 块 582 生成文本: <triplet> <concept> Processing Systems <org> manufacturer</s>
|
||
2025-06-11 11:02:31,806 - DEBUG - 原始生成文本: <triplet> <concept> Processing Systems <org> manufacturer</s>
|
||
2025-06-11 11:02:31,806 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Processing Systems', '<org>', 'manufacturer']
|
||
2025-06-11 11:02:31,806 - DEBUG - 处理块 583/753: Balažević I, Allen C, Hospedales T. Multi-relation...
|
||
2025-06-11 11:02:32,231 - DEBUG - 块 583 生成文本: <triplet> graph embeddings <concept> Neural Information <misc> subclass of</s>
|
||
2025-06-11 11:02:32,231 - DEBUG - 原始生成文本: <triplet> graph embeddings <concept> Neural Information <misc> subclass of</s>
|
||
2025-06-11 11:02:32,231 - DEBUG - 处理后标记: ['<triplet>', 'graph embeddings', '<concept>', 'Neural Information', '<misc>', 'subclass of']
|
||
2025-06-11 11:02:32,231 - DEBUG - 添加三元组: graph embeddings(concept) - subclass of - Neural Information(misc)
|
||
2025-06-11 11:02:32,231 - DEBUG - 块 583 提取到 1 个三元组
|
||
2025-06-11 11:02:32,231 - DEBUG - 处理块 584/753: Processing Systems. Vancouver: Curran Associates I...
|
||
2025-06-11 11:02:32,422 - DEBUG - 块 584 生成文本: <triplet> Associates Inc. <org> Processing Systems <concept> subsidiary</s>
|
||
2025-06-11 11:02:32,422 - DEBUG - 原始生成文本: <triplet> Associates Inc. <org> Processing Systems <concept> subsidiary</s>
|
||
2025-06-11 11:02:32,422 - DEBUG - 处理后标记: ['<triplet>', 'Associates Inc.', '<org>', 'Processing Systems', '<concept>', 'subsidiary']
|
||
2025-06-11 11:02:32,422 - DEBUG - 添加三元组: Associates Inc.(org) - subsidiary - Processing Systems(concept)
|
||
2025-06-11 11:02:32,422 - DEBUG - 块 584 提取到 1 个三元组
|
||
2025-06-11 11:02:32,422 - DEBUG - 处理块 585/753: Nguyen DQ, Vu T, Nguyen TD, Nguyen DQ, Phung D. A ...
|
||
2025-06-11 11:02:32,571 - DEBUG - 块 585 生成文本: <triplet> graph completion <concept> knowledge <media> part of</s>
|
||
2025-06-11 11:02:32,571 - DEBUG - 原始生成文本: <triplet> graph completion <concept> knowledge <media> part of</s>
|
||
2025-06-11 11:02:32,571 - DEBUG - 处理后标记: ['<triplet>', 'graph completion', '<concept>', 'knowledge', '<media>', 'part of']
|
||
2025-06-11 11:02:32,572 - DEBUG - 添加三元组: graph completion(concept) - part of - knowledge(media)
|
||
2025-06-11 11:02:32,572 - DEBUG - 块 585 提取到 1 个三元组
|
||
2025-06-11 11:02:32,572 - DEBUG - 处理块 586/753: and search personalization. In: Proc. of the 2019 ...
|
||
2025-06-11 11:02:33,018 - DEBUG - 块 586 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of the North American Chapter <media> Association <triplet> Association For Computing <eve> North America <loc> location</s>
|
||
2025-06-11 11:02:33,018 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of the North American Chapter <media> Association <triplet> Association For Computing <eve> North America <loc> location</s>
|
||
2025-06-11 11:02:33,018 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of the North American Chapter', '<media>', 'Association', '<triplet>', 'Association For Computing', '<eve>', 'North America', '<loc>', 'location']
|
||
2025-06-11 11:02:33,018 - DEBUG - 添加三元组: Association For Computing(eve) - location - North America(loc)
|
||
2025-06-11 11:02:33,018 - DEBUG - 块 586 提取到 1 个三元组
|
||
2025-06-11 11:02:33,018 - DEBUG - 处理块 587/753: (NAACL). Minneapolis: Association for Computationa...
|
||
2025-06-11 11:02:33,273 - DEBUG - 块 587 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:33,273 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:33,273 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:33,273 - DEBUG - 处理块 588/753: Zhang W, Paudel B, Zhang W, Bernstein A, Chen HJ. ...
|
||
2025-06-11 11:02:33,838 - DEBUG - 块 588 生成文本: <triplet> graphs <concept> Zhang W, Bernstein A, Chen HJ. Interaction <per> discoverer <misc> studies</s>
|
||
2025-06-11 11:02:33,838 - DEBUG - 原始生成文本: <triplet> graphs <concept> Zhang W, Bernstein A, Chen HJ. Interaction <per> discoverer <misc> studies</s>
|
||
2025-06-11 11:02:33,838 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Zhang W, Bernstein A, Chen HJ. Interaction', '<per>', 'discoverer', '<misc>', 'studies']
|
||
2025-06-11 11:02:33,838 - DEBUG - 添加三元组: graphs(concept) - discoverer - Zhang W, Bernstein A, Chen HJ. Interaction(per)
|
||
2025-06-11 11:02:33,838 - DEBUG - 块 588 提取到 1 个三元组
|
||
2025-06-11 11:02:33,838 - DEBUG - 处理块 589/753: Proc. of the 12th ACM Int’l Conf. on Web Search an...
|
||
2025-06-11 11:02:34,316 - DEBUG - 块 589 生成文本: <triplet> <media> Association for Computing Machinery <org> conferred by <concept> instance of <triplet> Web Search and Data Mining</s>
|
||
2025-06-11 11:02:34,317 - DEBUG - 原始生成文本: <triplet> <media> Association for Computing Machinery <org> conferred by <concept> instance of <triplet> Web Search and Data Mining</s>
|
||
2025-06-11 11:02:34,317 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computing Machinery', '<org>', 'conferred by', '<concept>', 'instance of', '<triplet>', 'Web Search and Data Mining']
|
||
2025-06-11 11:02:34,317 - DEBUG - 处理块 590/753: 96–104. [doi: 10.1145/3289600.3291014]
|
||
[91]
|
||
...
|
||
2025-06-11 11:02:34,624 - DEBUG - 块 590 生成文本: <triplet> <loc> <concept> instance of <triplet> 91 <misc> <time> <date> point in time</s>
|
||
2025-06-11 11:02:34,625 - DEBUG - 原始生成文本: <triplet> <loc> <concept> instance of <triplet> 91 <misc> <time> <date> point in time</s>
|
||
2025-06-11 11:02:34,625 - DEBUG - 处理后标记: ['<triplet>', '<loc>', '<concept>', 'instance of', '<triplet>', '91', '<misc>', '<time>', '<date>', 'point in time']
|
||
2025-06-11 11:02:34,625 - DEBUG - 添加三元组: <loc>(concept) - 91 - instance of(triplet)
|
||
2025-06-11 11:02:34,625 - DEBUG - 块 590 提取到 1 个三元组
|
||
2025-06-11 11:02:34,625 - DEBUG - 处理块 591/753: Jiang TS, Liu TY, Ge T, Sha L, Li SJ, Chang BB, Su...
|
||
2025-06-11 11:02:34,847 - DEBUG - 块 591 生成文本: <triplet> <concept> Ge T <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:34,848 - DEBUG - 原始生成文本: <triplet> <concept> Ge T <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:34,848 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Ge T', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:02:34,848 - DEBUG - 处理块 592/753: 2016 Conf. on Empirical Methods in Natural Languag...
|
||
2025-06-11 11:02:35,123 - DEBUG - 块 592 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:35,123 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:35,124 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:35,124 - DEBUG - 处理块 593/753: 张天成 等: 知识图谱嵌入技术研究综述 307
|
||
(ACL), 2016. 2350–2354. [d...
|
||
2025-06-11 11:02:35,465 - DEBUG - 块 593 生成文本: <triplet> 张天成 <unk> 等 <concept> instance of</s>
|
||
2025-06-11 11:02:35,465 - DEBUG - 原始生成文本: <triplet> 张天成 <unk> 等 <concept> instance of</s>
|
||
2025-06-11 11:02:35,465 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<unk>', '等', '<concept>', 'instance of']
|
||
2025-06-11 11:02:35,465 - DEBUG - 添加三元组: 张天成(unk) - instance of - 等(concept)
|
||
2025-06-11 11:02:35,465 - DEBUG - 块 593 提取到 1 个三元组
|
||
2025-06-11 11:02:35,465 - DEBUG - 处理块 594/753: Trivedi R, Dai HJ, Wang YC, Song L. Know-evolve: D...
|
||
2025-06-11 11:02:35,635 - DEBUG - 块 594 生成文本: <triplet> graphs <concept> Know-evolve <misc> studies</s>
|
||
2025-06-11 11:02:35,635 - DEBUG - 原始生成文本: <triplet> graphs <concept> Know-evolve <misc> studies</s>
|
||
2025-06-11 11:02:35,635 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Know-evolve', '<misc>', 'studies']
|
||
2025-06-11 11:02:35,635 - DEBUG - 添加三元组: graphs(concept) - studies - Know-evolve(misc)
|
||
2025-06-11 11:02:35,635 - DEBUG - 块 594 提取到 1 个三元组
|
||
2025-06-11 11:02:35,635 - DEBUG - 处理块 595/753: Conf. on Machine Learning (ICML). Sydney: JMLR, 20...
|
||
2025-06-11 11:02:35,815 - DEBUG - 块 595 生成文本: <triplet> JMLR <org> Sydney <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:35,816 - DEBUG - 原始生成文本: <triplet> JMLR <org> Sydney <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:02:35,816 - DEBUG - 处理后标记: ['<triplet>', 'JMLR', '<org>', 'Sydney', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:02:35,816 - DEBUG - 添加三元组: JMLR(org) - located in the administrative territorial entity - Sydney(loc)
|
||
2025-06-11 11:02:35,816 - DEBUG - 块 595 提取到 1 个三元组
|
||
2025-06-11 11:02:35,816 - DEBUG - 处理块 596/753: Leblay J, Chekol MW. Deriving validity time in kno...
|
||
2025-06-11 11:02:36,188 - DEBUG - 块 596 生成文本: <triplet> graph <concept> Leblay J <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:36,188 - DEBUG - 原始生成文本: <triplet> graph <concept> Leblay J <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:36,188 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Leblay J', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:02:36,188 - DEBUG - 添加三元组: graph(concept) - discoverer or inventor - Leblay J(per)
|
||
2025-06-11 11:02:36,188 - DEBUG - 块 596 提取到 1 个三元组
|
||
2025-06-11 11:02:36,188 - DEBUG - 处理块 597/753: Machinery, 2018. 1771–1776. [doi: 10.1145/3184558....
|
||
2025-06-11 11:02:36,389 - DEBUG - 块 597 生成文本: <triplet> <concept> 1771 <date> point in time</s>
|
||
2025-06-11 11:02:36,390 - DEBUG - 原始生成文本: <triplet> <concept> 1771 <date> point in time</s>
|
||
2025-06-11 11:02:36,390 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1771', '<date>', 'point in time']
|
||
2025-06-11 11:02:36,390 - DEBUG - 处理块 598/753: García-Durán A, Dumančić S, Niepert M. Learning se...
|
||
2025-06-11 11:02:37,212 - DEBUG - 块 598 生成文本: <triplet> graph completion <concept> Learning sequence encoders for temporal knowledge <media> part of <misc> <triplet> learning <eve> Learning <time> <loc> Learning incoder <unk> <per> <dis> <org> rition</s>
|
||
2025-06-11 11:02:37,212 - DEBUG - 原始生成文本: <triplet> graph completion <concept> Learning sequence encoders for temporal knowledge <media> part of <misc> <triplet> learning <eve> Learning <time> <loc> Learning incoder <unk> <per> <dis> <org> rition</s>
|
||
2025-06-11 11:02:37,212 - DEBUG - 处理后标记: ['<triplet>', 'graph completion', '<concept>', 'Learning sequence encoders for temporal knowledge', '<media>', 'part of', '<misc>', '<triplet>', 'learning', '<eve>', 'Learning', '<time>', '<loc>', 'Learning incoder', '<unk>', '<per>', '<dis>', '<org>', 'rition']
|
||
2025-06-11 11:02:37,212 - DEBUG - 添加三元组: graph completion(concept) - part of - Learning sequence encoders for temporal knowledge(media)
|
||
2025-06-11 11:02:37,212 - DEBUG - 添加三元组: learning(eve) - <loc> - Learning(time)
|
||
2025-06-11 11:02:37,212 - DEBUG - 块 598 提取到 2 个三元组
|
||
2025-06-11 11:02:37,212 - DEBUG - 处理块 599/753: Conf. on Empirical Methods in Natural Language Pro...
|
||
2025-06-11 11:02:37,488 - DEBUG - 块 599 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:37,489 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:37,489 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:02:37,489 - DEBUG - 处理块 600/753: 2018. 4816–4821. [doi: 10.18653/v1/D18-1516]
|
||
[95]
|
||
...
|
||
2025-06-11 11:02:37,616 - DEBUG - 块 600 生成文本: <triplet> <eve> 4816 <date> point in time</s>
|
||
2025-06-11 11:02:37,616 - DEBUG - 原始生成文本: <triplet> <eve> 4816 <date> point in time</s>
|
||
2025-06-11 11:02:37,616 - DEBUG - 处理后标记: ['<triplet>', '<eve>', '4816', '<date>', 'point in time']
|
||
2025-06-11 11:02:37,616 - DEBUG - 处理块 601/753: Dasgupta SS, Ray SN, Talukdar PP. HyTE: Hyperplane...
|
||
2025-06-11 11:02:38,213 - DEBUG - 块 601 生成文本: <triplet> graph embedding <concept> Dasgupta SS, Ray SN, Talukdar PP.HyTE <misc> used</s>
|
||
2025-06-11 11:02:38,213 - DEBUG - 原始生成文本: <triplet> graph embedding <concept> Dasgupta SS, Ray SN, Talukdar PP.HyTE <misc> used</s>
|
||
2025-06-11 11:02:38,213 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding', '<concept>', 'Dasgupta SS, Ray SN, Talukdar PP.HyTE', '<misc>', 'used']
|
||
2025-06-11 11:02:38,213 - DEBUG - 添加三元组: graph embedding(concept) - used - Dasgupta SS, Ray SN, Talukdar PP.HyTE(misc)
|
||
2025-06-11 11:02:38,213 - DEBUG - 块 601 提取到 1 个三元组
|
||
2025-06-11 11:02:38,213 - DEBUG - 处理块 602/753: Conf. on Empirical Methods in Natural Language Pro...
|
||
2025-06-11 11:02:38,489 - DEBUG - 块 602 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:38,489 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:38,489 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:02:38,489 - DEBUG - 处理块 603/753: 2018. 2001–2011. [doi: 10.18653/v1/D18-1225]
|
||
[96]
|
||
...
|
||
2025-06-11 11:02:38,797 - DEBUG - 块 603 生成文本: <triplet> <eve> 11 <date> point in time <triplet> 2018 <time> 11–2011 <concept> follows</s>
|
||
2025-06-11 11:02:38,797 - DEBUG - 原始生成文本: <triplet> <eve> 11 <date> point in time <triplet> 2018 <time> 11–2011 <concept> follows</s>
|
||
2025-06-11 11:02:38,797 - DEBUG - 处理后标记: ['<triplet>', '<eve>', '11', '<date>', 'point in time', '<triplet>', '2018', '<time>', '11–2011', '<concept>', 'follows']
|
||
2025-06-11 11:02:38,797 - DEBUG - 处理块 604/753: Tang XL, Yuan R, Li QY, Wang TY, Yang HZ, Cai YD, ...
|
||
2025-06-11 11:02:38,967 - DEBUG - 块 604 生成文本: <triplet> graph embedding by <concept> dynamic knowledge <media> use</s>
|
||
2025-06-11 11:02:38,967 - DEBUG - 原始生成文本: <triplet> graph embedding by <concept> dynamic knowledge <media> use</s>
|
||
2025-06-11 11:02:38,967 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding by', '<concept>', 'dynamic knowledge', '<media>', 'use']
|
||
2025-06-11 11:02:38,967 - DEBUG - 添加三元组: graph embedding by(concept) - use - dynamic knowledge(media)
|
||
2025-06-11 11:02:38,967 - DEBUG - 块 604 提取到 1 个三元组
|
||
2025-06-11 11:02:38,967 - DEBUG - 处理块 605/753: incorporating temporal evolution. IEEE Access, 202...
|
||
2025-06-11 11:02:39,276 - DEBUG - 块 605 生成文本: <triplet> <concept> IEEE <org> standards body</s>
|
||
2025-06-11 11:02:39,276 - DEBUG - 原始生成文本: <triplet> <concept> IEEE <org> standards body</s>
|
||
2025-06-11 11:02:39,276 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'IEEE', '<org>', 'standards body']
|
||
2025-06-11 11:02:39,276 - DEBUG - 处理块 606/753: Jin J, Wan HY, Lin YF. Knowledge graph representat...
|
||
2025-06-11 11:02:40,646 - DEBUG - 块 606 生成文本: <triplet> graph representation learning fused with entity category information <concept> Jin J, Wan HY, Lin YF. <unk> Lin <org> LinJ, <triplet> Knowledge <media> Lin J.computer.de <eve> LinYG, HY <misc> part of</s>
|
||
2025-06-11 11:02:40,646 - DEBUG - 原始生成文本: <triplet> graph representation learning fused with entity category information <concept> Jin J, Wan HY, Lin YF. <unk> Lin <org> LinJ, <triplet> Knowledge <media> Lin J.computer.de <eve> LinYG, HY <misc> part of</s>
|
||
2025-06-11 11:02:40,646 - DEBUG - 处理后标记: ['<triplet>', 'graph representation learning fused with entity category information', '<concept>', 'Jin J, Wan HY, Lin YF.', '<unk>', 'Lin', '<org>', 'LinJ,', '<triplet>', 'Knowledge', '<media>', 'Lin J.computer.de', '<eve>', 'LinYG, HY', '<misc>', 'part of']
|
||
2025-06-11 11:02:40,646 - DEBUG - 添加三元组: graph representation learning fused with entity category information(concept) - Lin - Jin J, Wan HY, Lin YF.(unk)
|
||
2025-06-11 11:02:40,646 - DEBUG - 添加三元组: Knowledge(media) - LinYG, HY - Lin J.computer.de(eve)
|
||
2025-06-11 11:02:40,647 - DEBUG - 块 606 提取到 2 个三元组
|
||
2025-06-11 11:02:40,647 - DEBUG - 处理块 607/753: 47(4): 77–83 (in Chinese with English abstract...
|
||
2025-06-11 11:02:40,784 - DEBUG - 块 607 生成文本: <triplet> <org> Chinese <concept> language of work or name</s>
|
||
2025-06-11 11:02:40,784 - DEBUG - 原始生成文本: <triplet> <org> Chinese <concept> language of work or name</s>
|
||
2025-06-11 11:02:40,784 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Chinese', '<concept>', 'language of work or name']
|
||
2025-06-11 11:02:40,784 - DEBUG - 处理块 608/753: Zhang DX, Yuan B, Wang D, Liu R. Joint semantic re...
|
||
2025-06-11 11:02:41,082 - DEBUG - 块 608 生成文本: <triplet> graph knowledge <concept> Zhang DX <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:41,082 - DEBUG - 原始生成文本: <triplet> graph knowledge <concept> Zhang DX <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:41,082 - DEBUG - 处理后标记: ['<triplet>', 'graph knowledge', '<concept>', 'Zhang DX', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:02:41,082 - DEBUG - 添加三元组: graph knowledge(concept) - discoverer or inventor - Zhang DX(per)
|
||
2025-06-11 11:02:41,082 - DEBUG - 块 608 提取到 1 个三元组
|
||
2025-06-11 11:02:41,082 - DEBUG - 处理块 609/753: Workshop on Continuous Vector Space Models and the...
|
||
2025-06-11 11:02:41,326 - DEBUG - 块 609 生成文本: <triplet> Continuous Vector Space Models and their Compositionality <misc> ACL <org> publisher</s>
|
||
2025-06-11 11:02:41,326 - DEBUG - 原始生成文本: <triplet> Continuous Vector Space Models and their Compositionality <misc> ACL <org> publisher</s>
|
||
2025-06-11 11:02:41,326 - DEBUG - 处理后标记: ['<triplet>', 'Continuous Vector Space Models and their Compositionality', '<misc>', 'ACL', '<org>', 'publisher']
|
||
2025-06-11 11:02:41,326 - DEBUG - 添加三元组: Continuous Vector Space Models and their Compositionality(misc) - publisher - ACL(org)
|
||
2025-06-11 11:02:41,327 - DEBUG - 块 609 提取到 1 个三元组
|
||
2025-06-11 11:02:41,327 - DEBUG - 处理块 610/753: Xiao H, Huang ML, Meng L, Zhu XY. SSP: Semantic sp...
|
||
2025-06-11 11:02:41,475 - DEBUG - 块 610 生成文本: <triplet> <org> Semantic space projection <concept> studies</s>
|
||
2025-06-11 11:02:41,475 - DEBUG - 原始生成文本: <triplet> <org> Semantic space projection <concept> studies</s>
|
||
2025-06-11 11:02:41,475 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Semantic space projection', '<concept>', 'studies']
|
||
2025-06-11 11:02:41,475 - DEBUG - 处理块 611/753: of the 31st AAAI Conf. on Artificial Intelligence ...
|
||
2025-06-11 11:02:41,837 - DEBUG - 块 611 生成文本: <triplet> <eve> AAAI <org> conferred by</s>
|
||
2025-06-11 11:02:41,837 - DEBUG - 原始生成文本: <triplet> <eve> AAAI <org> conferred by</s>
|
||
2025-06-11 11:02:41,837 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'AAAI', '<org>', 'conferred by']
|
||
2025-06-11 11:02:41,837 - DEBUG - 处理块 612/753: An B, Chen B, Han XP, Sun L. Accurate text-enhance...
|
||
2025-06-11 11:02:42,497 - DEBUG - 块 612 生成文本: <triplet> graph representation learning <concept> An B <per> discoverer text-enhanced knowledge <misc> part of the Sun L. <eve> An C <media> part</s>
|
||
2025-06-11 11:02:42,497 - DEBUG - 原始生成文本: <triplet> graph representation learning <concept> An B <per> discoverer text-enhanced knowledge <misc> part of the Sun L. <eve> An C <media> part</s>
|
||
2025-06-11 11:02:42,497 - DEBUG - 处理后标记: ['<triplet>', 'graph representation learning', '<concept>', 'An B', '<per>', 'discoverer text-enhanced knowledge', '<misc>', 'part of the Sun L.', '<eve>', 'An C', '<media>', 'part']
|
||
2025-06-11 11:02:42,497 - DEBUG - 添加三元组: graph representation learning(concept) - discoverer text-enhanced knowledge - An B(per)
|
||
2025-06-11 11:02:42,497 - DEBUG - 块 612 提取到 1 个三元组
|
||
2025-06-11 11:02:42,497 - DEBUG - 处理块 613/753: North American Chapter of the Association for Comp...
|
||
2025-06-11 11:02:42,783 - DEBUG - 块 613 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:42,784 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:42,784 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:02:42,784 - DEBUG - 处理块 614/753: Linguistics (ACL), 2018. 745–755. [doi: 10.18653/v...
|
||
2025-06-11 11:02:43,028 - DEBUG - 块 614 生成文本: <triplet> 755. <concept> 745 <num> population</s>
|
||
2025-06-11 11:02:43,028 - DEBUG - 原始生成文本: <triplet> 755. <concept> 745 <num> population</s>
|
||
2025-06-11 11:02:43,028 - DEBUG - 处理后标记: ['<triplet>', '755.', '<concept>', '745', '<num>', 'population']
|
||
2025-06-11 11:02:43,028 - DEBUG - 添加三元组: 755.(concept) - population - 745(num)
|
||
2025-06-11 11:02:43,028 - DEBUG - 块 614 提取到 1 个三元组
|
||
2025-06-11 11:02:43,028 - DEBUG - 处理块 615/753: Galárraga LA, Teflioudi C, Hose K, Suchanek ...
|
||
2025-06-11 11:02:43,422 - DEBUG - 块 615 生成文本: <triplet> <concept> AMIE <org> standards body</s>
|
||
2025-06-11 11:02:43,422 - DEBUG - 原始生成文本: <triplet> <concept> AMIE <org> standards body</s>
|
||
2025-06-11 11:02:43,422 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'AMIE', '<org>', 'standards body']
|
||
2025-06-11 11:02:43,422 - DEBUG - 处理块 616/753: knowledge bases. In: Proc. of the 22nd Int’l Conf....
|
||
2025-06-11 11:02:43,697 - DEBUG - 块 616 生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:43,697 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:43,697 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:02:43,698 - DEBUG - 处理块 617/753: 2013. 413–422. [doi: 10.1145/2488388.2488425]
|
||
[102...
|
||
2025-06-11 11:02:44,017 - DEBUG - 块 617 生成文本: <triplet> <eve> 388 <num> number of participants</s>
|
||
2025-06-11 11:02:44,017 - DEBUG - 原始生成文本: <triplet> <eve> 388 <num> number of participants</s>
|
||
2025-06-11 11:02:44,017 - DEBUG - 处理后标记: ['<triplet>', '<eve>', '388', '<num>', 'number of participants']
|
||
2025-06-11 11:02:44,017 - DEBUG - 处理块 618/753: Galárraga L, Teflioudi C, Hose K, Suchanek FM. Fas...
|
||
2025-06-11 11:02:44,165 - DEBUG - 块 618 生成文本: <triplet> <concept> VLDB Journal <media> published in</s>
|
||
2025-06-11 11:02:44,165 - DEBUG - 原始生成文本: <triplet> <concept> VLDB Journal <media> published in</s>
|
||
2025-06-11 11:02:44,165 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'VLDB Journal', '<media>', 'published in']
|
||
2025-06-11 11:02:44,165 - DEBUG - 处理块 619/753: 2015, 24(6): 707–730. [doi: 10.1007/s00778-015-039...
|
||
2025-06-11 11:02:44,356 - DEBUG - 块 619 生成文本: <triplet> 707–730 <concept> 24 <num> number of parts of this work</s>
|
||
2025-06-11 11:02:44,356 - DEBUG - 原始生成文本: <triplet> 707–730 <concept> 24 <num> number of parts of this work</s>
|
||
2025-06-11 11:02:44,356 - DEBUG - 处理后标记: ['<triplet>', '707–730', '<concept>', '24', '<num>', 'number of parts of this work']
|
||
2025-06-11 11:02:44,356 - DEBUG - 添加三元组: 707–730(concept) - number of parts of this work - 24(num)
|
||
2025-06-11 11:02:44,356 - DEBUG - 块 619 提取到 1 个三元组
|
||
2025-06-11 11:02:44,356 - DEBUG - 处理块 620/753: Omran PG, Wang KW, Wang Z. An embedding-based appr...
|
||
2025-06-11 11:02:44,548 - DEBUG - 块 620 生成文本: <triplet> PG, Wang KW <media> Omran <per> author</s>
|
||
2025-06-11 11:02:44,549 - DEBUG - 原始生成文本: <triplet> PG, Wang KW <media> Omran <per> author</s>
|
||
2025-06-11 11:02:44,549 - DEBUG - 处理后标记: ['<triplet>', 'PG, Wang KW', '<media>', 'Omran', '<per>', 'author']
|
||
2025-06-11 11:02:44,549 - DEBUG - 添加三元组: PG, Wang KW(media) - author - Omran(per)
|
||
2025-06-11 11:02:44,549 - DEBUG - 块 620 提取到 1 个三元组
|
||
2025-06-11 11:02:44,549 - DEBUG - 处理块 621/753: Data Engineering, 2021, 33(4): 1348–1359. [doi: 10...
|
||
2025-06-11 11:02:44,782 - DEBUG - 块 621 生成文本: <triplet> <org> 1348 <date> inception <triplet> 1359 <time> 1358 <concept> follows</s>
|
||
2025-06-11 11:02:44,782 - DEBUG - 原始生成文本: <triplet> <org> 1348 <date> inception <triplet> 1359 <time> 1358 <concept> follows</s>
|
||
2025-06-11 11:02:44,782 - DEBUG - 处理后标记: ['<triplet>', '<org>', '1348', '<date>', 'inception', '<triplet>', '1359', '<time>', '1358', '<concept>', 'follows']
|
||
2025-06-11 11:02:44,782 - DEBUG - 处理块 622/753: Guo S, Wang Q, Wang LH, Wang B, Guo L. Knowledge g...
|
||
2025-06-11 11:02:45,777 - DEBUG - 块 622 生成文本: <triplet> graph <concept> Guo S <per> named after the 32nd <media> Guop S, GuO <org> follows</s>
|
||
2025-06-11 11:02:45,777 - DEBUG - 原始生成文本: <triplet> graph <concept> Guo S <per> named after the 32nd <media> Guop S, GuO <org> follows</s>
|
||
2025-06-11 11:02:45,777 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Guo S', '<per>', 'named after the 32nd', '<media>', 'Guop S, GuO', '<org>', 'follows']
|
||
2025-06-11 11:02:45,778 - DEBUG - 添加三元组: graph(concept) - named after the 32nd - Guo S(per)
|
||
2025-06-11 11:02:45,778 - DEBUG - 块 622 提取到 1 个三元组
|
||
2025-06-11 11:02:45,778 - DEBUG - 处理块 623/753: AAAI Conf. on Artificial Intelligence (AAAI). New ...
|
||
2025-06-11 11:02:46,001 - DEBUG - 块 623 生成文本: <triplet> <concept> AAAI <org> standards body</s>
|
||
2025-06-11 11:02:46,001 - DEBUG - 原始生成文本: <triplet> <concept> AAAI <org> standards body</s>
|
||
2025-06-11 11:02:46,001 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'AAAI', '<org>', 'standards body']
|
||
2025-06-11 11:02:46,001 - DEBUG - 处理块 624/753: Niu GL, Zhang YF, Li B, Cui P, Liu S, Li JY, Zhang...
|
||
2025-06-11 11:02:46,277 - DEBUG - 块 624 生成文本: <triplet> graphs <concept> Niu GL, Zhang YF, Li B <per> named after</s>
|
||
2025-06-11 11:02:46,277 - DEBUG - 原始生成文本: <triplet> graphs <concept> Niu GL, Zhang YF, Li B <per> named after</s>
|
||
2025-06-11 11:02:46,277 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Niu GL, Zhang YF, Li B', '<per>', 'named after']
|
||
2025-06-11 11:02:46,277 - DEBUG - 添加三元组: graphs(concept) - named after - Niu GL, Zhang YF, Li B(per)
|
||
2025-06-11 11:02:46,277 - DEBUG - 块 624 提取到 1 个三元组
|
||
2025-06-11 11:02:46,277 - DEBUG - 处理块 625/753: Proc. of the 34th AAAI Conf. on Artificial Intelli...
|
||
2025-06-11 11:02:46,563 - DEBUG - 块 625 生成文本: <triplet> <media> AAAI <org> conferred by</s>
|
||
2025-06-11 11:02:46,563 - DEBUG - 原始生成文本: <triplet> <media> AAAI <org> conferred by</s>
|
||
2025-06-11 11:02:46,563 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'AAAI', '<org>', 'conferred by']
|
||
2025-06-11 11:02:46,564 - DEBUG - 处理块 626/753: Xie RB, Liu ZY, Luan HB, Sun MS. Image-embodied kn...
|
||
2025-06-11 11:02:46,755 - DEBUG - 块 626 生成文本: <triplet> ZY <per> Liu <concept> ethnic group</s>
|
||
2025-06-11 11:02:46,755 - DEBUG - 原始生成文本: <triplet> ZY <per> Liu <concept> ethnic group</s>
|
||
2025-06-11 11:02:46,755 - DEBUG - 处理后标记: ['<triplet>', 'ZY', '<per>', 'Liu', '<concept>', 'ethnic group']
|
||
2025-06-11 11:02:46,755 - DEBUG - 添加三元组: ZY(per) - ethnic group - Liu(concept)
|
||
2025-06-11 11:02:46,755 - DEBUG - 块 626 提取到 1 个三元组
|
||
2025-06-11 11:02:46,755 - DEBUG - 处理块 627/753: Artificial Intelligence (IJCAI). Melbourne: IJCAI....
|
||
2025-06-11 11:02:46,892 - DEBUG - 块 627 生成文本: <triplet> <eve> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:02:46,893 - DEBUG - 原始生成文本: <triplet> <eve> Artificial Intelligence <concept> facet of</s>
|
||
2025-06-11 11:02:46,893 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'Artificial Intelligence', '<concept>', 'facet of']
|
||
2025-06-11 11:02:46,893 - DEBUG - 处理块 628/753: Krizhevsky A, Sutskever I, Hinton GE. ImageNet cla...
|
||
2025-06-11 11:02:47,179 - DEBUG - 块 628 生成文本: <triplet> <concept> Proc. of the 25th Int’l <media> described by source</s>
|
||
2025-06-11 11:02:47,179 - DEBUG - 原始生成文本: <triplet> <concept> Proc. of the 25th Int’l <media> described by source</s>
|
||
2025-06-11 11:02:47,179 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Proc. of the 25th Int’l', '<media>', 'described by source']
|
||
2025-06-11 11:02:47,179 - DEBUG - 处理块 629/753: Conf. on Neural Information Processing Systems (NI...
|
||
2025-06-11 11:02:47,509 - DEBUG - 块 629 生成文本: <triplet> Associates Inc. <org> Lake Tahoe <loc> headquarters location</s>
|
||
2025-06-11 11:02:47,509 - DEBUG - 原始生成文本: <triplet> Associates Inc. <org> Lake Tahoe <loc> headquarters location</s>
|
||
2025-06-11 11:02:47,509 - DEBUG - 处理后标记: ['<triplet>', 'Associates Inc.', '<org>', 'Lake Tahoe', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:47,509 - DEBUG - 添加三元组: Associates Inc.(org) - headquarters location - Lake Tahoe(loc)
|
||
2025-06-11 11:02:47,509 - DEBUG - 块 629 提取到 1 个三元组
|
||
2025-06-11 11:02:47,509 - DEBUG - 处理块 630/753: Feng J, Huang ML, Yang Y, Zhu XY. GAKE: Graph awar...
|
||
2025-06-11 11:02:47,903 - DEBUG - 块 630 生成文本: <triplet> ML, Yang Y, Zhu <org> XY.GAKE <media> part of</s>
|
||
2025-06-11 11:02:47,903 - DEBUG - 原始生成文本: <triplet> ML, Yang Y, Zhu <org> XY.GAKE <media> part of</s>
|
||
2025-06-11 11:02:47,903 - DEBUG - 处理后标记: ['<triplet>', 'ML, Yang Y, Zhu', '<org>', 'XY.GAKE', '<media>', 'part of']
|
||
2025-06-11 11:02:47,903 - DEBUG - 添加三元组: ML, Yang Y, Zhu(org) - part of - XY.GAKE(media)
|
||
2025-06-11 11:02:47,903 - DEBUG - 块 630 提取到 1 个三元组
|
||
2025-06-11 11:02:47,903 - DEBUG - 处理块 631/753: Linguistics (COLING). Osaka: The COLING 2016 Organ...
|
||
2025-06-11 11:02:48,062 - DEBUG - 块 631 生成文本: <triplet> <concept> Linguistics (COLING <media> instance of</s>
|
||
2025-06-11 11:02:48,062 - DEBUG - 原始生成文本: <triplet> <concept> Linguistics (COLING <media> instance of</s>
|
||
2025-06-11 11:02:48,062 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Linguistics (COLING', '<media>', 'instance of']
|
||
2025-06-11 11:02:48,062 - DEBUG - 处理块 632/753: Du WQ, Li BC, Wang R. Representation learning of k...
|
||
2025-06-11 11:02:48,285 - DEBUG - 块 632 生成文本: <triplet> graph integrating <concept> entity description <unk> part of <media> part <org> part</s>
|
||
2025-06-11 11:02:48,285 - DEBUG - 原始生成文本: <triplet> graph integrating <concept> entity description <unk> part of <media> part <org> part</s>
|
||
2025-06-11 11:02:48,285 - DEBUG - 处理后标记: ['<triplet>', 'graph integrating', '<concept>', 'entity description', '<unk>', 'part of', '<media>', 'part', '<org>', 'part']
|
||
2025-06-11 11:02:48,285 - DEBUG - 添加三元组: graph integrating(concept) - part of - entity description(unk)
|
||
2025-06-11 11:02:48,285 - DEBUG - 块 632 提取到 1 个三元组
|
||
2025-06-11 11:02:48,285 - DEBUG - 处理块 633/753: Information Processing, 2020, 34(7): 50–59 (in Ch...
|
||
2025-06-11 11:02:48,412 - DEBUG - 块 633 生成文本: <triplet> <org> Chinese <concept> language of work or name</s>
|
||
2025-06-11 11:02:48,412 - DEBUG - 原始生成文本: <triplet> <org> Chinese <concept> language of work or name</s>
|
||
2025-06-11 11:02:48,413 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Chinese', '<concept>', 'language of work or name']
|
||
2025-06-11 11:02:48,413 - DEBUG - 处理块 634/753: Tang X, Chen L, Cui J, Wei BG. Knowledge represent...
|
||
2025-06-11 11:02:48,635 - DEBUG - 块 634 生成文本: <triplet> <concept> Knowledge representation learning with entity descriptions <media> studies</s>
|
||
2025-06-11 11:02:48,635 - DEBUG - 原始生成文本: <triplet> <concept> Knowledge representation learning with entity descriptions <media> studies</s>
|
||
2025-06-11 11:02:48,635 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Knowledge representation learning with entity descriptions', '<media>', 'studies']
|
||
2025-06-11 11:02:48,635 - DEBUG - 处理块 635/753: Information Processing & Management, 2019, 55(3): ...
|
||
2025-06-11 11:02:48,784 - DEBUG - 块 635 生成文本: <triplet> <org> Information Processing & Management <concept> field of work</s>
|
||
2025-06-11 11:02:48,784 - DEBUG - 原始生成文本: <triplet> <org> Information Processing & Management <concept> field of work</s>
|
||
2025-06-11 11:02:48,784 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Information Processing & Management', '<concept>', 'field of work']
|
||
2025-06-11 11:02:48,784 - DEBUG - 处理块 636/753: Yih WT, Chang MW, He XD, Gao JF. Semantic parsing ...
|
||
2025-06-11 11:02:49,059 - DEBUG - 块 636 生成文本: <triplet> <concept> staged query graph generation <media> used by</s>
|
||
2025-06-11 11:02:49,060 - DEBUG - 原始生成文本: <triplet> <concept> staged query graph generation <media> used by</s>
|
||
2025-06-11 11:02:49,060 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'staged query graph generation', '<media>', 'used by']
|
||
2025-06-11 11:02:49,060 - DEBUG - 处理块 637/753: In: Proc. of the 53rd Annual Meeting of the Associ...
|
||
2025-06-11 11:02:49,452 - DEBUG - 块 637 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:49,453 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:49,453 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:49,453 - DEBUG - 处理块 638/753: Processing. Beijing: Association for Computational...
|
||
2025-06-11 11:02:49,729 - DEBUG - 块 638 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:49,729 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:49,729 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:49,729 - DEBUG - 处理块 639/753: Blanco R, Ottaviano G, Meij E. Fast and space-effi...
|
||
2025-06-11 11:02:50,102 - DEBUG - 块 639 生成文本: <triplet> <concept> Proc. of the 8th ACM Int’l Conf. on Web Search <media> follows</s>
|
||
2025-06-11 11:02:50,102 - DEBUG - 原始生成文本: <triplet> <concept> Proc. of the 8th ACM Int’l Conf. on Web Search <media> follows</s>
|
||
2025-06-11 11:02:50,102 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Proc. of the 8th ACM Int’l Conf. on Web Search', '<media>', 'follows']
|
||
2025-06-11 11:02:50,102 - DEBUG - 处理块 640/753: and Data Mining (WSDM). Shanghai: Association for ...
|
||
2025-06-11 11:02:50,452 - DEBUG - 块 640 生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:50,452 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:50,452 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:02:50,452 - DEBUG - 处理块 641/753: Pappu A, Blanco R, Mehdad Y, Stent A, Thadani K. L...
|
||
2025-06-11 11:02:50,580 - DEBUG - 块 641 生成文本: <triplet> <concept> 10th ACM <media> part of</s>
|
||
2025-06-11 11:02:50,580 - DEBUG - 原始生成文本: <triplet> <concept> 10th ACM <media> part of</s>
|
||
2025-06-11 11:02:50,580 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '10th ACM', '<media>', 'part of']
|
||
2025-06-11 11:02:50,580 - DEBUG - 处理块 642/753: 308 软件学报 2023年第 34卷第 1期
|
||
Int’l Conf. on Web Searc...
|
||
2025-06-11 11:02:51,016 - DEBUG - 块 642 生成文本: <triplet> 软件学报 2023年第 34卷 <unk> 2017 <date> publication date</s>
|
||
2025-06-11 11:02:51,016 - DEBUG - 原始生成文本: <triplet> 软件学报 2023年第 34卷 <unk> 2017 <date> publication date</s>
|
||
2025-06-11 11:02:51,016 - DEBUG - 处理后标记: ['<triplet>', '软件学报 2023年第 34卷', '<unk>', '2017', '<date>', 'publication date']
|
||
2025-06-11 11:02:51,016 - DEBUG - 添加三元组: 软件学报 2023年第 34卷(unk) - publication date - 2017(date)
|
||
2025-06-11 11:02:51,016 - DEBUG - 块 642 提取到 1 个三元组
|
||
2025-06-11 11:02:51,016 - DEBUG - 处理块 643/753: 1145/3018661.3018724]
|
||
...
|
||
2025-06-11 11:02:51,175 - DEBUG - 块 643 生成文本: <triplet> <concept> 661.3018724 <dis> follows</s>
|
||
2025-06-11 11:02:51,175 - DEBUG - 原始生成文本: <triplet> <concept> 661.3018724 <dis> follows</s>
|
||
2025-06-11 11:02:51,175 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '661.3018724', '<dis>', 'follows']
|
||
2025-06-11 11:02:51,175 - DEBUG - 处理块 644/753: Bordes A, Usunier N, Chopra S, Weston J. Large-sca...
|
||
2025-06-11 11:02:51,569 - DEBUG - 块 644 生成文本: <triplet> <concept> Large-scale simple question answering with memory networks.arXiv:1506.02075,2015 <unk> 2015 <date> publication date</s>
|
||
2025-06-11 11:02:51,569 - DEBUG - 原始生成文本: <triplet> <concept> Large-scale simple question answering with memory networks.arXiv:1506.02075,2015 <unk> 2015 <date> publication date</s>
|
||
2025-06-11 11:02:51,569 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Large-scale simple question answering with memory networks.arXiv:1506.02075,2015', '<unk>', '2015', '<date>', 'publication date']
|
||
2025-06-11 11:02:51,569 - DEBUG - 处理块 645/753: Yang MC, Duan N, Zhou M, Rim HC. Joint relational ...
|
||
2025-06-11 11:02:51,963 - DEBUG - 块 645 生成文本: <triplet> embeddings for knowledge-based question answering. In: Proc. of the 2014 Conf. <eve> 2014 <date> point in time</s>
|
||
2025-06-11 11:02:51,963 - DEBUG - 原始生成文本: <triplet> embeddings for knowledge-based question answering. In: Proc. of the 2014 Conf. <eve> 2014 <date> point in time</s>
|
||
2025-06-11 11:02:51,963 - DEBUG - 处理后标记: ['<triplet>', 'embeddings for knowledge-based question answering. In: Proc. of the 2014 Conf.', '<eve>', '2014', '<date>', 'point in time']
|
||
2025-06-11 11:02:51,963 - DEBUG - 添加三元组: embeddings for knowledge-based question answering. In: Proc. of the 2014 Conf.(eve) - point in time - 2014(date)
|
||
2025-06-11 11:02:51,963 - DEBUG - 块 645 提取到 1 个三元组
|
||
2025-06-11 11:02:51,963 - DEBUG - 处理块 646/753: on Empirical Methods in Natural Language Processin...
|
||
2025-06-11 11:02:52,144 - DEBUG - 块 646 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:52,144 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:52,144 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:52,144 - DEBUG - 处理块 647/753: 645–650. [doi: 10.3115/v1/D14-1071]
|
||
[116]
|
||
...
|
||
2025-06-11 11:02:52,410 - DEBUG - 块 647 生成文本: <triplet> <concept> 645–650 <misc> follows</s>
|
||
2025-06-11 11:02:52,410 - DEBUG - 原始生成文本: <triplet> <concept> 645–650 <misc> follows</s>
|
||
2025-06-11 11:02:52,410 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '645–650', '<misc>', 'follows']
|
||
2025-06-11 11:02:52,410 - DEBUG - 处理块 648/753: Yang MC, Lee DG, Park SY, Rim HC. Knowledge-based ...
|
||
2025-06-11 11:02:52,601 - DEBUG - 块 648 生成文本: <triplet> <concept> Knowledge-based question answering using the semantic <misc> instance of</s>
|
||
2025-06-11 11:02:52,601 - DEBUG - 原始生成文本: <triplet> <concept> Knowledge-based question answering using the semantic <misc> instance of</s>
|
||
2025-06-11 11:02:52,601 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Knowledge-based question answering using the semantic', '<misc>', 'instance of']
|
||
2025-06-11 11:02:52,601 - DEBUG - 处理块 649/753: Applications, 2015, 42(23): 9086–9104. [doi: 10.10...
|
||
2025-06-11 11:02:52,867 - DEBUG - 块 649 生成文本: <triplet> <concept> 2015 <date> point in time <triplet> Applications,2015 <time> 2015</s>
|
||
2025-06-11 11:02:52,867 - DEBUG - 原始生成文本: <triplet> <concept> 2015 <date> point in time <triplet> Applications,2015 <time> 2015</s>
|
||
2025-06-11 11:02:52,867 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '2015', '<date>', 'point in time', '<triplet>', 'Applications,2015', '<time>', '2015']
|
||
2025-06-11 11:02:52,867 - DEBUG - 处理块 650/753: Dai ZH, Li L, Xu W. CFO: Conditional focused neura...
|
||
2025-06-11 11:02:53,228 - DEBUG - 块 650 生成文本: <triplet> ZH, Li L, Xu <per> CFO <concept> field of work</s>
|
||
2025-06-11 11:02:53,228 - DEBUG - 原始生成文本: <triplet> ZH, Li L, Xu <per> CFO <concept> field of work</s>
|
||
2025-06-11 11:02:53,228 - DEBUG - 处理后标记: ['<triplet>', 'ZH, Li L, Xu', '<per>', 'CFO', '<concept>', 'field of work']
|
||
2025-06-11 11:02:53,228 - DEBUG - 添加三元组: ZH, Li L, Xu(per) - field of work - CFO(concept)
|
||
2025-06-11 11:02:53,228 - DEBUG - 块 650 提取到 1 个三元组
|
||
2025-06-11 11:02:53,229 - DEBUG - 处理块 651/753: Annual Meeting of the Association for Computationa...
|
||
2025-06-11 11:02:53,558 - DEBUG - 块 651 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:53,558 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:02:53,558 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:02:53,558 - DEBUG - 处理块 652/753: 2016. 800–810. [doi: 10.18653/v1/P16-1076]
|
||
[118]
|
||
...
|
||
2025-06-11 11:02:53,909 - DEBUG - 块 652 生成文本: <triplet> <concept> 1076 <date> point in time</s>
|
||
2025-06-11 11:02:53,909 - DEBUG - 原始生成文本: <triplet> <concept> 1076 <date> point in time</s>
|
||
2025-06-11 11:02:53,909 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1076', '<date>', 'point in time']
|
||
2025-06-11 11:02:53,909 - DEBUG - 处理块 653/753: Dong L, Wei FR, Zhou M, Xu K. Question answering o...
|
||
2025-06-11 11:02:54,058 - DEBUG - 块 653 生成文本: <triplet> <concept> convolutional neural networks</s>
|
||
2025-06-11 11:02:54,058 - DEBUG - 原始生成文本: <triplet> <concept> convolutional neural networks</s>
|
||
2025-06-11 11:02:54,058 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'convolutional neural networks']
|
||
2025-06-11 11:02:54,058 - DEBUG - 处理块 654/753: 53rd Annual Meeting of the Association for Computa...
|
||
2025-06-11 11:02:54,398 - DEBUG - 块 654 生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> Int’l Joint</s>
|
||
2025-06-11 11:02:54,398 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> Int’l Joint</s>
|
||
2025-06-11 11:02:54,398 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'part of', '<triplet>', 'Int’l Joint']
|
||
2025-06-11 11:02:54,398 - DEBUG - 处理块 655/753: Beijing: Association for Computational Linguistics...
|
||
2025-06-11 11:02:54,674 - DEBUG - 块 655 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:54,674 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:02:54,674 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:02:54,674 - DEBUG - 处理块 656/753: Hao YC, Zhang YZ, Liu K, He SZ, Liu ZY, Wu H, Zhao...
|
||
2025-06-11 11:02:55,164 - DEBUG - 块 656 生成文本: <triplet> ZY <per> Liu <loc> country of citizenship</s>
|
||
2025-06-11 11:02:55,164 - DEBUG - 原始生成文本: <triplet> ZY <per> Liu <loc> country of citizenship</s>
|
||
2025-06-11 11:02:55,164 - DEBUG - 处理后标记: ['<triplet>', 'ZY', '<per>', 'Liu', '<loc>', 'country of citizenship']
|
||
2025-06-11 11:02:55,164 - DEBUG - 添加三元组: ZY(per) - country of citizenship - Liu(loc)
|
||
2025-06-11 11:02:55,164 - DEBUG - 块 656 提取到 1 个三元组
|
||
2025-06-11 11:02:55,164 - DEBUG - 处理块 657/753: cross-attention combining global knowledge. In: Pr...
|
||
2025-06-11 11:02:55,600 - DEBUG - 块 657 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of <triplet> of</s>
|
||
2025-06-11 11:02:55,600 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of <triplet> of</s>
|
||
2025-06-11 11:02:55,601 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of', '<triplet>', 'of']
|
||
2025-06-11 11:02:55,601 - DEBUG - 处理块 658/753: (ACL). Vancouver: Association for Computational Li...
|
||
2025-06-11 11:02:55,877 - DEBUG - 块 658 生成文本: <triplet> <concept> Association for Computational Linguistics (ACL) <org> member of</s>
|
||
2025-06-11 11:02:55,877 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics (ACL) <org> member of</s>
|
||
2025-06-11 11:02:55,877 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics (ACL)', '<org>', 'member of']
|
||
2025-06-11 11:02:55,877 - DEBUG - 处理块 659/753: Lukovnikov D, Fischer A, Lehmann J, Auer S. Neural...
|
||
2025-06-11 11:02:56,196 - DEBUG - 块 659 生成文本: <triplet> graphs <concept> Neural network-based question answering over knowledge <media> part of</s>
|
||
2025-06-11 11:02:56,196 - DEBUG - 原始生成文本: <triplet> graphs <concept> Neural network-based question answering over knowledge <media> part of</s>
|
||
2025-06-11 11:02:56,196 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Neural network-based question answering over knowledge', '<media>', 'part of']
|
||
2025-06-11 11:02:56,196 - DEBUG - 添加三元组: graphs(concept) - part of - Neural network-based question answering over knowledge(media)
|
||
2025-06-11 11:02:56,196 - DEBUG - 块 659 提取到 1 个三元组
|
||
2025-06-11 11:02:56,196 - DEBUG - 处理块 660/753: level. In: Proc. of the 26th Int’l Conf. on World ...
|
||
2025-06-11 11:02:56,452 - DEBUG - 块 660 生成文本: <triplet> <concept> ACM <org> conferred by</s>
|
||
2025-06-11 11:02:56,452 - DEBUG - 原始生成文本: <triplet> <concept> ACM <org> conferred by</s>
|
||
2025-06-11 11:02:56,452 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM', '<org>', 'conferred by']
|
||
2025-06-11 11:02:56,452 - DEBUG - 处理块 661/753: Yin WP, Yu M, Xiang B, Zhou BW, Schütze H. Simple ...
|
||
2025-06-11 11:02:56,996 - DEBUG - 块 661 生成文本: <triplet> <concept> Yin WP <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:56,996 - DEBUG - 原始生成文本: <triplet> <concept> Yin WP <per> discoverer or inventor</s>
|
||
2025-06-11 11:02:56,996 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Yin WP', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:02:56,997 - DEBUG - 处理块 662/753: 26th Int’l Conf. on Computational Linguistics: Tec...
|
||
2025-06-11 11:02:57,156 - DEBUG - 块 662 生成文本: <triplet> <media> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:02:57,156 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:02:57,156 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'main subject']
|
||
2025-06-11 11:02:57,156 - DEBUG - 处理块 663/753: Huang X, Zhang JY, Li DC, Li P. Knowledge graph em...
|
||
2025-06-11 11:02:57,948 - DEBUG - 块 663 生成文本: <triplet> graph embedding based question answering <concept> instance of the 12th ACM Int’l Conf. <misc> part <media> part</s>
|
||
2025-06-11 11:02:57,948 - DEBUG - 原始生成文本: <triplet> graph embedding based question answering <concept> instance of the 12th ACM Int’l Conf. <misc> part <media> part</s>
|
||
2025-06-11 11:02:57,948 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding based question answering', '<concept>', 'instance of the 12th ACM Int’l Conf.', '<misc>', 'part', '<media>', 'part']
|
||
2025-06-11 11:02:57,949 - DEBUG - 添加三元组: graph embedding based question answering(concept) - part - instance of the 12th ACM Int’l Conf.(misc)
|
||
2025-06-11 11:02:57,949 - DEBUG - 块 663 提取到 1 个三元组
|
||
2025-06-11 11:02:57,949 - DEBUG - 处理块 664/753: Web Search and Data Mining (WSDM). Melbourne: Asso...
|
||
2025-06-11 11:02:58,289 - DEBUG - 块 664 生成文本: <triplet> <media> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:58,289 - DEBUG - 原始生成文本: <triplet> <media> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:58,289 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:02:58,289 - DEBUG - 处理块 665/753: Di Noia T, Ostuni VC, Tomeo P, Di Sciascio E. SPra...
|
||
2025-06-11 11:02:58,630 - DEBUG - 块 665 生成文本: <triplet> <org> Semantic <concept> programming language</s>
|
||
2025-06-11 11:02:58,630 - DEBUG - 原始生成文本: <triplet> <org> Semantic <concept> programming language</s>
|
||
2025-06-11 11:02:58,630 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Semantic', '<concept>', 'programming language']
|
||
2025-06-11 11:02:58,630 - DEBUG - 处理块 666/753: data. ACM Trans. on Intelligent Systems and Techno...
|
||
2025-06-11 11:02:58,937 - DEBUG - 块 666 生成文本: <triplet> <concept> ACM <org> part of <triplet> Trans.on Intelligent Systems and Technology <unk> A CM <eve> is a list of</s>
|
||
2025-06-11 11:02:58,938 - DEBUG - 原始生成文本: <triplet> <concept> ACM <org> part of <triplet> Trans.on Intelligent Systems and Technology <unk> A CM <eve> is a list of</s>
|
||
2025-06-11 11:02:58,938 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM', '<org>', 'part of', '<triplet>', 'Trans.on Intelligent Systems and Technology', '<unk>', 'A CM', '<eve>', 'is a list of']
|
||
2025-06-11 11:02:58,938 - DEBUG - 处理块 667/753: Yu X, Ren X, Sun YZ, Gu QQ, Sturt B, Khandelwal U,...
|
||
2025-06-11 11:02:59,246 - DEBUG - 块 667 生成文本: <triplet> QQ <misc> Personalized entity recommendation <concept> instance of</s>
|
||
2025-06-11 11:02:59,246 - DEBUG - 原始生成文本: <triplet> QQ <misc> Personalized entity recommendation <concept> instance of</s>
|
||
2025-06-11 11:02:59,246 - DEBUG - 处理后标记: ['<triplet>', 'QQ', '<misc>', 'Personalized entity recommendation', '<concept>', 'instance of']
|
||
2025-06-11 11:02:59,246 - DEBUG - 添加三元组: QQ(misc) - instance of - Personalized entity recommendation(concept)
|
||
2025-06-11 11:02:59,246 - DEBUG - 块 667 提取到 1 个三元组
|
||
2025-06-11 11:02:59,246 - DEBUG - 处理块 668/753: information network approach. In: Proc. of the 7th...
|
||
2025-06-11 11:02:59,395 - DEBUG - 块 668 生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:02:59,395 - DEBUG - 原始生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:02:59,395 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New York', '<loc>', 'headquarters location']
|
||
2025-06-11 11:02:59,395 - DEBUG - 处理块 669/753: for Computing Machinery, 2014. 283–292. [doi: 10.1...
|
||
2025-06-11 11:02:59,532 - DEBUG - 块 669 生成文本: <triplet> <per> Computing Machinery <concept> field of work</s>
|
||
2025-06-11 11:02:59,532 - DEBUG - 原始生成文本: <triplet> <per> Computing Machinery <concept> field of work</s>
|
||
2025-06-11 11:02:59,532 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'Computing Machinery', '<concept>', 'field of work']
|
||
2025-06-11 11:02:59,532 - DEBUG - 处理块 670/753: Catherine R, Cohen W. Personalized recommendations...
|
||
2025-06-11 11:02:59,702 - DEBUG - 块 670 生成文本: <triplet> graphs <concept> probabilistic logic programming <media> part of</s>
|
||
2025-06-11 11:02:59,702 - DEBUG - 原始生成文本: <triplet> graphs <concept> probabilistic logic programming <media> part of</s>
|
||
2025-06-11 11:02:59,702 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'probabilistic logic programming', '<media>', 'part of']
|
||
2025-06-11 11:02:59,702 - DEBUG - 添加三元组: graphs(concept) - part of - probabilistic logic programming(media)
|
||
2025-06-11 11:02:59,702 - DEBUG - 块 670 提取到 1 个三元组
|
||
2025-06-11 11:02:59,702 - DEBUG - 处理块 671/753: of the 10th ACM Conf. on Recommender Systems (RecS...
|
||
2025-06-11 11:02:59,882 - DEBUG - 块 671 生成文本: <triplet> <media> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:59,882 - DEBUG - 原始生成文本: <triplet> <media> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:02:59,883 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:02:59,883 - DEBUG - 处理块 672/753: [126]
|
||
Ostuni VX, Di Noia T, Mirizzi R, Di Sciascio...
|
||
2025-06-11 11:03:00,095 - DEBUG - 块 672 生成文本: <triplet> <org> Ostuni VX <per> author</s>
|
||
2025-06-11 11:03:00,095 - DEBUG - 原始生成文本: <triplet> <org> Ostuni VX <per> author</s>
|
||
2025-06-11 11:03:00,096 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Ostuni VX', '<per>', 'author']
|
||
2025-06-11 11:03:00,096 - DEBUG - 处理块 673/753: of the 5th Italian Information Retrieval Workshop ...
|
||
2025-06-11 11:03:00,361 - DEBUG - 块 673 生成文本: <triplet> WS <media> 2014 <date> inception</s>
|
||
2025-06-11 11:03:00,361 - DEBUG - 原始生成文本: <triplet> WS <media> 2014 <date> inception</s>
|
||
2025-06-11 11:03:00,361 - DEBUG - 处理后标记: ['<triplet>', 'WS', '<media>', '2014', '<date>', 'inception']
|
||
2025-06-11 11:03:00,361 - DEBUG - 添加三元组: WS(media) - inception - 2014(date)
|
||
2025-06-11 11:03:00,361 - DEBUG - 块 673 提取到 1 个三元组
|
||
2025-06-11 11:03:00,361 - DEBUG - 处理块 674/753: Palumbo E, Rizzo G, Troncy R. entity2rec: Learning...
|
||
2025-06-11 11:03:00,510 - DEBUG - 块 674 生成文本: <triplet> graphs <concept> item recommendation <media> use</s>
|
||
2025-06-11 11:03:00,510 - DEBUG - 原始生成文本: <triplet> graphs <concept> item recommendation <media> use</s>
|
||
2025-06-11 11:03:00,510 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'item recommendation', '<media>', 'use']
|
||
2025-06-11 11:03:00,510 - DEBUG - 添加三元组: graphs(concept) - use - item recommendation(media)
|
||
2025-06-11 11:03:00,510 - DEBUG - 块 674 提取到 1 个三元组
|
||
2025-06-11 11:03:00,510 - DEBUG - 处理块 675/753: Proc. of the 11th ACM Conf. on Recommender Systems...
|
||
2025-06-11 11:03:00,839 - DEBUG - 块 675 生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:00,839 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:00,839 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:03:00,839 - DEBUG - 处理块 676/753: [128]
|
||
Zhang FZ, Yuan NJ, Lian DF, Xie X, Ma WY. Co...
|
||
2025-06-11 11:03:01,126 - DEBUG - 块 676 生成文本: <triplet> <media> knowledge base <concept> subclass of</s>
|
||
2025-06-11 11:03:01,126 - DEBUG - 原始生成文本: <triplet> <media> knowledge base <concept> subclass of</s>
|
||
2025-06-11 11:03:01,126 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'knowledge base', '<concept>', 'subclass of']
|
||
2025-06-11 11:03:01,127 - DEBUG - 处理块 677/753: 22nd ACM SIGKDD Int’l Conf. on Knowledge Discovery...
|
||
2025-06-11 11:03:01,391 - DEBUG - 块 677 生成文本: <triplet> <org> San Francisco <loc> headquarters location</s>
|
||
2025-06-11 11:03:01,392 - DEBUG - 原始生成文本: <triplet> <org> San Francisco <loc> headquarters location</s>
|
||
2025-06-11 11:03:01,392 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'San Francisco', '<loc>', 'headquarters location']
|
||
2025-06-11 11:03:01,392 - DEBUG - 处理块 678/753: Machinery, 2016. 353–362. [doi: 10.1145/2939672.29...
|
||
2025-06-11 11:03:01,657 - DEBUG - 块 678 生成文本: <triplet> <concept> 353 <num> quantity <triplet> 322 <misc> <time> <date> point in time</s>
|
||
2025-06-11 11:03:01,657 - DEBUG - 原始生成文本: <triplet> <concept> 353 <num> quantity <triplet> 322 <misc> <time> <date> point in time</s>
|
||
2025-06-11 11:03:01,657 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '353', '<num>', 'quantity', '<triplet>', '322', '<misc>', '<time>', '<date>', 'point in time']
|
||
2025-06-11 11:03:01,657 - DEBUG - 处理块 679/753: Wang HW, Zhang FZ, Xie X, Guo MY. DKN: Deep knowle...
|
||
2025-06-11 11:03:01,795 - DEBUG - 块 679 生成文本: <triplet> FZ <org> DKN <media> member of</s>
|
||
2025-06-11 11:03:01,795 - DEBUG - 原始生成文本: <triplet> FZ <org> DKN <media> member of</s>
|
||
2025-06-11 11:03:01,795 - DEBUG - 处理后标记: ['<triplet>', 'FZ', '<org>', 'DKN', '<media>', 'member of']
|
||
2025-06-11 11:03:01,795 - DEBUG - 添加三元组: FZ(org) - member of - DKN(media)
|
||
2025-06-11 11:03:01,795 - DEBUG - 块 679 提取到 1 个三元组
|
||
2025-06-11 11:03:01,795 - DEBUG - 处理块 680/753: on World Wide Web. Lyon: Association for Computing...
|
||
2025-06-11 11:03:02,093 - DEBUG - 块 680 生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:02,093 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:02,093 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:03:02,093 - DEBUG - 处理块 681/753: Wang HW, Zhang FZ, Zhao M, Li WJ, Xie X, Guo MY. M...
|
||
2025-06-11 11:03:02,316 - DEBUG - 块 681 生成文本: <triplet> graph enhanced recommendation <concept> use</s>
|
||
2025-06-11 11:03:02,316 - DEBUG - 原始生成文本: <triplet> graph enhanced recommendation <concept> use</s>
|
||
2025-06-11 11:03:02,316 - DEBUG - 处理后标记: ['<triplet>', 'graph enhanced recommendation', '<concept>', 'use']
|
||
2025-06-11 11:03:02,316 - DEBUG - 处理块 682/753: Proc. of the 2019 Conf. on World Wide Web (WWW). S...
|
||
2025-06-11 11:03:02,766 - DEBUG - 块 682 生成文本: <triplet> <media> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:02,766 - DEBUG - 原始生成文本: <triplet> <media> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:02,766 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:03:02,766 - DEBUG - 处理块 683/753: [131]
|
||
Ai QY, Azizi V, Chen X, Zhang YF. Le...
|
||
2025-06-11 11:03:02,958 - DEBUG - 块 683 生成文本: <triplet> embeddings <concept> heterogeneous knowledge base <misc> part of</s>
|
||
2025-06-11 11:03:02,958 - DEBUG - 原始生成文本: <triplet> embeddings <concept> heterogeneous knowledge base <misc> part of</s>
|
||
2025-06-11 11:03:02,958 - DEBUG - 处理后标记: ['<triplet>', 'embeddings', '<concept>', 'heterogeneous knowledge base', '<misc>', 'part of']
|
||
2025-06-11 11:03:02,958 - DEBUG - 添加三元组: embeddings(concept) - part of - heterogeneous knowledge base(misc)
|
||
2025-06-11 11:03:02,958 - DEBUG - 块 683 提取到 1 个三元组
|
||
2025-06-11 11:03:02,958 - DEBUG - 处理块 684/753: Algorithms, 2018, 11(9): 137. [doi: 10.3390/a11090...
|
||
2025-06-11 11:03:03,085 - DEBUG - 块 684 生成文本: <triplet> <org> Algorithms <concept> part of</s>
|
||
2025-06-11 11:03:03,085 - DEBUG - 原始生成文本: <triplet> <org> Algorithms <concept> part of</s>
|
||
2025-06-11 11:03:03,085 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Algorithms', '<concept>', 'part of']
|
||
2025-06-11 11:03:03,085 - DEBUG - 处理块 685/753: Chowdhury G, Srilakshmi M, Chain M, Sarkar S. Neur...
|
||
2025-06-11 11:03:03,480 - DEBUG - 块 685 生成文本: <triplet> graph <concept> Neural factorization for offer recommendation <media> use</s>
|
||
2025-06-11 11:03:03,480 - DEBUG - 原始生成文本: <triplet> graph <concept> Neural factorization for offer recommendation <media> use</s>
|
||
2025-06-11 11:03:03,480 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Neural factorization for offer recommendation', '<media>', 'use']
|
||
2025-06-11 11:03:03,480 - DEBUG - 添加三元组: graph(concept) - use - Neural factorization for offer recommendation(media)
|
||
2025-06-11 11:03:03,480 - DEBUG - 块 685 提取到 1 个三元组
|
||
2025-06-11 11:03:03,480 - DEBUG - 处理块 686/753: In: Proc. of the SIGIR 2019 Workshop on eCommerce,...
|
||
2025-06-11 11:03:03,864 - DEBUG - 块 686 生成文本: <triplet> <org> ACM <concept> instance of <triplet> SIGIR Conf. on Research and Development <media> ASM <eve> instance</s>
|
||
2025-06-11 11:03:03,864 - DEBUG - 原始生成文本: <triplet> <org> ACM <concept> instance of <triplet> SIGIR Conf. on Research and Development <media> ASM <eve> instance</s>
|
||
2025-06-11 11:03:03,864 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'ACM', '<concept>', 'instance of', '<triplet>', 'SIGIR Conf. on Research and Development', '<media>', 'ASM', '<eve>', 'instance']
|
||
2025-06-11 11:03:03,864 - DEBUG - 处理块 687/753: in Information Retrieval. Paris: CEUR-WS, 2019.
|
||
[1...
|
||
2025-06-11 11:03:04,119 - DEBUG - 块 687 生成文本: <triplet> 知识图谱嵌入技术研究综述 <unk> 张天成 <per> author</s>
|
||
2025-06-11 11:03:04,119 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入技术研究综述 <unk> 张天成 <per> author</s>
|
||
2025-06-11 11:03:04,119 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入技术研究综述', '<unk>', '张天成', '<per>', 'author']
|
||
2025-06-11 11:03:04,119 - DEBUG - 添加三元组: 知识图谱嵌入技术研究综述(unk) - author - 张天成(per)
|
||
2025-06-11 11:03:04,119 - DEBUG - 块 687 提取到 1 个三元组
|
||
2025-06-11 11:03:04,119 - DEBUG - 处理块 688/753: Sha X, Sun Z, Zhang J. Hierarchical attentive know...
|
||
2025-06-11 11:03:04,792 - DEBUG - 块 688 生成文本: <triplet> graph embedding for personalized recommendation <concept> Sha X, Sun Z, Zhang J. Hierarchical attentive knowledge <misc> Sun <per> named</s>
|
||
2025-06-11 11:03:04,792 - DEBUG - 原始生成文本: <triplet> graph embedding for personalized recommendation <concept> Sha X, Sun Z, Zhang J. Hierarchical attentive knowledge <misc> Sun <per> named</s>
|
||
2025-06-11 11:03:04,792 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding for personalized recommendation', '<concept>', 'Sha X, Sun Z, Zhang J. Hierarchical attentive knowledge', '<misc>', 'Sun', '<per>', 'named']
|
||
2025-06-11 11:03:04,792 - DEBUG - 添加三元组: graph embedding for personalized recommendation(concept) - Sun - Sha X, Sun Z, Zhang J. Hierarchical attentive knowledge(misc)
|
||
2025-06-11 11:03:04,792 - DEBUG - 块 688 提取到 1 个三元组
|
||
2025-06-11 11:03:04,792 - DEBUG - 处理块 689/753: Ni CC, Liu KS, Torzec N. Layered graph embedding f...
|
||
2025-06-11 11:03:05,111 - DEBUG - 块 689 生成文本: <triplet> wikipedia <media> Knowledge graph <concept> instance of</s>
|
||
2025-06-11 11:03:05,112 - DEBUG - 原始生成文本: <triplet> wikipedia <media> Knowledge graph <concept> instance of</s>
|
||
2025-06-11 11:03:05,112 - DEBUG - 处理后标记: ['<triplet>', 'wikipedia', '<media>', 'Knowledge graph', '<concept>', 'instance of']
|
||
2025-06-11 11:03:05,112 - DEBUG - 添加三元组: wikipedia(media) - instance of - Knowledge graph(concept)
|
||
2025-06-11 11:03:05,112 - DEBUG - 块 689 提取到 1 个三元组
|
||
2025-06-11 11:03:05,112 - DEBUG - 处理块 690/753: Proc. of the 2020 Companion of the Web Conf. Taipe...
|
||
2025-06-11 11:03:05,388 - DEBUG - 块 690 生成文本: <triplet> <org> Taipei <loc> headquarters location</s>
|
||
2025-06-11 11:03:05,388 - DEBUG - 原始生成文本: <triplet> <org> Taipei <loc> headquarters location</s>
|
||
2025-06-11 11:03:05,388 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Taipei', '<loc>', 'headquarters location']
|
||
2025-06-11 11:03:05,388 - DEBUG - 处理块 691/753: Zelenko D, Aone C, Richardella A. Kernel methods f...
|
||
2025-06-11 11:03:05,547 - DEBUG - 块 691 生成文本: <triplet> <media> Journal of Machine Learning Research <org> publisher</s>
|
||
2025-06-11 11:03:05,547 - DEBUG - 原始生成文本: <triplet> <media> Journal of Machine Learning Research <org> publisher</s>
|
||
2025-06-11 11:03:05,547 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Journal of Machine Learning Research', '<org>', 'publisher']
|
||
2025-06-11 11:03:05,547 - DEBUG - 处理块 692/753: Zeng DJ, Liu K, Lai SW, Zhou GY, Zhao J. Relation ...
|
||
2025-06-11 11:03:05,717 - DEBUG - 块 692 生成文本: <triplet> GY <concept> Interferometrics <media> part of</s>
|
||
2025-06-11 11:03:05,717 - DEBUG - 原始生成文本: <triplet> GY <concept> Interferometrics <media> part of</s>
|
||
2025-06-11 11:03:05,717 - DEBUG - 处理后标记: ['<triplet>', 'GY', '<concept>', 'Interferometrics', '<media>', 'part of']
|
||
2025-06-11 11:03:05,717 - DEBUG - 添加三元组: GY(concept) - part of - Interferometrics(media)
|
||
2025-06-11 11:03:05,717 - DEBUG - 块 692 提取到 1 个三元组
|
||
2025-06-11 11:03:05,718 - DEBUG - 处理块 693/753: Conf. on Computational Linguistics (COLING). Dubli...
|
||
2025-06-11 11:03:05,887 - DEBUG - 块 693 生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:03:05,888 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:03:05,888 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:03:05,888 - DEBUG - 处理块 694/753: Riedel S, Yao LM, McCallum A. Modeling relations a...
|
||
2025-06-11 11:03:06,100 - DEBUG - 块 694 生成文本: <triplet> LM <org> Modeling relations <concept> field of work</s>
|
||
2025-06-11 11:03:06,100 - DEBUG - 原始生成文本: <triplet> LM <org> Modeling relations <concept> field of work</s>
|
||
2025-06-11 11:03:06,100 - DEBUG - 处理后标记: ['<triplet>', 'LM', '<org>', 'Modeling relations', '<concept>', 'field of work']
|
||
2025-06-11 11:03:06,100 - DEBUG - 添加三元组: LM(org) - field of work - Modeling relations(concept)
|
||
2025-06-11 11:03:06,100 - DEBUG - 块 694 提取到 1 个三元组
|
||
2025-06-11 11:03:06,100 - DEBUG - 处理块 695/753: Machine Learning and Knowledge Discovery in Databa...
|
||
2025-06-11 11:03:06,409 - DEBUG - 块 695 生成文本: <triplet> <org> Machine Learning <concept> main subject has role</s>
|
||
2025-06-11 11:03:06,409 - DEBUG - 原始生成文本: <triplet> <org> Machine Learning <concept> main subject has role</s>
|
||
2025-06-11 11:03:06,409 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Machine Learning', '<concept>', 'main subject has role']
|
||
2025-06-11 11:03:06,409 - DEBUG - 处理块 696/753: Surdeanu M, Tibshirani J, Nallapati R, Manning CD....
|
||
2025-06-11 11:03:06,781 - DEBUG - 块 696 生成文本: <triplet> <concept> multi-label learning for relation extraction. In: Proc. of the 2012 <media> 2012</s>
|
||
2025-06-11 11:03:06,781 - DEBUG - 原始生成文本: <triplet> <concept> multi-label learning for relation extraction. In: Proc. of the 2012 <media> 2012</s>
|
||
2025-06-11 11:03:06,781 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'multi-label learning for relation extraction. In: Proc. of the 2012', '<media>', '2012']
|
||
2025-06-11 11:03:06,781 - DEBUG - 处理块 697/753: Joint Conf. on Empirical Methods in Natural Langua...
|
||
2025-06-11 11:03:07,014 - DEBUG - 块 697 生成文本: <triplet> <concept> Joint Conf. on Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:03:07,015 - DEBUG - 原始生成文本: <triplet> <concept> Joint Conf. on Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:03:07,015 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Joint Conf. on Empirical Methods in Natural Language Processing', '<media>', 'studies']
|
||
2025-06-11 11:03:07,015 - DEBUG - 处理块 698/753: Jeju Island: Association for Computational Linguis...
|
||
2025-06-11 11:03:07,312 - DEBUG - 块 698 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:03:07,312 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:03:07,312 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:03:07,312 - DEBUG - 处理块 699/753: Weston J, Bordes A, Yakhnenko O, Usunier N. Connec...
|
||
2025-06-11 11:03:07,611 - DEBUG - 块 699 生成文本: <triplet> embedding model <concept> Connecting language and knowledge bases with <media> studies</s>
|
||
2025-06-11 11:03:07,612 - DEBUG - 原始生成文本: <triplet> embedding model <concept> Connecting language and knowledge bases with <media> studies</s>
|
||
2025-06-11 11:03:07,612 - DEBUG - 处理后标记: ['<triplet>', 'embedding model', '<concept>', 'Connecting language and knowledge bases with', '<media>', 'studies']
|
||
2025-06-11 11:03:07,612 - DEBUG - 添加三元组: embedding model(concept) - studies - Connecting language and knowledge bases with(media)
|
||
2025-06-11 11:03:07,612 - DEBUG - 块 699 提取到 1 个三元组
|
||
2025-06-11 11:03:07,612 - DEBUG - 处理块 700/753: extraction. In: Proc. of the 2013 Conf. on Empiric...
|
||
2025-06-11 11:03:07,952 - DEBUG - 块 700 生成文本: <triplet> <media> Association for <org> publisher <triplet> Association <concept> Seattle <loc> location</s>
|
||
2025-06-11 11:03:07,953 - DEBUG - 原始生成文本: <triplet> <media> Association for <org> publisher <triplet> Association <concept> Seattle <loc> location</s>
|
||
2025-06-11 11:03:07,953 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for', '<org>', 'publisher', '<triplet>', 'Association', '<concept>', 'Seattle', '<loc>', 'location']
|
||
2025-06-11 11:03:07,953 - DEBUG - 处理块 701/753: Computational Linguistics (ACL), 2013. 1366–1371.
|
||
...
|
||
2025-06-11 11:03:08,154 - DEBUG - 块 701 生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:03:08,154 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> part of</s>
|
||
2025-06-11 11:03:08,154 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'part of']
|
||
2025-06-11 11:03:08,154 - DEBUG - 处理块 702/753: Han X, Liu ZY, Sun MS. Joint representation learni...
|
||
2025-06-11 11:03:08,762 - DEBUG - 块 702 生成文本: <triplet> <concept> Joint representation learning of text and knowledge for knowledge graph completion.arXiv <media> 1611.04125, 2016 <date> publication date</s>
|
||
2025-06-11 11:03:08,762 - DEBUG - 原始生成文本: <triplet> <concept> Joint representation learning of text and knowledge for knowledge graph completion.arXiv <media> 1611.04125, 2016 <date> publication date</s>
|
||
2025-06-11 11:03:08,762 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Joint representation learning of text and knowledge for knowledge graph completion.arXiv', '<media>', '1611.04125, 2016', '<date>', 'publication date']
|
||
2025-06-11 11:03:08,762 - DEBUG - 处理块 703/753: Han X, Liu ZY, Sun MS. Neural knowledge acquisitio...
|
||
2025-06-11 11:03:09,198 - DEBUG - 块 703 生成文本: <triplet> graph <concept> Neural knowledge <misc> studies</s>
|
||
2025-06-11 11:03:09,199 - DEBUG - 原始生成文本: <triplet> graph <concept> Neural knowledge <misc> studies</s>
|
||
2025-06-11 11:03:09,199 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'Neural knowledge', '<misc>', 'studies']
|
||
2025-06-11 11:03:09,199 - DEBUG - 添加三元组: graph(concept) - studies - Neural knowledge(misc)
|
||
2025-06-11 11:03:09,199 - DEBUG - 块 703 提取到 1 个三元组
|
||
2025-06-11 11:03:09,199 - DEBUG - 处理块 704/753: AAAI Conf. on Artificial Intelligence (AAAI). New ...
|
||
2025-06-11 11:03:09,508 - DEBUG - 块 704 生成文本: <triplet> <media> AAAI <org> publisher <triplet> Artificial Intelligence <concept> AAAII <loc> part of</s>
|
||
2025-06-11 11:03:09,508 - DEBUG - 原始生成文本: <triplet> <media> AAAI <org> publisher <triplet> Artificial Intelligence <concept> AAAII <loc> part of</s>
|
||
2025-06-11 11:03:09,508 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'AAAI', '<org>', 'publisher', '<triplet>', 'Artificial Intelligence', '<concept>', 'AAAII', '<loc>', 'part of']
|
||
2025-06-11 11:03:09,508 - DEBUG - 处理块 705/753: Lei K, Chen DY, Li YL, Du N, Yang M, Fan W, Shen Y...
|
||
2025-06-11 11:03:09,667 - DEBUG - 块 705 生成文本: <triplet> DY <media> Lei K <per> author</s>
|
||
2025-06-11 11:03:09,667 - DEBUG - 原始生成文本: <triplet> DY <media> Lei K <per> author</s>
|
||
2025-06-11 11:03:09,667 - DEBUG - 处理后标记: ['<triplet>', 'DY', '<media>', 'Lei K', '<per>', 'author']
|
||
2025-06-11 11:03:09,667 - DEBUG - 添加三元组: DY(media) - author - Lei K(per)
|
||
2025-06-11 11:03:09,668 - DEBUG - 块 705 提取到 1 个三元组
|
||
2025-06-11 11:03:09,668 - DEBUG - 处理块 706/753: the 27th Int’l Conf. on Computational Linguistics ...
|
||
2025-06-11 11:03:09,880 - DEBUG - 块 706 生成文本: <triplet> <media> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:03:09,880 - DEBUG - 原始生成文本: <triplet> <media> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:03:09,880 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Computational Linguistics', '<concept>', 'main subject']
|
||
2025-06-11 11:03:09,880 - DEBUG - 处理块 707/753: Zhang Z, Zhuang FZ, Qu M, Lin F, He Q. Knowledge g...
|
||
2025-06-11 11:03:10,812 - DEBUG - 块 707 生成文本: <triplet> graph embedding with hierarchical relation structure. In: Proc. of the 2018 Conf. <unk> 2018 <date> point in <concept> is a list of <triplet> Zhang Z <misc> Zhuang Z, Qu M, Lin F, He Q.com.In: Knowledge in: Promp.Of the 18th.in <dis> Zhan Zh <per> named after</s>
|
||
2025-06-11 11:03:10,812 - DEBUG - 原始生成文本: <triplet> graph embedding with hierarchical relation structure. In: Proc. of the 2018 Conf. <unk> 2018 <date> point in <concept> is a list of <triplet> Zhang Z <misc> Zhuang Z, Qu M, Lin F, He Q.com.In: Knowledge in: Promp.Of the 18th.in <dis> Zhan Zh <per> named after</s>
|
||
2025-06-11 11:03:10,812 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding with hierarchical relation structure. In: Proc. of the 2018 Conf.', '<unk>', '2018', '<date>', 'point in', '<concept>', 'is a list of', '<triplet>', 'Zhang Z', '<misc>', 'Zhuang Z, Qu M, Lin F, He Q.com.In: Knowledge in: Promp.Of the 18th.in', '<dis>', 'Zhan Zh', '<per>', 'named after']
|
||
2025-06-11 11:03:10,812 - DEBUG - 添加三元组: graph embedding with hierarchical relation structure. In: Proc. of the 2018 Conf.(unk) - point in - 2018(date)
|
||
2025-06-11 11:03:10,812 - DEBUG - 添加三元组: Zhang Z(misc) - Zhan Zh - Zhuang Z, Qu M, Lin F, He Q.com.In: Knowledge in: Promp.Of the 18th.in(dis)
|
||
2025-06-11 11:03:10,812 - DEBUG - 块 707 提取到 2 个三元组
|
||
2025-06-11 11:03:10,812 - DEBUG - 处理块 708/753: on Empirical Methods in Natural Language Processin...
|
||
2025-06-11 11:03:11,035 - DEBUG - 块 708 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:03:11,035 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:03:11,035 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:03:11,035 - DEBUG - 处理块 709/753: 3198–3207. [doi: 10.18653/v1/D18-1358]
|
||
[144]
|
||
...
|
||
2025-06-11 11:03:11,321 - DEBUG - 块 709 生成文本: <triplet> <concept> 1 <num> number of seasons</s>
|
||
2025-06-11 11:03:11,321 - DEBUG - 原始生成文本: <triplet> <concept> 1 <num> number of seasons</s>
|
||
2025-06-11 11:03:11,321 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1', '<num>', 'number of seasons']
|
||
2025-06-11 11:03:11,321 - DEBUG - 处理块 710/753: Toutanova K, Chen DQ. Observed versus latent featu...
|
||
2025-06-11 11:03:11,705 - DEBUG - 块 710 生成文本: <triplet> <concept> latent features for knowledge base and text inference</s>
|
||
2025-06-11 11:03:11,705 - DEBUG - 原始生成文本: <triplet> <concept> latent features for knowledge base and text inference</s>
|
||
2025-06-11 11:03:11,705 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'latent features for knowledge base and text inference']
|
||
2025-06-11 11:03:11,705 - DEBUG - 处理块 711/753: Continuous Vector Space Models and Their Compositi...
|
||
2025-06-11 11:03:12,099 - DEBUG - 块 711 生成文本: <triplet> Continuous Vector Space Models and Their Compositionality. Beijing <media> Association for Computational Linguistics <org> 2015 <date> publication date</s>
|
||
2025-06-11 11:03:12,099 - DEBUG - 原始生成文本: <triplet> Continuous Vector Space Models and Their Compositionality. Beijing <media> Association for Computational Linguistics <org> 2015 <date> publication date</s>
|
||
2025-06-11 11:03:12,099 - DEBUG - 处理后标记: ['<triplet>', 'Continuous Vector Space Models and Their Compositionality. Beijing', '<media>', 'Association for Computational Linguistics', '<org>', '2015', '<date>', 'publication date']
|
||
2025-06-11 11:03:12,099 - DEBUG - 添加三元组: Continuous Vector Space Models and Their Compositionality. Beijing(media) - 2015 - Association for Computational Linguistics(org)
|
||
2025-06-11 11:03:12,099 - DEBUG - 块 711 提取到 1 个三元组
|
||
2025-06-11 11:03:12,099 - DEBUG - 处理块 712/753: [doi: 10.18653/v1/W15-4007]
|
||
[145]
|
||
...
|
||
2025-06-11 11:03:12,472 - DEBUG - 块 712 生成文本: <triplet> <eve> 1 <num> number of matches played/racescore</s>
|
||
2025-06-11 11:03:12,472 - DEBUG - 原始生成文本: <triplet> <eve> 1 <num> number of matches played/racescore</s>
|
||
2025-06-11 11:03:12,472 - DEBUG - 处理后标记: ['<triplet>', '<eve>', '1', '<num>', 'number of matches played/racescore']
|
||
2025-06-11 11:03:12,472 - DEBUG - 处理块 713/753: Le P, Dymetman M, Renders JM. LSTM-based mixture-o...
|
||
2025-06-11 11:03:12,975 - DEBUG - 块 713 生成文本: <triplet> JM.LSTM <media> Le P,Dymetman M.Le P.LsTM-based mixture-of <concept> LeP,LeP.Demithman <per> founded by</s>
|
||
2025-06-11 11:03:12,976 - DEBUG - 原始生成文本: <triplet> JM.LSTM <media> Le P,Dymetman M.Le P.LsTM-based mixture-of <concept> LeP,LeP.Demithman <per> founded by</s>
|
||
2025-06-11 11:03:12,976 - DEBUG - 处理后标记: ['<triplet>', 'JM.LSTM', '<media>', 'Le P,Dymetman M.Le P.LsTM-based mixture-of', '<concept>', 'LeP,LeP.Demithman', '<per>', 'founded by']
|
||
2025-06-11 11:03:12,976 - DEBUG - 添加三元组: JM.LSTM(media) - LeP,LeP.Demithman - Le P,Dymetman M.Le P.LsTM-based mixture-of(concept)
|
||
2025-06-11 11:03:12,976 - DEBUG - 块 713 提取到 1 个三元组
|
||
2025-06-11 11:03:12,976 - DEBUG - 处理块 714/753: Representation Learning for NLP (Rep4NLP). Berlin:...
|
||
2025-06-11 11:03:13,210 - DEBUG - 块 714 生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:03:13,210 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:03:13,210 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:03:13,211 - DEBUG - 处理块 715/753: Zhu WY, Mo KX, Zhang Y, Zhu ZB, Peng XZ, Yang Q. F...
|
||
2025-06-11 11:03:13,744 - DEBUG - 块 715 生成文本: <triplet> WY, Mo KX, Zhang Y, Peng XZ, Yang Q. Flexible end-to-end dialogue system for knowledge grounded conversation <concept> use</s>
|
||
2025-06-11 11:03:13,744 - DEBUG - 原始生成文本: <triplet> WY, Mo KX, Zhang Y, Peng XZ, Yang Q. Flexible end-to-end dialogue system for knowledge grounded conversation <concept> use</s>
|
||
2025-06-11 11:03:13,744 - DEBUG - 处理后标记: ['<triplet>', 'WY, Mo KX, Zhang Y, Peng XZ, Yang Q. Flexible end-to-end dialogue system for knowledge grounded conversation', '<concept>', 'use']
|
||
2025-06-11 11:03:13,744 - DEBUG - 处理块 716/753: [147]
|
||
Huang HZ, Heck LP, Ji H. Leveraging deep neu...
|
||
2025-06-11 11:03:13,892 - DEBUG - 块 716 生成文本: <triplet> <concept> knowledge graphs <misc> studies</s>
|
||
2025-06-11 11:03:13,892 - DEBUG - 原始生成文本: <triplet> <concept> knowledge graphs <misc> studies</s>
|
||
2025-06-11 11:03:13,893 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge graphs', '<misc>', 'studies']
|
||
2025-06-11 11:03:13,893 - DEBUG - 处理块 717/753: Fang W, Zhang JW, Wang DL, Chen Z, Li M. Entity di...
|
||
2025-06-11 11:03:14,233 - DEBUG - 块 717 生成文本: <triplet> <concept> disambiguation <misc> subclass of</s>
|
||
2025-06-11 11:03:14,233 - DEBUG - 原始生成文本: <triplet> <concept> disambiguation <misc> subclass of</s>
|
||
2025-06-11 11:03:14,233 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'disambiguation', '<misc>', 'subclass of']
|
||
2025-06-11 11:03:14,233 - DEBUG - 处理块 718/753: SIGNLL Conf. on Computational Natural Language Lea...
|
||
2025-06-11 11:03:14,552 - DEBUG - 块 718 生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:03:14,552 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational Linguistics <org> publisher</s>
|
||
2025-06-11 11:03:14,552 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational Linguistics', '<org>', 'publisher']
|
||
2025-06-11 11:03:14,552 - DEBUG - 处理块 719/753: 2016. 260–269. [doi: 10.18653/v1/K16-1026]
|
||
[149]
|
||
...
|
||
2025-06-11 11:03:14,775 - DEBUG - 块 719 生成文本: <triplet> <concept> 1026 <date> point in time</s>
|
||
2025-06-11 11:03:14,775 - DEBUG - 原始生成文本: <triplet> <concept> 1026 <date> point in time</s>
|
||
2025-06-11 11:03:14,775 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1026', '<date>', 'point in time']
|
||
2025-06-11 11:03:14,775 - DEBUG - 处理块 720/753: Krompaß D, Baier S, Tresp V. Type-constrained repr...
|
||
2025-06-11 11:03:15,137 - DEBUG - 块 720 生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:03:15,137 - DEBUG - 原始生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:03:15,137 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:03:15,137 - DEBUG - 处理块 721/753: Conf. (ISWC). Bethlehem: Springer, 2015. 640–655. ...
|
||
2025-06-11 11:03:15,296 - DEBUG - 块 721 生成文本: <triplet> <org> Bethlehem <loc> headquarters location</s>
|
||
2025-06-11 11:03:15,296 - DEBUG - 原始生成文本: <triplet> <org> Bethlehem <loc> headquarters location</s>
|
||
2025-06-11 11:03:15,296 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Bethlehem', '<loc>', 'headquarters location']
|
||
2025-06-11 11:03:15,296 - DEBUG - 处理块 722/753: Cochez M, Ristoski P, Ponzetto SP, Paulheim H. Glo...
|
||
2025-06-11 11:03:15,434 - DEBUG - 块 722 生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:03:15,434 - DEBUG - 原始生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:03:15,434 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:03:15,434 - DEBUG - 处理块 723/753: (ISWC). Vienna: Springer Int’l Publishing, 2017. 1...
|
||
2025-06-11 11:03:15,582 - DEBUG - 块 723 生成文本: <triplet> <org> Vienna <loc> headquarters location</s>
|
||
2025-06-11 11:03:15,583 - DEBUG - 原始生成文本: <triplet> <org> Vienna <loc> headquarters location</s>
|
||
2025-06-11 11:03:15,583 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Vienna', '<loc>', 'headquarters location']
|
||
2025-06-11 11:03:15,583 - DEBUG - 处理块 724/753: Ristoski P, Paulheim H. RDF2Vec: RDF graph embeddi...
|
||
2025-06-11 11:03:15,752 - DEBUG - 块 724 生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:03:15,752 - DEBUG - 原始生成文本: <triplet> <concept> Semantic Web <misc> used by</s>
|
||
2025-06-11 11:03:15,752 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:03:15,752 - DEBUG - 处理块 725/753: Springer, 2016. 498–514. [doi: 10.1007/978-3-319-4...
|
||
2025-06-11 11:03:15,933 - DEBUG - 块 725 生成文本: <triplet> 498–514 <concept> Springer <per> author</s>
|
||
2025-06-11 11:03:15,933 - DEBUG - 原始生成文本: <triplet> 498–514 <concept> Springer <per> author</s>
|
||
2025-06-11 11:03:15,933 - DEBUG - 处理后标记: ['<triplet>', '498–514', '<concept>', 'Springer', '<per>', 'author']
|
||
2025-06-11 11:03:15,933 - DEBUG - 添加三元组: 498–514(concept) - author - Springer(per)
|
||
2025-06-11 11:03:15,933 - DEBUG - 块 725 提取到 1 个三元组
|
||
2025-06-11 11:03:15,933 - DEBUG - 处理块 726/753: Chen MH, Tian YT, Chang KW, Skiena S, Zaniolo C. C...
|
||
2025-06-11 11:03:16,263 - DEBUG - 块 726 生成文本: <triplet> <concept> knowledge graphs and entity descriptions for cross-</s>
|
||
2025-06-11 11:03:16,263 - DEBUG - 原始生成文本: <triplet> <concept> knowledge graphs and entity descriptions for cross-</s>
|
||
2025-06-11 11:03:16,263 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge graphs and entity descriptions for cross-']
|
||
2025-06-11 11:03:16,263 - DEBUG - 处理块 727/753: lingual entity alignment. In: Proc. of the 27th In...
|
||
2025-06-11 11:03:16,444 - DEBUG - 块 727 生成文本: <triplet> alignment <concept> IJCAI.org <org> publisher</s>
|
||
2025-06-11 11:03:16,444 - DEBUG - 原始生成文本: <triplet> alignment <concept> IJCAI.org <org> publisher</s>
|
||
2025-06-11 11:03:16,444 - DEBUG - 处理后标记: ['<triplet>', 'alignment', '<concept>', 'IJCAI.org', '<org>', 'publisher']
|
||
2025-06-11 11:03:16,444 - DEBUG - 添加三元组: alignment(concept) - publisher - IJCAI.org(org)
|
||
2025-06-11 11:03:16,444 - DEBUG - 块 727 提取到 1 个三元组
|
||
2025-06-11 11:03:16,444 - DEBUG - 处理块 728/753: 3998–4004. [doi: 10.24963/ijcai.2018/556]
|
||
[153]
|
||
...
|
||
2025-06-11 11:03:16,794 - DEBUG - 块 728 生成文本: <triplet> <concept> 556 <num> quantity <triplet> 3998–4004 <time> <date> point in time</s>
|
||
2025-06-11 11:03:16,795 - DEBUG - 原始生成文本: <triplet> <concept> 556 <num> quantity <triplet> 3998–4004 <time> <date> point in time</s>
|
||
2025-06-11 11:03:16,795 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '556', '<num>', 'quantity', '<triplet>', '3998–4004', '<time>', '<date>', 'point in time']
|
||
2025-06-11 11:03:16,795 - DEBUG - 处理块 729/753: Chen MH, Tian YT, Yang MH, Zaniolo C. Multilingual...
|
||
2025-06-11 11:03:17,532 - DEBUG - 块 729 生成文本: <triplet> graph embeddings <concept> Chen MH, Tian <per> discoverer or inventor</s>
|
||
2025-06-11 11:03:17,532 - DEBUG - 原始生成文本: <triplet> graph embeddings <concept> Chen MH, Tian <per> discoverer or inventor</s>
|
||
2025-06-11 11:03:17,532 - DEBUG - 处理后标记: ['<triplet>', 'graph embeddings', '<concept>', 'Chen MH, Tian', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:03:17,532 - DEBUG - 添加三元组: graph embeddings(concept) - discoverer or inventor - Chen MH, Tian(per)
|
||
2025-06-11 11:03:17,532 - DEBUG - 块 729 提取到 1 个三元组
|
||
2025-06-11 11:03:17,532 - DEBUG - 处理块 730/753: of the 26th Int’l Joint Conf. on Artificial Intell...
|
||
2025-06-11 11:03:17,939 - DEBUG - 块 730 生成文本: <triplet> IJCAI <media> Artificial Intelligence <concept> main subject</s>
|
||
2025-06-11 11:03:17,939 - DEBUG - 原始生成文本: <triplet> IJCAI <media> Artificial Intelligence <concept> main subject</s>
|
||
2025-06-11 11:03:17,939 - DEBUG - 处理后标记: ['<triplet>', 'IJCAI', '<media>', 'Artificial Intelligence', '<concept>', 'main subject']
|
||
2025-06-11 11:03:17,939 - DEBUG - 添加三元组: IJCAI(media) - main subject - Artificial Intelligence(concept)
|
||
2025-06-11 11:03:17,939 - DEBUG - 块 730 提取到 1 个三元组
|
||
2025-06-11 11:03:17,939 - DEBUG - 处理块 731/753: Gentile AL, Ristoski P, Eckel S, Ritze D, Paulheim...
|
||
2025-06-11 11:03:18,345 - DEBUG - 块 731 生成文本: <triplet> embeddings approach for blocking <concept> matching on Web tables <media> part of</s>
|
||
2025-06-11 11:03:18,345 - DEBUG - 原始生成文本: <triplet> embeddings approach for blocking <concept> matching on Web tables <media> part of</s>
|
||
2025-06-11 11:03:18,345 - DEBUG - 处理后标记: ['<triplet>', 'embeddings approach for blocking', '<concept>', 'matching on Web tables', '<media>', 'part of']
|
||
2025-06-11 11:03:18,345 - DEBUG - 添加三元组: embeddings approach for blocking(concept) - part of - matching on Web tables(media)
|
||
2025-06-11 11:03:18,345 - DEBUG - 块 731 提取到 1 个三元组
|
||
2025-06-11 11:03:18,345 - DEBUG - 处理块 732/753: Proc. of the 20th Int’l Conf. on Extending Databas...
|
||
2025-06-11 11:03:18,504 - DEBUG - 块 732 生成文本: <triplet> <concept> OpenProceedings.org <media> part of</s>
|
||
2025-06-11 11:03:18,504 - DEBUG - 原始生成文本: <triplet> <concept> OpenProceedings.org <media> part of</s>
|
||
2025-06-11 11:03:18,504 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'OpenProceedings.org', '<media>', 'part of']
|
||
2025-06-11 11:03:18,504 - DEBUG - 处理块 733/753: Sun ZQ, Hu W, Li CK. Cross-lingual entity alignmen...
|
||
2025-06-11 11:03:18,621 - DEBUG - 块 733 生成文本: <triplet> <concept> Semantic Web <misc> part of</s>
|
||
2025-06-11 11:03:18,621 - DEBUG - 原始生成文本: <triplet> <concept> Semantic Web <misc> part of</s>
|
||
2025-06-11 11:03:18,621 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic Web', '<misc>', 'part of']
|
||
2025-06-11 11:03:18,621 - DEBUG - 处理块 734/753: Conf. (ISWC). Vienna: Springer Int’l Publishing, 2...
|
||
2025-06-11 11:03:19,026 - DEBUG - 块 734 生成文本: <triplet> 软件学报 <concept> Springer Int’l Publishing <org> publisher</s>
|
||
2025-06-11 11:03:19,026 - DEBUG - 原始生成文本: <triplet> 软件学报 <concept> Springer Int’l Publishing <org> publisher</s>
|
||
2025-06-11 11:03:19,026 - DEBUG - 处理后标记: ['<triplet>', '软件学报', '<concept>', 'Springer Int’l Publishing', '<org>', 'publisher']
|
||
2025-06-11 11:03:19,026 - DEBUG - 添加三元组: 软件学报(concept) - publisher - Springer Int’l Publishing(org)
|
||
2025-06-11 11:03:19,026 - DEBUG - 块 734 提取到 1 个三元组
|
||
2025-06-11 11:03:19,026 - DEBUG - 处理块 735/753: Tay Y, Luu AT, Hui SC, Brauer F. Random semantic t...
|
||
2025-06-11 11:03:19,882 - DEBUG - 块 735 生成文本: <triplet> graph link prediction <concept> Random semantic tensor ensemble for scalable knowledge <media> part <eve> Rando <triplet> link <misc> Randoma <per> Randoms <org> Randon predictions <unk> part of the 10th <loc> part 3D <time> part the same as a list of</s>
|
||
2025-06-11 11:03:19,883 - DEBUG - 原始生成文本: <triplet> graph link prediction <concept> Random semantic tensor ensemble for scalable knowledge <media> part <eve> Rando <triplet> link <misc> Randoma <per> Randoms <org> Randon predictions <unk> part of the 10th <loc> part 3D <time> part the same as a list of</s>
|
||
2025-06-11 11:03:19,883 - DEBUG - 处理后标记: ['<triplet>', 'graph link prediction', '<concept>', 'Random semantic tensor ensemble for scalable knowledge', '<media>', 'part', '<eve>', 'Rando', '<triplet>', 'link', '<misc>', 'Randoma', '<per>', 'Randoms', '<org>', 'Randon predictions', '<unk>', 'part of the 10th', '<loc>', 'part 3D', '<time>', 'part the same as a list of']
|
||
2025-06-11 11:03:19,883 - DEBUG - 添加三元组: graph link prediction(concept) - part - Random semantic tensor ensemble for scalable knowledge(media)
|
||
2025-06-11 11:03:19,883 - DEBUG - 添加三元组: link(misc) - Randoms - Randoma(per)
|
||
2025-06-11 11:03:19,883 - DEBUG - 块 735 提取到 2 个三元组
|
||
2025-06-11 11:03:19,883 - DEBUG - 处理块 736/753: ACM Int’l Conf. on Web Search and Data Mining (WSD...
|
||
2025-06-11 11:03:20,191 - DEBUG - 块 736 生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:20,191 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computing Machinery <org> publisher</s>
|
||
2025-06-11 11:03:20,191 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computing Machinery', '<org>', 'publisher']
|
||
2025-06-11 11:03:20,192 - DEBUG - 处理块 737/753: [157]
|
||
Wang YJ, Gemulla R, Li H. On multi-relationa...
|
||
2025-06-11 11:03:20,554 - DEBUG - 块 737 生成文本: <triplet> <concept> Conf. on Artificial <media> part of the 32nd AAAI <eve> follows</s>
|
||
2025-06-11 11:03:20,554 - DEBUG - 原始生成文本: <triplet> <concept> Conf. on Artificial <media> part of the 32nd AAAI <eve> follows</s>
|
||
2025-06-11 11:03:20,554 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Conf. on Artificial', '<media>', 'part of the 32nd AAAI', '<eve>', 'follows']
|
||
2025-06-11 11:03:20,554 - DEBUG - 处理块 738/753: Intelligence (AAAI). New Orleans: AAAI Press, 2018...
|
||
2025-06-11 11:03:20,819 - DEBUG - 块 738 生成文本: <triplet> <concept> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:03:20,819 - DEBUG - 原始生成文本: <triplet> <concept> AAAI Press <org> publisher</s>
|
||
2025-06-11 11:03:20,819 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'AAAI Press', '<org>', 'publisher']
|
||
2025-06-11 11:03:20,819 - DEBUG - 处理块 739/753: Chandrahas, Sharma A, Talukdar P. Towards understa...
|
||
2025-06-11 11:03:21,545 - DEBUG - 块 739 生成文本: <triplet> graph embeddings <concept> geometry <media> part of knowledge <misc> geometric <org> <per> <loc> geography <eve> geology <triplet> geographie <dis> geogram <time> geddy <date> . <unk> geografic.geometrys aligns</s>
|
||
2025-06-11 11:03:21,545 - DEBUG - 原始生成文本: <triplet> graph embeddings <concept> geometry <media> part of knowledge <misc> geometric <org> <per> <loc> geography <eve> geology <triplet> geographie <dis> geogram <time> geddy <date> . <unk> geografic.geometrys aligns</s>
|
||
2025-06-11 11:03:21,545 - DEBUG - 处理后标记: ['<triplet>', 'graph embeddings', '<concept>', 'geometry', '<media>', 'part of knowledge', '<misc>', 'geometric', '<org>', '<per>', '<loc>', 'geography', '<eve>', 'geology', '<triplet>', 'geographie', '<dis>', 'geogram', '<time>', 'geddy', '<date>', '.', '<unk>', 'geografic.geometrys aligns']
|
||
2025-06-11 11:03:21,546 - DEBUG - 添加三元组: graph embeddings(concept) - part of knowledge - geometry(media)
|
||
2025-06-11 11:03:21,546 - DEBUG - 添加三元组: geographie(dis) - geddy - geogram(time)
|
||
2025-06-11 11:03:21,546 - DEBUG - 块 739 提取到 2 个三元组
|
||
2025-06-11 11:03:21,546 - DEBUG - 处理块 740/753: Meeting of the Association for Computational Lingu...
|
||
2025-06-11 11:03:21,918 - DEBUG - 块 740 生成文本: <triplet> <eve> Association for Computational Linguistics (ACL) <org> conferred <concept> instance of 2018 <date> point in time</s>
|
||
2025-06-11 11:03:21,918 - DEBUG - 原始生成文本: <triplet> <eve> Association for Computational Linguistics (ACL) <org> conferred <concept> instance of 2018 <date> point in time</s>
|
||
2025-06-11 11:03:21,918 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'Association for Computational Linguistics (ACL)', '<org>', 'conferred', '<concept>', 'instance of 2018', '<date>', 'point in time']
|
||
2025-06-11 11:03:21,918 - DEBUG - 处理块 741/753: 122–131. [doi: 10.18653/v1/P18-1012]
|
||
[159]
|
||
...
|
||
2025-06-11 11:03:22,185 - DEBUG - 块 741 生成文本: <triplet> <concept> 1 <num> number of seasons</s>
|
||
2025-06-11 11:03:22,186 - DEBUG - 原始生成文本: <triplet> <concept> 1 <num> number of seasons</s>
|
||
2025-06-11 11:03:22,186 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '1', '<num>', 'number of seasons']
|
||
2025-06-11 11:03:22,186 - DEBUG - 处理块 742/753: Battaglia PW, Hamrick JB, Bapst V, et al. Relation...
|
||
2025-06-11 11:03:22,786 - DEBUG - 块 742 生成文本: <triplet> graph network <concept> inductive biases, deep learning, and <misc> inductives <media> induces <eve> subclass of</s>
|
||
2025-06-11 11:03:22,786 - DEBUG - 原始生成文本: <triplet> graph network <concept> inductive biases, deep learning, and <misc> inductives <media> induces <eve> subclass of</s>
|
||
2025-06-11 11:03:22,786 - DEBUG - 处理后标记: ['<triplet>', 'graph network', '<concept>', 'inductive biases, deep learning, and', '<misc>', 'inductives', '<media>', 'induces', '<eve>', 'subclass of']
|
||
2025-06-11 11:03:22,786 - DEBUG - 添加三元组: graph network(concept) - inductives - inductive biases, deep learning, and(misc)
|
||
2025-06-11 11:03:22,787 - DEBUG - 块 742 提取到 1 个三元组
|
||
2025-06-11 11:03:22,787 - DEBUG - 处理块 743/753: Qu M, Tang J. Probabilistic logic neural networks ...
|
||
2025-06-11 11:03:22,925 - DEBUG - 块 743 生成文本: <triplet> <concept> Information Processing Systems <misc> subclass of</s>
|
||
2025-06-11 11:03:22,925 - DEBUG - 原始生成文本: <triplet> <concept> Information Processing Systems <misc> subclass of</s>
|
||
2025-06-11 11:03:22,925 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Information Processing Systems', '<misc>', 'subclass of']
|
||
2025-06-11 11:03:22,925 - DEBUG - 处理块 744/753: (NIPS). Vancouver: Neural Information Processing S...
|
||
2025-06-11 11:03:23,094 - DEBUG - 块 744 生成文本: <triplet> <concept> Neural Information Processing Systems Foundation <org> developer</s>
|
||
2025-06-11 11:03:23,094 - DEBUG - 原始生成文本: <triplet> <concept> Neural Information Processing Systems Foundation <org> developer</s>
|
||
2025-06-11 11:03:23,094 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Neural Information Processing Systems Foundation', '<org>', 'developer']
|
||
2025-06-11 11:03:23,094 - DEBUG - 处理块 745/753: Zhang YY, Chen XS, Yang Y, Ramamurthy A, Li B, Qi ...
|
||
2025-06-11 11:03:23,254 - DEBUG - 块 745 生成文本: <triplet> <concept> neural networks <misc> subclass of</s>
|
||
2025-06-11 11:03:23,254 - DEBUG - 原始生成文本: <triplet> <concept> neural networks <misc> subclass of</s>
|
||
2025-06-11 11:03:23,254 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'neural networks', '<misc>', 'subclass of']
|
||
2025-06-11 11:03:23,254 - DEBUG - 处理块 746/753: In: Proc. of the 8th Int’l Conf. on Learning Repre...
|
||
2025-06-11 11:03:23,509 - DEBUG - 块 746 生成文本: <triplet> <org> Addis Ababa <loc> headquarters location</s>
|
||
2025-06-11 11:03:23,509 - DEBUG - 原始生成文本: <triplet> <org> Addis Ababa <loc> headquarters location</s>
|
||
2025-06-11 11:03:23,509 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Addis Ababa', '<loc>', 'headquarters location']
|
||
2025-06-11 11:03:23,509 - DEBUG - 处理块 747/753: Yang F, Yang ZL, Cohen WW. Differentiable learning...
|
||
2025-06-11 11:03:23,700 - DEBUG - 块 747 生成文本: <triplet> WW. <org> Yang F <per> author</s>
|
||
2025-06-11 11:03:23,700 - DEBUG - 原始生成文本: <triplet> WW. <org> Yang F <per> author</s>
|
||
2025-06-11 11:03:23,700 - DEBUG - 处理后标记: ['<triplet>', 'WW.', '<org>', 'Yang F', '<per>', 'author']
|
||
2025-06-11 11:03:23,700 - DEBUG - 添加三元组: WW.(org) - author - Yang F(per)
|
||
2025-06-11 11:03:23,700 - DEBUG - 块 747 提取到 1 个三元组
|
||
2025-06-11 11:03:23,700 - DEBUG - 处理块 748/753: Neural Information Processing Systems (NIPS). Long...
|
||
2025-06-11 11:03:23,848 - DEBUG - 块 748 生成文本: <triplet> <org> Long Beach <loc> headquarters location</s>
|
||
2025-06-11 11:03:23,849 - DEBUG - 原始生成文本: <triplet> <org> Long Beach <loc> headquarters location</s>
|
||
2025-06-11 11:03:23,849 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Long Beach', '<loc>', 'headquarters location']
|
||
2025-06-11 11:03:23,849 - DEBUG - 处理块 749/753: 金婧, 万怀宇, 林友芳. 融合实体类别信息的知识图谱表示学习方法. 计算机工程, 2021, 47...
|
||
2025-06-11 11:03:24,051 - DEBUG - 块 749 生成文本: <triplet> 金婧 <unk> 计算机工程 <concept> field of work</s>
|
||
2025-06-11 11:03:24,051 - DEBUG - 原始生成文本: <triplet> 金婧 <unk> 计算机工程 <concept> field of work</s>
|
||
2025-06-11 11:03:24,051 - DEBUG - 处理后标记: ['<triplet>', '金婧', '<unk>', '计算机工程', '<concept>', 'field of work']
|
||
2025-06-11 11:03:24,051 - DEBUG - 添加三元组: 金婧(unk) - field of work - 计算机工程(concept)
|
||
2025-06-11 11:03:24,051 - DEBUG - 块 749 提取到 1 个三元组
|
||
2025-06-11 11:03:24,051 - DEBUG - 处理块 750/753: 杜文倩, 李弼程, 王瑞. 融合实体描述及类型的知识图谱表示学习方法. 中文信息学报, 2020, ...
|
||
2025-06-11 11:03:24,221 - DEBUG - 块 750 生成文本: <triplet> 张天成 <concept> 1969 <date> date of birth</s>
|
||
2025-06-11 11:03:24,221 - DEBUG - 原始生成文本: <triplet> 张天成 <concept> 1969 <date> date of birth</s>
|
||
2025-06-11 11:03:24,221 - DEBUG - 处理后标记: ['<triplet>', '张天成', '<concept>', '1969', '<date>', 'date of birth']
|
||
2025-06-11 11:03:24,222 - DEBUG - 添加三元组: 张天成(concept) - date of birth - 1969(date)
|
||
2025-06-11 11:03:24,222 - DEBUG - 块 750 提取到 1 个三元组
|
||
2025-06-11 11:03:24,222 - DEBUG - 处理块 751/753: 员, 主要研究领域为教育大数据, 时空数据管理.
|
||
田雪(1998-), 女, 硕士生, CCF学生...
|
||
2025-06-11 11:03:24,391 - DEBUG - 块 751 生成文本: <triplet> 孙相会 <concept> CCF <org> member of</s>
|
||
2025-06-11 11:03:24,391 - DEBUG - 原始生成文本: <triplet> 孙相会 <concept> CCF <org> member of</s>
|
||
2025-06-11 11:03:24,391 - DEBUG - 处理后标记: ['<triplet>', '孙相会', '<concept>', 'CCF', '<org>', 'member of']
|
||
2025-06-11 11:03:24,391 - DEBUG - 添加三元组: 孙相会(concept) - member of - CCF(org)
|
||
2025-06-11 11:03:24,392 - DEBUG - 块 751 提取到 1 个三元组
|
||
2025-06-11 11:03:24,392 - DEBUG - 处理块 752/753: 于明鹤(1989-), 女, 博士, 讲师, CCF专业会员,
|
||
主要研究领域为数据库, 信息检索....
|
||
2025-06-11 11:03:24,540 - DEBUG - 块 752 生成文本: <triplet> 于戈 <concept> CCF <org> member of</s>
|
||
2025-06-11 11:03:24,540 - DEBUG - 原始生成文本: <triplet> 于戈 <concept> CCF <org> member of</s>
|
||
2025-06-11 11:03:24,540 - DEBUG - 处理后标记: ['<triplet>', '于戈', '<concept>', 'CCF', '<org>', 'member of']
|
||
2025-06-11 11:03:24,540 - DEBUG - 添加三元组: 于戈(concept) - member of - CCF(org)
|
||
2025-06-11 11:03:24,540 - DEBUG - 块 752 提取到 1 个三元组
|
||
2025-06-11 11:03:24,540 - DEBUG - 处理块 753/753: 会士, 主要研究领域为数据库理论与技术, 区块链.
|
||
张天成 等: 知识图谱嵌入技术研究综述 311...
|
||
2025-06-11 11:03:24,699 - DEBUG - 块 753 生成文本: <triplet> 会士 <concept> 区块链 <media> field of work</s>
|
||
2025-06-11 11:03:24,699 - DEBUG - 原始生成文本: <triplet> 会士 <concept> 区块链 <media> field of work</s>
|
||
2025-06-11 11:03:24,699 - DEBUG - 处理后标记: ['<triplet>', '会士', '<concept>', '区块链', '<media>', 'field of work']
|
||
2025-06-11 11:03:24,699 - DEBUG - 添加三元组: 会士(concept) - field of work - 区块链(media)
|
||
2025-06-11 11:03:24,700 - DEBUG - 块 753 提取到 1 个三元组
|
||
2025-06-11 11:03:24,710 - INFO - 文档 796af784-5a60-47f1-a4e2-3d73643fd4c5 的 466 个三元组已保存到: /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt
|
||
2025-06-11 11:03:24,710 - INFO - 文档 796af784-5a60-47f1-a4e2-3d73643fd4c5 三元组抽取完成,耗时: 275.26 秒
|
||
2025-06-11 11:03:24,710 - INFO - 文件 /share/wangmeihua/rag/data/qianru.pdf 成功嵌入到数据库 ragdb_textdb
|
||
2025-06-11 11:03:50,197 - INFO -
|
||
测试 2:列出所有 db_types 和文档映射
|
||
2025-06-11 11:03:51,052 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:03:51,053 - DEBUG - 处理集合: ragdb_textdb (db_type: textdb)
|
||
2025-06-11 11:03:51,138 - DEBUG - 集合 ragdb_textdb 中找到用户和文档映射: {'testuser1': ['796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}
|
||
2025-06-11 11:03:51,138 - DEBUG - 可用 db_types 和数据: {'textdb': {'userids': {'testuser1': ['796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-11 11:03:51,138 - INFO - 可用 db_types 和文档: {'textdb': {'userids': {'testuser1': ['796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-11 11:03:51,138 - INFO -
|
||
测试 3:查看 userid testuser1 的所有集合
|
||
2025-06-11 11:03:51,138 - DEBUG - 正在查看 userid testuser1 的集合
|
||
2025-06-11 11:03:51,138 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 11:03:51,147 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的文档数: 52
|
||
2025-06-11 11:03:51,147 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的内容:
|
||
2025-06-11 11:03:51,147 - DEBUG - 文档 1: 内容: 开元云(北京)科技有限公司,是一家注册于2020年的高科技企业,在上海、南京、深圳、济南等地设有分支机构,创始团队核心成员来自一流的云计算公司及电信运营商,拥有云计算、超算、智算和网络运营专业经验,在企业市场均拥有超过十年以上行业经验,服务客户超过2万家。公司以自主研发的业务操作支撑系统(KBoss)为底座,打造开放算力应用服务平台(open-computing),将云计算、算力资源和算力应用进行..., 元数据: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 2: 内容: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 3: 内容: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 4: 内容: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 5: 内容: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 6: 内容: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 7: 内容: 因此, 投影矩阵仅由关系决定是不合理的; ③ 与TransE和TransH相比, 矩阵-向量乘法使TransR模型参数急剧增
|
||
加, 因此, TransR难以应用于大规模知识图谱.
|
||
Mrh
|
||
Mrt
|
||
whi
|
||
wti
|
||
(i = 1;2;3)
|
||
wr
|
||
hi⊥
|
||
ti⊥
|
||
hi⊥ +r ≈ ti⊥
|
||
(i = 1;2;3)
|
||
(h;r;t)
|
||
wh
|
||
wt ∈ Rd
|
||
wr ∈ Rk
|
||
Mrh
|
||
Mrt ∈ Rk×d
|
||
为此, ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 8: 内容: 系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体的数量, 表示
|
||
中的最大数. 投影矩阵的稀疏度为:
|
||
l
|
||
r = 1−(1− min)Nl
|
||
r=Nl∗
|
||
r∗ (12)
|
||
|
||
投影向量定义为:
|
||
h⊥ = Mh
|
||
r
|
||
(
|
||
h
|
||
r
|
||
)
|
||
h;t⊥ = Mt
|
||
r
|
||
( t
|
||
r
|
||
)t (13)
|
||
|
||
(h;r;t)
|
||
wr
|
||
● TransM: Tr..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 9: 内容: 过程中除了学习嵌入之外还引入了学习关系相关候选对象与关系相关注意力两个任务. 而以往的模型(如TransH,
|
||
TransR, TranSparse)无法学习细粒度的注意力.
|
||
由此, Qian等人[52]提出TransAt模型来同时学习嵌入, 关系相关候选对象和关系相关注意力. TransAt的评分
|
||
函数定义如下:
|
||
fr (h;t)= Pr ( (rh)h)+r− Pr ( (rt)t) (18..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - DEBUG - 文档 10: 内容: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,148 - INFO -
|
||
测试 5:获取 userid testuser1 在textdb数据库的文档映射
|
||
2025-06-11 11:03:51,149 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 11:03:51,157 - DEBUG - document_id: 29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,158 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,159 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,160 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:03:51,161 - DEBUG - 找到 2 个文档的映射
|
||
2025-06-11 11:03:51,161 - INFO - 文档映射: {'29c93db6-c633-42cc-a9b0-1fa83a49d8bc': {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}, '796af784-5a60-47f1-a4e2-3d73643fd4c5': {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}}
|
||
2025-06-11 11:05:16,815 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 11:05:16,815 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 11:05:16,823 - INFO - 生成 document_id: 842b6180-667a-4ac8-b051-5c225c859011 for file: /share/wangmeihua/rag/data/zongshu.pdf
|
||
2025-06-11 11:05:16,823 - INFO - 开始处理文件 /share/wangmeihua/rag/data/zongshu.pdf,userid: testuser1,db_type: textdb
|
||
2025-06-11 11:05:16,823 - DEBUG - 检查文件: /share/wangmeihua/rag/data/zongshu.pdf, 大小: 3585826 字节
|
||
2025-06-11 11:05:16,823 - DEBUG - 文件扩展名: pdf
|
||
2025-06-11 11:05:16,823 - DEBUG - 开始加载文件
|
||
2025-06-11 11:05:18,203 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-11 11:05:18,207 - DEBUG - 分割完成,生成 36 个文档块
|
||
2025-06-11 11:05:18,207 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,207 - DEBUG - 生成文档块 1: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 2: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 3: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 4: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 4, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 5: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 5, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 6: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 6, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 7: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 7, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 8: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 8, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 9: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 9, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 10: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 10, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 11: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 11, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 12: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 12, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 13: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 13, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 14: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 14, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 15: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 15, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 16: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 16, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 17: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 17, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 18: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 18, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 19: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 19, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 20: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 20, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 21: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 21, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 22: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 22, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 23: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 23, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 24: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 24, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 25: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 25, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,208 - DEBUG - 生成文档块 26: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 26, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 27: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 27, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 28: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 28, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 29: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 29, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 30: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 30, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 31: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 31, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 32: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 32, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 33: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 33, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 34: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 34, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 生成文档块 35: metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 35, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:18,209 - DEBUG - 文件 /share/wangmeihua/rag/data/zongshu.pdf 加载并分割为 36 个文档块,document_id: 842b6180-667a-4ac8-b051-5c225c859011
|
||
2025-06-11 11:05:18,209 - DEBUG - 处理文件 /share/wangmeihua/rag/data/zongshu.pdf,生成 36 个文档块
|
||
2025-06-11 11:05:18,209 - DEBUG - 第一个文档块: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c
|
||
2025-06-11 11:05:18,962 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:05:24,311 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-11 11:05:24,311 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-11 11:05:24,315 - DEBUG - 检查集合 ragdb_textdb 的 schema: 字段匹配=True, vector_field存在=True, dtype=101, dim=1024
|
||
2025-06-11 11:05:24,390 - DEBUG - 集合 ragdb_textdb 已存在并加载成功
|
||
2025-06-11 11:05:24,397 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-11 11:05:24,397 - DEBUG - 正在为 userid testuser1 插入 36 个文档到 ragdb_textdb
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 4, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 5, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 6, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 7, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 8, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 9, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 10, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 11, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 12, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 13, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 14, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 15, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 16, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,397 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 17, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 18, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 19, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 20, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 21, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 22, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 23, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 24, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 25, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 26, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 27, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 28, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 29, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 30, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 31, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 32, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 33, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 34, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:24,398 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf', 'chunk_index': 35, 'source': '/share/wangmeihua/rag/data/zongshu.pdf'}
|
||
2025-06-11 11:05:25,568 - DEBUG - 成功插入 36 个文档
|
||
2025-06-11 11:05:25,575 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 11:05:25,575 - DEBUG - 插入后查询结果: pk=458649953127104512, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,575 - DEBUG - 插入后查询结果: pk=458649953127104513, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,575 - DEBUG - 插入后查询结果: pk=458649953127104514, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,575 - DEBUG - 插入后查询结果: pk=458649953127104515, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,576 - DEBUG - 插入后查询结果: pk=458649953127104516, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,576 - DEBUG - 插入后查询结果: pk=458649953127104517, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,576 - DEBUG - 插入后查询结果: pk=458649953127104518, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,576 - DEBUG - 插入后查询结果: pk=458649953127104519, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,576 - DEBUG - 插入后查询结果: pk=458649953127104520, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:05:25,576 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 11:05:30,233 - INFO - 开始抽取文档 842b6180-667a-4ac8-b051-5c225c859011 的三元组,userid: testuser1
|
||
2025-06-11 11:05:30,236 - DEBUG - 分割为 504 个文本块
|
||
2025-06-11 11:05:30,236 - DEBUG - 处理块 1/504: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, ...
|
||
2025-06-11 11:05:30,859 - DEBUG - 块 1 生成文本: <triplet> 陈子睿 <per> 天津大学 <org> employer</s>
|
||
2025-06-11 11:05:30,860 - DEBUG - 原始生成文本: <triplet> 陈子睿 <per> 天津大学 <org> employer</s>
|
||
2025-06-11 11:05:30,860 - DEBUG - 处理后标记: ['<triplet>', '陈子睿', '<per>', '天津大学', '<org>', 'employer']
|
||
2025-06-11 11:05:30,860 - DEBUG - 添加三元组: 陈子睿(per) - employer - 天津大学(org)
|
||
2025-06-11 11:05:30,860 - DEBUG - 块 1 提取到 1 个三元组
|
||
2025-06-11 11:05:30,860 - DEBUG - 处理块 2/504: 3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju...
|
||
2025-06-11 11:05:31,108 - DEBUG - 块 2 生成文本: <triplet> 知 识图谱问答 <concept> 自然语言 <media> studies</s>
|
||
2025-06-11 11:05:31,109 - DEBUG - 原始生成文本: <triplet> 知 识图谱问答 <concept> 自然语言 <media> studies</s>
|
||
2025-06-11 11:05:31,109 - DEBUG - 处理后标记: ['<triplet>', '知 识图谱问答', '<concept>', '自然语言', '<media>', 'studies']
|
||
2025-06-11 11:05:31,109 - DEBUG - 添加三元组: 知 识图谱问答(concept) - studies - 自然语言(media)
|
||
2025-06-11 11:05:31,109 - DEBUG - 块 2 提取到 1 个三元组
|
||
2025-06-11 11:05:31,109 - DEBUG - 处理块 3/504: 由于知识规模 、 计算能力及自然语言处理能力的制约 , 早期知识库问答系统被应用于限定领域 。 近...
|
||
2025-06-11 11:05:31,644 - DEBUG - 块 3 生成文本: <triplet> 开放领域知识图谱 <media> 知识库 <concept> <org> 问答系统 <misc> 限定领域 <unk> 分类 <per> <loc> instance of</s>
|
||
2025-06-11 11:05:31,644 - DEBUG - 原始生成文本: <triplet> 开放领域知识图谱 <media> 知识库 <concept> <org> 问答系统 <misc> 限定领域 <unk> 分类 <per> <loc> instance of</s>
|
||
2025-06-11 11:05:31,644 - DEBUG - 处理后标记: ['<triplet>', '开放领域知识图谱', '<media>', '知识库', '<concept>', '<org>', '问答系统', '<misc>', '限定领域', '<unk>', '分类', '<per>', '<loc>', 'instance of']
|
||
2025-06-11 11:05:31,644 - DEBUG - 添加三元组: 开放领域知识图谱(media) - <org> - 知识库(concept)
|
||
2025-06-11 11:05:31,644 - DEBUG - 块 3 提取到 1 个三元组
|
||
2025-06-11 11:05:31,644 - DEBUG - 处理块 4/504: 首先 , 介绍五种基于规则模板的开放领域知识图谱
|
||
问答方法 : 传统语义解析 、 传统信息检索 、...
|
||
2025-06-11 11:05:32,366 - DEBUG - 块 4 生成文本: <triplet> 规则模板 <concept> 知识图谱 <media> 问答方法 <unk> 深度学习的方法 <misc> 神经网络模型 <org> 分类信息检索 <eve> 算法 <per> <loc> part of</s>
|
||
2025-06-11 11:05:32,367 - DEBUG - 原始生成文本: <triplet> 规则模板 <concept> 知识图谱 <media> 问答方法 <unk> 深度学习的方法 <misc> 神经网络模型 <org> 分类信息检索 <eve> 算法 <per> <loc> part of</s>
|
||
2025-06-11 11:05:32,367 - DEBUG - 处理后标记: ['<triplet>', '规则模板', '<concept>', '知识图谱', '<media>', '问答方法', '<unk>', '深度学习的方法', '<misc>', '神经网络模型', '<org>', '分类信息检索', '<eve>', '算法', '<per>', '<loc>', 'part of']
|
||
2025-06-11 11:05:32,367 - DEBUG - 添加三元组: 规则模板(concept) - 问答方法 - 知识图谱(media)
|
||
2025-06-11 11:05:32,367 - DEBUG - 块 4 提取到 1 个三元组
|
||
2025-06-11 11:05:32,367 - DEBUG - 处理块 5/504: 类子任务 , 包括知识图谱嵌入 、 记忆网络 、 基于神经网络的语义解析 、 基于神经网络的查询图 ...
|
||
2025-06-11 11:05:32,826 - DEBUG - 块 5 生成文本: <triplet> 通用领域知识图谱 <concept> 类子任务 <media> 任务列表 <unk> <org> 分类 <per> is a list of</s>
|
||
2025-06-11 11:05:32,826 - DEBUG - 原始生成文本: <triplet> 通用领域知识图谱 <concept> 类子任务 <media> 任务列表 <unk> <org> 分类 <per> is a list of</s>
|
||
2025-06-11 11:05:32,826 - DEBUG - 处理后标记: ['<triplet>', '通用领域知识图谱', '<concept>', '类子任务', '<media>', '任务列表', '<unk>', '<org>', '分类', '<per>', 'is a list of']
|
||
2025-06-11 11:05:32,826 - DEBUG - 添加三元组: 通用领域知识图谱(concept) - 任务列表 - 类子任务(media)
|
||
2025-06-11 11:05:32,826 - DEBUG - 块 5 提取到 1 个三元组
|
||
2025-06-11 11:05:32,826 - DEBUG - 处理块 6/504: 后 , 按照问题的难易程度选择 3 个经典问答数据集比较各问答系统的性能指标 , 对比不同方法间的性...
|
||
2025-06-11 11:05:33,190 - DEBUG - 块 6 生成文本: <triplet> 知识图谱问 答 (KGQA) <media> 问答 <concept> instance of</s>
|
||
2025-06-11 11:05:33,190 - DEBUG - 原始生成文本: <triplet> 知识图谱问 答 (KGQA) <media> 问答 <concept> instance of</s>
|
||
2025-06-11 11:05:33,190 - DEBUG - 处理后标记: ['<triplet>', '知识图谱问 答 (KGQA)', '<media>', '问答', '<concept>', 'instance of']
|
||
2025-06-11 11:05:33,190 - DEBUG - 添加三元组: 知识图谱问 答 (KGQA)(media) - instance of - 问答(concept)
|
||
2025-06-11 11:05:33,190 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-11 11:05:33,190 - DEBUG - 处理块 7/504: 文献标志码 : A 中图分类号 : TP311
|
||
Survey of Open-Domain Know...
|
||
2025-06-11 11:05:34,083 - DEBUG - 块 7 生成文本: <triplet> 图分类号 <concept> 文献标志码 <misc> 中 <media> A <org> <eve> <per> <unk> <loc> country</s>
|
||
2025-06-11 11:05:34,083 - DEBUG - 原始生成文本: <triplet> 图分类号 <concept> 文献标志码 <misc> 中 <media> A <org> <eve> <per> <unk> <loc> country</s>
|
||
2025-06-11 11:05:34,083 - DEBUG - 处理后标记: ['<triplet>', '图分类号', '<concept>', '文献标志码', '<misc>', '中', '<media>', 'A', '<org>', '<eve>', '<per>', '<unk>', '<loc>', 'country']
|
||
2025-06-11 11:05:34,083 - DEBUG - 添加三元组: 图分类号(concept) - 中 - 文献标志码(misc)
|
||
2025-06-11 11:05:34,083 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-11 11:05:34,083 - DEBUG - 处理块 8/504: 1,3
|
||
1. College of Intelligence and Computing, Tian...
|
||
2025-06-11 11:05:34,317 - DEBUG - 块 8 生成文本: <triplet> <concept> China <loc> country <triplet> Tianjin300350 <unk> 300 <num> quantity</s>
|
||
2025-06-11 11:05:34,317 - DEBUG - 原始生成文本: <triplet> <concept> China <loc> country <triplet> Tianjin300350 <unk> 300 <num> quantity</s>
|
||
2025-06-11 11:05:34,317 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'China', '<loc>', 'country', '<triplet>', 'Tianjin300350', '<unk>', '300', '<num>', 'quantity']
|
||
2025-06-11 11:05:34,317 - DEBUG - 处理块 9/504: 2. Tianjin Key Laboratory of Cognitive Computing a...
|
||
2025-06-11 11:05:34,682 - DEBUG - 块 9 生成文本: <triplet> <concept> China <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:05:34,682 - DEBUG - 原始生成文本: <triplet> <concept> China <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:05:34,682 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'China', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:05:34,682 - DEBUG - 处理块 10/504: Abstract: Knowledge graph question answering (KGQA...
|
||
2025-06-11 11:05:35,046 - DEBUG - 块 10 生成文本: <triplet> graph question answering <concept> natural language questions <media> subclass of <triplet> Knowledge <misc> natural язык question <eve> instance of</s>
|
||
2025-06-11 11:05:35,046 - DEBUG - 原始生成文本: <triplet> graph question answering <concept> natural language questions <media> subclass of <triplet> Knowledge <misc> natural язык question <eve> instance of</s>
|
||
2025-06-11 11:05:35,046 - DEBUG - 处理后标记: ['<triplet>', 'graph question answering', '<concept>', 'natural language questions', '<media>', 'subclass of', '<triplet>', 'Knowledge', '<misc>', 'natural язык question', '<eve>', 'instance of']
|
||
2025-06-11 11:05:35,046 - DEBUG - 添加三元组: graph question answering(concept) - subclass of - natural language questions(media)
|
||
2025-06-11 11:05:35,046 - DEBUG - 添加三元组: Knowledge(misc) - instance of - natural язык question(eve)
|
||
2025-06-11 11:05:35,046 - DEBUG - 块 10 提取到 2 个三元组
|
||
2025-06-11 11:05:35,046 - DEBUG - 处理块 11/504: posed by users to obtain relevant answers from kno...
|
||
2025-06-11 11:05:35,366 - DEBUG - 块 11 生成文本: <triplet> graph <concept> knowledge <misc> part of KG <media> based on some form <org> <eve> knowledge</s>
|
||
2025-06-11 11:05:35,367 - DEBUG - 原始生成文本: <triplet> graph <concept> knowledge <misc> part of KG <media> based on some form <org> <eve> knowledge</s>
|
||
2025-06-11 11:05:35,367 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'knowledge', '<misc>', 'part of KG', '<media>', 'based on some form', '<org>', '<eve>', 'knowledge']
|
||
2025-06-11 11:05:35,367 - DEBUG - 添加三元组: graph(concept) - part of KG - knowledge(misc)
|
||
2025-06-11 11:05:35,367 - DEBUG - 块 11 提取到 1 个三元组
|
||
2025-06-11 11:05:35,367 - DEBUG - 处理块 12/504: limitation of knowledge scale, computing power and...
|
||
2025-06-11 11:05:35,580 - DEBUG - 块 12 生成文本: <triplet> <concept> natural language processing <media> part of</s>
|
||
2025-06-11 11:05:35,580 - DEBUG - 原始生成文本: <triplet> <concept> natural language processing <media> part of</s>
|
||
2025-06-11 11:05:35,580 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'natural language processing', '<media>', 'part of']
|
||
2025-06-11 11:05:35,580 - DEBUG - 处理块 13/504: base question answering systems were limited to cl...
|
||
2025-06-11 11:05:35,966 - DEBUG - 块 13 生成文本: <triplet> <media> closed-domain <concept> subclass of the Internet domain <org> follows</s>
|
||
2025-06-11 11:05:35,966 - DEBUG - 原始生成文本: <triplet> <media> closed-domain <concept> subclass of the Internet domain <org> follows</s>
|
||
2025-06-11 11:05:35,966 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'closed-domain', '<concept>', 'subclass of the Internet domain', '<org>', 'follows']
|
||
2025-06-11 11:05:35,966 - DEBUG - 处理块 14/504: KG and the construction of open-domain question an...
|
||
2025-06-11 11:05:36,242 - DEBUG - 块 14 生成文本: <triplet> QA <concept> open-domain question answering (QA) <media> facet of</s>
|
||
2025-06-11 11:05:36,242 - DEBUG - 原始生成文本: <triplet> QA <concept> open-domain question answering (QA) <media> facet of</s>
|
||
2025-06-11 11:05:36,242 - DEBUG - 处理后标记: ['<triplet>', 'QA', '<concept>', 'open-domain question answering (QA)', '<media>', 'facet of']
|
||
2025-06-11 11:05:36,242 - DEBUG - 添加三元组: QA(concept) - facet of - open-domain question answering (QA)(media)
|
||
2025-06-11 11:05:36,242 - DEBUG - 块 14 提取到 1 个三元组
|
||
2025-06-11 11:05:36,242 - DEBUG - 处理块 15/504: research and practice. In this paper, in accordanc...
|
||
2025-06-11 11:05:36,476 - DEBUG - 块 15 生成文本: <triplet> <org> open-domain <concept> instance of</s>
|
||
2025-06-11 11:05:36,477 - DEBUG - 原始生成文本: <triplet> <org> open-domain <concept> instance of</s>
|
||
2025-06-11 11:05:36,477 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'open-domain', '<concept>', 'instance of']
|
||
2025-06-11 11:05:36,477 - DEBUG - 处理块 16/504: summarized. Firstly, five rule and template based ...
|
||
2025-06-11 11:05:36,852 - DEBUG - 块 16 生成文本: <triplet> 计算机科学 <concept> semantic <misc> studies</s>
|
||
2025-06-11 11:05:36,852 - DEBUG - 原始生成文本: <triplet> 计算机科学 <concept> semantic <misc> studies</s>
|
||
2025-06-11 11:05:36,852 - DEBUG - 处理后标记: ['<triplet>', '计算机科学', '<concept>', 'semantic', '<misc>', 'studies']
|
||
2025-06-11 11:05:36,852 - DEBUG - 添加三元组: 计算机科学(concept) - studies - semantic(misc)
|
||
2025-06-11 11:05:36,852 - DEBUG - 块 16 提取到 1 个三元组
|
||
2025-06-11 11:05:36,852 - DEBUG - 处理块 17/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:05:37,260 - DEBUG - 块 17 生成文本: <triplet> <concept> Journal of Frontiers of Computer Science and Technology <media> publisher</s>
|
||
2025-06-11 11:05:37,260 - DEBUG - 原始生成文本: <triplet> <concept> Journal of Frontiers of Computer Science and Technology <media> publisher</s>
|
||
2025-06-11 11:05:37,260 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Journal of Frontiers of Computer Science and Technology', '<media>', 'publisher']
|
||
2025-06-11 11:05:37,260 - DEBUG - 处理块 18/504: 基金项目 : 国家重点研发计划(2019YFE0198600) ;国家自然科学基金面上项目(6197...
|
||
2025-06-11 11:05:37,409 - DEBUG - 块 18 生成文本: <triplet> 国家重点研发计划 <concept> 2019 <date> inception</s>
|
||
2025-06-11 11:05:37,409 - DEBUG - 原始生成文本: <triplet> 国家重点研发计划 <concept> 2019 <date> inception</s>
|
||
2025-06-11 11:05:37,409 - DEBUG - 处理后标记: ['<triplet>', '国家重点研发计划', '<concept>', '2019', '<date>', 'inception']
|
||
2025-06-11 11:05:37,409 - DEBUG - 添加三元组: 国家重点研发计划(concept) - inception - 2019(date)
|
||
2025-06-11 11:05:37,409 - DEBUG - 块 18 提取到 1 个三元组
|
||
2025-06-11 11:05:37,409 - DEBUG - 处理块 19/504: This work was supported by the National Key Resear...
|
||
2025-06-11 11:05:37,707 - DEBUG - 块 19 生成文本: <triplet> <concept> National Key Research and Development Program of China <org> sponsor</s>
|
||
2025-06-11 11:05:37,707 - DEBUG - 原始生成文本: <triplet> <concept> National Key Research and Development Program of China <org> sponsor</s>
|
||
2025-06-11 11:05:37,707 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'National Key Research and Development Program of China', '<org>', 'sponsor']
|
||
2025-06-11 11:05:37,707 - DEBUG - 处理块 20/504: of National Natural Science Foundation of China (6...
|
||
2025-06-11 11:05:37,878 - DEBUG - 块 20 生成文本: <triplet> 计算机科学与探索 <concept> 科学 <media> occupation</s>
|
||
2025-06-11 11:05:37,878 - DEBUG - 原始生成文本: <triplet> 计算机科学与探索 <concept> 科学 <media> occupation</s>
|
||
2025-06-11 11:05:37,878 - DEBUG - 处理后标记: ['<triplet>', '计算机科学与探索', '<concept>', '科学', '<media>', 'occupation']
|
||
2025-06-11 11:05:37,878 - DEBUG - 添加三元组: 计算机科学与探索(concept) - occupation - 科学(media)
|
||
2025-06-11 11:05:37,878 - DEBUG - 块 20 提取到 1 个三元组
|
||
2025-06-11 11:05:37,878 - DEBUG - 处理块 21/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:05:38,272 - DEBUG - 块 21 生成文本: <triplet> ጊ X X D F B KP S H <org> Journal of Frontiers of Computer Science and Technology <unk> <concept> is a list of</s>
|
||
2025-06-11 11:05:38,272 - DEBUG - 原始生成文本: <triplet> ጊ X X D F B KP S H <org> Journal of Frontiers of Computer Science and Technology <unk> <concept> is a list of</s>
|
||
2025-06-11 11:05:38,272 - DEBUG - 处理后标记: ['<triplet>', 'ጊ X X D F B KP S H', '<org>', 'Journal of Frontiers of Computer Science and Technology', '<unk>', '<concept>', 'is a list of']
|
||
2025-06-11 11:05:38,272 - DEBUG - 添加三元组: ጊ X X D F B KP S H(org) - <concept> - Journal of Frontiers of Computer Science and Technology(unk)
|
||
2025-06-11 11:05:38,272 - DEBUG - 块 21 提取到 1 个三元组
|
||
2025-06-11 11:05:38,272 - DEBUG - 处理块 22/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:05:38,858 - DEBUG - 块 22 生成文本: <triplet> 信息检索 <concept> 问答系统 <media> Journal of Frontiers of Computer Science and Technology <org> 计算机科学与探索 <unk> <eve> 自然语言 <misc> studies</s>
|
||
2025-06-11 11:05:38,859 - DEBUG - 原始生成文本: <triplet> 信息检索 <concept> 问答系统 <media> Journal of Frontiers of Computer Science and Technology <org> 计算机科学与探索 <unk> <eve> 自然语言 <misc> studies</s>
|
||
2025-06-11 11:05:38,859 - DEBUG - 处理后标记: ['<triplet>', '信息检索', '<concept>', '问答系统', '<media>', 'Journal of Frontiers of Computer Science and Technology', '<org>', '计算机科学与探索', '<unk>', '<eve>', '自然语言', '<misc>', 'studies']
|
||
2025-06-11 11:05:38,859 - DEBUG - 添加三元组: 信息检索(concept) - Journal of Frontiers of Computer Science and Technology - 问答系统(media)
|
||
2025-06-11 11:05:38,859 - DEBUG - 块 22 提取到 1 个三元组
|
||
2025-06-11 11:05:38,859 - DEBUG - 处理块 23/504: 言处理的交叉研究方向
|
||
[1]
|
||
。 知识库 ( knowledge base,
|
||
KB) 是用于存储计算...
|
||
2025-06-11 11:05:39,392 - DEBUG - 块 23 生成文本: <triplet> 限定领 域知识库 <media> 知识 <concept> subclass of</s>
|
||
2025-06-11 11:05:39,393 - DEBUG - 原始生成文本: <triplet> 限定领 域知识库 <media> 知识 <concept> subclass of</s>
|
||
2025-06-11 11:05:39,393 - DEBUG - 处理后标记: ['<triplet>', '限定领 域知识库', '<media>', '知识', '<concept>', 'subclass of']
|
||
2025-06-11 11:05:39,393 - DEBUG - 添加三元组: 限定领 域知识库(media) - subclass of - 知识(concept)
|
||
2025-06-11 11:05:39,393 - DEBUG - 块 23 提取到 1 个三元组
|
||
2025-06-11 11:05:39,393 - DEBUG - 处理块 24/504: 并获得所需领域问题的答案 , 而无需使用数据库
|
||
查询语 言 ( 如 SQL) 来构建查询 。 代表性...
|
||
2025-06-11 11:05:40,638 - DEBUG - 块 24 生成文本: <triplet> 语 言 <concept> 知识图谱 <media> KG <org> <misc> 数据库 <unk> <per> <loc> graph <eve> BASEBALL <dis> <cel> 범 <triplet> KG) <time> 查询 <date> point in time</s>
|
||
2025-06-11 11:05:40,638 - DEBUG - 原始生成文本: <triplet> 语 言 <concept> 知识图谱 <media> KG <org> <misc> 数据库 <unk> <per> <loc> graph <eve> BASEBALL <dis> <cel> 범 <triplet> KG) <time> 查询 <date> point in time</s>
|
||
2025-06-11 11:05:40,638 - DEBUG - 处理后标记: ['<triplet>', '语 言', '<concept>', '知识图谱', '<media>', 'KG', '<org>', '<misc>', '数据库', '<unk>', '<per>', '<loc>', 'graph', '<eve>', 'BASEBALL', '<dis>', '<cel>', '범', '<triplet>', 'KG)', '<time>', '查询', '<date>', 'point in time']
|
||
2025-06-11 11:05:40,638 - DEBUG - 添加三元组: 语 言(concept) - KG - 知识图谱(media)
|
||
2025-06-11 11:05:40,638 - DEBUG - 添加三元组: KG)(time) - point in time - 查询(date)
|
||
2025-06-11 11:05:40,638 - DEBUG - 块 24 提取到 2 个三元组
|
||
2025-06-11 11:05:40,639 - DEBUG - 处理块 25/504: 、 信息检索及深度学习等技
|
||
术的发展 , Freebase
|
||
[7]
|
||
、 DBpedia
|
||
[8]
|
||
、 ...
|
||
2025-06-11 11:05:40,939 - DEBUG - 块 25 生成文本: <triplet> 知识图谱 <concept> 深度学习 <media> part of</s>
|
||
2025-06-11 11:05:40,940 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 深度学习 <media> part of</s>
|
||
2025-06-11 11:05:40,940 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '深度学习', '<media>', 'part of']
|
||
2025-06-11 11:05:40,940 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 深度学习(media)
|
||
2025-06-11 11:05:40,940 - DEBUG - 块 25 提取到 1 个三元组
|
||
2025-06-11 11:05:40,940 - DEBUG - 处理块 26/504: graph question answering, KGQA) 作为限定领域知识
|
||
库问答的发展 , ...
|
||
2025-06-11 11:05:41,430 - DEBUG - 块 26 生成文本: <triplet> 知识图谱 <concept> 库问答 <media> graph question answering <org> KGQA <misc> part of</s>
|
||
2025-06-11 11:05:41,430 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 库问答 <media> graph question answering <org> KGQA <misc> part of</s>
|
||
2025-06-11 11:05:41,430 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '库问答', '<media>', 'graph question answering', '<org>', 'KGQA', '<misc>', 'part of']
|
||
2025-06-11 11:05:41,430 - DEBUG - 添加三元组: 知识图谱(concept) - graph question answering - 库问答(media)
|
||
2025-06-11 11:05:41,430 - DEBUG - 块 26 提取到 1 个三元组
|
||
2025-06-11 11:05:41,430 - DEBUG - 处理块 27/504: 开放领域知识图谱问答的实际应用十分广泛 :
|
||
可作为搜索引擎的组成部分 , 将问答系统所得答案
|
||
与搜索...
|
||
2025-06-11 11:05:41,600 - DEBUG - 块 27 生成文本: <triplet> 知识图谱问答 <media> 搜索引擎 <concept> use</s>
|
||
2025-06-11 11:05:41,600 - DEBUG - 原始生成文本: <triplet> 知识图谱问答 <media> 搜索引擎 <concept> use</s>
|
||
2025-06-11 11:05:41,600 - DEBUG - 处理后标记: ['<triplet>', '知识图谱问答', '<media>', '搜索引擎', '<concept>', 'use']
|
||
2025-06-11 11:05:41,600 - DEBUG - 添加三元组: 知识图谱问答(media) - use - 搜索引擎(concept)
|
||
2025-06-11 11:05:41,600 - DEBUG - 块 27 提取到 1 个三元组
|
||
2025-06-11 11:05:41,600 - DEBUG - 处理块 28/504: 为了实现开放领域知识图谱问答 , 问答系统需
|
||
要利用问题的语义信息深入理解自然语言问题 , 并
|
||
从通...
|
||
2025-06-11 11:05:41,985 - DEBUG - 块 28 生成文本: <triplet> 开放领域知识图谱问答 <concept> 通用领域 <media> 知识 <org> <unk> 图 <eve> 系统 <misc> part of</s>
|
||
2025-06-11 11:05:41,985 - DEBUG - 原始生成文本: <triplet> 开放领域知识图谱问答 <concept> 通用领域 <media> 知识 <org> <unk> 图 <eve> 系统 <misc> part of</s>
|
||
2025-06-11 11:05:41,985 - DEBUG - 处理后标记: ['<triplet>', '开放领域知识图谱问答', '<concept>', '通用领域', '<media>', '知识', '<org>', '<unk>', '图', '<eve>', '系统', '<misc>', 'part of']
|
||
2025-06-11 11:05:41,985 - DEBUG - 添加三元组: 开放领域知识图谱问答(concept) - 知识 - 通用领域(media)
|
||
2025-06-11 11:05:41,985 - DEBUG - 块 28 提取到 1 个三元组
|
||
2025-06-11 11:05:41,985 - DEBUG - 处理块 29/504: ( 1) 提取问题的语义信息 。 无论对于语义解析
|
||
还是信息检索方法而言 , 都需要系统充分理解并利...
|
||
2025-06-11 11:05:42,156 - DEBUG - 块 29 生成文本: <triplet> 子知识图谱 <concept> KGQA <org> standards body</s>
|
||
2025-06-11 11:05:42,157 - DEBUG - 原始生成文本: <triplet> 子知识图谱 <concept> KGQA <org> standards body</s>
|
||
2025-06-11 11:05:42,157 - DEBUG - 处理后标记: ['<triplet>', '子知识图谱', '<concept>', 'KGQA', '<org>', 'standards body']
|
||
2025-06-11 11:05:42,157 - DEBUG - 添加三元组: 子知识图谱(concept) - standards body - KGQA(org)
|
||
2025-06-11 11:05:42,157 - DEBUG - 块 29 提取到 1 个三元组
|
||
2025-06-11 11:05:42,157 - DEBUG - 处理块 30/504: ( 2) 充分利用知识图谱信息 。 通用领域 KG 的规
|
||
模通常较为庞大 , 其中不乏大量长尾关系及...
|
||
2025-06-11 11:05:42,380 - DEBUG - 块 30 生成文本: <triplet> 训练系统 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:05:42,380 - DEBUG - 原始生成文本: <triplet> 训练系统 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:05:42,380 - DEBUG - 处理后标记: ['<triplet>', '训练系统', '<concept>', 'KGQA', '<media>', 'part of']
|
||
2025-06-11 11:05:42,380 - DEBUG - 添加三元组: 训练系统(concept) - part of - KGQA(media)
|
||
2025-06-11 11:05:42,380 - DEBUG - 块 30 提取到 1 个三元组
|
||
2025-06-11 11:05:42,380 - DEBUG - 处理块 31/504: 通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为...
|
||
2025-06-11 11:05:42,733 - DEBUG - 块 31 生成文本: <triplet> 知识图谱 <concept> KGQA <media> used by</s>
|
||
2025-06-11 11:05:42,733 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> KGQA <media> used by</s>
|
||
2025-06-11 11:05:42,733 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', 'KGQA', '<media>', 'used by']
|
||
2025-06-11 11:05:42,733 - DEBUG - 添加三元组: 知识图谱(concept) - used by - KGQA(media)
|
||
2025-06-11 11:05:42,733 - DEBUG - 块 31 提取到 1 个三元组
|
||
2025-06-11 11:05:42,733 - DEBUG - 处理块 32/504: 部方法 , 并用相同基线评测分析不同方法运行效果
|
||
的综述工作 。 文献 [13]针对 2016 年以...
|
||
2025-06-11 11:05:42,925 - DEBUG - 块 32 生成文本: <triplet> 基线 <concept> 图谱问答 <media> part of</s>
|
||
2025-06-11 11:05:42,925 - DEBUG - 原始生成文本: <triplet> 基线 <concept> 图谱问答 <media> part of</s>
|
||
2025-06-11 11:05:42,925 - DEBUG - 处理后标记: ['<triplet>', '基线', '<concept>', '图谱问答', '<media>', 'part of']
|
||
2025-06-11 11:05:42,925 - DEBUG - 添加三元组: 基线(concept) - part of - 图谱问答(media)
|
||
2025-06-11 11:05:42,925 - DEBUG - 块 32 提取到 1 个三元组
|
||
2025-06-11 11:05:42,925 - DEBUG - 处理块 33/504: 程相同的 5 个子任务组成 , 忽略了流程多样性 。 文献
|
||
[14]将基于神经网络的方法作为综述内容...
|
||
2025-06-11 11:05:43,373 - DEBUG - 块 33 生成文本: <triplet> 子任务 <concept> 5 <num> quantity</s>
|
||
2025-06-11 11:05:43,373 - DEBUG - 原始生成文本: <triplet> 子任务 <concept> 5 <num> quantity</s>
|
||
2025-06-11 11:05:43,373 - DEBUG - 处理后标记: ['<triplet>', '子任务', '<concept>', '5', '<num>', 'quantity']
|
||
2025-06-11 11:05:43,373 - DEBUG - 添加三元组: 子任务(concept) - quantity - 5(num)
|
||
2025-06-11 11:05:43,373 - DEBUG - 块 33 提取到 1 个三元组
|
||
2025-06-11 11:05:43,373 - DEBUG - 处理块 34/504: 问答相关资源及方法实现原理缺乏详细描述 。 文献
|
||
[14-16]皆未在相同基线上统一评测不同方法的运...
|
||
2025-06-11 11:05:43,755 - DEBUG - 块 34 生成文本: <triplet> 问答相关资源及方法实现原理 <org> 文献 <concept> instance of</s>
|
||
2025-06-11 11:05:43,756 - DEBUG - 原始生成文本: <triplet> 问答相关资源及方法实现原理 <org> 文献 <concept> instance of</s>
|
||
2025-06-11 11:05:43,756 - DEBUG - 处理后标记: ['<triplet>', '问答相关资源及方法实现原理', '<org>', '文献', '<concept>', 'instance of']
|
||
2025-06-11 11:05:43,756 - DEBUG - 添加三元组: 问答相关资源及方法实现原理(org) - instance of - 文献(concept)
|
||
2025-06-11 11:05:43,756 - DEBUG - 块 34 提取到 1 个三元组
|
||
2025-06-11 11:05:43,756 - DEBUG - 处理块 35/504: parsing, traditional information retrieval, triple...
|
||
2025-06-11 11:05:43,895 - DEBUG - 块 35 生成文本: <triplet> <concept> query template <misc> subclass of</s>
|
||
2025-06-11 11:05:43,895 - DEBUG - 原始生成文本: <triplet> <concept> query template <misc> subclass of</s>
|
||
2025-06-11 11:05:43,895 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'query template', '<misc>', 'subclass of']
|
||
2025-06-11 11:05:43,895 - DEBUG - 处理块 36/504: methods mainly relies on manually defined rules an...
|
||
2025-06-11 11:05:44,182 - DEBUG - 块 36 生成文本: <triplet> <media> deep learning <concept> subclass of <triplet> five deep <org> QA <eve> facet of</s>
|
||
2025-06-11 11:05:44,182 - DEBUG - 原始生成文本: <triplet> <media> deep learning <concept> subclass of <triplet> five deep <org> QA <eve> facet of</s>
|
||
2025-06-11 11:05:44,182 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'deep learning', '<concept>', 'subclass of', '<triplet>', 'five deep', '<org>', 'QA', '<eve>', 'facet of']
|
||
2025-06-11 11:05:44,183 - DEBUG - 处理块 37/504: based KGQA methods are introduced, which use neura...
|
||
2025-06-11 11:05:44,803 - DEBUG - 块 37 生成文本: <triplet> QA <media> neural network model <concept> subclass of <triplet> subtask <misc> KGQA method <org> used by</s>
|
||
2025-06-11 11:05:44,803 - DEBUG - 原始生成文本: <triplet> QA <media> neural network model <concept> subclass of <triplet> subtask <misc> KGQA method <org> used by</s>
|
||
2025-06-11 11:05:44,803 - DEBUG - 处理后标记: ['<triplet>', 'QA', '<media>', 'neural network model', '<concept>', 'subclass of', '<triplet>', 'subtask', '<misc>', 'KGQA method', '<org>', 'used by']
|
||
2025-06-11 11:05:44,803 - DEBUG - 添加三元组: QA(media) - subclass of - neural network model(concept)
|
||
2025-06-11 11:05:44,803 - DEBUG - 添加三元组: subtask(misc) - used by - KGQA method(org)
|
||
2025-06-11 11:05:44,803 - DEBUG - 块 37 提取到 2 个三元组
|
||
2025-06-11 11:05:44,803 - DEBUG - 处理块 38/504: including knowledge graph embedding, memory networ...
|
||
2025-06-11 11:05:45,143 - DEBUG - 块 38 生成文本: <triplet> graph embedding <concept> neural network-based semantic parsing <media> part of <misc> memory network <org> part <loc> part</s>
|
||
2025-06-11 11:05:45,143 - DEBUG - 原始生成文本: <triplet> graph embedding <concept> neural network-based semantic parsing <media> part of <misc> memory network <org> part <loc> part</s>
|
||
2025-06-11 11:05:45,143 - DEBUG - 处理后标记: ['<triplet>', 'graph embedding', '<concept>', 'neural network-based semantic parsing', '<media>', 'part of', '<misc>', 'memory network', '<org>', 'part', '<loc>', 'part']
|
||
2025-06-11 11:05:45,143 - DEBUG - 添加三元组: graph embedding(concept) - part of - neural network-based semantic parsing(media)
|
||
2025-06-11 11:05:45,143 - DEBUG - 块 38 提取到 1 个三元组
|
||
2025-06-11 11:05:45,143 - DEBUG - 处理块 39/504: based query graph, and neural network-based inform...
|
||
2025-06-11 11:05:45,302 - DEBUG - 块 39 生成文本: <triplet> graph <concept> information retrieval method</s>
|
||
2025-06-11 11:05:45,303 - DEBUG - 原始生成文本: <triplet> graph <concept> information retrieval method</s>
|
||
2025-06-11 11:05:45,303 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'information retrieval method']
|
||
2025-06-11 11:05:45,303 - DEBUG - 处理块 40/504: open- domain QA datasets, which KGQA commonly used...
|
||
2025-06-11 11:05:45,621 - DEBUG - 块 40 生成文本: <triplet> QA <media> open-domain <concept> facet of</s>
|
||
2025-06-11 11:05:45,622 - DEBUG - 原始生成文本: <triplet> QA <media> open-domain <concept> facet of</s>
|
||
2025-06-11 11:05:45,622 - DEBUG - 处理后标记: ['<triplet>', 'QA', '<media>', 'open-domain', '<concept>', 'facet of']
|
||
2025-06-11 11:05:45,622 - DEBUG - 添加三元组: QA(media) - facet of - open-domain(concept)
|
||
2025-06-11 11:05:45,622 - DEBUG - 块 40 提取到 1 个三元组
|
||
2025-06-11 11:05:45,622 - DEBUG - 处理块 41/504: selected according to the difficulty of questions ...
|
||
2025-06-11 11:05:45,760 - DEBUG - 块 41 生成文本: <triplet> <concept> KGQA system <media> part of</s>
|
||
2025-06-11 11:05:45,760 - DEBUG - 原始生成文本: <triplet> <concept> KGQA system <media> part of</s>
|
||
2025-06-11 11:05:45,760 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KGQA system', '<media>', 'part of']
|
||
2025-06-11 11:05:45,760 - DEBUG - 处理块 42/504: and the effect between above methods. Finally, thi...
|
||
2025-06-11 11:05:46,079 - DEBUG - 块 42 生成文本: <triplet> <concept> research directions <media> instance of</s>
|
||
2025-06-11 11:05:46,079 - DEBUG - 原始生成文本: <triplet> <concept> research directions <media> instance of</s>
|
||
2025-06-11 11:05:46,079 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'research directions', '<media>', 'instance of']
|
||
2025-06-11 11:05:46,079 - DEBUG - 处理块 43/504: Key words: knowledge graph question answering (KGQ...
|
||
2025-06-11 11:05:46,506 - DEBUG - 块 43 生成文本: <triplet> ଊ ጊ <concept> knowledge graph question answering (KGQA) <media> 1844 <date> inception</s>
|
||
2025-06-11 11:05:46,506 - DEBUG - 原始生成文本: <triplet> ଊ ጊ <concept> knowledge graph question answering (KGQA) <media> 1844 <date> inception</s>
|
||
2025-06-11 11:05:46,507 - DEBUG - 处理后标记: ['<triplet>', 'ଊ ጊ', '<concept>', 'knowledge graph question answering (KGQA)', '<media>', '1844', '<date>', 'inception']
|
||
2025-06-11 11:05:46,507 - DEBUG - 添加三元组: ଊ ጊ(concept) - 1844 - knowledge graph question answering (KGQA)(media)
|
||
2025-06-11 11:05:46,507 - DEBUG - 块 43 提取到 1 个三元组
|
||
2025-06-11 11:05:46,507 - DEBUG - 处理块 44/504: X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
效果 。 本...
|
||
2025-06-11 11:05:46,970 - DEBUG - 块 44 生成文本: <triplet> 陈子睿 <per> 等 <concept> field of work</s>
|
||
2025-06-11 11:05:46,970 - DEBUG - 原始生成文本: <triplet> 陈子睿 <per> 等 <concept> field of work</s>
|
||
2025-06-11 11:05:46,970 - DEBUG - 处理后标记: ['<triplet>', '陈子睿', '<per>', '等', '<concept>', 'field of work']
|
||
2025-06-11 11:05:46,970 - DEBUG - 添加三元组: 陈子睿(per) - field of work - 等(concept)
|
||
2025-06-11 11:05:46,970 - DEBUG - 块 44 提取到 1 个三元组
|
||
2025-06-11 11:05:46,970 - DEBUG - 处理块 45/504: 法 , 方法间的箭头表示方法的演变方向 。 从图中可
|
||
以看出 , 在深度学习技术得到广泛应用之前 ,...
|
||
2025-06-11 11:05:47,578 - DEBUG - 块 45 生成文本: <triplet> 规则模板方法 <concept> 方法间的箭头表示方法的演变方向 <misc> 深度学习技术 <media> facet of</s>
|
||
2025-06-11 11:05:47,578 - DEBUG - 原始生成文本: <triplet> 规则模板方法 <concept> 方法间的箭头表示方法的演变方向 <misc> 深度学习技术 <media> facet of</s>
|
||
2025-06-11 11:05:47,578 - DEBUG - 处理后标记: ['<triplet>', '规则模板方法', '<concept>', '方法间的箭头表示方法的演变方向', '<misc>', '深度学习技术', '<media>', 'facet of']
|
||
2025-06-11 11:05:47,579 - DEBUG - 添加三元组: 规则模板方法(concept) - 深度学习技术 - 方法间的箭头表示方法的演变方向(misc)
|
||
2025-06-11 11:05:47,579 - DEBUG - 块 45 提取到 1 个三元组
|
||
2025-06-11 11:05:47,579 - DEBUG - 处理块 46/504: 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模...
|
||
2025-06-11 11:05:47,879 - DEBUG - 块 46 生成文本: <triplet> 查询模板方法 <concept> 三元组匹配 <media> <org> <misc> <unk> <per> follows</s>
|
||
2025-06-11 11:05:47,879 - DEBUG - 原始生成文本: <triplet> 查询模板方法 <concept> 三元组匹配 <media> <org> <misc> <unk> <per> follows</s>
|
||
2025-06-11 11:05:47,879 - DEBUG - 处理后标记: ['<triplet>', '查询模板方法', '<concept>', '三元组匹配', '<media>', '<org>', '<misc>', '<unk>', '<per>', 'follows']
|
||
2025-06-11 11:05:47,879 - DEBUG - 添加三元组: 查询模板方法(concept) - <org> - 三元组匹配(media)
|
||
2025-06-11 11:05:47,879 - DEBUG - 块 46 提取到 1 个三元组
|
||
2025-06-11 11:05:47,879 - DEBUG - 处理块 47/504: 性与迁移能力较低 、 准确率等性能指标提升瓶颈等
|
||
原因 , 导致该类方法的研究热度逐渐减低 ; 而同...
|
||
2025-06-11 11:05:48,156 - DEBUG - 块 47 生成文本: <triplet> 准确率 <concept> 性能指标 <media> subclass of</s>
|
||
2025-06-11 11:05:48,156 - DEBUG - 原始生成文本: <triplet> 准确率 <concept> 性能指标 <media> subclass of</s>
|
||
2025-06-11 11:05:48,156 - DEBUG - 处理后标记: ['<triplet>', '准确率', '<concept>', '性能指标', '<media>', 'subclass of']
|
||
2025-06-11 11:05:48,156 - DEBUG - 添加三元组: 准确率(concept) - subclass of - 性能指标(media)
|
||
2025-06-11 11:05:48,157 - DEBUG - 块 47 提取到 1 个三元组
|
||
2025-06-11 11:05:48,157 - DEBUG - 处理块 48/504: 于深度学习方法的部分 , 基于低维向量空间的知识
|
||
图谱嵌入方法率先产生 ; 随后以知识图谱嵌入为基
|
||
...
|
||
2025-06-11 11:05:48,701 - DEBUG - 块 48 生成文本: <triplet> 卷积神 经网络 <concept> 注意力 <misc> CNN <media> part of</s>
|
||
2025-06-11 11:05:48,701 - DEBUG - 原始生成文本: <triplet> 卷积神 经网络 <concept> 注意力 <misc> CNN <media> part of</s>
|
||
2025-06-11 11:05:48,701 - DEBUG - 处理后标记: ['<triplet>', '卷积神 经网络', '<concept>', '注意力', '<misc>', 'CNN', '<media>', 'part of']
|
||
2025-06-11 11:05:48,701 - DEBUG - 添加三元组: 卷积神 经网络(concept) - CNN - 注意力(misc)
|
||
2025-06-11 11:05:48,701 - DEBUG - 块 48 提取到 1 个三元组
|
||
2025-06-11 11:05:48,701 - DEBUG - 处理块 49/504: 机制 ( attention mechanism) 、 图神经网络 ( graph neural
|
||
n...
|
||
2025-06-11 11:05:48,882 - DEBUG - 块 49 生成文本: <triplet> 机制 <concept> 神经网络模型 <misc> instance of</s>
|
||
2025-06-11 11:05:48,882 - DEBUG - 原始生成文本: <triplet> 机制 <concept> 神经网络模型 <misc> instance of</s>
|
||
2025-06-11 11:05:48,882 - DEBUG - 处理后标记: ['<triplet>', '机制', '<concept>', '神经网络模型', '<misc>', 'instance of']
|
||
2025-06-11 11:05:48,882 - DEBUG - 添加三元组: 机制(concept) - instance of - 神经网络模型(misc)
|
||
2025-06-11 11:05:48,882 - DEBUG - 块 49 提取到 1 个三元组
|
||
2025-06-11 11:05:48,882 - DEBUG - 处理块 50/504: 析 、 查询图和信息检索方法 , 其中基于神经网络的信
|
||
息检索方法近几年得到了广泛关注 。
|
||
本文的目...
|
||
2025-06-11 11:05:49,373 - DEBUG - 块 50 生成文本: <triplet> 析、查询图和信息检索方法 <concept> 知识图谱问答 <media> Fig.1 Framework of knowledge graph question <unk> <misc> studies</s>
|
||
2025-06-11 11:05:49,373 - DEBUG - 原始生成文本: <triplet> 析、查询图和信息检索方法 <concept> 知识图谱问答 <media> Fig.1 Framework of knowledge graph question <unk> <misc> studies</s>
|
||
2025-06-11 11:05:49,373 - DEBUG - 处理后标记: ['<triplet>', '析、查询图和信息检索方法', '<concept>', '知识图谱问答', '<media>', 'Fig.1 Framework of knowledge graph question', '<unk>', '<misc>', 'studies']
|
||
2025-06-11 11:05:49,373 - DEBUG - 添加三元组: 析、查询图和信息检索方法(concept) - Fig.1 Framework of knowledge graph question - 知识图谱问答(media)
|
||
2025-06-11 11:05:49,373 - DEBUG - 块 50 提取到 1 个三元组
|
||
2025-06-11 11:05:49,373 - DEBUG - 处理块 51/504: answering methods
|
||
˝…1 ¿“•¯`ìÓòÖ“˚¶˝…˘×˛˚·ð•‰•¤¿ò…Ü...
|
||
2025-06-11 11:05:50,227 - DEBUG - 块 51 生成文本: <triplet> ̄`ìÓòÖ <concept> ̊––...äÖÆÆ <media> 2 <dis> <misc> ̆× <unk> Ñ <per> <org> ̨– <time> <date> point</s>
|
||
2025-06-11 11:05:50,228 - DEBUG - 原始生成文本: <triplet> ̄`ìÓòÖ <concept> ̊––...äÖÆÆ <media> 2 <dis> <misc> ̆× <unk> Ñ <per> <org> ̨– <time> <date> point</s>
|
||
2025-06-11 11:05:50,228 - DEBUG - 处理后标记: ['<triplet>', '̄`ìÓòÖ', '<concept>', '̊––...äÖÆÆ', '<media>', '2', '<dis>', '<misc>', '̆×', '<unk>', 'Ñ', '<per>', '<org>', '̨–', '<time>', '<date>', 'point']
|
||
2025-06-11 11:05:50,228 - DEBUG - 添加三元组: ̄`ìÓòÖ(concept) - 2 - ̊––...äÖÆÆ(media)
|
||
2025-06-11 11:05:50,228 - DEBUG - 块 51 提取到 1 个三元组
|
||
2025-06-11 11:05:50,228 - DEBUG - 处理块 52/504: 1845
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
Journal of Frontie...
|
||
2025-06-11 11:05:50,836 - DEBUG - 块 52 生成文本: <triplet> Ақпарат X X D F B KP S H Journal of Frontiers of Computer Science and Technology <media> 计算机科学与探索 <org> <concept> सित <unk> ଊ ጊ <per> is a list of</s>
|
||
2025-06-11 11:05:50,836 - DEBUG - 原始生成文本: <triplet> Ақпарат X X D F B KP S H Journal of Frontiers of Computer Science and Technology <media> 计算机科学与探索 <org> <concept> सित <unk> ଊ ጊ <per> is a list of</s>
|
||
2025-06-11 11:05:50,836 - DEBUG - 处理后标记: ['<triplet>', 'Ақпарат X X D F B KP S H Journal of Frontiers of Computer Science and Technology', '<media>', '计算机科学与探索', '<org>', '<concept>', 'सित', '<unk>', 'ଊ ጊ', '<per>', 'is a list of']
|
||
2025-06-11 11:05:50,836 - DEBUG - 添加三元组: Ақпарат X X D F B KP S H Journal of Frontiers of Computer Science and Technology(media) - <concept> - 计算机科学与探索(org)
|
||
2025-06-11 11:05:50,836 - DEBUG - 块 52 提取到 1 个三元组
|
||
2025-06-11 11:05:50,836 - DEBUG - 处理块 53/504: ( 1) 从开放领域知识图谱问答的技术角度出发 ,
|
||
基于方法使用的核心技术 , 以规则模板与深度学习...
|
||
2025-06-11 11:05:51,209 - DEBUG - 块 53 生成文本: <triplet> 通用领域知识图谱 <concept> 开放领域 <media> part of</s>
|
||
2025-06-11 11:05:51,209 - DEBUG - 原始生成文本: <triplet> 通用领域知识图谱 <concept> 开放领域 <media> part of</s>
|
||
2025-06-11 11:05:51,209 - DEBUG - 处理后标记: ['<triplet>', '通用领域知识图谱', '<concept>', '开放领域', '<media>', 'part of']
|
||
2025-06-11 11:05:51,209 - DEBUG - 添加三元组: 通用领域知识图谱(concept) - part of - 开放领域(media)
|
||
2025-06-11 11:05:51,209 - DEBUG - 块 53 提取到 1 个三元组
|
||
2025-06-11 11:05:51,209 - DEBUG - 处理块 54/504: ( 3) 以 3 个经典问答数据集为基线 , 评测不同方
|
||
法的实验效果并进行分析 。
|
||
( 4) 总结...
|
||
2025-06-11 11:05:51,539 - DEBUG - 块 54 生成文本: <triplet> 知 识图谱 <concept> 知识 <media> 知識 <org> <per> 지식 <loc> <time></s>
|
||
2025-06-11 11:05:51,539 - DEBUG - 原始生成文本: <triplet> 知 识图谱 <concept> 知识 <media> 知識 <org> <per> 지식 <loc> <time></s>
|
||
2025-06-11 11:05:51,539 - DEBUG - 处理后标记: ['<triplet>', '知 识图谱', '<concept>', '知识', '<media>', '知識', '<org>', '<per>', '지식', '<loc>', '<time>']
|
||
2025-06-11 11:05:51,539 - DEBUG - 添加三元组: 知 识图谱(concept) - 知識 - 知识(media)
|
||
2025-06-11 11:05:51,539 - DEBUG - 块 54 提取到 1 个三元组
|
||
2025-06-11 11:05:51,539 - DEBUG - 处理块 55/504: description framework , RDF) 图 、 属性图 、 异构信息网
|
||
络和有向标...
|
||
2025-06-11 11:05:51,880 - DEBUG - 块 55 生成文本: <triplet> 图 <concept> 谱 <media> KGQA <org> developer</s>
|
||
2025-06-11 11:05:51,880 - DEBUG - 原始生成文本: <triplet> 图 <concept> 谱 <media> KGQA <org> developer</s>
|
||
2025-06-11 11:05:51,880 - DEBUG - 处理后标记: ['<triplet>', '图', '<concept>', '谱', '<media>', 'KGQA', '<org>', 'developer']
|
||
2025-06-11 11:05:51,880 - DEBUG - 添加三元组: 图(concept) - KGQA - 谱(media)
|
||
2025-06-11 11:05:51,880 - DEBUG - 块 55 提取到 1 个三元组
|
||
2025-06-11 11:05:51,880 - DEBUG - 处理块 56/504: 出一个 KG 实例 , 其中圆角矩形表示实体 e , 有向边
|
||
表示谓语 p。
|
||
定义 1( 知识图谱 ...
|
||
2025-06-11 11:05:52,274 - DEBUG - 块 56 生成文本: <triplet> 主语 <concept> 实体集合 <misc> part of</s>
|
||
2025-06-11 11:05:52,274 - DEBUG - 原始生成文本: <triplet> 主语 <concept> 实体集合 <misc> part of</s>
|
||
2025-06-11 11:05:52,274 - DEBUG - 处理后标记: ['<triplet>', '主语', '<concept>', '实体集合', '<misc>', 'part of']
|
||
2025-06-11 11:05:52,274 - DEBUG - 添加三元组: 主语(concept) - part of - 实体集合(misc)
|
||
2025-06-11 11:05:52,274 - DEBUG - 块 56 提取到 1 个三元组
|
||
2025-06-11 11:05:52,274 - DEBUG - 处理块 57/504: 知识图谱问答 : 由于不同方法使用的训练数据 、
|
||
元素定义及实现的功能不同 , 知识图谱问答没有统
|
||
...
|
||
2025-06-11 11:05:52,592 - DEBUG - 块 57 生成文本: <triplet><triplet> 知识图谱问答 <concept> 信息检 索 <media> subclass of</s>
|
||
2025-06-11 11:05:52,592 - DEBUG - 原始生成文本: <triplet><triplet> 知识图谱问答 <concept> 信息检 索 <media> subclass of</s>
|
||
2025-06-11 11:05:52,593 - DEBUG - 处理后标记: ['<triplet>', '<triplet>', '知识图谱问答', '<concept>', '信息检 索', '<media>', 'subclass of']
|
||
2025-06-11 11:05:52,593 - DEBUG - 处理块 58/504: 可以看出 ,
|
||
语义解析与信息检索细化了知识图谱问答的流程 ,
|
||
在获得正确答案集 A前分别增加了查询...
|
||
2025-06-11 11:05:53,148 - DEBUG - 块 58 生成文本: <triplet> 知识图谱问答 <concept> 语义解析与信息检索细化 <media> 通用领域 <org> 범密 <unk> 分类 <per> part of</s>
|
||
2025-06-11 11:05:53,148 - DEBUG - 原始生成文本: <triplet> 知识图谱问答 <concept> 语义解析与信息检索细化 <media> 通用领域 <org> 범密 <unk> 分类 <per> part of</s>
|
||
2025-06-11 11:05:53,148 - DEBUG - 处理后标记: ['<triplet>', '知识图谱问答', '<concept>', '语义解析与信息检索细化', '<media>', '通用领域', '<org>', '범密', '<unk>', '分类', '<per>', 'part of']
|
||
2025-06-11 11:05:53,148 - DEBUG - 添加三元组: 知识图谱问答(concept) - 通用领域 - 语义解析与信息检索细化(media)
|
||
2025-06-11 11:05:53,148 - DEBUG - 块 58 提取到 1 个三元组
|
||
2025-06-11 11:05:53,148 - DEBUG - 处理块 59/504: 定义 2( 知识图谱问答 ) 给定知识图谱 G , 自然
|
||
语言问题 q, 返回正确答案集 A, 其中...
|
||
2025-06-11 11:05:53,318 - DEBUG - 块 59 生成文本: <triplet> 子集 <concept> 定义 2 <media> part of</s>
|
||
2025-06-11 11:05:53,319 - DEBUG - 原始生成文本: <triplet> 子集 <concept> 定义 2 <media> part of</s>
|
||
2025-06-11 11:05:53,319 - DEBUG - 处理后标记: ['<triplet>', '子集', '<concept>', '定义 2', '<media>', 'part of']
|
||
2025-06-11 11:05:53,319 - DEBUG - 添加三元组: 子集(concept) - part of - 定义 2(media)
|
||
2025-06-11 11:05:53,319 - DEBUG - 块 59 提取到 1 个三元组
|
||
2025-06-11 11:05:53,319 - DEBUG - 处理块 60/504: 查询语句常用 SPARQL 查询语言 ,
|
||
表达逻辑形式的逻辑语言常用 λ-DCS( λ depen...
|
||
2025-06-11 11:05:53,627 - DEBUG - 块 60 生成文本: <triplet> 查询语言 <media> <concept> instance of</s>
|
||
2025-06-11 11:05:53,627 - DEBUG - 原始生成文本: <triplet> 查询语言 <media> <concept> instance of</s>
|
||
2025-06-11 11:05:53,627 - DEBUG - 处理后标记: ['<triplet>', '查询语言', '<media>', '<concept>', 'instance of']
|
||
2025-06-11 11:05:53,627 - DEBUG - 处理块 61/504: 问题 q , 将 q 映射为可在 G 上执行并返回正确答案集
|
||
A的查询语句 y 或查询语句的逻辑形式...
|
||
2025-06-11 11:05:54,162 - DEBUG - 块 61 生成文本: <triplet> 信息检索 <concept> 知识图谱 G <media> part of</s>
|
||
2025-06-11 11:05:54,163 - DEBUG - 原始生成文本: <triplet> 信息检索 <concept> 知识图谱 G <media> part of</s>
|
||
2025-06-11 11:05:54,163 - DEBUG - 处理后标记: ['<triplet>', '信息检索', '<concept>', '知识图谱 G', '<media>', 'part of']
|
||
2025-06-11 11:05:54,163 - DEBUG - 添加三元组: 信息检索(concept) - part of - 知识图谱 G(media)
|
||
2025-06-11 11:05:54,163 - DEBUG - 块 61 提取到 1 个三元组
|
||
2025-06-11 11:05:54,163 - DEBUG - 处理块 62/504: 问题 q , 在 G 中检索与问题 q 所含主题实体 ( topic
|
||
entity) e 的在数跳 ...
|
||
2025-06-11 11:05:54,312 - DEBUG - 块 62 生成文本: <triplet> 实体 <concept> G <media> part of</s>
|
||
2025-06-11 11:05:54,312 - DEBUG - 原始生成文本: <triplet> 实体 <concept> G <media> part of</s>
|
||
2025-06-11 11:05:54,312 - DEBUG - 处理后标记: ['<triplet>', '实体', '<concept>', 'G', '<media>', 'part of']
|
||
2025-06-11 11:05:54,312 - DEBUG - 添加三元组: 实体(concept) - part of - G(media)
|
||
2025-06-11 11:05:54,312 - DEBUG - 块 62 提取到 1 个三元组
|
||
2025-06-11 11:05:54,312 - DEBUG - 处理块 63/504: “ Who is Obama’ s wife?” , 图中的上下两部分 , 分别对
|
||
应语义解析和信息...
|
||
2025-06-11 11:05:54,472 - DEBUG - 块 63 生成文本: <triplet> 主题实体 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:05:54,472 - DEBUG - 原始生成文本: <triplet> 主题实体 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:05:54,472 - DEBUG - 处理后标记: ['<triplet>', '主题实体', '<concept>', 'SPARQL', '<media>', 'part of']
|
||
2025-06-11 11:05:54,472 - DEBUG - 添加三元组: 主题实体(concept) - part of - SPARQL(media)
|
||
2025-06-11 11:05:54,472 - DEBUG - 块 63 提取到 1 个三元组
|
||
2025-06-11 11:05:54,472 - DEBUG - 处理块 64/504: Obama 在 KG 中的邻近实体作为候选答案集 , 并根据
|
||
特征或相似度排序获得最 终答案集 。
|
||
...
|
||
2025-06-11 11:05:54,823 - DEBUG - 块 64 生成文本: <triplet> <concept> KG <media> part of the series</s>
|
||
2025-06-11 11:05:54,823 - DEBUG - 原始生成文本: <triplet> <concept> KG <media> part of the series</s>
|
||
2025-06-11 11:05:54,823 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KG', '<media>', 'part of the series']
|
||
2025-06-11 11:05:54,823 - DEBUG - 处理块 65/504: question answering
|
||
˝…4 Ö“˚¶˝…˘×˛˚·ðµ˜`‰ÖÖ•‰•¤
|
||
1846...
|
||
2025-06-11 11:05:55,346 - DEBUG - 块 65 生成文本: <triplet> 陈子睿 <per> KGQA <media> field of work</s>
|
||
2025-06-11 11:05:55,347 - DEBUG - 原始生成文本: <triplet> 陈子睿 <per> KGQA <media> field of work</s>
|
||
2025-06-11 11:05:55,347 - DEBUG - 处理后标记: ['<triplet>', '陈子睿', '<per>', 'KGQA', '<media>', 'field of work']
|
||
2025-06-11 11:05:55,347 - DEBUG - 添加三元组: 陈子睿(per) - field of work - KGQA(media)
|
||
2025-06-11 11:05:55,347 - DEBUG - 块 65 提取到 1 个三元组
|
||
2025-06-11 11:05:55,347 - DEBUG - 处理块 66/504: 无需人工定义特征的深度学习方法在 KGQA 领
|
||
域得到广泛应用之前 , KGQA 主要依赖各类人工定...
|
||
2025-06-11 11:05:55,945 - DEBUG - 块 66 生成文本: <triplet> 无需人工定义特征的深度学习方法 <concept> 人工经验 <media> 深度 学习模型 <misc> 技术角度 <org> <eve> 语言学 <loc> part of</s>
|
||
2025-06-11 11:05:55,945 - DEBUG - 原始生成文本: <triplet> 无需人工定义特征的深度学习方法 <concept> 人工经验 <media> 深度 学习模型 <misc> 技术角度 <org> <eve> 语言学 <loc> part of</s>
|
||
2025-06-11 11:05:55,945 - DEBUG - 处理后标记: ['<triplet>', '无需人工定义特征的深度学习方法', '<concept>', '人工经验', '<media>', '深度 学习模型', '<misc>', '技术角度', '<org>', '<eve>', '语言学', '<loc>', 'part of']
|
||
2025-06-11 11:05:55,945 - DEBUG - 添加三元组: 无需人工定义特征的深度学习方法(concept) - 深度 学习模型 - 人工经验(media)
|
||
2025-06-11 11:05:55,945 - DEBUG - 块 66 提取到 1 个三元组
|
||
2025-06-11 11:05:55,945 - DEBUG - 处理块 67/504: 解答问题所需跳数与模型训练监督方法的不同 , 将
|
||
数据集分为简单问题数据集 ( 答案仅涉及单个三元
|
||
...
|
||
2025-06-11 11:05:56,468 - DEBUG - 块 67 生成文本: <triplet> 复杂多限制问 题 <concept> 跳数与模型训练监督方法 <media> 解答问题 <misc> instance of</s>
|
||
2025-06-11 11:05:56,468 - DEBUG - 原始生成文本: <triplet> 复杂多限制问 题 <concept> 跳数与模型训练监督方法 <media> 解答问题 <misc> instance of</s>
|
||
2025-06-11 11:05:56,468 - DEBUG - 处理后标记: ['<triplet>', '复杂多限制问 题', '<concept>', '跳数与模型训练监督方法', '<media>', '解答问题', '<misc>', 'instance of']
|
||
2025-06-11 11:05:56,468 - DEBUG - 添加三元组: 复杂多限制问 题(concept) - 解答问题 - 跳数与模型训练监督方法(media)
|
||
2025-06-11 11:05:56,468 - DEBUG - 块 67 提取到 1 个三元组
|
||
2025-06-11 11:05:56,468 - DEBUG - 处理块 68/504: 数据集 ( 远程监督学习方法 ) 。 基于模板规则的工作
|
||
主要集中在简单问题数据集的处理上 。
|
||
2....
|
||
2025-06-11 11:05:57,065 - DEBUG - 块 68 生成文本: <triplet> 传统语义解析 <media> <concept> instance of</s>
|
||
2025-06-11 11:05:57,066 - DEBUG - 原始生成文本: <triplet> 传统语义解析 <media> <concept> instance of</s>
|
||
2025-06-11 11:05:57,066 - DEBUG - 处理后标记: ['<triplet>', '传统语义解析', '<media>', '<concept>', 'instance of']
|
||
2025-06-11 11:05:57,066 - DEBUG - 处理块 69/504: 或逻辑形式解释系统的答案来源 , 可解释性较高 。
|
||
传统语义解析共有直接映射和复述 ( paraph...
|
||
2025-06-11 11:05:57,749 - DEBUG - 块 69 生成文本: <triplet> 结构表示 <concept> 直接映射 <media> 语义解析 <org> 自然语言问题 <misc> 人工定义的规则 <eve> 逻辑形式解释系统 <loc> 汉语学 <unk> 语言学的 <dis> part of</s>
|
||
2025-06-11 11:05:57,749 - DEBUG - 原始生成文本: <triplet> 结构表示 <concept> 直接映射 <media> 语义解析 <org> 自然语言问题 <misc> 人工定义的规则 <eve> 逻辑形式解释系统 <loc> 汉语学 <unk> 语言学的 <dis> part of</s>
|
||
2025-06-11 11:05:57,750 - DEBUG - 处理后标记: ['<triplet>', '结构表示', '<concept>', '直接映射', '<media>', '语义解析', '<org>', '自然语言问题', '<misc>', '人工定义的规则', '<eve>', '逻辑形式解释系统', '<loc>', '汉语学', '<unk>', '语言学的', '<dis>', 'part of']
|
||
2025-06-11 11:05:57,750 - DEBUG - 添加三元组: 结构表示(concept) - 语义解析 - 直接映射(media)
|
||
2025-06-11 11:05:57,750 - DEBUG - 块 69 提取到 1 个三元组
|
||
2025-06-11 11:05:57,750 - DEBUG - 处理块 70/504: 为中间形式 , 然后基于中间形式的各类特征进行打
|
||
分排序 , 将最佳中间形式对应的逻辑形式作为输出 ...
|
||
2025-06-11 11:05:58,294 - DEBUG - 块 70 生成文本: <triplet> 直接映射 <concept> 语法工具完 <org> 结构 <misc> 组合范畴 <media> <eve> <per> 工具 <unk> <loc> instance of</s>
|
||
2025-06-11 11:05:58,294 - DEBUG - 原始生成文本: <triplet> 直接映射 <concept> 语法工具完 <org> 结构 <misc> 组合范畴 <media> <eve> <per> 工具 <unk> <loc> instance of</s>
|
||
2025-06-11 11:05:58,294 - DEBUG - 处理后标记: ['<triplet>', '直接映射', '<concept>', '语法工具完', '<org>', '结构', '<misc>', '组合范畴', '<media>', '<eve>', '<per>', '工具', '<unk>', '<loc>', 'instance of']
|
||
2025-06-11 11:05:58,294 - DEBUG - 添加三元组: 直接映射(concept) - 结构 - 语法工具完(org)
|
||
2025-06-11 11:05:58,294 - DEBUG - 块 70 提取到 1 个三元组
|
||
2025-06-11 11:05:58,294 - DEBUG - 处理块 71/504: grammar , CCG) , 并使用语法工具附带的词汇表完成
|
||
短语—实体 /关系的映射 , 产生...
|
||
2025-06-11 11:05:58,923 - DEBUG - 块 71 生成文本: <triplet> 直接映射 <concept> <media> 语法工具附带 <misc> 词汇表 <org> NLP 领 域 <per> grammar <unk> <eve> <time> 语言 <loc> part of</s>
|
||
2025-06-11 11:05:58,923 - DEBUG - 原始生成文本: <triplet> 直接映射 <concept> <media> 语法工具附带 <misc> 词汇表 <org> NLP 领 域 <per> grammar <unk> <eve> <time> 语言 <loc> part of</s>
|
||
2025-06-11 11:05:58,923 - DEBUG - 处理后标记: ['<triplet>', '直接映射', '<concept>', '<media>', '语法工具附带', '<misc>', '词汇表', '<org>', 'NLP 领 域', '<per>', 'grammar', '<unk>', '<eve>', '<time>', '语言', '<loc>', 'part of']
|
||
2025-06-11 11:05:58,923 - DEBUG - 处理块 72/504: Berant 等人
|
||
[17]
|
||
将直接映射的传统语
|
||
义解析融入 KGQA 作为解决方法 , 解决了两...
|
||
2025-06-11 11:05:59,114 - DEBUG - 块 72 生成文本: <triplet> 数据集基线 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:05:59,114 - DEBUG - 原始生成文本: <triplet> 数据集基线 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:05:59,114 - DEBUG - 处理后标记: ['<triplet>', '数据集基线', '<concept>', 'KGQA', '<media>', 'part of']
|
||
2025-06-11 11:05:59,114 - DEBUG - 添加三元组: 数据集基线(concept) - part of - KGQA(media)
|
||
2025-06-11 11:05:59,114 - DEBUG - 块 72 提取到 1 个三元组
|
||
2025-06-11 11:05:59,114 - DEBUG - 处理块 73/504: 该 KGQA 系统分为两个阶段 : 构造逻辑形式和
|
||
打分 。
|
||
( 1) 构造逻辑形式阶段 。 生成问...
|
||
2025-06-11 11:05:59,402 - DEBUG - 块 73 生成文本: <triplet> 构造逻辑形式 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:05:59,402 - DEBUG - 原始生成文本: <triplet> 构造逻辑形式 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:05:59,402 - DEBUG - 处理后标记: ['<triplet>', '构造逻辑形式', '<concept>', 'KGQA', '<media>', 'part of']
|
||
2025-06-11 11:05:59,402 - DEBUG - 添加三元组: 构造逻辑形式(concept) - part of - KGQA(media)
|
||
2025-06-11 11:05:59,402 - DEBUG - 块 73 提取到 1 个三元组
|
||
2025-06-11 11:05:59,402 - DEBUG - 处理块 74/504: 词汇表 L
|
||
的形式如图 6 所示 , 其中 w 为自然语言短语 , 通过词
|
||
汇表 L(w) 映射得...
|
||
2025-06-11 11:06:00,137 - DEBUG - 块 74 生成文本: <triplet> 类组合 <concept> 词汇表 L <misc> part of</s>
|
||
2025-06-11 11:06:00,137 - DEBUG - 原始生成文本: <triplet> 类组合 <concept> 词汇表 L <misc> part of</s>
|
||
2025-06-11 11:06:00,137 - DEBUG - 处理后标记: ['<triplet>', '类组合', '<concept>', '词汇表 L', '<misc>', 'part of']
|
||
2025-06-11 11:06:00,137 - DEBUG - 添加三元组: 类组合(concept) - part of - 词汇表 L(misc)
|
||
2025-06-11 11:06:00,137 - DEBUG - 块 74 提取到 1 个三元组
|
||
2025-06-11 11:06:00,137 - DEBUG - 处理块 75/504: 规则 — —连接 、 交集 、 聚合与桥接 , 将谓词随机组合 ,
|
||
生成所有可能的逻辑形式 。 使用...
|
||
2025-06-11 11:06:00,864 - DEBUG - 块 75 生成文本: <triplet> 规则 <concept> 规 则 <media> 逻辑形式 <misc> 交集 +连接组合 <org> 규칙 <unk> 连接 <eve> part of</s>
|
||
2025-06-11 11:06:00,864 - DEBUG - 原始生成文本: <triplet> 规则 <concept> 规 则 <media> 逻辑形式 <misc> 交集 +连接组合 <org> 규칙 <unk> 连接 <eve> part of</s>
|
||
2025-06-11 11:06:00,864 - DEBUG - 处理后标记: ['<triplet>', '规则', '<concept>', '规 则', '<media>', '逻辑形式', '<misc>', '交集 +连接组合', '<org>', '규칙', '<unk>', '连接', '<eve>', 'part of']
|
||
2025-06-11 11:06:00,864 - DEBUG - 添加三元组: 规则(concept) - 逻辑形式 - 规 则(media)
|
||
2025-06-11 11:06:00,864 - DEBUG - 块 75 提取到 1 个三元组
|
||
2025-06-11 11:06:00,864 - DEBUG - 处理块 76/504: and information retrieval methods
|
||
˝…5 ÓïÒå‰â˛öÓº—¯...
|
||
2025-06-11 11:06:01,418 - DEBUG - 块 76 生成文本: <triplet> <concept> 表1 <dis> part of</s>
|
||
2025-06-11 11:06:01,418 - DEBUG - 原始生成文本: <triplet> <concept> 表1 <dis> part of</s>
|
||
2025-06-11 11:06:01,418 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '表1', '<dis>', 'part of']
|
||
2025-06-11 11:06:01,418 - DEBUG - 处理块 77/504: A′
|
||
A
|
||
描述
|
||
知识图谱
|
||
一个事实三元组 , 即 ( 主语 , 谓语 , 宾语 )
|
||
实体集合
|
||
谓词集...
|
||
2025-06-11 11:06:02,144 - DEBUG - 块 77 生成文本: <triplet> 自然语言短语 <concept> 词汇表 <org> <media> <unk> رار <per> <misc> A 描述 知识图谱 <loc> part of the <dis> <cel> 事实三元组 <eve> instance of</s>
|
||
2025-06-11 11:06:02,144 - DEBUG - 原始生成文本: <triplet> 自然语言短语 <concept> 词汇表 <org> <media> <unk> رار <per> <misc> A 描述 知识图谱 <loc> part of the <dis> <cel> 事实三元组 <eve> instance of</s>
|
||
2025-06-11 11:06:02,144 - DEBUG - 处理后标记: ['<triplet>', '自然语言短语', '<concept>', '词汇表', '<org>', '<media>', '<unk>', 'رار', '<per>', '<misc>', 'A 描述 知识图谱', '<loc>', 'part of the', '<dis>', '<cel>', '事实三元组', '<eve>', 'instance of']
|
||
2025-06-11 11:06:02,144 - DEBUG - 添加三元组: 自然语言短语(concept) - <media> - 词汇表(org)
|
||
2025-06-11 11:06:02,144 - DEBUG - 块 77 提取到 1 个三元组
|
||
2025-06-11 11:06:02,144 - DEBUG - 处理块 78/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:06:02,787 - DEBUG - 块 78 生成文本: <triplet> 规则应用总数 <concept> 连接与桥接过程中的跳过词 <media> 逻辑形式 <misc> 计算机科学与探索 <org> Journal of Frontiers of Computer Science and Technology <unk> <per> 人工特征 <loc> studies</s>
|
||
2025-06-11 11:06:02,787 - DEBUG - 原始生成文本: <triplet> 规则应用总数 <concept> 连接与桥接过程中的跳过词 <media> 逻辑形式 <misc> 计算机科学与探索 <org> Journal of Frontiers of Computer Science and Technology <unk> <per> 人工特征 <loc> studies</s>
|
||
2025-06-11 11:06:02,787 - DEBUG - 处理后标记: ['<triplet>', '规则应用总数', '<concept>', '连接与桥接过程中的跳过词', '<media>', '逻辑形式', '<misc>', '计算机科学与探索', '<org>', 'Journal of Frontiers of Computer Science and Technology', '<unk>', '<per>', '人工特征', '<loc>', 'studies']
|
||
2025-06-11 11:06:02,787 - DEBUG - 添加三元组: 规则应用总数(concept) - 逻辑形式 - 连接与桥接过程中的跳过词(media)
|
||
2025-06-11 11:06:02,787 - DEBUG - 块 78 提取到 1 个三元组
|
||
2025-06-11 11:06:02,787 - DEBUG - 处理块 79/504: ( skipped work) POS( part-of-speech ) 标记 、 逻辑形式
|
||
的长...
|
||
2025-06-11 11:06:02,959 - DEBUG - 块 79 生成文本: <triplet> 特征权重 <concept> 模型训练 <media> part of</s>
|
||
2025-06-11 11:06:02,959 - DEBUG - 原始生成文本: <triplet> 特征权重 <concept> 模型训练 <media> part of</s>
|
||
2025-06-11 11:06:02,959 - DEBUG - 处理后标记: ['<triplet>', '特征权重', '<concept>', '模型训练', '<media>', 'part of']
|
||
2025-06-11 11:06:02,959 - DEBUG - 添加三元组: 特征权重(concept) - part of - 模型训练(media)
|
||
2025-06-11 11:06:02,959 - DEBUG - 块 79 提取到 1 个三元组
|
||
2025-06-11 11:06:02,959 - DEBUG - 处理块 80/504: 用问答对数据集 , 目标是最大化正确答案的对数概率 。
|
||
后来对直接映射方法的研究可细分至直接映射
|
||
流...
|
||
2025-06-11 11:06:03,512 - DEBUG - 块 80 生成文本: <triplet> 直接映射 <concept> 流水线的不同环节 <misc> 消歧排序 <media> 系统 <org> DEANNA <per> author</s>
|
||
2025-06-11 11:06:03,512 - DEBUG - 原始生成文本: <triplet> 直接映射 <concept> 流水线的不同环节 <misc> 消歧排序 <media> 系统 <org> DEANNA <per> author</s>
|
||
2025-06-11 11:06:03,512 - DEBUG - 处理后标记: ['<triplet>', '直接映射', '<concept>', '流水线的不同环节', '<misc>', '消歧排序', '<media>', '系统', '<org>', 'DEANNA', '<per>', 'author']
|
||
2025-06-11 11:06:03,512 - DEBUG - 添加三元组: 直接映射(concept) - 消歧排序 - 流水线的不同环节(misc)
|
||
2025-06-11 11:06:03,512 - DEBUG - 块 80 提取到 1 个三元组
|
||
2025-06-11 11:06:03,512 - DEBUG - 处理块 81/504: 者采用整数线性规划 ( integer linear programming,ILP)
|
||
模型 , 提...
|
||
2025-06-11 11:06:04,004 - DEBUG - 块 81 生成文本: <triplet> 整数线性规划 <concept> 词汇表映射环节 <media> 三元组 <misc> part of</s>
|
||
2025-06-11 11:06:04,004 - DEBUG - 原始生成文本: <triplet> 整数线性规划 <concept> 词汇表映射环节 <media> 三元组 <misc> part of</s>
|
||
2025-06-11 11:06:04,004 - DEBUG - 处理后标记: ['<triplet>', '整数线性规划', '<concept>', '词汇表映射环节', '<media>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 11:06:04,004 - DEBUG - 添加三元组: 整数线性规划(concept) - 三元组 - 词汇表映射环节(media)
|
||
2025-06-11 11:06:04,004 - DEBUG - 块 81 提取到 1 个三元组
|
||
2025-06-11 11:06:04,004 - DEBUG - 处理块 82/504: AGENDAIL 系统
|
||
[51]
|
||
将模仿
|
||
学习结合进语义解析器的训练过程中 , 使得所生 成
|
||
逻辑...
|
||
2025-06-11 11:06:04,635 - DEBUG - 块 82 生成文本: <triplet> 学习 <concept> AGENDAIL 系统 <misc> 进语义解析器的训练 <media> <per> 模仿 <org> <eve> 学習 <unk> <triplet> Reddy 等人 <loc> 继承 <time> <date> point in time</s>
|
||
2025-06-11 11:06:04,635 - DEBUG - 原始生成文本: <triplet> 学习 <concept> AGENDAIL 系统 <misc> 进语义解析器的训练 <media> <per> 模仿 <org> <eve> 学習 <unk> <triplet> Reddy 等人 <loc> 继承 <time> <date> point in time</s>
|
||
2025-06-11 11:06:04,635 - DEBUG - 处理后标记: ['<triplet>', '学习', '<concept>', 'AGENDAIL 系统', '<misc>', '进语义解析器的训练', '<media>', '<per>', '模仿', '<org>', '<eve>', '学習', '<unk>', '<triplet>', 'Reddy 等人', '<loc>', '继承', '<time>', '<date>', 'point in time']
|
||
2025-06-11 11:06:04,635 - DEBUG - 添加三元组: 学习(concept) - 进语义解析器的训练 - AGENDAIL 系统(misc)
|
||
2025-06-11 11:06:04,635 - DEBUG - 添加三元组: Reddy 等人(loc) - <date> - 继承(time)
|
||
2025-06-11 11:06:04,635 - DEBUG - 块 82 提取到 2 个三元组
|
||
2025-06-11 11:06:04,635 - DEBUG - 处理块 83/504: calculus 表达式 ; UDepLambda 系统
|
||
[53]
|
||
以 Reddy 等人的
|
||
系统为基...
|
||
2025-06-11 11:06:04,805 - DEBUG - 块 83 生成文本: <triplet> 通用依赖树库 <concept> s-expression <media> based on</s>
|
||
2025-06-11 11:06:04,805 - DEBUG - 原始生成文本: <triplet> 通用依赖树库 <concept> s-expression <media> based on</s>
|
||
2025-06-11 11:06:04,805 - DEBUG - 处理后标记: ['<triplet>', '通用依赖树库', '<concept>', 's-expression', '<media>', 'based on']
|
||
2025-06-11 11:06:04,805 - DEBUG - 添加三元组: 通用依赖树库(concept) - based on - s-expression(media)
|
||
2025-06-11 11:06:04,805 - DEBUG - 块 83 提取到 1 个三元组
|
||
2025-06-11 11:06:04,805 - DEBUG - 处理块 84/504: 复述方法采用各类人工模板或规则 , 将问题改
|
||
写为中间形式打分得到最优改写 。
|
||
PARASEMPRE...
|
||
2025-06-11 11:06:05,125 - DEBUG - 块 84 生成文本: <triplet> 个人工定义模板 <concept> 模 <misc> <media> <org> 系统 <loc> use</s>
|
||
2025-06-11 11:06:05,125 - DEBUG - 原始生成文本: <triplet> 个人工定义模板 <concept> 模 <misc> <media> <org> 系统 <loc> use</s>
|
||
2025-06-11 11:06:05,125 - DEBUG - 处理后标记: ['<triplet>', '个人工定义模板', '<concept>', '模', '<misc>', '<media>', '<org>', '系统', '<loc>', 'use']
|
||
2025-06-11 11:06:05,125 - DEBUG - 添加三元组: 个人工定义模板(concept) - <media> - 模(misc)
|
||
2025-06-11 11:06:05,125 - DEBUG - 块 84 提取到 1 个三元组
|
||
2025-06-11 11:06:05,125 - DEBUG - 处理块 85/504: 转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c...
|
||
2025-06-11 11:06:05,455 - DEBUG - 块 85 生成文本: <triplet> 形式 z <concept> 逻辑形式 <misc> instance of <triplet> c <media> 自然语言 c,z <org> different from</s>
|
||
2025-06-11 11:06:05,456 - DEBUG - 原始生成文本: <triplet> 形式 z <concept> 逻辑形式 <misc> instance of <triplet> c <media> 自然语言 c,z <org> different from</s>
|
||
2025-06-11 11:06:05,456 - DEBUG - 处理后标记: ['<triplet>', '形式 z', '<concept>', '逻辑形式', '<misc>', 'instance of', '<triplet>', 'c', '<media>', '自然语言 c,z', '<org>', 'different from']
|
||
2025-06-11 11:06:05,456 - DEBUG - 添加三元组: 形式 z(concept) - instance of - 逻辑形式(misc)
|
||
2025-06-11 11:06:05,456 - DEBUG - 添加三元组: c(media) - different from - 自然语言 c,z(org)
|
||
2025-06-11 11:06:05,456 - DEBUG - 块 85 提取到 2 个三元组
|
||
2025-06-11 11:06:05,456 - DEBUG - 处理块 86/504: 使用预先定义的操作符与模板 , 将
|
||
用户问题提炼为语法正确 、 用词准确的标准问题 , 并
|
||
将该标准...
|
||
2025-06-11 11:06:05,583 - DEBUG - 块 86 生成文本: <triplet> 模板 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:06:05,583 - DEBUG - 原始生成文本: <triplet> 模板 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:06:05,583 - DEBUG - 处理后标记: ['<triplet>', '模板', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:06:05,583 - DEBUG - 添加三元组: 模板(concept) - part of - KG(misc)
|
||
2025-06-11 11:06:05,583 - DEBUG - 块 86 提取到 1 个三元组
|
||
2025-06-11 11:06:05,583 - DEBUG - 处理块 87/504: 更标准 , SPARQL 查询更贴近 KG 内容 , 但该方法使
|
||
用的操作符与模板需线下构建 , 如...
|
||
2025-06-11 11:06:05,721 - DEBUG - 块 87 生成文本: <triplet> 子图 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:06:05,721 - DEBUG - 原始生成文本: <triplet> 子图 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:06:05,721 - DEBUG - 处理后标记: ['<triplet>', '子图', '<concept>', 'KGQA', '<media>', 'part of']
|
||
2025-06-11 11:06:05,721 - DEBUG - 添加三元组: 子图(concept) - part of - KGQA(media)
|
||
2025-06-11 11:06:05,721 - DEBUG - 块 87 提取到 1 个三元组
|
||
2025-06-11 11:06:05,721 - DEBUG - 处理块 88/504: 从中抽取出与主题实体数跳内的相关节点作为候选
|
||
答案集 , 通过提取问题和答案等信息的人工特征 , 作...
|
||
2025-06-11 11:06:06,157 - DEBUG - 块 88 生成文本: <triplet> <media> 人工特征 <concept> instance of</s>
|
||
2025-06-11 11:06:06,157 - DEBUG - 原始生成文本: <triplet> <media> 人工特征 <concept> instance of</s>
|
||
2025-06-11 11:06:06,157 - DEBUG - 处理后标记: ['<triplet>', '<media>', '人工特征', '<concept>', 'instance of']
|
||
2025-06-11 11:06:06,157 - DEBUG - 处理块 89/504: ˝…8 PARASEMPRE ˇµ˝‡`÷‡Ì˝…
|
||
1848
|
||
ˁ ଊ ጊ
|
||
X X X D F B ...
|
||
2025-06-11 11:06:06,541 - DEBUG - 块 89 生成文本: <triplet> 义解析 <concept> 陈子睿 <per> author</s>
|
||
2025-06-11 11:06:06,541 - DEBUG - 原始生成文本: <triplet> 义解析 <concept> 陈子睿 <per> author</s>
|
||
2025-06-11 11:06:06,541 - DEBUG - 处理后标记: ['<triplet>', '义解析', '<concept>', '陈子睿', '<per>', 'author']
|
||
2025-06-11 11:06:06,541 - DEBUG - 添加三元组: 义解析(concept) - author - 陈子睿(per)
|
||
2025-06-11 11:06:06,541 - DEBUG - 块 89 提取到 1 个三元组
|
||
2025-06-11 11:06:06,541 - DEBUG - 处理块 90/504: 法的启发 , 对技术演变方向产生重大影响 。 通过指
|
||
定的查询语句模板完成自然语言到查询语句的转
|
||
换...
|
||
2025-06-11 11:06:07,169 - DEBUG - 块 90 生成文本: <triplet> 查询语句模板 <concept> JACANA <media> use</s>
|
||
2025-06-11 11:06:07,169 - DEBUG - 原始生成文本: <triplet> 查询语句模板 <concept> JACANA <media> use</s>
|
||
2025-06-11 11:06:07,170 - DEBUG - 处理后标记: ['<triplet>', '查询语句模板', '<concept>', 'JACANA', '<media>', 'use']
|
||
2025-06-11 11:06:07,170 - DEBUG - 添加三元组: 查询语句模板(concept) - use - JACANA(media)
|
||
2025-06-11 11:06:07,170 - DEBUG - 块 90 提取到 1 个三元组
|
||
2025-06-11 11:06:07,170 - DEBUG - 处理块 91/504: 到问题特征与答案特征来获得答案 。
|
||
( 1) 问题特征 。 对问题执行依存分析 , 将分析结
|
||
果转化...
|
||
2025-06-11 11:06:07,361 - DEBUG - 块 91 生成文本: <triplet> 词 <concept> 问题特征 <misc> part of</s>
|
||
2025-06-11 11:06:07,361 - DEBUG - 原始生成文本: <triplet> 词 <concept> 问题特征 <misc> part of</s>
|
||
2025-06-11 11:06:07,361 - DEBUG - 处理后标记: ['<triplet>', '词', '<concept>', '问题特征', '<misc>', 'part of']
|
||
2025-06-11 11:06:07,361 - DEBUG - 添加三元组: 词(concept) - part of - 问题特征(misc)
|
||
2025-06-11 11:06:07,361 - DEBUG - 块 91 提取到 1 个三元组
|
||
2025-06-11 11:06:07,361 - DEBUG - 处理块 92/504: [20]
|
||
, 其中问题主题即主题实
|
||
体 , 用于寻找相关 Freebase 网页页面以构成该系统主
|
||
...
|
||
2025-06-11 11:06:07,884 - DEBUG - 块 92 生成文本: <triplet> 主 题 图 <concept> 实 体 <misc> graph <media> Freebase <org> developer</s>
|
||
2025-06-11 11:06:07,884 - DEBUG - 原始生成文本: <triplet> 主 题 图 <concept> 实 体 <misc> graph <media> Freebase <org> developer</s>
|
||
2025-06-11 11:06:07,884 - DEBUG - 处理后标记: ['<triplet>', '主 题 图', '<concept>', '实 体', '<misc>', 'graph', '<media>', 'Freebase', '<org>', 'developer']
|
||
2025-06-11 11:06:07,884 - DEBUG - 添加三元组: 主 题 图(concept) - graph - 实 体(misc)
|
||
2025-06-11 11:06:07,884 - DEBUG - 块 92 提取到 1 个三元组
|
||
2025-06-11 11:06:07,884 - DEBUG - 处理块 93/504: 图 9 所示 , 每个圆角矩形代表一个单词 , 单词特征通
|
||
过等号对应标记 , 其中 justin ...
|
||
2025-06-11 11:06:08,054 - DEBUG - 块 93 生成文本: <triplet> 实体数跳 <concept> Freebase <media> part of</s>
|
||
2025-06-11 11:06:08,054 - DEBUG - 原始生成文本: <triplet> 实体数跳 <concept> Freebase <media> part of</s>
|
||
2025-06-11 11:06:08,054 - DEBUG - 处理后标记: ['<triplet>', '实体数跳', '<concept>', 'Freebase', '<media>', 'part of']
|
||
2025-06-11 11:06:08,054 - DEBUG - 添加三元组: 实体数跳(concept) - part of - Freebase(media)
|
||
2025-06-11 11:06:08,054 - DEBUG - 块 93 提取到 1 个三元组
|
||
2025-06-11 11:06:08,054 - DEBUG - 处理块 94/504: 其中 , 一个重要的特征是关系与问题
|
||
的相关度 , 该特征值通过检索人工收集 Reverb 谓词
|
||
...
|
||
2025-06-11 11:06:08,661 - DEBUG - 块 94 生成文本: <triplet> 关系表 <concept> 的相关度 <misc> <media> <unk> <org> 的关系表</s>
|
||
2025-06-11 11:06:08,661 - DEBUG - 原始生成文本: <triplet> 关系表 <concept> 的相关度 <misc> <media> <unk> <org> 的关系表</s>
|
||
2025-06-11 11:06:08,661 - DEBUG - 处理后标记: ['<triplet>', '关系表', '<concept>', '的相关度', '<misc>', '<media>', '<unk>', '<org>', '的关系表']
|
||
2025-06-11 11:06:08,661 - DEBUG - 添加三元组: 关系表(concept) - <media> - 的相关度(misc)
|
||
2025-06-11 11:06:08,662 - DEBUG - 块 94 提取到 1 个三元组
|
||
2025-06-11 11:06:08,662 - DEBUG - 处理块 95/504: 示 , 主题实体为 Justin Bieber, 圆角矩形代表实体 , 矩
|
||
形代表属性 , 有向边代...
|
||
2025-06-11 11:06:08,831 - DEBUG - 块 95 生成文本: <triplet> 正则化逻 <concept> Justin Bieber <per> named after</s>
|
||
2025-06-11 11:06:08,831 - DEBUG - 原始生成文本: <triplet> 正则化逻 <concept> Justin Bieber <per> named after</s>
|
||
2025-06-11 11:06:08,831 - DEBUG - 处理后标记: ['<triplet>', '正则化逻', '<concept>', 'Justin Bieber', '<per>', 'named after']
|
||
2025-06-11 11:06:08,831 - DEBUG - 添加三元组: 正则化逻(concept) - named after - Justin Bieber(per)
|
||
2025-06-11 11:06:08,831 - DEBUG - 块 95 提取到 1 个三元组
|
||
2025-06-11 11:06:08,831 - DEBUG - 处理块 96/504: 辑回归模型对主题图中的每个节点进行二分类 , 提
|
||
取答案节点 。
|
||
因 KG 为 KGQA 的信息源 ...
|
||
2025-06-11 11:06:09,150 - DEBUG - 块 96 生成文本: <triplet> 辑回归模型 <concept> AquaLog <media> based on</s>
|
||
2025-06-11 11:06:09,150 - DEBUG - 原始生成文本: <triplet> 辑回归模型 <concept> AquaLog <media> based on</s>
|
||
2025-06-11 11:06:09,151 - DEBUG - 处理后标记: ['<triplet>', '辑回归模型', '<concept>', 'AquaLog', '<media>', 'based on']
|
||
2025-06-11 11:06:09,151 - DEBUG - 添加三元组: 辑回归模型(concept) - based on - AquaLog(media)
|
||
2025-06-11 11:06:09,151 - DEBUG - 块 96 提取到 1 个三元组
|
||
2025-06-11 11:06:09,151 - DEBUG - 处理块 97/504: [55- 56]
|
||
、 FREyA
|
||
[57]
|
||
为代表的早期 RDF 问答系统
|
||
[58-59]
|
||
提出 ,...
|
||
2025-06-11 11:06:09,844 - DEBUG - 块 97 生成文本: <triplet> 相似三元组 <concept> 流水线 <misc> 两类 <media> <org> <eve> 题映射 <loc> <per> <dis> <unk> 三元 <cel> <time> 次次数 <triplet> RDF 数 据</s>
|
||
2025-06-11 11:06:09,844 - DEBUG - 原始生成文本: <triplet> 相似三元组 <concept> 流水线 <misc> 两类 <media> <org> <eve> 题映射 <loc> <per> <dis> <unk> 三元 <cel> <time> 次次数 <triplet> RDF 数 据</s>
|
||
2025-06-11 11:06:09,844 - DEBUG - 处理后标记: ['<triplet>', '相似三元组', '<concept>', '流水线', '<misc>', '两类', '<media>', '<org>', '<eve>', '题映射', '<loc>', '<per>', '<dis>', '<unk>', '三元', '<cel>', '<time>', '次次数', '<triplet>', 'RDF 数 据']
|
||
2025-06-11 11:06:09,844 - DEBUG - 添加三元组: 相似三元组(concept) - 两类 - 流水线(misc)
|
||
2025-06-11 11:06:09,844 - DEBUG - 块 97 提取到 1 个三元组
|
||
2025-06-11 11:06:09,844 - DEBUG - 处理块 98/504: 方法 , 并应用于开放领域知识图谱问答 。 但三元组
|
||
匹配方法在简单问题上的效果并不理想 , 在 W...
|
||
2025-06-11 11:06:10,602 - DEBUG - 块 98 生成文本: <triplet> 匹配方法 <concept> 知识图谱问答 <media> Web- Questions 基线的最高精确度指标 <misc> 查询语句模板 <org> 自然语言问 题 <eve> 通用 <per> part of</s>
|
||
2025-06-11 11:06:10,602 - DEBUG - 原始生成文本: <triplet> 匹配方法 <concept> 知识图谱问答 <media> Web- Questions 基线的最高精确度指标 <misc> 查询语句模板 <org> 自然语言问 题 <eve> 通用 <per> part of</s>
|
||
2025-06-11 11:06:10,602 - DEBUG - 处理后标记: ['<triplet>', '匹配方法', '<concept>', '知识图谱问答', '<media>', 'Web- Questions 基线的最高精确度指标', '<misc>', '查询语句模板', '<org>', '自然语言问 题', '<eve>', '通用', '<per>', 'part of']
|
||
2025-06-11 11:06:10,602 - DEBUG - 添加三元组: 匹配方法(concept) - Web- Questions 基线的最高精确度指标 - 知识图谱问答(media)
|
||
2025-06-11 11:06:10,602 - DEBUG - 块 98 提取到 1 个三元组
|
||
2025-06-11 11:06:10,602 - DEBUG - 处理块 99/504: 为定义的模板及表达式进行实体关系匹配 。 三元组
|
||
匹配方法可通过三元组形式解释系统的答案来源 ,
|
||
采...
|
||
2025-06-11 11:06:11,145 - DEBUG - 块 99 生成文本: <triplet> 匹配 <concept> 三元组 <misc> facet of <triplet> 三元的 <unk> 模板 <org> 实体关系 <media> 系统 <loc> part of the series <eve> 系统的答案来源 <per> is a list of</s>
|
||
2025-06-11 11:06:11,145 - DEBUG - 原始生成文本: <triplet> 匹配 <concept> 三元组 <misc> facet of <triplet> 三元的 <unk> 模板 <org> 实体关系 <media> 系统 <loc> part of the series <eve> 系统的答案来源 <per> is a list of</s>
|
||
2025-06-11 11:06:11,145 - DEBUG - 处理后标记: ['<triplet>', '匹配', '<concept>', '三元组', '<misc>', 'facet of', '<triplet>', '三元的', '<unk>', '模板', '<org>', '实体关系', '<media>', '系统', '<loc>', 'part of the series', '<eve>', '系统的答案来源', '<per>', 'is a list of']
|
||
2025-06-11 11:06:11,145 - DEBUG - 添加三元组: 匹配(concept) - facet of - 三元组(misc)
|
||
2025-06-11 11:06:11,145 - DEBUG - 添加三元组: 三元的(unk) - 实体关系 - 模板(org)
|
||
2025-06-11 11:06:11,145 - DEBUG - 块 99 提取到 2 个三元组
|
||
2025-06-11 11:06:11,145 - DEBUG - 处理块 100/504: 方法细化为 3 个步骤 : 问题拆分 、 翻译和三元组排序 。
|
||
( 1) 问题拆分环节 。 使用图 ...
|
||
2025-06-11 11:06:11,495 - DEBUG - 块 100 生成文本: <triplet> 子问题 <concept> 类依存解析树 模板 <misc> part of</s>
|
||
2025-06-11 11:06:11,496 - DEBUG - 原始生成文本: <triplet> 子问题 <concept> 类依存解析树 模板 <misc> part of</s>
|
||
2025-06-11 11:06:11,496 - DEBUG - 处理后标记: ['<triplet>', '子问题', '<concept>', '类依存解析树 模板', '<misc>', 'part of']
|
||
2025-06-11 11:06:11,496 - DEBUG - 添加三元组: 子问题(concept) - part of - 类依存解析树 模板(misc)
|
||
2025-06-11 11:06:11,496 - DEBUG - 块 100 提取到 1 个三元组
|
||
2025-06-11 11:06:11,496 - DEBUG - 处理块 101/504: 使用图 12所示的 CYK( Cocke-Younger-Kasami) 算法
|
||
[60]
|
||
,
|
||
结合人...
|
||
2025-06-11 11:06:12,190 - DEBUG - 块 101 生成文本: <triplet> 跨度 <concept> 字符串表达式 <misc> 自然语言 <media> <unk> 系字 <org> part of</s>
|
||
2025-06-11 11:06:12,190 - DEBUG - 原始生成文本: <triplet> 跨度 <concept> 字符串表达式 <misc> 自然语言 <media> <unk> 系字 <org> part of</s>
|
||
2025-06-11 11:06:12,190 - DEBUG - 处理后标记: ['<triplet>', '跨度', '<concept>', '字符串表达式', '<misc>', '自然语言', '<media>', '<unk>', '系字', '<org>', 'part of']
|
||
2025-06-11 11:06:12,190 - DEBUG - 添加三元组: 跨度(concept) - 自然语言 - 字符串表达式(misc)
|
||
2025-06-11 11:06:12,190 - DEBUG - 块 101 提取到 1 个三元组
|
||
2025-06-11 11:06:12,190 - DEBUG - 处理块 102/504: ( 3) 三元组排序环节 。 根据特征 , 将步骤 ( 2) 所
|
||
Fig.9 Question gr...
|
||
2025-06-11 11:06:12,766 - DEBUG - 块 102 生成文本: <triplet> ̋...9 Freebase Éœ‡Éμ ̃ ̨ ̊Ìâ <concept> <misc> <dis> <media> graph <org> <eve> <triplet> Fig.9 Question <loc> 그래미 <per> named after a list of</s>
|
||
2025-06-11 11:06:12,766 - DEBUG - 原始生成文本: <triplet> ̋...9 Freebase Éœ‡Éμ ̃ ̨ ̊Ìâ <concept> <misc> <dis> <media> graph <org> <eve> <triplet> Fig.9 Question <loc> 그래미 <per> named after a list of</s>
|
||
2025-06-11 11:06:12,766 - DEBUG - 处理后标记: ['<triplet>', '̋...9 Freebase Éœ‡Éμ ̃ ̨ ̊Ìâ', '<concept>', '<misc>', '<dis>', '<media>', 'graph', '<org>', '<eve>', '<triplet>', 'Fig.9 Question', '<loc>', '그래미', '<per>', 'named after a list of']
|
||
2025-06-11 11:06:12,766 - DEBUG - 添加三元组: ̋...9 Freebase Éœ‡Éμ ̃ ̨ ̊Ìâ(concept) - <media> - <misc>(dis)
|
||
2025-06-11 11:06:12,766 - DEBUG - 添加三元组: Fig.9 Question(loc) - named after a list of - 그래미(per)
|
||
2025-06-11 11:06:12,766 - DEBUG - 块 102 提取到 2 个三元组
|
||
2025-06-11 11:06:12,766 - DEBUG - 处理块 103/504: Fig.10 Topic graph generated by dependency parsing...
|
||
2025-06-11 11:06:13,795 - DEBUG - 块 103 生成文本: <triplet> රාව <concept> Topic graph generated by dependency parsing <media> 1849 <unk> <misc> Topics <org> 10 <dis> <loc> 10D <eve> 10 (X X XXX <cel> 1010 <per> 10C 10X 10 10 X <time> 1012 <date> 10 12 <triplet> 10E 10B レー 10I 1011 <num> 10</s>
|
||
2025-06-11 11:06:13,795 - DEBUG - 原始生成文本: <triplet> රාව <concept> Topic graph generated by dependency parsing <media> 1849 <unk> <misc> Topics <org> 10 <dis> <loc> 10D <eve> 10 (X X XXX <cel> 1010 <per> 10C 10X 10 10 X <time> 1012 <date> 10 12 <triplet> 10E 10B レー 10I 1011 <num> 10</s>
|
||
2025-06-11 11:06:13,795 - DEBUG - 处理后标记: ['<triplet>', 'රාව', '<concept>', 'Topic graph generated by dependency parsing', '<media>', '1849', '<unk>', '<misc>', 'Topics', '<org>', '10', '<dis>', '<loc>', '10D', '<eve>', '10 (X X XXX', '<cel>', '1010', '<per>', '10C 10X 10 10 X', '<time>', '1012', '<date>', '10 12', '<triplet>', '10E 10B レー 10I 1011', '<num>', '10']
|
||
2025-06-11 11:06:13,795 - DEBUG - 添加三元组: රාව(concept) - 1849 - Topic graph generated by dependency parsing(media)
|
||
2025-06-11 11:06:13,795 - DEBUG - 块 103 提取到 1 个三元组
|
||
2025-06-11 11:06:13,795 - DEBUG - 处理块 104/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:06:14,318 - DEBUG - 块 104 生成文本: <triplet> 个数 <concept> 三元 <misc> 单词 <media> <unk> <dis> <cel> 次数法 <org> <eve> <per> <loc> <time> <triplet></s>
|
||
2025-06-11 11:06:14,318 - DEBUG - 原始生成文本: <triplet> 个数 <concept> 三元 <misc> 单词 <media> <unk> <dis> <cel> 次数法 <org> <eve> <per> <loc> <time> <triplet></s>
|
||
2025-06-11 11:06:14,318 - DEBUG - 处理后标记: ['<triplet>', '个数', '<concept>', '三元', '<misc>', '单词', '<media>', '<unk>', '<dis>', '<cel>', '次数法', '<org>', '<eve>', '<per>', '<loc>', '<time>', '<triplet>']
|
||
2025-06-11 11:06:14,318 - DEBUG - 添加三元组: 个数(concept) - 单词 - 三元(misc)
|
||
2025-06-11 11:06:14,318 - DEBUG - 块 104 提取到 1 个三元组
|
||
2025-06-11 11:06:14,318 - DEBUG - 处理块 105/504: 组转换成功的跨度个数 、 翻译所得的三元组总个数
|
||
等 。 将上述特征结合最小错误率训练算法 ( mi...
|
||
2025-06-11 11:06:14,799 - DEBUG - 块 105 生成文本: <triplet> 组排序流水线 <concept> TAQA 系统 <media> part of</s>
|
||
2025-06-11 11:06:14,799 - DEBUG - 原始生成文本: <triplet> 组排序流水线 <concept> TAQA 系统 <media> part of</s>
|
||
2025-06-11 11:06:14,799 - DEBUG - 处理后标记: ['<triplet>', '组排序流水线', '<concept>', 'TAQA 系统', '<media>', 'part of']
|
||
2025-06-11 11:06:14,799 - DEBUG - 添加三元组: 组排序流水线(concept) - part of - TAQA 系统(media)
|
||
2025-06-11 11:06:14,799 - DEBUG - 块 105 提取到 1 个三元组
|
||
2025-06-11 11:06:14,799 - DEBUG - 处理块 106/504: 以问题复述为首要环节 , 将第一类
|
||
方法的环节 ( 1) 改为问题复述环节 。 使用人工预定
|
||
义模板...
|
||
2025-06-11 11:06:15,184 - DEBUG - 块 106 生成文本: <triplet> 话语模板 <concept> <media> 人工预定 <org> 义 <misc> <eve> <per> 理查 <unk> <triplet></s>
|
||
2025-06-11 11:06:15,184 - DEBUG - 原始生成文本: <triplet> 话语模板 <concept> <media> 人工预定 <org> 义 <misc> <eve> <per> 理查 <unk> <triplet></s>
|
||
2025-06-11 11:06:15,184 - DEBUG - 处理后标记: ['<triplet>', '话语模板', '<concept>', '<media>', '人工预定', '<org>', '义', '<misc>', '<eve>', '<per>', '理查', '<unk>', '<triplet>']
|
||
2025-06-11 11:06:15,184 - DEBUG - 处理块 107/504: 传统语义解析方法同时考虑词汇 、 结构信息 , 并
|
||
完成词汇映射工作 , 而本节话语模板则先构造语义...
|
||
2025-06-11 11:06:15,642 - DEBUG - 块 107 生成文本: <triplet> 结构 <concept> 话语模板 <misc> 语义解析 <media> <org> <per> <eve> <triplet></s>
|
||
2025-06-11 11:06:15,642 - DEBUG - 原始生成文本: <triplet> 结构 <concept> 话语模板 <misc> 语义解析 <media> <org> <per> <eve> <triplet></s>
|
||
2025-06-11 11:06:15,642 - DEBUG - 处理后标记: ['<triplet>', '结构', '<concept>', '话语模板', '<misc>', '语义解析', '<media>', '<org>', '<per>', '<eve>', '<triplet>']
|
||
2025-06-11 11:06:15,642 - DEBUG - 添加三元组: 结构(concept) - 语义解析 - 话语模板(misc)
|
||
2025-06-11 11:06:15,642 - DEBUG - 块 107 提取到 1 个三元组
|
||
2025-06-11 11:06:15,642 - DEBUG - 处理块 108/504: 后使用 KG 数据实例化该中间形式 , 得到对应的逻辑
|
||
查询 。 中间形式可分为语义结构模板与查询图...
|
||
2025-06-11 11:06:15,929 - DEBUG - 块 108 生成文本: <triplet> 模板 <concept> 语义解析复述 <media> part of</s>
|
||
2025-06-11 11:06:15,929 - DEBUG - 原始生成文本: <triplet> 模板 <concept> 语义解析复述 <media> part of</s>
|
||
2025-06-11 11:06:15,929 - DEBUG - 处理后标记: ['<triplet>', '模板', '<concept>', '语义解析复述', '<media>', 'part of']
|
||
2025-06-11 11:06:15,929 - DEBUG - 添加三元组: 模板(concept) - part of - 语义解析复述(media)
|
||
2025-06-11 11:06:15,929 - DEBUG - 块 108 提取到 1 个三元组
|
||
2025-06-11 11:06:15,930 - DEBUG - 处理块 109/504: 语义结构模板使用包含占位符的 SPARQL 模板
|
||
或包含变量的领域独立逻辑形式 , 表示问题语义结
|
||
...
|
||
2025-06-11 11:06:16,089 - DEBUG - 块 109 生成文本: <triplet> 模板 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:06:16,089 - DEBUG - 原始生成文本: <triplet> 模板 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:06:16,089 - DEBUG - 处理后标记: ['<triplet>', '模板', '<concept>', 'SPARQL', '<media>', 'part of']
|
||
2025-06-11 11:06:16,089 - DEBUG - 添加三元组: 模板(concept) - part of - SPARQL(media)
|
||
2025-06-11 11:06:16,089 - DEBUG - 块 109 提取到 1 个三元组
|
||
2025-06-11 11:06:16,089 - DEBUG - 处理块 110/504: 自然语言问题首先使用
|
||
CCG 与 Wikitionary 的词信息构建包含变量的领域独
|
||
立逻辑形式...
|
||
2025-06-11 11:06:16,783 - DEBUG - 块 110 生成文本: <triplet> 自然语言问题 <concept> 排序生成最终逻辑形 <misc> 算法 <media> <eve> 线性模型参数 <unk> <per> part of the series <org> grapher</s>
|
||
2025-06-11 11:06:16,784 - DEBUG - 原始生成文本: <triplet> 自然语言问题 <concept> 排序生成最终逻辑形 <misc> 算法 <media> <eve> 线性模型参数 <unk> <per> part of the series <org> grapher</s>
|
||
2025-06-11 11:06:16,784 - DEBUG - 处理后标记: ['<triplet>', '自然语言问题', '<concept>', '排序生成最终逻辑形', '<misc>', '算法', '<media>', '<eve>', '线性模型参数', '<unk>', '<per>', 'part of the series', '<org>', 'grapher']
|
||
2025-06-11 11:06:16,784 - DEBUG - 添加三元组: 自然语言问题(concept) - 算法 - 排序生成最终逻辑形(misc)
|
||
2025-06-11 11:06:16,784 - DEBUG - 块 110 提取到 1 个三元组
|
||
2025-06-11 11:06:16,784 - DEBUG - 处理块 111/504: Fig.11 Dependency parsing tree template
|
||
˝…11 ÒÀ·æ‰...
|
||
2025-06-11 11:06:17,007 - DEBUG - 块 111 生成文本: <triplet> Òo„ý‡Ì <concept> Fig.12 CYK <misc> part of</s>
|
||
2025-06-11 11:06:17,007 - DEBUG - 原始生成文本: <triplet> Òo„ý‡Ì <concept> Fig.12 CYK <misc> part of</s>
|
||
2025-06-11 11:06:17,007 - DEBUG - 处理后标记: ['<triplet>', 'Òo„ý‡Ì', '<concept>', 'Fig.12 CYK', '<misc>', 'part of']
|
||
2025-06-11 11:06:17,007 - DEBUG - 添加三元组: Òo„ý‡Ì(concept) - part of - Fig.12 CYK(misc)
|
||
2025-06-11 11:06:17,007 - DEBUG - 块 111 提取到 1 个三元组
|
||
2025-06-11 11:06:17,007 - DEBUG - 处理块 112/504: Fig.13 Two forms of utterance-query template
|
||
˝…13 ...
|
||
2025-06-11 11:06:17,572 - DEBUG - 块 112 生成文本: <triplet> ̋...13 »°Óï ̃£°åμÅÅ„„–„ ̨ ̊‰</s>
|
||
2025-06-11 11:06:17,572 - DEBUG - 原始生成文本: <triplet> ̋...13 »°Óï ̃£°åμÅÅ„„–„ ̨ ̊‰</s>
|
||
2025-06-11 11:06:17,572 - DEBUG - 处理后标记: ['<triplet>', '̋...13 »°Óï ̃£°åμÅÅ„„–„ ̨ ̊‰']
|
||
2025-06-11 11:06:17,572 - DEBUG - 处理块 113/504: ˝…14 `ìÓò¶À`¢´ß…›—˛˚‰×“»»`÷‡Ì
|
||
1850
|
||
ˁ ଊ ጊ
|
||
X X X D ...
|
||
2025-06-11 11:06:18,158 - DEBUG - 块 113 生成文本: <triplet> 查询图 语义结构模板方法 <concept> 式并检索 KG 获得答案 <media> <misc> 式的 <org> <per> 查查索 <eve> <unk> <loc> subclass of</s>
|
||
2025-06-11 11:06:18,158 - DEBUG - 原始生成文本: <triplet> 查询图 语义结构模板方法 <concept> 式并检索 KG 获得答案 <media> <misc> 式的 <org> <per> 查查索 <eve> <unk> <loc> subclass of</s>
|
||
2025-06-11 11:06:18,158 - DEBUG - 处理后标记: ['<triplet>', '查询图 语义结构模板方法', '<concept>', '式并检索 KG 获得答案', '<media>', '<misc>', '式的', '<org>', '<per>', '查查索', '<eve>', '<unk>', '<loc>', 'subclass of']
|
||
2025-06-11 11:06:18,158 - DEBUG - 添加三元组: 查询图 语义结构模板方法(concept) - <misc> - 式并检索 KG 获得答案(media)
|
||
2025-06-11 11:06:18,158 - DEBUG - 块 113 提取到 1 个三元组
|
||
2025-06-11 11:06:18,159 - DEBUG - 处理块 114/504: 发 , 转向以查询图为中间形式 , 系统性能得到提升 。
|
||
查询图使用无根据图 ( ungrounde...
|
||
2025-06-11 11:06:18,371 - DEBUG - 块 114 生成文本: <triplet> 语义查询图 <concept> <misc> 查询 <media> subclass of</s>
|
||
2025-06-11 11:06:18,371 - DEBUG - 原始生成文本: <triplet> 语义查询图 <concept> <misc> 查询 <media> subclass of</s>
|
||
2025-06-11 11:06:18,371 - DEBUG - 处理后标记: ['<triplet>', '语义查询图', '<concept>', '<misc>', '查询', '<media>', 'subclass of']
|
||
2025-06-11 11:06:18,371 - DEBUG - 处理块 115/504: 查询图转换为逻辑形式 。
|
||
GRAPHPARSER 系统
|
||
[26]
|
||
率先引入查询图方法 ,
|
||
如图 15...
|
||
2025-06-11 11:06:18,616 - DEBUG - 块 115 生成文本: <triplet> 解析工具 <concept> CCG <misc> part of</s>
|
||
2025-06-11 11:06:18,616 - DEBUG - 原始生成文本: <triplet> 解析工具 <concept> CCG <misc> part of</s>
|
||
2025-06-11 11:06:18,616 - DEBUG - 处理后标记: ['<triplet>', '解析工具', '<concept>', 'CCG', '<misc>', 'part of']
|
||
2025-06-11 11:06:18,616 - DEBUG - 添加三元组: 解析工具(concept) - part of - CCG(misc)
|
||
2025-06-11 11:06:18,616 - DEBUG - 块 115 提取到 1 个三元组
|
||
2025-06-11 11:06:18,616 - DEBUG - 处理块 116/504: 根据解析结果 , 各词汇的
|
||
POS 标签及词间关系 , 依据人工规则转换为表示问题
|
||
结构的无根据图...
|
||
2025-06-11 11:06:18,935 - DEBUG - 块 116 生成文本: <triplet> 关系 <concept> 语义查询图 <media> part of</s>
|
||
2025-06-11 11:06:18,935 - DEBUG - 原始生成文本: <triplet> 关系 <concept> 语义查询图 <media> part of</s>
|
||
2025-06-11 11:06:18,935 - DEBUG - 处理后标记: ['<triplet>', '关系', '<concept>', '语义查询图', '<media>', 'part of']
|
||
2025-06-11 11:06:18,935 - DEBUG - 添加三元组: 关系(concept) - part of - 语义查询图(media)
|
||
2025-06-11 11:06:18,935 - DEBUG - 块 116 提取到 1 个三元组
|
||
2025-06-11 11:06:18,936 - DEBUG - 处理块 117/504: 一对多映射 , 故将产生多种语义查询图 ; 最后利用模
|
||
型从问题 、 无根据图 、 语义查询图和 K...
|
||
2025-06-11 11:06:19,554 - DEBUG - 块 117 生成文本: <triplet> 模 型从 <concept> Zou <per> discoverer</s>
|
||
2025-06-11 11:06:19,554 - DEBUG - 原始生成文本: <triplet> 模 型从 <concept> Zou <per> discoverer</s>
|
||
2025-06-11 11:06:19,555 - DEBUG - 处理后标记: ['<triplet>', '模 型从', '<concept>', 'Zou', '<per>', 'discoverer']
|
||
2025-06-11 11:06:19,555 - DEBUG - 添加三元组: 模 型从(concept) - discoverer - Zou(per)
|
||
2025-06-11 11:06:19,555 - DEBUG - 块 117 提取到 1 个三元组
|
||
2025-06-11 11:06:19,555 - DEBUG - 处理块 118/504: 通过依存树而非 CCG 创建查询
|
||
图 , 获得更优的结构表示 ; SINA
|
||
[65]
|
||
通过问题关键字...
|
||
2025-06-11 11:06:19,863 - DEBUG - 块 118 生成文本: <triplet> 查询图 <concept> SINA <misc> used by</s>
|
||
2025-06-11 11:06:19,863 - DEBUG - 原始生成文本: <triplet> 查询图 <concept> SINA <misc> used by</s>
|
||
2025-06-11 11:06:19,863 - DEBUG - 处理后标记: ['<triplet>', '查询图', '<concept>', 'SINA', '<misc>', 'used by']
|
||
2025-06-11 11:06:19,863 - DEBUG - 添加三元组: 查询图(concept) - used by - SINA(misc)
|
||
2025-06-11 11:06:19,863 - DEBUG - 块 118 提取到 1 个三元组
|
||
2025-06-11 11:06:19,863 - DEBUG - 处理块 119/504: 查询的图编辑距离计算相似性 , 自动生成话语模板 ,
|
||
但 KG 与问题数据集变动时系统无法动态更新的...
|
||
2025-06-11 11:06:20,012 - DEBUG - 块 119 生成文本: <triplet> 模板 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:06:20,012 - DEBUG - 原始生成文本: <triplet> 模板 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:06:20,012 - DEBUG - 处理后标记: ['<triplet>', '模板', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:06:20,012 - DEBUG - 添加三元组: 模板(concept) - part of - KG(misc)
|
||
2025-06-11 11:06:20,012 - DEBUG - 块 119 提取到 1 个三元组
|
||
2025-06-11 11:06:20,012 - DEBUG - 处理块 120/504: 射 , 所得结果即为查询语句 , 可解释性较高 。 使用预
|
||
先定义的高通用性查询模板 , 填充实体 ...
|
||
2025-06-11 11:06:20,469 - DEBUG - 块 120 生成文本: <triplet> 模板匹配流水线 +候选排序 Aqqu <concept> 系统 <media> 高通用性查询 <misc> 语句 <unk> 查询模 <org> is a list of</s>
|
||
2025-06-11 11:06:20,469 - DEBUG - 原始生成文本: <triplet> 模板匹配流水线 +候选排序 Aqqu <concept> 系统 <media> 高通用性查询 <misc> 语句 <unk> 查询模 <org> is a list of</s>
|
||
2025-06-11 11:06:20,469 - DEBUG - 处理后标记: ['<triplet>', '模板匹配流水线 +候选排序 Aqqu', '<concept>', '系统', '<media>', '高通用性查询', '<misc>', '语句', '<unk>', '查询模', '<org>', 'is a list of']
|
||
2025-06-11 11:06:20,469 - DEBUG - 添加三元组: 模板匹配流水线 +候选排序 Aqqu(concept) - 高通用性查询 - 系统(media)
|
||
2025-06-11 11:06:20,469 - DEBUG - 块 120 提取到 1 个三元组
|
||
2025-06-11 11:06:20,469 - DEBUG - 处理块 121/504: 率先使用模板匹配流水线 +候选排
|
||
序完成 KGQA。
|
||
( 1) 实体链接环节 。 获得问题词语可匹配...
|
||
2025-06-11 11:06:20,863 - DEBUG - 块 121 生成文本: <triplet> 模板匹配流水线 +候选排 序完成 <concept> graph method <media> part of</s>
|
||
2025-06-11 11:06:20,864 - DEBUG - 原始生成文本: <triplet> 模板匹配流水线 +候选排 序完成 <concept> graph method <media> part of</s>
|
||
2025-06-11 11:06:20,864 - DEBUG - 处理后标记: ['<triplet>', '模板匹配流水线 +候选排 序完成', '<concept>', 'graph method', '<media>', 'part of']
|
||
2025-06-11 11:06:20,864 - DEBUG - 添加三元组: 模板匹配流水线 +候选排 序完成(concept) - part of - graph method(media)
|
||
2025-06-11 11:06:20,864 - DEBUG - 块 121 提取到 1 个三元组
|
||
2025-06-11 11:06:20,864 - DEBUG - 处理块 122/504: ˝…15 †ØÑfl˝…•‰•¤˛˚·ð`÷‡Ì
|
||
1851
|
||
ˁ ଊ ጊ
|
||
X X X D F B K...
|
||
2025-06-11 11:06:21,514 - DEBUG - 块 122 生成文本: <triplet> Perkara X X D F B KP S H Journal of Frontiers of Computer Science and Technology计算机科学与探索 <media> විකිපීඩියා <concept> सितम्बर <unk> 1851 <date> inception</s>
|
||
2025-06-11 11:06:21,514 - DEBUG - 原始生成文本: <triplet> Perkara X X D F B KP S H Journal of Frontiers of Computer Science and Technology计算机科学与探索 <media> විකිපීඩියා <concept> सितम्बर <unk> 1851 <date> inception</s>
|
||
2025-06-11 11:06:21,514 - DEBUG - 处理后标记: ['<triplet>', 'Perkara X X D F B KP S H Journal of Frontiers of Computer Science and Technology计算机科学与探索', '<media>', 'විකිපීඩියා', '<concept>', 'सितम्बर', '<unk>', '1851', '<date>', 'inception']
|
||
2025-06-11 11:06:21,514 - DEBUG - 添加三元组: Perkara X X D F B KP S H Journal of Frontiers of Computer Science and Technology计算机科学与探索(media) - सितम्बर - විකිපීඩියා(concept)
|
||
2025-06-11 11:06:21,514 - DEBUG - 块 122 提取到 1 个三元组
|
||
2025-06-11 11:06:21,514 - DEBUG - 处理块 123/504: 务中类别为 true 的概率值 ) 打分 , 打分通过 CrossWikis
|
||
数据集提供的实体别名概...
|
||
2025-06-11 11:06:21,758 - DEBUG - 块 123 生成文本: <triplet> 类模板 <concept> 充图 16 <media> part of</s>
|
||
2025-06-11 11:06:21,758 - DEBUG - 原始生成文本: <triplet> 类模板 <concept> 充图 16 <media> part of</s>
|
||
2025-06-11 11:06:21,759 - DEBUG - 处理后标记: ['<triplet>', '类模板', '<concept>', '充图 16', '<media>', 'part of']
|
||
2025-06-11 11:06:21,759 - DEBUG - 添加三元组: 类模板(concept) - part of - 充图 16(media)
|
||
2025-06-11 11:06:21,759 - DEBUG - 块 123 提取到 1 个三元组
|
||
2025-06-11 11:06:21,759 - DEBUG - 处理块 124/504: ( 3) 关系匹配环节 。 根据模板的关系数 , 检索
|
||
KG 对应实体的所有关系 , 以填充模板关系...
|
||
2025-06-11 11:06:22,334 - DEBUG - 块 124 生成文本: <triplet> 关系占位符 <concept> 模板特征值 <misc> 的关系数 <loc> <media> <unk> <org> <eve> KG <per> is a list of</s>
|
||
2025-06-11 11:06:22,334 - DEBUG - 原始生成文本: <triplet> 关系占位符 <concept> 模板特征值 <misc> 的关系数 <loc> <media> <unk> <org> <eve> KG <per> is a list of</s>
|
||
2025-06-11 11:06:22,334 - DEBUG - 处理后标记: ['<triplet>', '关系占位符', '<concept>', '模板特征值', '<misc>', '的关系数', '<loc>', '<media>', '<unk>', '<org>', '<eve>', 'KG', '<per>', 'is a list of']
|
||
2025-06-11 11:06:22,334 - DEBUG - 添加三元组: 关系占位符(concept) - 的关系数 - 模板特征值(misc)
|
||
2025-06-11 11:06:22,334 - DEBUG - 块 124 提取到 1 个三元组
|
||
2025-06-11 11:06:22,334 - DEBUG - 处理块 125/504: 实体置信度等特征 , 一并输入随机森林 , 选出最优模
|
||
板进行检索 。
|
||
2.5.2 模板匹配流水线 ...
|
||
2025-06-11 11:06:22,802 - DEBUG - 块 125 生成文本: <triplet> 实体置信度 <concept> Aqqu <media> used by</s>
|
||
2025-06-11 11:06:22,802 - DEBUG - 原始生成文本: <triplet> 实体置信度 <concept> Aqqu <media> used by</s>
|
||
2025-06-11 11:06:22,802 - DEBUG - 处理后标记: ['<triplet>', '实体置信度', '<concept>', 'Aqqu', '<media>', 'used by']
|
||
2025-06-11 11:06:22,802 - DEBUG - 添加三元组: 实体置信度(concept) - used by - Aqqu(media)
|
||
2025-06-11 11:06:22,802 - DEBUG - 块 125 提取到 1 个三元组
|
||
2025-06-11 11:06:22,803 - DEBUG - 处理块 126/504: 链接环节的性能 ; 通过挖掘 CQA( community question
|
||
answering) ...
|
||
2025-06-11 11:06:23,270 - DEBUG - 块 126 生成文本: <triplet> 规则模板 <concept> CQA <media> part of</s>
|
||
2025-06-11 11:06:23,270 - DEBUG - 原始生成文本: <triplet> 规则模板 <concept> CQA <media> part of</s>
|
||
2025-06-11 11:06:23,270 - DEBUG - 处理后标记: ['<triplet>', '规则模板', '<concept>', 'CQA', '<media>', 'part of']
|
||
2025-06-11 11:06:23,270 - DEBUG - 添加三元组: 规则模板(concept) - part of - CQA(media)
|
||
2025-06-11 11:06:23,270 - DEBUG - 块 126 提取到 1 个三元组
|
||
2025-06-11 11:06:23,270 - DEBUG - 处理块 127/504: 有方法前列 , 但对于含有丰富语义限制的复杂问题
|
||
效果依旧不佳
|
||
[67]
|
||
。
|
||
表 2 给出了基于规则...
|
||
2025-06-11 11:06:23,429 - DEBUG - 块 127 生成文本: <triplet> 多跳 <concept> 复杂问题 <misc> subclass of</s>
|
||
2025-06-11 11:06:23,430 - DEBUG - 原始生成文本: <triplet> 多跳 <concept> 复杂问题 <misc> subclass of</s>
|
||
2025-06-11 11:06:23,430 - DEBUG - 处理后标记: ['<triplet>', '多跳', '<concept>', '复杂问题', '<misc>', 'subclass of']
|
||
2025-06-11 11:06:23,430 - DEBUG - 添加三元组: 多跳(concept) - subclass of - 复杂问题(misc)
|
||
2025-06-11 11:06:23,430 - DEBUG - 块 127 提取到 1 个三元组
|
||
2025-06-11 11:06:23,430 - DEBUG - 处理块 128/504: Fig.16 Query statement template
|
||
˝…16 †ØÑflÓï¾ä˜£°å
|
||
...
|
||
2025-06-11 11:06:23,943 - DEBUG - 块 128 生成文本: <triplet> 查询模板 <concept> <media> 小结 <org> <misc> <per> <unk> <eve> <loc> <dis> <triplet> 三元组匹配 <time> <cel> <date> point 對 ca_XX</s>
|
||
2025-06-11 11:06:23,943 - DEBUG - 原始生成文本: <triplet> 查询模板 <concept> <media> 小结 <org> <misc> <per> <unk> <eve> <loc> <dis> <triplet> 三元组匹配 <time> <cel> <date> point 對 ca_XX</s>
|
||
2025-06-11 11:06:23,943 - DEBUG - 处理后标记: ['<triplet>', '查询模板', '<concept>', '<media>', '小结', '<org>', '<misc>', '<per>', '<unk>', '<eve>', '<loc>', '<dis>', '<triplet>', '三元组匹配', '<time>', '<cel>', '<date>', 'point 對 ca_XX']
|
||
2025-06-11 11:06:23,943 - DEBUG - 添加三元组: 三元组匹配(time) - point 對 ca_XX - <cel>(date)
|
||
2025-06-11 11:06:23,943 - DEBUG - 块 128 提取到 1 个三元组
|
||
2025-06-11 11:06:23,943 - DEBUG - 处理块 129/504: 所得的逻辑形式
|
||
可执行于 KG, 对
|
||
所得答案具有充
|
||
分的可解释性
|
||
聚焦与问题相关
|
||
的 KG 内容 ...
|
||
2025-06-11 11:06:24,135 - DEBUG - 块 129 生成文本: <triplet> 词汇表 <concept> KG 信息 模板 <media> KG信息</s>
|
||
2025-06-11 11:06:24,135 - DEBUG - 原始生成文本: <triplet> 词汇表 <concept> KG 信息 模板 <media> KG信息</s>
|
||
2025-06-11 11:06:24,135 - DEBUG - 处理后标记: ['<triplet>', '词汇表', '<concept>', 'KG 信息 模板', '<media>', 'KG信息']
|
||
2025-06-11 11:06:24,135 - DEBUG - 添加三元组: 词汇表(concept) - KG信息 - KG 信息 模板(media)
|
||
2025-06-11 11:06:24,135 - DEBUG - 块 129 提取到 1 个三元组
|
||
2025-06-11 11:06:24,135 - DEBUG - 处理块 130/504: 训练数据具有较大
|
||
的依赖性
|
||
对复杂多关系问题
|
||
缺乏表示能力
|
||
语义复杂的问题无
|
||
法使用三元组如实
|
||
捕获...
|
||
2025-06-11 11:06:24,817 - DEBUG - 块 130 生成文本: <triplet> 复杂多关系 <concept> 语义复杂的问题无 法使用三元组排序流水线 <misc> 训练数据具有较大的依赖性 <media> 描述能力较 <per> 差 方法 <unk> 种 <triplet> 三 <org> 编译 <loc> part of</s>
|
||
2025-06-11 11:06:24,817 - DEBUG - 原始生成文本: <triplet> 复杂多关系 <concept> 语义复杂的问题无 法使用三元组排序流水线 <misc> 训练数据具有较大的依赖性 <media> 描述能力较 <per> 差 方法 <unk> 种 <triplet> 三 <org> 编译 <loc> part of</s>
|
||
2025-06-11 11:06:24,817 - DEBUG - 处理后标记: ['<triplet>', '复杂多关系', '<concept>', '语义复杂的问题无 法使用三元组排序流水线', '<misc>', '训练数据具有较大的依赖性', '<media>', '描述能力较', '<per>', '差 方法', '<unk>', '种', '<triplet>', '三', '<org>', '编译', '<loc>', 'part of']
|
||
2025-06-11 11:06:24,817 - DEBUG - 添加三元组: 复杂多关系(concept) - 训练数据具有较大的依赖性 - 语义复杂的问题无 法使用三元组排序流水线(misc)
|
||
2025-06-11 11:06:24,817 - DEBUG - 添加三元组: 三(org) - part of - 编译(loc)
|
||
2025-06-11 11:06:24,817 - DEBUG - 块 130 提取到 2 个三元组
|
||
2025-06-11 11:06:24,817 - DEBUG - 处理块 131/504: 元组排序流水线
|
||
语义结构模板
|
||
查询图
|
||
模板匹配流水线 +候
|
||
选排序
|
||
模板匹配流水线 +候
|
||
选排序 +...
|
||
2025-06-11 11:06:25,050 - DEBUG - 块 131 生成文本: <triplet> 模板匹配流水线 +候 选排序 <unk> <concept> instance of</s>
|
||
2025-06-11 11:06:25,050 - DEBUG - 原始生成文本: <triplet> 模板匹配流水线 +候 选排序 <unk> <concept> instance of</s>
|
||
2025-06-11 11:06:25,050 - DEBUG - 处理后标记: ['<triplet>', '模板匹配流水线 +候 选排序', '<unk>', '<concept>', 'instance of']
|
||
2025-06-11 11:06:25,050 - DEBUG - 处理块 132/504: 使用语法规则及词汇表完成谓词映射 ,
|
||
以高召回率生成逻辑形式用于排序
|
||
使用模板或规则将问题改写为中间...
|
||
2025-06-11 11:06:25,448 - DEBUG - 块 132 生成文本: <triplet> 模板拆分子问题 <concept> 问题模 <misc> part of</s>
|
||
2025-06-11 11:06:25,448 - DEBUG - 原始生成文本: <triplet> 模板拆分子问题 <concept> 问题模 <misc> part of</s>
|
||
2025-06-11 11:06:25,448 - DEBUG - 处理后标记: ['<triplet>', '模板拆分子问题', '<concept>', '问题模', '<misc>', 'part of']
|
||
2025-06-11 11:06:25,448 - DEBUG - 添加三元组: 模板拆分子问题(concept) - part of - 问题模(misc)
|
||
2025-06-11 11:06:25,448 - DEBUG - 块 132 提取到 1 个三元组
|
||
2025-06-11 11:06:25,448 - DEBUG - 处理块 133/504: 式模板和关系表达式字典构造三元
|
||
组 , 使用人工特征排序
|
||
复述模板改写问题 , 依赖树规则构造
|
||
三元...
|
||
2025-06-11 11:06:25,856 - DEBUG - 块 133 生成文本: <triplet> 式字典构造三元组 <concept> 模板 <misc> instance of</s>
|
||
2025-06-11 11:06:25,856 - DEBUG - 原始生成文本: <triplet> 式字典构造三元组 <concept> 模板 <misc> instance of</s>
|
||
2025-06-11 11:06:25,856 - DEBUG - 处理后标记: ['<triplet>', '式字典构造三元组', '<concept>', '模板', '<misc>', 'instance of']
|
||
2025-06-11 11:06:25,856 - DEBUG - 添加三元组: 式字典构造三元组(concept) - instance of - 模板(misc)
|
||
2025-06-11 11:06:25,856 - DEBUG - 块 133 提取到 1 个三元组
|
||
2025-06-11 11:06:25,856 - DEBUG - 处理块 134/504: 转换得到逻辑形式
|
||
使用流水线提高生成的候选查询召回
|
||
率 , 通过实体 、 关系 、 查询特征筛选查
|
||
...
|
||
2025-06-11 11:06:26,132 - DEBUG - 块 134 生成文本: <triplet> 库 <concept> 陈子睿 <per> discoverer or inventor</s>
|
||
2025-06-11 11:06:26,132 - DEBUG - 原始生成文本: <triplet> 库 <concept> 陈子睿 <per> discoverer or inventor</s>
|
||
2025-06-11 11:06:26,133 - DEBUG - 处理后标记: ['<triplet>', '库', '<concept>', '陈子睿', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:06:26,133 - DEBUG - 添加三元组: 库(concept) - discoverer or inventor - 陈子睿(per)
|
||
2025-06-11 11:06:26,133 - DEBUG - 块 134 提取到 1 个三元组
|
||
2025-06-11 11:06:26,133 - DEBUG - 处理块 135/504: 传统语义解析依赖人工指定
|
||
的词汇表 , 短语映射结果的好坏与数据的质量密切
|
||
相关 ; 话语模板方法...
|
||
2025-06-11 11:06:26,644 - DEBUG - 块 135 生成文本: <triplet> 话语模板 <concept> <misc> 三元组匹配方 <media> 法 <eve> <org> <per> <unk> <dis> <time> 代 <loc> <cel> 分类 ca_XX <date> point in time</s>
|
||
2025-06-11 11:06:26,644 - DEBUG - 原始生成文本: <triplet> 话语模板 <concept> <misc> 三元组匹配方 <media> 法 <eve> <org> <per> <unk> <dis> <time> 代 <loc> <cel> 分类 ca_XX <date> point in time</s>
|
||
2025-06-11 11:06:26,644 - DEBUG - 处理后标记: ['<triplet>', '话语模板', '<concept>', '<misc>', '三元组匹配方', '<media>', '法', '<eve>', '<org>', '<per>', '<unk>', '<dis>', '<time>', '代', '<loc>', '<cel>', '分类 ca_XX', '<date>', 'point in time']
|
||
2025-06-11 11:06:26,644 - DEBUG - 处理块 136/504: 查询模板则对人工设定的模板通用性要求
|
||
较高 。
|
||
基于规则模板方法所含的人工干预较多 , 导致
|
||
系统...
|
||
2025-06-11 11:06:27,061 - DEBUG - 块 136 生成文本: <triplet> 规则模板 <concept> 基线指标 <media> 查询模 <misc> instance of</s>
|
||
2025-06-11 11:06:27,061 - DEBUG - 原始生成文本: <triplet> 规则模板 <concept> 基线指标 <media> 查询模 <misc> instance of</s>
|
||
2025-06-11 11:06:27,061 - DEBUG - 处理后标记: ['<triplet>', '规则模板', '<concept>', '基线指标', '<media>', '查询模', '<misc>', 'instance of']
|
||
2025-06-11 11:06:27,061 - DEBUG - 添加三元组: 规则模板(concept) - 查询模 - 基线指标(media)
|
||
2025-06-11 11:06:27,061 - DEBUG - 块 136 提取到 1 个三元组
|
||
2025-06-11 11:06:27,061 - DEBUG - 处理块 137/504: 3 基于深度学习的方法
|
||
随着深度学习不断发展 , 各类基于深度学习的
|
||
KGQA 方法逐渐被提出和发展...
|
||
2025-06-11 11:06:27,402 - DEBUG - 块 137 生成文本: <triplet> 基于深度学习 <concept> KGQA <media> <misc> 神经网络模型抽取问题特征完成问答 <eve> KG <org> developer</s>
|
||
2025-06-11 11:06:27,402 - DEBUG - 原始生成文本: <triplet> 基于深度学习 <concept> KGQA <media> <misc> 神经网络模型抽取问题特征完成问答 <eve> KG <org> developer</s>
|
||
2025-06-11 11:06:27,402 - DEBUG - 处理后标记: ['<triplet>', '基于深度学习', '<concept>', 'KGQA', '<media>', '<misc>', '神经网络模型抽取问题特征完成问答', '<eve>', 'KG', '<org>', 'developer']
|
||
2025-06-11 11:06:27,402 - DEBUG - 添加三元组: 基于深度学习(concept) - <misc> - KGQA(media)
|
||
2025-06-11 11:06:27,402 - DEBUG - 块 137 提取到 1 个三元组
|
||
2025-06-11 11:06:27,402 - DEBUG - 处理块 138/504: 信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络...
|
||
2025-06-11 11:06:28,052 - DEBUG - 块 138 生成文本: <triplet> 语义解析 <concept> 知识图谱嵌入及记忆网络的 <misc> 神经网络 <media> 信息检索方法 <eve> <unk> 问答流程子环节 <loc> 果推断答案的来由 <org> 编码 <per> author</s>
|
||
2025-06-11 11:06:28,052 - DEBUG - 原始生成文本: <triplet> 语义解析 <concept> 知识图谱嵌入及记忆网络的 <misc> 神经网络 <media> 信息检索方法 <eve> <unk> 问答流程子环节 <loc> 果推断答案的来由 <org> 编码 <per> author</s>
|
||
2025-06-11 11:06:28,052 - DEBUG - 处理后标记: ['<triplet>', '语义解析', '<concept>', '知识图谱嵌入及记忆网络的', '<misc>', '神经网络', '<media>', '信息检索方法', '<eve>', '<unk>', '问答流程子环节', '<loc>', '果推断答案的来由', '<org>', '编码', '<per>', 'author']
|
||
2025-06-11 11:06:28,052 - DEBUG - 添加三元组: 语义解析(concept) - 神经网络 - 知识图谱嵌入及记忆网络的(misc)
|
||
2025-06-11 11:06:28,052 - DEBUG - 块 138 提取到 1 个三元组
|
||
2025-06-11 11:06:28,052 - DEBUG - 处理块 139/504: 知识图谱嵌入和记忆网络方法更高的性能表现 。
|
||
3.1 知识图谱嵌入
|
||
知识图谱嵌入方法作为最基础的深度...
|
||
2025-06-11 11:06:28,414 - DEBUG - 块 139 生成文本: <triplet> 知识图谱嵌入 <media> 深度学习 <concept> subclass of</s>
|
||
2025-06-11 11:06:28,414 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <media> 深度学习 <concept> subclass of</s>
|
||
2025-06-11 11:06:28,414 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<media>', '深度学习', '<concept>', 'subclass of']
|
||
2025-06-11 11:06:28,414 - DEBUG - 添加三元组: 知识图谱嵌入(media) - subclass of - 深度学习(concept)
|
||
2025-06-11 11:06:28,414 - DEBUG - 块 139 提取到 1 个三元组
|
||
2025-06-11 11:06:28,414 - DEBUG - 处理块 140/504: 识图谱嵌入方法常作为其他神经网络模型组成环节
|
||
的一部分 。
|
||
最基本的知识图谱嵌入方法 TransE ...
|
||
2025-06-11 11:06:29,098 - DEBUG - 块 140 生成文本: <triplet> 识图谱嵌入方法 <concept> 神经网络模型组成环节 <misc> 知识 <unk> <media> 编码 <org> <loc> <dis> <eve> 路 径 <per> <cel> part of</s>
|
||
2025-06-11 11:06:29,098 - DEBUG - 原始生成文本: <triplet> 识图谱嵌入方法 <concept> 神经网络模型组成环节 <misc> 知识 <unk> <media> 编码 <org> <loc> <dis> <eve> 路 径 <per> <cel> part of</s>
|
||
2025-06-11 11:06:29,098 - DEBUG - 处理后标记: ['<triplet>', '识图谱嵌入方法', '<concept>', '神经网络模型组成环节', '<misc>', '知识', '<unk>', '<media>', '编码', '<org>', '<loc>', '<dis>', '<eve>', '路 径', '<per>', '<cel>', 'part of']
|
||
2025-06-11 11:06:29,098 - DEBUG - 添加三元组: 识图谱嵌入方法(concept) - 知识 - 神经网络模型组成环节(misc)
|
||
2025-06-11 11:06:29,098 - DEBUG - 块 140 提取到 1 个三元组
|
||
2025-06-11 11:06:29,098 - DEBUG - 处理块 141/504: 的矩阵 W 表示 , 其中 k 为预先指定
|
||
的嵌入空间维度 。
|
||
候选答案的得分通过问题表示 f(q)...
|
||
2025-06-11 11:06:29,258 - DEBUG - 块 141 生成文本: <triplet> 算法 <concept> EmbedKGQA <media> used by</s>
|
||
2025-06-11 11:06:29,258 - DEBUG - 原始生成文本: <triplet> 算法 <concept> EmbedKGQA <media> used by</s>
|
||
2025-06-11 11:06:29,258 - DEBUG - 处理后标记: ['<triplet>', '算法', '<concept>', 'EmbedKGQA', '<media>', 'used by']
|
||
2025-06-11 11:06:29,258 - DEBUG - 添加三元组: 算法(concept) - used by - EmbedKGQA(media)
|
||
2025-06-11 11:06:29,258 - DEBUG - 块 141 提取到 1 个三元组
|
||
2025-06-11 11:06:29,258 - DEBUG - 处理块 142/504: , 针对文献 [75]候选答案集合进行缩减
|
||
的需求 , 提出一种简单的缩减方法 , 并实现利用知识
|
||
...
|
||
2025-06-11 11:06:29,396 - DEBUG - 块 142 生成文本: <triplet> <concept> EmQL <media> part of</s>
|
||
2025-06-11 11:06:29,396 - DEBUG - 原始生成文本: <triplet> <concept> EmQL <media> part of</s>
|
||
2025-06-11 11:06:29,396 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'EmQL', '<media>', 'part of']
|
||
2025-06-11 11:06:29,396 - DEBUG - 处理块 143/504: EmQL 首次将 KG 实体与查询语句同时嵌入相同空
|
||
间 , 提高系统在不完整 KG 中的推理问答能...
|
||
2025-06-11 11:06:29,535 - DEBUG - 块 143 生成文本: <triplet> 循环 <concept> EmQL <media> used by</s>
|
||
2025-06-11 11:06:29,535 - DEBUG - 原始生成文本: <triplet> 循环 <concept> EmQL <media> used by</s>
|
||
2025-06-11 11:06:29,535 - DEBUG - 处理后标记: ['<triplet>', '循环', '<concept>', 'EmQL', '<media>', 'used by']
|
||
2025-06-11 11:06:29,535 - DEBUG - 添加三元组: 循环(concept) - used by - EmQL(media)
|
||
2025-06-11 11:06:29,535 - DEBUG - 块 143 提取到 1 个三元组
|
||
2025-06-11 11:06:29,535 - DEBUG - 处理块 144/504: 神经网络 ( recurrent neural networks, RNN) 特殊变体
|
||
的长短时记忆...
|
||
2025-06-11 11:06:29,875 - DEBUG - 块 144 生成文本: <triplet> 记忆网络模型 <concept> 神经网络 <misc> part of</s>
|
||
2025-06-11 11:06:29,875 - DEBUG - 原始生成文本: <triplet> 记忆网络模型 <concept> 神经网络 <misc> part of</s>
|
||
2025-06-11 11:06:29,875 - DEBUG - 处理后标记: ['<triplet>', '记忆网络模型', '<concept>', '神经网络', '<misc>', 'part of']
|
||
2025-06-11 11:06:29,875 - DEBUG - 添加三元组: 记忆网络模型(concept) - part of - 神经网络(misc)
|
||
2025-06-11 11:06:29,875 - DEBUG - 块 144 提取到 1 个三元组
|
||
2025-06-11 11:06:29,875 - DEBUG - 处理块 145/504: 名为 MemNN — —以可读写记忆组件为核心的学习
|
||
系统 , 通过将 KG 的所有内容嵌入至向量空...
|
||
2025-06-11 11:06:30,269 - DEBUG - 块 145 生成文本: <triplet> 记忆网络框架 <media> 的学习 系统 <concept> use</s>
|
||
2025-06-11 11:06:30,269 - DEBUG - 原始生成文本: <triplet> 记忆网络框架 <media> 的学习 系统 <concept> use</s>
|
||
2025-06-11 11:06:30,269 - DEBUG - 处理后标记: ['<triplet>', '记忆网络框架', '<media>', '的学习 系统', '<concept>', 'use']
|
||
2025-06-11 11:06:30,269 - DEBUG - 添加三元组: 记忆网络框架(media) - use - 的学习 系统(concept)
|
||
2025-06-11 11:06:30,269 - DEBUG - 块 145 提取到 1 个三元组
|
||
2025-06-11 11:06:30,269 - DEBUG - 处理块 146/504: 问题数据集 SimpleQuestions
|
||
[24]
|
||
。
|
||
MemNNs 系统通过图 18 中的记忆 ...
|
||
2025-06-11 11:06:30,429 - DEBUG - 块 146 生成文本: <triplet> 记忆模块 <concept> MemNNs <media> part of</s>
|
||
2025-06-11 11:06:30,429 - DEBUG - 原始生成文本: <triplet> 记忆模块 <concept> MemNNs <media> part of</s>
|
||
2025-06-11 11:06:30,429 - DEBUG - 处理后标记: ['<triplet>', '记忆模块', '<concept>', 'MemNNs', '<media>', 'part of']
|
||
2025-06-11 11:06:30,429 - DEBUG - 添加三元组: 记忆模块(concept) - part of - MemNNs(media)
|
||
2025-06-11 11:06:30,429 - DEBUG - 块 146 提取到 1 个三元组
|
||
2025-06-11 11:06:30,429 - DEBUG - 处理块 147/504: Fig.17 Working process of improved TransE
|
||
˝…17 Tra...
|
||
2025-06-11 11:06:30,567 - DEBUG - 块 147 生成文本: <triplet> реакції <concept> 1853 <date> point in time</s>
|
||
2025-06-11 11:06:30,567 - DEBUG - 原始生成文本: <triplet> реакції <concept> 1853 <date> point in time</s>
|
||
2025-06-11 11:06:30,567 - DEBUG - 处理后标记: ['<triplet>', 'реакції', '<concept>', '1853', '<date>', 'point in time']
|
||
2025-06-11 11:06:30,567 - DEBUG - 添加三元组: реакції(concept) - point in time - 1853(date)
|
||
2025-06-11 11:06:30,567 - DEBUG - 块 147 提取到 1 个三元组
|
||
2025-06-11 11:06:30,567 - DEBUG - 处理块 148/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:06:30,727 - DEBUG - 块 148 生成文本: <triplet> <concept> KG 三元组 <misc> part of</s>
|
||
2025-06-11 11:06:30,727 - DEBUG - 原始生成文本: <triplet> <concept> KG 三元组 <misc> part of</s>
|
||
2025-06-11 11:06:30,727 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KG 三元组', '<misc>', 'part of']
|
||
2025-06-11 11:06:30,727 - DEBUG - 处理块 149/504: 用于在 M 中选择与 I 的输出最相关的记忆 , 并对所得
|
||
候选记忆进行打分排序 ; 响应模块 R ...
|
||
2025-06-11 11:06:31,100 - DEBUG - 块 149 生成文本: <triplet> 响应模块 <concept> 工作流程 <media> Jain <per> creator</s>
|
||
2025-06-11 11:06:31,100 - DEBUG - 原始生成文本: <triplet> 响应模块 <concept> 工作流程 <media> Jain <per> creator</s>
|
||
2025-06-11 11:06:31,100 - DEBUG - 处理后标记: ['<triplet>', '响应模块', '<concept>', '工作流程', '<media>', 'Jain', '<per>', 'creator']
|
||
2025-06-11 11:06:31,100 - DEBUG - 添加三元组: 响应模块(concept) - Jain - 工作流程(media)
|
||
2025-06-11 11:06:31,100 - DEBUG - 块 149 提取到 1 个三元组
|
||
2025-06-11 11:06:31,100 - DEBUG - 处理块 150/504: 以 MemNNs 为基础 , 在 KG 预处理环
|
||
节舍去合并相同主谓三元组的过程 , 但使用词袋结
|
||
...
|
||
2025-06-11 11:06:31,440 - DEBUG - 块 150 生成文本: <triplet> <concept> KV-MemNN <misc> used by</s>
|
||
2025-06-11 11:06:31,440 - DEBUG - 原始生成文本: <triplet> <concept> KV-MemNN <misc> used by</s>
|
||
2025-06-11 11:06:31,440 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KV-MemNN', '<misc>', 'used by']
|
||
2025-06-11 11:06:31,440 - DEBUG - 处理块 151/504: 基础 , 通过引入 STOP 策略 , 设计一种新式查询更新
|
||
策略 , 屏蔽已寻址的内存信息 , 使...
|
||
2025-06-11 11:06:31,769 - DEBUG - 块 151 生成文本: <triplet> 语义解析 <concept> 神经网络模块 <misc> part of</s>
|
||
2025-06-11 11:06:31,769 - DEBUG - 原始生成文本: <triplet> 语义解析 <concept> 神经网络模块 <misc> part of</s>
|
||
2025-06-11 11:06:31,769 - DEBUG - 处理后标记: ['<triplet>', '语义解析', '<concept>', '神经网络模块', '<misc>', 'part of']
|
||
2025-06-11 11:06:31,769 - DEBUG - 添加三元组: 语义解析(concept) - part of - 神经网络模块(misc)
|
||
2025-06-11 11:06:31,769 - DEBUG - 块 151 提取到 1 个三元组
|
||
2025-06-11 11:06:31,769 - DEBUG - 处理块 152/504: 除本节程序归纳子方法用于处理复杂问题
|
||
外 , 其他子方法皆用于简单问题的处理 。
|
||
3.3.1 神经...
|
||
2025-06-11 11:06:32,248 - DEBUG - 块 152 生成文本: <triplet> 神经网络+知识图谱嵌入 <media> 词汇映射 <concept> <misc> 性能升 级 <triplet> Golub <per> <org> 复杂问题 <loc> field of work</s>
|
||
2025-06-11 11:06:32,248 - DEBUG - 原始生成文本: <triplet> 神经网络+知识图谱嵌入 <media> 词汇映射 <concept> <misc> 性能升 级 <triplet> Golub <per> <org> 复杂问题 <loc> field of work</s>
|
||
2025-06-11 11:06:32,248 - DEBUG - 处理后标记: ['<triplet>', '神经网络+知识图谱嵌入', '<media>', '词汇映射', '<concept>', '<misc>', '性能升 级', '<triplet>', 'Golub', '<per>', '<org>', '复杂问题', '<loc>', 'field of work']
|
||
2025-06-11 11:06:32,248 - DEBUG - 添加三元组: 神经网络+知识图谱嵌入(media) - <misc> - 词汇映射(concept)
|
||
2025-06-11 11:06:32,248 - DEBUG - 块 152 提取到 1 个三元组
|
||
2025-06-11 11:06:32,248 - DEBUG - 处理块 153/504: 召回的候选实体结果 , 将流行度最高的 10 个候选实
|
||
体作为候选实体集 E , 接着检索候选实体集...
|
||
2025-06-11 11:06:32,664 - DEBUG - 块 153 生成文本: <triplet> 召回的候选实体结果 <concept> LSTM <misc> <media> 独热向量输入 <eve> <org> 问题编码 <dis> part of</s>
|
||
2025-06-11 11:06:32,664 - DEBUG - 原始生成文本: <triplet> 召回的候选实体结果 <concept> LSTM <misc> <media> 独热向量输入 <eve> <org> 问题编码 <dis> part of</s>
|
||
2025-06-11 11:06:32,664 - DEBUG - 处理后标记: ['<triplet>', '召回的候选实体结果', '<concept>', 'LSTM', '<misc>', '<media>', '独热向量输入', '<eve>', '<org>', '问题编码', '<dis>', 'part of']
|
||
2025-06-11 11:06:32,664 - DEBUG - 添加三元组: 召回的候选实体结果(concept) - <media> - LSTM(misc)
|
||
2025-06-11 11:06:32,664 - DEBUG - 块 153 提取到 1 个三元组
|
||
2025-06-11 11:06:32,664 - DEBUG - 处理块 154/504: 最优实体 、 关系作为输出 , 并分别使用一个 CNN 网络
|
||
以字符为单位进行编码 , 获得固定长度...
|
||
2025-06-11 11:06:32,908 - DEBUG - 块 154 生成文本: <triplet> 相似度函数 <concept> CNN 网络 <media> CNN网络</s>
|
||
2025-06-11 11:06:32,909 - DEBUG - 原始生成文本: <triplet> 相似度函数 <concept> CNN 网络 <media> CNN网络</s>
|
||
2025-06-11 11:06:32,909 - DEBUG - 处理后标记: ['<triplet>', '相似度函数', '<concept>', 'CNN 网络', '<media>', 'CNN网络']
|
||
2025-06-11 11:06:32,909 - DEBUG - 添加三元组: 相似度函数(concept) - CNN网络 - CNN 网络(media)
|
||
2025-06-11 11:06:32,909 - DEBUG - 块 154 提取到 1 个三元组
|
||
2025-06-11 11:06:32,909 - DEBUG - 处理块 155/504: e 、 p 作为输出 , 用于填充逻 辑查询语句的
|
||
实体关系占位符 。 ISS-NR 系统
|
||
[81]...
|
||
2025-06-11 11:06:33,451 - DEBUG - 块 155 生成文本: <triplet> 神经网络+候选排序 <concept> 逻 辑查询语句 <media> ISS-NR 系统 <org> <misc> 实体关系 <dis> <cel> part of</s>
|
||
2025-06-11 11:06:33,451 - DEBUG - 原始生成文本: <triplet> 神经网络+候选排序 <concept> 逻 辑查询语句 <media> ISS-NR 系统 <org> <misc> 实体关系 <dis> <cel> part of</s>
|
||
2025-06-11 11:06:33,451 - DEBUG - 处理后标记: ['<triplet>', '神经网络+候选排序', '<concept>', '逻 辑查询语句', '<media>', 'ISS-NR 系统', '<org>', '<misc>', '实体关系', '<dis>', '<cel>', 'part of']
|
||
2025-06-11 11:06:33,451 - DEBUG - 添加三元组: 神经网络+候选排序(concept) - ISS-NR 系统 - 逻 辑查询语句(media)
|
||
2025-06-11 11:06:33,451 - DEBUG - 块 155 提取到 1 个三元组
|
||
2025-06-11 11:06:33,452 - DEBUG - 处理块 156/504: 提升简单问题的排序打分工作 , 主要通过神经
|
||
网络模型替换传统方法的统计学习模型来完成 。
|
||
Yavu...
|
||
2025-06-11 11:06:33,877 - DEBUG - 块 156 生成文本: <triplet> 统计学习 <concept> 神经 网络模型 <unk> <misc> instance of</s>
|
||
2025-06-11 11:06:33,877 - DEBUG - 原始生成文本: <triplet> 统计学习 <concept> 神经 网络模型 <unk> <misc> instance of</s>
|
||
2025-06-11 11:06:33,878 - DEBUG - 处理后标记: ['<triplet>', '统计学习', '<concept>', '神经 网络模型', '<unk>', '<misc>', 'instance of']
|
||
2025-06-11 11:06:33,878 - DEBUG - 添加三元组: 统计学习(concept) - <misc> - 神经 网络模型(unk)
|
||
2025-06-11 11:06:33,878 - DEBUG - 块 156 提取到 1 个三元组
|
||
2025-06-11 11:06:33,878 - DEBUG - 处理块 157/504: memory) 模型对实体前后内容进行向量表示并用于
|
||
预测实体的正确类型 , 排序部分则以实体类型相...
|
||
2025-06-11 11:06:34,282 - DEBUG - 块 157 生成文本: <triplet> 复述 <concept> 模型 <misc> Dong <per> named <media> <org> <loc> <eve> チャート <unk> <dis> <cel></s>
|
||
2025-06-11 11:06:34,283 - DEBUG - 原始生成文本: <triplet> 复述 <concept> 模型 <misc> Dong <per> named <media> <org> <loc> <eve> チャート <unk> <dis> <cel></s>
|
||
2025-06-11 11:06:34,283 - DEBUG - 处理后标记: ['<triplet>', '复述', '<concept>', '模型', '<misc>', 'Dong', '<per>', 'named', '<media>', '<org>', '<loc>', '<eve>', 'チャート', '<unk>', '<dis>', '<cel>']
|
||
2025-06-11 11:06:34,283 - DEBUG - 添加三元组: 复述(concept) - Dong - 模型(misc)
|
||
2025-06-11 11:06:34,283 - DEBUG - 块 157 提取到 1 个三元组
|
||
2025-06-11 11:06:34,283 - DEBUG - 处理块 158/504: 改写使用 BiLSTM 模型得到向量表示 , 获得改写问题
|
||
与原问题的相似度打分 P(q′|q), ...
|
||
2025-06-11 11:06:34,783 - DEBUG - 块 158 生成文本: <triplet> 改写问题 <concept> BiLSTM 模型 <misc> part of</s>
|
||
2025-06-11 11:06:34,783 - DEBUG - 原始生成文本: <triplet> 改写问题 <concept> BiLSTM 模型 <misc> part of</s>
|
||
2025-06-11 11:06:34,783 - DEBUG - 处理后标记: ['<triplet>', '改写问题', '<concept>', 'BiLSTM 模型', '<misc>', 'part of']
|
||
2025-06-11 11:06:34,783 - DEBUG - 添加三元组: 改写问题(concept) - part of - BiLSTM 模型(misc)
|
||
2025-06-11 11:06:34,783 - DEBUG - 块 158 提取到 1 个三元组
|
||
2025-06-11 11:06:34,783 - DEBUG - 处理块 159/504: 3.3.4 程序归纳
|
||
对于复杂多关系问题部分 , 诸如 SSRP
|
||
[84]
|
||
、 CIPITR
|
||
[85...
|
||
2025-06-11 11:06:35,403 - DEBUG - 块 159 生成文本: <triplet> 神经网络模块组合 <concept> 复杂多关系问题 <misc> <media> SSRP <org> <eve> <per> <unk> 系统 <triplet> KG <loc> <time> 系统的 <date> point in time</s>
|
||
2025-06-11 11:06:35,403 - DEBUG - 原始生成文本: <triplet> 神经网络模块组合 <concept> 复杂多关系问题 <misc> <media> SSRP <org> <eve> <per> <unk> 系统 <triplet> KG <loc> <time> 系统的 <date> point in time</s>
|
||
2025-06-11 11:06:35,403 - DEBUG - 处理后标记: ['<triplet>', '神经网络模块组合', '<concept>', '复杂多关系问题', '<misc>', '<media>', 'SSRP', '<org>', '<eve>', '<per>', '<unk>', '系统', '<triplet>', 'KG', '<loc>', '<time>', '系统的', '<date>', 'point in time']
|
||
2025-06-11 11:06:35,403 - DEBUG - 添加三元组: 神经网络模块组合(concept) - <media> - 复杂多关系问题(misc)
|
||
2025-06-11 11:06:35,403 - DEBUG - 块 159 提取到 1 个三元组
|
||
2025-06-11 11:06:35,403 - DEBUG - 处理块 160/504: 本类方法也有诸如 Andreas 等人
|
||
[31]
|
||
的特殊实现 。
|
||
该工作针对不同的问题 , 组合神经...
|
||
2025-06-11 11:06:35,883 - DEBUG - 块 160 生成文本: <triplet> 组合神经网络子模块 <concept> 18 MemNNs ¿ò...Ü`÷‡Ì <misc> 18 <media> based on</s>
|
||
2025-06-11 11:06:35,883 - DEBUG - 原始生成文本: <triplet> 组合神经网络子模块 <concept> 18 MemNNs ¿ò...Ü`÷‡Ì <misc> 18 <media> based on</s>
|
||
2025-06-11 11:06:35,883 - DEBUG - 处理后标记: ['<triplet>', '组合神经网络子模块', '<concept>', '18 MemNNs ¿ò...Ü`÷‡Ì', '<misc>', '18', '<media>', 'based on']
|
||
2025-06-11 11:06:35,883 - DEBUG - 添加三元组: 组合神经网络子模块(concept) - 18 - 18 MemNNs ¿ò...Ü`÷‡Ì(misc)
|
||
2025-06-11 11:06:35,883 - DEBUG - 块 160 提取到 1 个三元组
|
||
2025-06-11 11:06:35,883 - DEBUG - 处理块 161/504: Fig.19 Neural network models to complete
|
||
lexical m...
|
||
2025-06-11 11:06:36,663 - DEBUG - 块 161 生成文本: <triplet> рика <concept> 陈子睿 <per> discoverer or inventor</s>
|
||
2025-06-11 11:06:36,663 - DEBUG - 原始生成文本: <triplet> рика <concept> 陈子睿 <per> discoverer or inventor</s>
|
||
2025-06-11 11:06:36,663 - DEBUG - 处理后标记: ['<triplet>', 'рика', '<concept>', '陈子睿', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:06:36,663 - DEBUG - 添加三元组: рика(concept) - discoverer or inventor - 陈子睿(per)
|
||
2025-06-11 11:06:36,663 - DEBUG - 块 161 提取到 1 个三元组
|
||
2025-06-11 11:06:36,663 - DEBUG - 处理块 162/504: 形成特定的神经网络模型 , 用 于获得问题的答案 , 常
|
||
规对多个候选逻辑形式的排序 , 转换为对多...
|
||
2025-06-11 11:06:36,854 - DEBUG - 块 162 生成文本: <triplet> 语义查询图 <concept> 神经网络 <misc> part of</s>
|
||
2025-06-11 11:06:36,854 - DEBUG - 原始生成文本: <triplet> 语义查询图 <concept> 神经网络 <misc> part of</s>
|
||
2025-06-11 11:06:36,854 - DEBUG - 处理后标记: ['<triplet>', '语义查询图', '<concept>', '神经网络', '<misc>', 'part of']
|
||
2025-06-11 11:06:36,854 - DEBUG - 添加三元组: 语义查询图(concept) - part of - 神经网络(misc)
|
||
2025-06-11 11:06:36,854 - DEBUG - 块 162 提取到 1 个三元组
|
||
2025-06-11 11:06:36,854 - DEBUG - 处理块 163/504: 基于
|
||
神经网络的方法在上述实例化转换和排序环节均
|
||
有涉及 。
|
||
3.4.1 神经网络+答案特征
|
||
针对...
|
||
2025-06-11 11:06:37,343 - DEBUG - 块 163 生成文本: <triplet> 关系映射 <concept> CNN 模型 <media> based on</s>
|
||
2025-06-11 11:06:37,343 - DEBUG - 原始生成文本: <triplet> 关系映射 <concept> CNN 模型 <media> based on</s>
|
||
2025-06-11 11:06:37,344 - DEBUG - 处理后标记: ['<triplet>', '关系映射', '<concept>', 'CNN 模型', '<media>', 'based on']
|
||
2025-06-11 11:06:37,344 - DEBUG - 添加三元组: 关系映射(concept) - based on - CNN 模型(media)
|
||
2025-06-11 11:06:37,344 - DEBUG - 块 163 提取到 1 个三元组
|
||
2025-06-11 11:06:37,344 - DEBUG - 处理块 164/504: 关系映射 , 实验证明 MCCNN 比 CNN 更适合关系的
|
||
特征抽取 。
|
||
3.4.2 神经网络+问...
|
||
2025-06-11 11:06:37,662 - DEBUG - 块 164 生成文本: <triplet> 关系映射 <concept> CNN <misc> used by</s>
|
||
2025-06-11 11:06:37,662 - DEBUG - 原始生成文本: <triplet> 关系映射 <concept> CNN <misc> used by</s>
|
||
2025-06-11 11:06:37,662 - DEBUG - 处理后标记: ['<triplet>', '关系映射', '<concept>', 'CNN', '<misc>', 'used by']
|
||
2025-06-11 11:06:37,662 - DEBUG - 添加三元组: 关系映射(concept) - used by - CNN(misc)
|
||
2025-06-11 11:06:37,662 - DEBUG - 块 164 提取到 1 个三元组
|
||
2025-06-11 11:06:37,662 - DEBUG - 处理块 165/504: 使用 BiGRU( bi-directional gate recurrent
|
||
unit) 完成上述...
|
||
2025-06-11 11:06:37,821 - DEBUG - 块 165 生成文本: <triplet> GGNN <media> 系统 <concept> instance of</s>
|
||
2025-06-11 11:06:37,821 - DEBUG - 原始生成文本: <triplet> GGNN <media> 系统 <concept> instance of</s>
|
||
2025-06-11 11:06:37,821 - DEBUG - 处理后标记: ['<triplet>', 'GGNN', '<media>', '系统', '<concept>', 'instance of']
|
||
2025-06-11 11:06:37,821 - DEBUG - 添加三元组: GGNN(media) - instance of - 系统(concept)
|
||
2025-06-11 11:06:37,821 - DEBUG - 块 165 提取到 1 个三元组
|
||
2025-06-11 11:06:37,821 - DEBUG - 处理块 166/504: 与 STAGG 完全相同的图生成框架 , 但在 STAGG 基
|
||
础上使用 CNN 与 GGNN 分别...
|
||
2025-06-11 11:06:38,088 - DEBUG - 块 166 生成文本: <triplet> 图生成框架 <concept> CNN <media> <org> owned by</s>
|
||
2025-06-11 11:06:38,088 - DEBUG - 原始生成文本: <triplet> 图生成框架 <concept> CNN <media> <org> owned by</s>
|
||
2025-06-11 11:06:38,088 - DEBUG - 处理后标记: ['<triplet>', '图生成框架', '<concept>', 'CNN', '<media>', '<org>', 'owned by']
|
||
2025-06-11 11:06:38,088 - DEBUG - 添加三元组: 图生成框架(concept) - <org> - CNN(media)
|
||
2025-06-11 11:06:38,088 - DEBUG - 块 166 提取到 1 个三元组
|
||
2025-06-11 11:06:38,088 - DEBUG - 处理块 167/504: 为例 , 如图 20 所示 , CNN 将问题映射到长度固定为
|
||
dw 的向量表示 。 在问题序列首尾...
|
||
2025-06-11 11:06:38,280 - DEBUG - 块 167 生成文本: <triplet> 矩阵 W <misc> CNN <media> part of</s>
|
||
2025-06-11 11:06:38,280 - DEBUG - 原始生成文本: <triplet> 矩阵 W <misc> CNN <media> part of</s>
|
||
2025-06-11 11:06:38,280 - DEBUG - 处理后标记: ['<triplet>', '矩阵 W', '<misc>', 'CNN', '<media>', 'part of']
|
||
2025-06-11 11:06:38,280 - DEBUG - 添加三元组: 矩阵 W(misc) - part of - CNN(media)
|
||
2025-06-11 11:06:38,280 - DEBUG - 块 167 提取到 1 个三元组
|
||
2025-06-11 11:06:38,280 - DEBUG - 处理块 168/504: 向量输入双层 CNN+Pooling 层 , 连接全连接层 H 得
|
||
到最终表示向量 vq 。
|
||
GGN...
|
||
2025-06-11 11:06:38,599 - DEBUG - 块 168 生成文本: <triplet> 标 签 <concept> GGNN <misc> part of</s>
|
||
2025-06-11 11:06:38,599 - DEBUG - 原始生成文本: <triplet> 标 签 <concept> GGNN <misc> part of</s>
|
||
2025-06-11 11:06:38,599 - DEBUG - 处理后标记: ['<triplet>', '标 签', '<concept>', 'GGNN', '<misc>', 'part of']
|
||
2025-06-11 11:06:38,599 - DEBUG - 添加三元组: 标 签(concept) - part of - GGNN(misc)
|
||
2025-06-11 11:06:38,599 - DEBUG - 块 168 提取到 1 个三元组
|
||
2025-06-11 11:06:38,599 - DEBUG - 处理块 169/504: |V|×2|R|
|
||
表示图信
|
||
息 , 其中 V 为节点集合 , R 为关系集合 , A 表示节点
|
||
间的...
|
||
2025-06-11 11:06:39,014 - DEBUG - 块 169 生成文本: <triplet> 线性变换 <concept> <misc> 迭代得到图 <media> <eve> <unk> 图的图表 <loc> <dis> <org> <time></s>
|
||
2025-06-11 11:06:39,014 - DEBUG - 原始生成文本: <triplet> 线性变换 <concept> <misc> 迭代得到图 <media> <eve> <unk> 图的图表 <loc> <dis> <org> <time></s>
|
||
2025-06-11 11:06:39,014 - DEBUG - 处理后标记: ['<triplet>', '线性变换', '<concept>', '<misc>', '迭代得到图', '<media>', '<eve>', '<unk>', '图的图表', '<loc>', '<dis>', '<org>', '<time>']
|
||
2025-06-11 11:06:39,014 - DEBUG - 处理块 170/504: 节点向量表示 , 将结果输入全连接层及线性整流函
|
||
数 ( rectified linear unit...
|
||
2025-06-11 11:06:39,719 - DEBUG - 块 170 生成文本: <triplet> 全连接层及线性整流函 数 <concept> 向量表示 vg <misc> 节点 <media> 余弦相似度分析得到最优语义查询图 <eve> 查询语句 <org> is a list of</s>
|
||
2025-06-11 11:06:39,719 - DEBUG - 原始生成文本: <triplet> 全连接层及线性整流函 数 <concept> 向量表示 vg <misc> 节点 <media> 余弦相似度分析得到最优语义查询图 <eve> 查询语句 <org> is a list of</s>
|
||
2025-06-11 11:06:39,719 - DEBUG - 处理后标记: ['<triplet>', '全连接层及线性整流函 数', '<concept>', '向量表示 vg', '<misc>', '节点', '<media>', '余弦相似度分析得到最优语义查询图', '<eve>', '查询语句', '<org>', 'is a list of']
|
||
2025-06-11 11:06:39,719 - DEBUG - 添加三元组: 全连接层及线性整流函 数(concept) - 节点 - 向量表示 vg(misc)
|
||
2025-06-11 11:06:39,719 - DEBUG - 块 170 提取到 1 个三元组
|
||
2025-06-11 11:06:39,719 - DEBUG - 处理块 171/504: Xu 等人
|
||
[91]
|
||
在编码端进行改进 , 同时结合问题的
|
||
词序 、 依存句法以及成分句法的分析结果...
|
||
2025-06-11 11:06:40,446 - DEBUG - 块 171 生成文本: <triplet> 词序 <concept> 成分句法 <misc> <media> <org> 编码端 <eve> CNN Ó‡É䉯„„ <per> <loc> part of CNN ̋...20 <dis> <date> indigenous to</s>
|
||
2025-06-11 11:06:40,447 - DEBUG - 原始生成文本: <triplet> 词序 <concept> 成分句法 <misc> <media> <org> 编码端 <eve> CNN Ó‡É䉯„„ <per> <loc> part of CNN ̋...20 <dis> <date> indigenous to</s>
|
||
2025-06-11 11:06:40,447 - DEBUG - 处理后标记: ['<triplet>', '词序', '<concept>', '成分句法', '<misc>', '<media>', '<org>', '编码端', '<eve>', 'CNN Ó‡É䉯„„', '<per>', '<loc>', 'part of CNN ̋...20', '<dis>', '<date>', 'indigenous to']
|
||
2025-06-11 11:06:40,447 - DEBUG - 添加三元组: 词序(concept) - <media> - 成分句法(misc)
|
||
2025-06-11 11:06:40,447 - DEBUG - 块 171 提取到 1 个三元组
|
||
2025-06-11 11:06:40,447 - DEBUG - 处理块 172/504: Fig.21 Representation of label vector
|
||
˝…21 –Œ˙'·˚ˇ...
|
||
2025-06-11 11:06:40,810 - DEBUG - 块 172 生成文本: <triplet> القضايا <concept> 1855 <date> point in time</s>
|
||
2025-06-11 11:06:40,810 - DEBUG - 原始生成文本: <triplet> القضايا <concept> 1855 <date> point in time</s>
|
||
2025-06-11 11:06:40,810 - DEBUG - 处理后标记: ['<triplet>', 'القضايا', '<concept>', '1855', '<date>', 'point in time']
|
||
2025-06-11 11:06:40,810 - DEBUG - 添加三元组: القضايا(concept) - point in time - 1855(date)
|
||
2025-06-11 11:06:40,810 - DEBUG - 块 172 提取到 1 个三元组
|
||
2025-06-11 11:06:40,810 - DEBUG - 处理块 173/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:06:41,514 - DEBUG - 块 173 生成文本: <triplet> 剪枝 +集束搜索 <concept> 控 制查询图的生成过程 <media> 复杂多约束 <misc> 多关系问 题 <unk> <eve> 计算机科学与探索 <org> part of</s>
|
||
2025-06-11 11:06:41,514 - DEBUG - 原始生成文本: <triplet> 剪枝 +集束搜索 <concept> 控 制查询图的生成过程 <media> 复杂多约束 <misc> 多关系问 题 <unk> <eve> 计算机科学与探索 <org> part of</s>
|
||
2025-06-11 11:06:41,514 - DEBUG - 处理后标记: ['<triplet>', '剪枝 +集束搜索', '<concept>', '控 制查询图的生成过程', '<media>', '复杂多约束', '<misc>', '多关系问 题', '<unk>', '<eve>', '计算机科学与探索', '<org>', 'part of']
|
||
2025-06-11 11:06:41,514 - DEBUG - 添加三元组: 剪枝 +集束搜索(concept) - 复杂多约束 - 控 制查询图的生成过程(media)
|
||
2025-06-11 11:06:41,514 - DEBUG - 块 173 提取到 1 个三元组
|
||
2025-06-11 11:06:41,514 - DEBUG - 处理块 174/504: 对于单关系多约束问题 ,在查询图生成阶段 ,每
|
||
获得一个约束就对应进行图剪枝操作 ;对于复杂多
|
||
关系...
|
||
2025-06-11 11:06:42,079 - DEBUG - 块 174 生成文本: <triplet> 集束搜索 <concept> 信息检索 <media> 神经网络模型完成候选答案 <unk> <misc> <eve> 单关系多约束 <per> <org> 关系 <dis> <cel> part of</s>
|
||
2025-06-11 11:06:42,080 - DEBUG - 原始生成文本: <triplet> 集束搜索 <concept> 信息检索 <media> 神经网络模型完成候选答案 <unk> <misc> <eve> 单关系多约束 <per> <org> 关系 <dis> <cel> part of</s>
|
||
2025-06-11 11:06:42,080 - DEBUG - 处理后标记: ['<triplet>', '集束搜索', '<concept>', '信息检索', '<media>', '神经网络模型完成候选答案', '<unk>', '<misc>', '<eve>', '单关系多约束', '<per>', '<org>', '关系', '<dis>', '<cel>', 'part of']
|
||
2025-06-11 11:06:42,080 - DEBUG - 添加三元组: 集束搜索(concept) - 神经网络模型完成候选答案 - 信息检索(media)
|
||
2025-06-11 11:06:42,080 - DEBUG - 块 174 提取到 1 个三元组
|
||
2025-06-11 11:06:42,080 - DEBUG - 处理块 175/504: 排序和关系匹配,或使用外部知识完成候选答案排序。
|
||
3.5.1 神经网络 +候选排序
|
||
传统信息检索方法...
|
||
2025-06-11 11:06:42,754 - DEBUG - 块 175 生成文本: <triplet> 神经网络 +候选排序 <concept> 信息检索主题实体 <misc> 系统 <media> MCCNNs <org> <eve> 系统的 <unk> <loc> <per> 编号 <dis> <cel> part of</s>
|
||
2025-06-11 11:06:42,754 - DEBUG - 原始生成文本: <triplet> 神经网络 +候选排序 <concept> 信息检索主题实体 <misc> 系统 <media> MCCNNs <org> <eve> 系统的 <unk> <loc> <per> 编号 <dis> <cel> part of</s>
|
||
2025-06-11 11:06:42,754 - DEBUG - 处理后标记: ['<triplet>', '神经网络 +候选排序', '<concept>', '信息检索主题实体', '<misc>', '系统', '<media>', 'MCCNNs', '<org>', '<eve>', '系统的', '<unk>', '<loc>', '<per>', '编号', '<dis>', '<cel>', 'part of']
|
||
2025-06-11 11:06:42,754 - DEBUG - 添加三元组: 神经网络 +候选排序(concept) - 系统 - 信息检索主题实体(misc)
|
||
2025-06-11 11:06:42,754 - DEBUG - 块 175 提取到 1 个三元组
|
||
2025-06-11 11:06:42,754 - DEBUG - 处理块 176/504: 使用 MCCNN 卷积
|
||
得到问题答案路径 、类型、上下文 3 类特征,并学习候
|
||
选答案的嵌入向量表示...
|
||
2025-06-11 11:06:43,053 - DEBUG - 块 176 生成文本: <triplet> 卷积 <concept> MCCNN <media> part of</s>
|
||
2025-06-11 11:06:43,053 - DEBUG - 原始生成文本: <triplet> 卷积 <concept> MCCNN <media> part of</s>
|
||
2025-06-11 11:06:43,053 - DEBUG - 处理后标记: ['<triplet>', '卷积', '<concept>', 'MCCNN', '<media>', 'part of']
|
||
2025-06-11 11:06:43,053 - DEBUG - 添加三元组: 卷积(concept) - part of - MCCNN(media)
|
||
2025-06-11 11:06:43,053 - DEBUG - 块 176 提取到 1 个三元组
|
||
2025-06-11 11:06:43,053 - DEBUG - 处理块 177/504: 3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
...
|
||
2025-06-11 11:06:43,606 - DEBUG - 块 177 生成文本: <triplet> 关系 <concept> 单词两级表示 <misc> BiLSTM <media> based on</s>
|
||
2025-06-11 11:06:43,606 - DEBUG - 原始生成文本: <triplet> 关系 <concept> 单词两级表示 <misc> BiLSTM <media> based on</s>
|
||
2025-06-11 11:06:43,606 - DEBUG - 处理后标记: ['<triplet>', '关系', '<concept>', '单词两级表示', '<misc>', 'BiLSTM', '<media>', 'based on']
|
||
2025-06-11 11:06:43,606 - DEBUG - 添加三元组: 关系(concept) - BiLSTM - 单词两级表示(misc)
|
||
2025-06-11 11:06:43,606 - DEBUG - 块 177 提取到 1 个三元组
|
||
2025-06-11 11:06:43,606 - DEBUG - 处理块 178/504: 评测深度学习与传统方
|
||
法的效果差异 ,探寻深度学习对 KGQA 的有效贡献 ,
|
||
关注简单问题的回答 ...
|
||
2025-06-11 11:06:44,118 - DEBUG - 块 178 生成文本: <triplet> 评测深度学习与传统方 法的效果差异 <concept> KGQA <org> <media> 系统整体流程 <eve> 图 22 <misc> 描述 <triplet> SimpleQuestions <per> 传统 <time> time period</s>
|
||
2025-06-11 11:06:44,118 - DEBUG - 原始生成文本: <triplet> 评测深度学习与传统方 法的效果差异 <concept> KGQA <org> <media> 系统整体流程 <eve> 图 22 <misc> 描述 <triplet> SimpleQuestions <per> 传统 <time> time period</s>
|
||
2025-06-11 11:06:44,118 - DEBUG - 处理后标记: ['<triplet>', '评测深度学习与传统方 法的效果差异', '<concept>', 'KGQA', '<org>', '<media>', '系统整体流程', '<eve>', '图 22', '<misc>', '描述', '<triplet>', 'SimpleQuestions', '<per>', '传统', '<time>', 'time period']
|
||
2025-06-11 11:06:44,118 - DEBUG - 添加三元组: 评测深度学习与传统方 法的效果差异(concept) - <media> - KGQA(org)
|
||
2025-06-11 11:06:44,118 - DEBUG - 添加三元组: SimpleQuestions(per) - time period - 传统(time)
|
||
2025-06-11 11:06:44,118 - DEBUG - 块 178 提取到 2 个三元组
|
||
2025-06-11 11:06:44,118 - DEBUG - 处理块 179/504: 实体检测环节,BiLSTM 与条件随机场(conditional
|
||
random fields,CRF...
|
||
2025-06-11 11:06:44,470 - DEBUG - 块 179 生成文本: <triplet> 实体检测环节 <concept> BiLSTM <media> part of</s>
|
||
2025-06-11 11:06:44,470 - DEBUG - 原始生成文本: <triplet> 实体检测环节 <concept> BiLSTM <media> part of</s>
|
||
2025-06-11 11:06:44,470 - DEBUG - 处理后标记: ['<triplet>', '实体检测环节', '<concept>', 'BiLSTM', '<media>', 'part of']
|
||
2025-06-11 11:06:44,470 - DEBUG - 添加三元组: 实体检测环节(concept) - part of - BiLSTM(media)
|
||
2025-06-11 11:06:44,470 - DEBUG - 块 179 提取到 1 个三元组
|
||
2025-06-11 11:06:44,470 - DEBUG - 处理块 180/504: 回归(logical regression ,LR)的 R@1 分别为 82.3% 、
|
||
82.8%和...
|
||
2025-06-11 11:06:44,778 - DEBUG - 块 180 生成文本: <triplet> 回归 <concept> R@1 <misc> studies</s>
|
||
2025-06-11 11:06:44,778 - DEBUG - 原始生成文本: <triplet> 回归 <concept> R@1 <misc> studies</s>
|
||
2025-06-11 11:06:44,778 - DEBUG - 处理后标记: ['<triplet>', '回归', '<concept>', 'R@1', '<misc>', 'studies']
|
||
2025-06-11 11:06:44,778 - DEBUG - 添加三元组: 回归(concept) - studies - R@1(misc)
|
||
2025-06-11 11:06:44,778 - DEBUG - 块 180 提取到 1 个三元组
|
||
2025-06-11 11:06:44,778 - DEBUG - 处理块 181/504: 由上可知,对于简单问题的 KGQA 而言,传统规
|
||
则模板方法有能力取得与深度学习方法相近的准确
|
||
率,...
|
||
2025-06-11 11:06:44,916 - DEBUG - 块 181 生成文本: <triplet> <concept> MCCNN <media> part of</s>
|
||
2025-06-11 11:06:44,917 - DEBUG - 原始生成文本: <triplet> <concept> MCCNN <media> part of</s>
|
||
2025-06-11 11:06:44,917 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'MCCNN', '<media>', 'part of']
|
||
2025-06-11 11:06:44,917 - DEBUG - 处理块 182/504: 结合主题实体对应的维基百科
|
||
(Wikipedia)页面信息 ,过滤系统返回的不正确答案 ;
|
||
Talm...
|
||
2025-06-11 11:06:45,385 - DEBUG - 块 182 生成文本: <triplet> 题语义 <concept> 计算树 <misc> 分析问 <media> Talmor <per> author</s>
|
||
2025-06-11 11:06:45,385 - DEBUG - 原始生成文本: <triplet> 题语义 <concept> 计算树 <misc> 分析问 <media> Talmor <per> author</s>
|
||
2025-06-11 11:06:45,385 - DEBUG - 处理后标记: ['<triplet>', '题语义', '<concept>', '计算树', '<misc>', '分析问', '<media>', 'Talmor', '<per>', 'author']
|
||
2025-06-11 11:06:45,385 - DEBUG - 添加三元组: 题语义(concept) - 分析问 - 计算树(misc)
|
||
2025-06-11 11:06:45,385 - DEBUG - 块 182 提取到 1 个三元组
|
||
2025-06-11 11:06:45,385 - DEBUG - 处理块 183/504: GRAFTNet 系统
|
||
[37]
|
||
提出问题表示图 ,用
|
||
于确定答案在 KG 与文本数据中的存在情况 ...
|
||
2025-06-11 11:06:45,842 - DEBUG - 块 183 生成文本: <triplet> 深度学习 <concept> GRAFTNet <media> part of</s>
|
||
2025-06-11 11:06:45,842 - DEBUG - 原始生成文本: <triplet> 深度学习 <concept> GRAFTNet <media> part of</s>
|
||
2025-06-11 11:06:45,842 - DEBUG - 处理后标记: ['<triplet>', '深度学习', '<concept>', 'GRAFTNet', '<media>', 'part of']
|
||
2025-06-11 11:06:45,842 - DEBUG - 添加三元组: 深度学习(concept) - part of - GRAFTNet(media)
|
||
2025-06-11 11:06:45,842 - DEBUG - 块 183 提取到 1 个三元组
|
||
2025-06-11 11:06:45,842 - DEBUG - 处理块 184/504: 实现简单问题问答性能的进一步提升 ,记忆网络结
|
||
构具有较大的扩展性 ;基于神经网络的语义解析与
|
||
信息...
|
||
2025-06-11 11:06:46,310 - DEBUG - 块 184 生成文本: <triplet> 语句 <concept> 信息检索方法 <media> 记忆网络 <misc> <unk> 神经网络的语义解析 <eve> 的方法 <org></s>
|
||
2025-06-11 11:06:46,310 - DEBUG - 原始生成文本: <triplet> 语句 <concept> 信息检索方法 <media> 记忆网络 <misc> <unk> 神经网络的语义解析 <eve> 的方法 <org></s>
|
||
2025-06-11 11:06:46,310 - DEBUG - 处理后标记: ['<triplet>', '语句', '<concept>', '信息检索方法', '<media>', '记忆网络', '<misc>', '<unk>', '神经网络的语义解析', '<eve>', '的方法', '<org>']
|
||
2025-06-11 11:06:46,310 - DEBUG - 添加三元组: 语句(concept) - 记忆网络 - 信息检索方法(media)
|
||
2025-06-11 11:06:46,310 - DEBUG - 块 184 提取到 1 个三元组
|
||
2025-06-11 11:06:46,311 - DEBUG - 处理块 185/504: 基于神经网络的查询图目前为较理想
|
||
的方法,可同时处理简单问题与复杂问题 ,但其在搜
|
||
索空间的缩减方面...
|
||
2025-06-11 11:06:46,961 - DEBUG - 块 185 生成文本: <triplet> 知识图谱 <concept> 神经网络的查询图 <media> <misc> 基于 <unk> ଊ ጊ <per> <triplet> Fig.22 Evaluation flow ̋...22 ̆À†â`÷‡Ì 1856 <dis> <date> point in time</s>
|
||
2025-06-11 11:06:46,961 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 神经网络的查询图 <media> <misc> 基于 <unk> ଊ ጊ <per> <triplet> Fig.22 Evaluation flow ̋...22 ̆À†â`÷‡Ì 1856 <dis> <date> point in time</s>
|
||
2025-06-11 11:06:46,961 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '神经网络的查询图', '<media>', '<misc>', '基于', '<unk>', 'ଊ ጊ', '<per>', '<triplet>', 'Fig.22 Evaluation flow ̋...22 ̆À†â`÷‡Ì 1856', '<dis>', '<date>', 'point in time']
|
||
2025-06-11 11:06:46,961 - DEBUG - 添加三元组: 知识图谱(concept) - <misc> - 神经网络的查询图(media)
|
||
2025-06-11 11:06:46,961 - DEBUG - 块 185 提取到 1 个三元组
|
||
2025-06-11 11:06:46,961 - DEBUG - 处理块 186/504: X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
Table ...
|
||
2025-06-11 11:06:47,355 - DEBUG - 块 186 生成文本: <triplet> 知识图谱 <concept> 记忆网络 <media> part of</s>
|
||
2025-06-11 11:06:47,355 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 记忆网络 <media> part of</s>
|
||
2025-06-11 11:06:47,355 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '记忆网络', '<media>', 'part of']
|
||
2025-06-11 11:06:47,355 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 记忆网络(media)
|
||
2025-06-11 11:06:47,355 - DEBUG - 块 186 提取到 1 个三元组
|
||
2025-06-11 11:06:47,355 - DEBUG - 处理块 187/504: 基于神经
|
||
网络的信
|
||
息检索
|
||
优点
|
||
无需使用任何人工定
|
||
义的特征参与运算
|
||
扩展组合性较强 ,可
|
||
灵活修...
|
||
2025-06-11 11:06:47,899 - DEBUG - 块 187 生成文本: <triplet> 信 息检索 <concept> 复杂多跳问题 <misc> instance of</s>
|
||
2025-06-11 11:06:47,899 - DEBUG - 原始生成文本: <triplet> 信 息检索 <concept> 复杂多跳问题 <misc> instance of</s>
|
||
2025-06-11 11:06:47,899 - DEBUG - 处理后标记: ['<triplet>', '信 息检索', '<concept>', '复杂多跳问题', '<misc>', 'instance of']
|
||
2025-06-11 11:06:47,899 - DEBUG - 添加三元组: 信 息检索(concept) - instance of - 复杂多跳问题(misc)
|
||
2025-06-11 11:06:47,899 - DEBUG - 块 187 提取到 1 个三元组
|
||
2025-06-11 11:06:47,899 - DEBUG - 处理块 188/504: 处理能力较低
|
||
对复杂多限制
|
||
问题的处理能
|
||
力较弱
|
||
剪枝缩小搜索
|
||
空 间 技 术 欠
|
||
佳,待排序的
|
||
结...
|
||
2025-06-11 11:06:48,217 - DEBUG - 块 188 生成文本: <triplet> 神经网络模块 <concept> 知识图谱嵌入 相似度 <unk> 记忆模块+知识 <misc> part of</s>
|
||
2025-06-11 11:06:48,218 - DEBUG - 原始生成文本: <triplet> 神经网络模块 <concept> 知识图谱嵌入 相似度 <unk> 记忆模块+知识 <misc> part of</s>
|
||
2025-06-11 11:06:48,218 - DEBUG - 处理后标记: ['<triplet>', '神经网络模块', '<concept>', '知识图谱嵌入 相似度', '<unk>', '记忆模块+知识', '<misc>', 'part of']
|
||
2025-06-11 11:06:48,218 - DEBUG - 添加三元组: 神经网络模块(concept) - 记忆模块+知识 - 知识图谱嵌入 相似度(unk)
|
||
2025-06-11 11:06:48,218 - DEBUG - 块 188 提取到 1 个三元组
|
||
2025-06-11 11:06:48,218 - DEBUG - 处理块 189/504: 神经网络+答案
|
||
特征
|
||
神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+...
|
||
2025-06-11 11:06:48,398 - DEBUG - 块 189 生成文本: <triplet> 关系 <concept> 神经网络 <media> part of</s>
|
||
2025-06-11 11:06:48,398 - DEBUG - 原始生成文本: <triplet> 关系 <concept> 神经网络 <media> part of</s>
|
||
2025-06-11 11:06:48,398 - DEBUG - 处理后标记: ['<triplet>', '关系', '<concept>', '神经网络', '<media>', 'part of']
|
||
2025-06-11 11:06:48,398 - DEBUG - 添加三元组: 关系(concept) - part of - 神经网络(media)
|
||
2025-06-11 11:06:48,398 - DEBUG - 块 189 提取到 1 个三元组
|
||
2025-06-11 11:06:48,398 - DEBUG - 处理块 190/504: [31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,...
|
||
2025-06-11 11:06:48,889 - DEBUG - 块 190 生成文本: <triplet> 知识图谱 <concept> 记忆组 件存储 KG <misc> <media> 存储 <unk> <loc> <org> 描述 <eve> <per> 函数 <dis> part of</s>
|
||
2025-06-11 11:06:48,889 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 记忆组 件存储 KG <misc> <media> 存储 <unk> <loc> <org> 描述 <eve> <per> 函数 <dis> part of</s>
|
||
2025-06-11 11:06:48,889 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '记忆组 件存储 KG', '<misc>', '<media>', '存储', '<unk>', '<loc>', '<org>', '描述', '<eve>', '<per>', '函数', '<dis>', 'part of']
|
||
2025-06-11 11:06:48,889 - DEBUG - 添加三元组: 知识图谱(concept) - <media> - 记忆组 件存储 KG(misc)
|
||
2025-06-11 11:06:48,889 - DEBUG - 块 190 提取到 1 个三元组
|
||
2025-06-11 11:06:48,889 - DEBUG - 处理块 191/504: 使用神经网络获得问题与候选答案的向量
|
||
表示,计算相似度
|
||
使用神经网络获得答案类型打分作为重要
|
||
排序依...
|
||
2025-06-11 11:06:49,101 - DEBUG - 块 191 生成文本: <triplet> 改写 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:06:49,101 - DEBUG - 原始生成文本: <triplet> 改写 <concept> KG <misc> part of</s>
|
||
2025-06-11 11:06:49,101 - DEBUG - 处理后标记: ['<triplet>', '改写', '<concept>', 'KG', '<misc>', 'part of']
|
||
2025-06-11 11:06:49,101 - DEBUG - 添加三元组: 改写(concept) - part of - KG(misc)
|
||
2025-06-11 11:06:49,101 - DEBUG - 块 191 提取到 1 个三元组
|
||
2025-06-11 11:06:49,101 - DEBUG - 处理块 192/504: 题组合出不同结构的神经网络模型用以解
|
||
析问题语义
|
||
使用神经网络表示候选关系 ,与问题做相似
|
||
度比较作...
|
||
2025-06-11 11:06:49,323 - DEBUG - 块 192 生成文本: <triplet> 语义查询图 <concept> 神经网络模型 <misc> part of</s>
|
||
2025-06-11 11:06:49,324 - DEBUG - 原始生成文本: <triplet> 语义查询图 <concept> 神经网络模型 <misc> part of</s>
|
||
2025-06-11 11:06:49,324 - DEBUG - 处理后标记: ['<triplet>', '语义查询图', '<concept>', '神经网络模型', '<misc>', 'part of']
|
||
2025-06-11 11:06:49,324 - DEBUG - 添加三元组: 语义查询图(concept) - part of - 神经网络模型(misc)
|
||
2025-06-11 11:06:49,324 - DEBUG - 块 192 提取到 1 个三元组
|
||
2025-06-11 11:06:49,324 - DEBUG - 处理块 193/504: 同神经网络 +知识图谱嵌入方法 ,但直接返
|
||
回最佳答案
|
||
同神经网络 +答案特征方法 ,但直接返回最
|
||
...
|
||
2025-06-11 11:06:49,984 - DEBUG - 块 193 生成文本: <triplet> 同神经网络 +知识图谱嵌入方法 <concept> 答案特征 <misc> instance of</s>
|
||
2025-06-11 11:06:49,984 - DEBUG - 原始生成文本: <triplet> 同神经网络 +知识图谱嵌入方法 <concept> 答案特征 <misc> instance of</s>
|
||
2025-06-11 11:06:49,984 - DEBUG - 处理后标记: ['<triplet>', '同神经网络 +知识图谱嵌入方法', '<concept>', '答案特征', '<misc>', 'instance of']
|
||
2025-06-11 11:06:49,984 - DEBUG - 添加三元组: 同神经网络 +知识图谱嵌入方法(concept) - instance of - 答案特征(misc)
|
||
2025-06-11 11:06:49,984 - DEBUG - 块 193 提取到 1 个三元组
|
||
2025-06-11 11:06:49,984 - DEBUG - 处理块 194/504: 表 4 开放领域知识图谱问答方法总结
|
||
类型
|
||
基于规则模
|
||
板的方法
|
||
基于深度学
|
||
习的方法
|
||
名称
|
||
传统语...
|
||
2025-06-11 11:06:50,516 - DEBUG - 块 194 生成文本: <triplet> 基于规则模 板的方法 <concept> 传统信息检索 三元组匹配 <media> 知识图谱问答方法总结 类型 <org> 开放领域 <loc> facet of</s>
|
||
2025-06-11 11:06:50,516 - DEBUG - 原始生成文本: <triplet> 基于规则模 板的方法 <concept> 传统信息检索 三元组匹配 <media> 知识图谱问答方法总结 类型 <org> 开放领域 <loc> facet of</s>
|
||
2025-06-11 11:06:50,516 - DEBUG - 处理后标记: ['<triplet>', '基于规则模 板的方法', '<concept>', '传统信息检索 三元组匹配', '<media>', '知识图谱问答方法总结 类型', '<org>', '开放领域', '<loc>', 'facet of']
|
||
2025-06-11 11:06:50,516 - DEBUG - 添加三元组: 基于规则模 板的方法(concept) - 知识图谱问答方法总结 类型 - 传统信息检索 三元组匹配(media)
|
||
2025-06-11 11:06:50,516 - DEBUG - 块 194 提取到 1 个三元组
|
||
2025-06-11 11:06:50,516 - DEBUG - 处理块 195/504: [20,71]
|
||
[22,55-62]
|
||
[18,26,34,63-66,72-74]
|
||
[25,67]
|
||
...
|
||
2025-06-11 11:06:50,941 - DEBUG - 块 195 生成文本: <triplet> <org> <concept> instance of <triplet> 42 <media> <per> <eve> <unk> <time> <date> point in time <misc> <loc> <dis> <cel> cyclist</s>
|
||
2025-06-11 11:06:50,941 - DEBUG - 原始生成文本: <triplet> <org> <concept> instance of <triplet> 42 <media> <per> <eve> <unk> <time> <date> point in time <misc> <loc> <dis> <cel> cyclist</s>
|
||
2025-06-11 11:06:50,941 - DEBUG - 处理后标记: ['<triplet>', '<org>', '<concept>', 'instance of', '<triplet>', '42', '<media>', '<per>', '<eve>', '<unk>', '<time>', '<date>', 'point in time', '<misc>', '<loc>', '<dis>', '<cel>', 'cyclist']
|
||
2025-06-11 11:06:50,941 - DEBUG - 添加三元组: <org>(concept) - 42 - instance of(triplet)
|
||
2025-06-11 11:06:50,941 - DEBUG - 块 195 提取到 1 个三元组
|
||
2025-06-11 11:06:50,941 - DEBUG - 处理块 196/504: [28-29,35,37-38,92-94,97-101]
|
||
描述
|
||
同时完成结构和词汇到 KG 的映射...
|
||
2025-06-11 11:06:51,122 - DEBUG - 块 196 生成文本: <triplet> 实体关系 <concept> KG 映射 <misc> part of</s>
|
||
2025-06-11 11:06:51,122 - DEBUG - 原始生成文本: <triplet> 实体关系 <concept> KG 映射 <misc> part of</s>
|
||
2025-06-11 11:06:51,122 - DEBUG - 处理后标记: ['<triplet>', '实体关系', '<concept>', 'KG 映射', '<misc>', 'part of']
|
||
2025-06-11 11:06:51,122 - DEBUG - 添加三元组: 实体关系(concept) - part of - KG 映射(misc)
|
||
2025-06-11 11:06:51,122 - DEBUG - 块 196 提取到 1 个三元组
|
||
2025-06-11 11:06:51,122 - DEBUG - 处理块 197/504: 通过问题与答案的嵌入表示 ,获得答案打分
|
||
以知识图谱嵌入为基础 ,引入记忆模块存储 KG
|
||
使用神经网...
|
||
2025-06-11 11:06:51,472 - DEBUG - 块 197 生成文本: <triplet> 消息检索 <concept> 神经网络完成查询 <misc> <media> <unk> <org> <per> <eve> 系统 <loc> <triplet></s>
|
||
2025-06-11 11:06:51,473 - DEBUG - 原始生成文本: <triplet> 消息检索 <concept> 神经网络完成查询 <misc> <media> <unk> <org> <per> <eve> 系统 <loc> <triplet></s>
|
||
2025-06-11 11:06:51,473 - DEBUG - 处理后标记: ['<triplet>', '消息检索', '<concept>', '神经网络完成查询', '<misc>', '<media>', '<unk>', '<org>', '<per>', '<eve>', '系统', '<loc>', '<triplet>']
|
||
2025-06-11 11:06:51,473 - DEBUG - 添加三元组: 消息检索(concept) - <media> - 神经网络完成查询(misc)
|
||
2025-06-11 11:06:51,473 - DEBUG - 块 197 提取到 1 个三元组
|
||
2025-06-11 11:06:51,473 - DEBUG - 处理块 198/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:06:51,674 - DEBUG - 块 198 生成文本: <triplet> 通用领 域知识图谱 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:06:51,674 - DEBUG - 原始生成文本: <triplet> 通用领 域知识图谱 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:06:51,674 - DEBUG - 处理后标记: ['<triplet>', '通用领 域知识图谱', '<concept>', 'KGQA', '<media>', 'part of']
|
||
2025-06-11 11:06:51,674 - DEBUG - 添加三元组: 通用领 域知识图谱(concept) - part of - KGQA(media)
|
||
2025-06-11 11:06:51,674 - DEBUG - 块 198 提取到 1 个三元组
|
||
2025-06-11 11:06:51,674 - DEBUG - 处理块 199/504: 的信息构建而成的开放领域问答数 据集。
|
||
4.1 通用领域知识图谱
|
||
通用领域知识图谱作为问答系统的信息...
|
||
2025-06-11 11:06:52,057 - DEBUG - 块 199 生成文本: <triplet> 通用领域知识图谱 <concept> 大规模数 <unk> 分布式 <misc> part of the series <triplet> Freebase <media> 开放 <per> instance of</s>
|
||
2025-06-11 11:06:52,057 - DEBUG - 原始生成文本: <triplet> 通用领域知识图谱 <concept> 大规模数 <unk> 分布式 <misc> part of the series <triplet> Freebase <media> 开放 <per> instance of</s>
|
||
2025-06-11 11:06:52,057 - DEBUG - 处理后标记: ['<triplet>', '通用领域知识图谱', '<concept>', '大规模数', '<unk>', '分布式', '<misc>', 'part of the series', '<triplet>', 'Freebase', '<media>', '开放', '<per>', 'instance of']
|
||
2025-06-11 11:06:52,058 - DEBUG - 添加三元组: 通用领域知识图谱(concept) - 分布式 - 大规模数(unk)
|
||
2025-06-11 11:06:52,058 - DEBUG - 添加三元组: Freebase(media) - instance of - 开放(per)
|
||
2025-06-11 11:06:52,058 - DEBUG - 块 199 提取到 2 个三元组
|
||
2025-06-11 11:06:52,058 - DEBUG - 处理块 200/504: 据库,基于 RDF 三元组模型构建并采用图数据库进
|
||
行底层存储 。其知识表示框架主要包含对象 、事实...
|
||
2025-06-11 11:06:52,238 - DEBUG - 块 200 生成文本: <triplet> 多领域知识本体 <concept> DBpedia <media> described by source</s>
|
||
2025-06-11 11:06:52,238 - DEBUG - 原始生成文本: <triplet> 多领域知识本体 <concept> DBpedia <media> described by source</s>
|
||
2025-06-11 11:06:52,238 - DEBUG - 处理后标记: ['<triplet>', '多领域知识本体', '<concept>', 'DBpedia', '<media>', 'described by source']
|
||
2025-06-11 11:06:52,238 - DEBUG - 添加三元组: 多领域知识本体(concept) - described by source - DBpedia(media)
|
||
2025-06-11 11:06:52,238 - DEBUG - 块 200 提取到 1 个三元组
|
||
2025-06-11 11:06:52,238 - DEBUG - 处理块 201/504: 也是语义网应用的一个典型范例 。它从维基百科词
|
||
条中提取结构化资源 ,增强维基百科搜寻功能 ,并将
|
||
...
|
||
2025-06-11 11:06:52,663 - DEBUG - 块 201 生成文本: <triplet> 维基百科 <media> 数据库 <concept> instance of</s>
|
||
2025-06-11 11:06:52,663 - DEBUG - 原始生成文本: <triplet> 维基百科 <media> 数据库 <concept> instance of</s>
|
||
2025-06-11 11:06:52,663 - DEBUG - 处理后标记: ['<triplet>', '维基百科', '<media>', '数据库', '<concept>', 'instance of']
|
||
2025-06-11 11:06:52,663 - DEBUG - 添加三元组: 维基百科(media) - instance of - 数据库(concept)
|
||
2025-06-11 11:06:52,663 - DEBUG - 块 201 提取到 1 个三元组
|
||
2025-06-11 11:06:52,663 - DEBUG - 处理块 202/504: 维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接...
|
||
2025-06-11 11:06:52,854 - DEBUG - 块 202 生成文本: <triplet> 维基百科 <media> 多语 <concept> language of work or name</s>
|
||
2025-06-11 11:06:52,855 - DEBUG - 原始生成文本: <triplet> 维基百科 <media> 多语 <concept> language of work or name</s>
|
||
2025-06-11 11:06:52,855 - DEBUG - 处理后标记: ['<triplet>', '维基百科', '<media>', '多语', '<concept>', 'language of work or name']
|
||
2025-06-11 11:06:52,855 - DEBUG - 添加三元组: 维基百科(media) - language of work or name - 多语(concept)
|
||
2025-06-11 11:06:52,855 - DEBUG - 块 202 提取到 1 个三元组
|
||
2025-06-11 11:06:52,855 - DEBUG - 处理块 203/504: 言、任何人或机器都可以编辑修改的大规模链接知
|
||
识图谱。Wikidata 起源于维基百科 ,已作为维基...
|
||
2025-06-11 11:06:53,141 - DEBUG - 块 203 生成文本: <triplet> 知识图谱 <concept> Wikidata <media> part of</s>
|
||
2025-06-11 11:06:53,141 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> Wikidata <media> part of</s>
|
||
2025-06-11 11:06:53,141 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', 'Wikidata', '<media>', 'part of']
|
||
2025-06-11 11:06:53,141 - DEBUG - 添加三元组: 知识图谱(concept) - part of - Wikidata(media)
|
||
2025-06-11 11:06:53,141 - DEBUG - 块 203 提取到 1 个三元组
|
||
2025-06-11 11:06:53,142 - DEBUG - 处理块 204/504: 发展而不断被开发 ,数据集间的比较如表 5 所示。
|
||
Free917
|
||
[50]
|
||
的问题类型没有限制 ,...
|
||
2025-06-11 11:06:53,290 - DEBUG - 块 204 生成文本: <triplet> 属性 <concept> 自然语言 <media> part of</s>
|
||
2025-06-11 11:06:53,291 - DEBUG - 原始生成文本: <triplet> 属性 <concept> 自然语言 <media> part of</s>
|
||
2025-06-11 11:06:53,291 - DEBUG - 处理后标记: ['<triplet>', '属性', '<concept>', '自然语言', '<media>', 'part of']
|
||
2025-06-11 11:06:53,291 - DEBUG - 添加三元组: 属性(concept) - part of - 自然语言(media)
|
||
2025-06-11 11:06:53,291 - DEBUG - 块 204 提取到 1 个三元组
|
||
2025-06-11 11:06:53,291 - DEBUG - 处理块 205/504: WebQuestions 使用Google Suggest API随机获取
|
||
以Wh 疑问词开头并仅含...
|
||
2025-06-11 11:06:53,418 - DEBUG - 块 205 生成文本: <triplet> <concept> WebQuestions <media> used by</s>
|
||
2025-06-11 11:06:53,418 - DEBUG - 原始生成文本: <triplet> <concept> WebQuestions <media> used by</s>
|
||
2025-06-11 11:06:53,418 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'WebQuestions', '<media>', 'used by']
|
||
2025-06-11 11:06:53,418 - DEBUG - 处理块 206/504: 构建流程 ,该数据集的问题完全独立于 Freebase ,相
|
||
比Free917 更加自然多样化 ,但...
|
||
2025-06-11 11:06:53,587 - DEBUG - 块 206 生成文本: <triplet> 统一资源标志符 <concept> SimpleQuestions <media> based on</s>
|
||
2025-06-11 11:06:53,588 - DEBUG - 原始生成文本: <triplet> 统一资源标志符 <concept> SimpleQuestions <media> based on</s>
|
||
2025-06-11 11:06:53,588 - DEBUG - 处理后标记: ['<triplet>', '统一资源标志符', '<concept>', 'SimpleQuestions', '<media>', 'based on']
|
||
2025-06-11 11:06:53,588 - DEBUG - 添加三元组: 统一资源标志符(concept) - based on - SimpleQuestions(media)
|
||
2025-06-11 11:06:53,588 - DEBUG - 块 206 提取到 1 个三元组
|
||
2025-06-11 11:06:53,588 - DEBUG - 处理块 207/504: (uniform resource identifier,URI)标识 ,数据形式为
|
||
(主语 URI...
|
||
2025-06-11 11:06:53,715 - DEBUG - 块 207 生成文本: <triplet> <misc> 标识 <concept> instance of</s>
|
||
2025-06-11 11:06:53,715 - DEBUG - 原始生成文本: <triplet> <misc> 标识 <concept> instance of</s>
|
||
2025-06-11 11:06:53,715 - DEBUG - 处理后标记: ['<triplet>', '<misc>', '标识', '<concept>', 'instance of']
|
||
2025-06-11 11:06:53,715 - DEBUG - 处理块 208/504: 以SimpleQuestions 作为训练
|
||
数据,将Freebase 中的三元组通过神经网络模型自动...
|
||
2025-06-11 11:06:53,917 - DEBUG - 块 208 生成文本: <triplet> 关系URI <concept> ComplexQuestions <media> part of</s>
|
||
2025-06-11 11:06:53,917 - DEBUG - 原始生成文本: <triplet> 关系URI <concept> ComplexQuestions <media> part of</s>
|
||
2025-06-11 11:06:53,917 - DEBUG - 处理后标记: ['<triplet>', '关系URI', '<concept>', 'ComplexQuestions', '<media>', 'part of']
|
||
2025-06-11 11:06:53,917 - DEBUG - 添加三元组: 关系URI(concept) - part of - ComplexQuestions(media)
|
||
2025-06-11 11:06:53,917 - DEBUG - 块 208 提取到 1 个三元组
|
||
2025-06-11 11:06:53,917 - DEBUG - 处理块 209/504: [105]
|
||
的目标是构建一个多限制
|
||
问题数据集 ,测试 KGQA 系统在复杂多限制问题上
|
||
Table...
|
||
2025-06-11 11:06:54,044 - DEBUG - 块 209 生成文本: <triplet> <concept> KGQA 系统 <org> manufacturer</s>
|
||
2025-06-11 11:06:54,044 - DEBUG - 原始生成文本: <triplet> <concept> KGQA 系统 <org> manufacturer</s>
|
||
2025-06-11 11:06:54,044 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'KGQA 系统', '<org>', 'manufacturer']
|
||
2025-06-11 11:06:54,044 - DEBUG - 处理块 210/504: DBpedia+Wikidata
|
||
提供答案
|
||
否
|
||
是
|
||
是
|
||
否
|
||
数据集
|
||
Free917
|
||
WebQuest...
|
||
2025-06-11 11:06:54,352 - DEBUG - 块 210 生成文本: <triplet> <media> DBpedia+Wikidata <concept> part of</s>
|
||
2025-06-11 11:06:54,352 - DEBUG - 原始生成文本: <triplet> <media> DBpedia+Wikidata <concept> part of</s>
|
||
2025-06-11 11:06:54,352 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'DBpedia+Wikidata', '<concept>', 'part of']
|
||
2025-06-11 11:06:54,352 - DEBUG - 处理块 211/504: GraphQuestions
|
||
PathQuestion
|
||
QALD
|
||
LC-QuAD
|
||
问题数
|
||
917
|
||
5...
|
||
2025-06-11 11:06:55,023 - DEBUG - 块 211 生成文本: <triplet> LC-QuAD <misc> GraphQuestions <media> part of the series <concept> <org> <per> <eve> <dis> <loc> <cel> <unk> QALD LB-Qad <time> facet of</s>
|
||
2025-06-11 11:06:55,023 - DEBUG - 原始生成文本: <triplet> LC-QuAD <misc> GraphQuestions <media> part of the series <concept> <org> <per> <eve> <dis> <loc> <cel> <unk> QALD LB-Qad <time> facet of</s>
|
||
2025-06-11 11:06:55,023 - DEBUG - 处理后标记: ['<triplet>', 'LC-QuAD', '<misc>', 'GraphQuestions', '<media>', 'part of the series', '<concept>', '<org>', '<per>', '<eve>', '<dis>', '<loc>', '<cel>', '<unk>', 'QALD LB-Qad', '<time>', 'facet of']
|
||
2025-06-11 11:06:55,023 - DEBUG - 添加三元组: LC-QuAD(misc) - part of the series - GraphQuestions(media)
|
||
2025-06-11 11:06:55,023 - DEBUG - 块 211 提取到 1 个三元组
|
||
2025-06-11 11:06:55,023 - DEBUG - 处理块 212/504: 三元组
|
||
无
|
||
SPARQL
|
||
SPARQL
|
||
SPARQL
|
||
路径
|
||
SPARQL
|
||
SPARQL
|
||
实体数
|
||
73...
|
||
2025-06-11 11:06:55,362 - DEBUG - 块 212 生成文本: <triplet> 实体数 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:06:55,362 - DEBUG - 原始生成文本: <triplet> 实体数 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:06:55,363 - DEBUG - 处理后标记: ['<triplet>', '实体数', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 11:06:55,363 - DEBUG - 添加三元组: 实体数(concept) - part of - 三元组(misc)
|
||
2025-06-11 11:06:55,363 - DEBUG - 块 212 提取到 1 个三元组
|
||
2025-06-11 11:06:55,363 - DEBUG - 处理块 213/504: 596
|
||
14
|
||
378
|
||
615~1 310
|
||
问题结构
|
||
简单
|
||
84%简单
|
||
[105]
|
||
简单
|
||
简单
|
||
复杂
|
||
...
|
||
2025-06-11 11:06:55,512 - DEBUG - 块 213 生成文本: <triplet> 陈子睿 <per> 高手 <concept> occupation</s>
|
||
2025-06-11 11:06:55,512 - DEBUG - 原始生成文本: <triplet> 陈子睿 <per> 高手 <concept> occupation</s>
|
||
2025-06-11 11:06:55,512 - DEBUG - 处理后标记: ['<triplet>', '陈子睿', '<per>', '高手', '<concept>', 'occupation']
|
||
2025-06-11 11:06:55,512 - DEBUG - 添加三元组: 陈子睿(per) - occupation - 高手(concept)
|
||
2025-06-11 11:06:55,512 - DEBUG - 块 213 提取到 1 个三元组
|
||
2025-06-11 11:06:55,512 - DEBUG - 处理块 214/504: 创建者分别从 WebQuestions 的训练集和测
|
||
试集选取 596 和 326 个问题 , 从...
|
||
2025-06-11 11:06:56,013 - DEBUG - 块 214 生成文本: <triplet> 测 试集 <media> WebQuestionsSP [107] 重新审视语义解析逻辑形式 <concept> <misc> 问 题 <org> subclass of</s>
|
||
2025-06-11 11:06:56,013 - DEBUG - 原始生成文本: <triplet> 测 试集 <media> WebQuestionsSP [107] 重新审视语义解析逻辑形式 <concept> <misc> 问 题 <org> subclass of</s>
|
||
2025-06-11 11:06:56,013 - DEBUG - 处理后标记: ['<triplet>', '测 试集', '<media>', 'WebQuestionsSP [107] 重新审视语义解析逻辑形式', '<concept>', '<misc>', '问 题', '<org>', 'subclass of']
|
||
2025-06-11 11:06:56,013 - DEBUG - 添加三元组: 测 试集(media) - <misc> - WebQuestionsSP [107] 重新审视语义解析逻辑形式(concept)
|
||
2025-06-11 11:06:56,013 - DEBUG - 块 214 提取到 1 个三元组
|
||
2025-06-11 11:06:56,013 - DEBUG - 处理块 215/504: 数据的价值 , 证明逻辑形式数据有助于 KGQA 性能
|
||
提升 , 并以 WebQuestions 数...
|
||
2025-06-11 11:06:56,225 - DEBUG - 块 215 生成文本: <triplet> 逻辑形式数据 <concept> WebQuestions <media> part of</s>
|
||
2025-06-11 11:06:56,225 - DEBUG - 原始生成文本: <triplet> 逻辑形式数据 <concept> WebQuestions <media> part of</s>
|
||
2025-06-11 11:06:56,226 - DEBUG - 处理后标记: ['<triplet>', '逻辑形式数据', '<concept>', 'WebQuestions', '<media>', 'part of']
|
||
2025-06-11 11:06:56,226 - DEBUG - 添加三元组: 逻辑形式数据(concept) - part of - WebQuestions(media)
|
||
2025-06-11 11:06:56,226 - DEBUG - 块 215 提取到 1 个三元组
|
||
2025-06-11 11:06:56,226 - DEBUG - 处理块 216/504: 从 WebQuestionsSP 数据
|
||
集中检索符合条件的 SPARQL 查询 , 据此自动创建
|
||
更...
|
||
2025-06-11 11:06:56,587 - DEBUG - 块 216 生成文本: <triplet> 查询 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:06:56,587 - DEBUG - 原始生成文本: <triplet> 查询 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:06:56,587 - DEBUG - 处理后标记: ['<triplet>', '查询', '<concept>', 'SPARQL', '<media>', 'part of']
|
||
2025-06-11 11:06:56,587 - DEBUG - 添加三元组: 查询(concept) - part of - SPARQL(media)
|
||
2025-06-11 11:06:56,587 - DEBUG - 块 216 提取到 1 个三元组
|
||
2025-06-11 11:06:56,587 - DEBUG - 处理块 217/504: 集 , 用于考察不同问题特征对问答过程的影响 。 问
|
||
题通过 KG 创建的多个查询模板生成对应查询图...
|
||
2025-06-11 11:06:56,810 - DEBUG - 块 217 生成文本: <triplet> 模板生成 <concept> KG <org> manufacturer</s>
|
||
2025-06-11 11:06:56,810 - DEBUG - 原始生成文本: <triplet> 模板生成 <concept> KG <org> manufacturer</s>
|
||
2025-06-11 11:06:56,811 - DEBUG - 处理后标记: ['<triplet>', '模板生成', '<concept>', 'KG', '<org>', 'manufacturer']
|
||
2025-06-11 11:06:56,811 - DEBUG - 添加三元组: 模板生成(concept) - manufacturer - KG(org)
|
||
2025-06-11 11:06:56,811 - DEBUG - 块 217 提取到 1 个三元组
|
||
2025-06-11 11:06:56,811 - DEBUG - 处理块 218/504: 为提高生成问题的多样性 , 构建者搜索互联网 、
|
||
WebQuestions 和 WikiAnswer...
|
||
2025-06-11 11:06:57,215 - DEBUG - 块 218 生成文本: <triplet> 模板生成 <concept> Freebase <media> part of</s>
|
||
2025-06-11 11:06:57,215 - DEBUG - 原始生成文本: <triplet> 模板生成 <concept> Freebase <media> part of</s>
|
||
2025-06-11 11:06:57,215 - DEBUG - 处理后标记: ['<triplet>', '模板生成', '<concept>', 'Freebase', '<media>', 'part of']
|
||
2025-06-11 11:06:57,215 - DEBUG - 添加三元组: 模板生成(concept) - part of - Freebase(media)
|
||
2025-06-11 11:06:57,215 - DEBUG - 块 218 提取到 1 个三元组
|
||
2025-06-11 11:06:57,215 - DEBUG - 处理块 219/504: 是 CLEF( Conference and Labs of the
|
||
Evaluation Foru...
|
||
2025-06-11 11:06:57,448 - DEBUG - 块 219 生成文本: <triplet> LC-QuAD <eve> Conference and Labs of the Evaluation Forum <org> organizer</s>
|
||
2025-06-11 11:06:57,448 - DEBUG - 原始生成文本: <triplet> LC-QuAD <eve> Conference and Labs of the Evaluation Forum <org> organizer</s>
|
||
2025-06-11 11:06:57,448 - DEBUG - 处理后标记: ['<triplet>', 'LC-QuAD', '<eve>', 'Conference and Labs of the Evaluation Forum', '<org>', 'organizer']
|
||
2025-06-11 11:06:57,448 - DEBUG - 添加三元组: LC-QuAD(eve) - organizer - Conference and Labs of the Evaluation Forum(org)
|
||
2025-06-11 11:06:57,448 - DEBUG - 块 219 提取到 1 个三元组
|
||
2025-06-11 11:06:57,448 - DEBUG - 处理块 220/504: [116-117]
|
||
创建一组 SPARQL 模板和种子实
|
||
体 , 提取种子实体对应的 DBpedia...
|
||
2025-06-11 11:06:57,780 - DEBUG - 块 220 生成文本: <triplet> 模板 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:06:57,780 - DEBUG - 原始生成文本: <triplet> 模板 <concept> SPARQL <media> part of</s>
|
||
2025-06-11 11:06:57,780 - DEBUG - 处理后标记: ['<triplet>', '模板', '<concept>', 'SPARQL', '<media>', 'part of']
|
||
2025-06-11 11:06:57,780 - DEBUG - 添加三元组: 模板(concept) - part of - SPARQL(media)
|
||
2025-06-11 11:06:57,780 - DEBUG - 块 220 提取到 1 个三元组
|
||
2025-06-11 11:06:57,780 - DEBUG - 处理块 221/504: 本章首先介绍评测 KGQA 系统常用的指标类
|
||
型 , 然后选取 3 个经典的数据集对比不同方法间的性...
|
||
2025-06-11 11:06:58,024 - DEBUG - 块 221 生成文本: <triplet> 准确率 <concept> 评测指标 <media> instance of</s>
|
||
2025-06-11 11:06:58,024 - DEBUG - 原始生成文本: <triplet> 准确率 <concept> 评测指标 <media> instance of</s>
|
||
2025-06-11 11:06:58,025 - DEBUG - 处理后标记: ['<triplet>', '准确率', '<concept>', '评测指标', '<media>', 'instance of']
|
||
2025-06-11 11:06:58,025 - DEBUG - 添加三元组: 准确率(concept) - instance of - 评测指标(media)
|
||
2025-06-11 11:06:58,025 - DEBUG - 块 221 提取到 1 个三元组
|
||
2025-06-11 11:06:58,025 - DEBUG - 处理块 222/504: 以问题集整体为单位进行计算外 , 其他 3 个指标均以
|
||
单个问题为计算单位 。
|
||
设系统针对单个问题返...
|
||
2025-06-11 11:06:58,621 - DEBUG - 块 222 生成文本: <triplet> 正确答案 <concept> 系统预测 <misc> 设系统 <media> <org> ranki <eve> <per> <loc> part of</s>
|
||
2025-06-11 11:06:58,621 - DEBUG - 原始生成文本: <triplet> 正确答案 <concept> 系统预测 <misc> 设系统 <media> <org> ranki <eve> <per> <loc> part of</s>
|
||
2025-06-11 11:06:58,621 - DEBUG - 处理后标记: ['<triplet>', '正确答案', '<concept>', '系统预测', '<misc>', '设系统', '<media>', '<org>', 'ranki', '<eve>', '<per>', '<loc>', 'part of']
|
||
2025-06-11 11:06:58,621 - DEBUG - 添加三元组: 正确答案(concept) - 设系统 - 系统预测(misc)
|
||
2025-06-11 11:06:58,621 - DEBUG - 块 222 提取到 1 个三元组
|
||
2025-06-11 11:06:58,621 - DEBUG - 处理块 223/504: 对单个问题 q 而
|
||
言 , 令 A 为系统返回答案集 , G 为黄金标准答案集
|
||
( 每个问题对应的...
|
||
2025-06-11 11:06:58,982 - DEBUG - 块 223 生成文本: <triplet> 子答案集 <concept> 5 <num> quantity</s>
|
||
2025-06-11 11:06:58,982 - DEBUG - 原始生成文本: <triplet> 子答案集 <concept> 5 <num> quantity</s>
|
||
2025-06-11 11:06:58,982 - DEBUG - 处理后标记: ['<triplet>', '子答案集', '<concept>', '5', '<num>', 'quantity']
|
||
2025-06-11 11:06:58,982 - DEBUG - 添加三元组: 子答案集(concept) - quantity - 5(num)
|
||
2025-06-11 11:06:58,982 - DEBUG - 块 223 提取到 1 个三元组
|
||
2025-06-11 11:06:58,982 - DEBUG - 处理块 224/504: 准确率 ( accuracy) 表示系统回答正确的问题数
|
||
占问题总数的比例 , 若单个问题同时拥有多...
|
||
2025-06-11 11:06:59,707 - DEBUG - 块 224 生成文本: <triplet> 准确率 <concept> 指标 <media> 描述 <misc> 指標 <unk> <loc> part of</s>
|
||
2025-06-11 11:06:59,707 - DEBUG - 原始生成文本: <triplet> 准确率 <concept> 指标 <media> 描述 <misc> 指標 <unk> <loc> part of</s>
|
||
2025-06-11 11:06:59,707 - DEBUG - 处理后标记: ['<triplet>', '准确率', '<concept>', '指标', '<media>', '描述', '<misc>', '指標', '<unk>', '<loc>', 'part of']
|
||
2025-06-11 11:06:59,707 - DEBUG - 添加三元组: 准确率(concept) - 描述 - 指标(media)
|
||
2025-06-11 11:06:59,707 - DEBUG - 块 224 提取到 1 个三元组
|
||
2025-06-11 11:06:59,707 - DEBUG - 处理块 225/504: 按某顺序排列答案列表 , 前 K 个答案中至少存在一
|
||
个正确答案则为 1 hit, 反之没有正确答案...
|
||
2025-06-11 11:07:00,025 - DEBUG - 块 225 生成文本: <triplet> 精度 <concept> 系统返 <misc> subclass of</s>
|
||
2025-06-11 11:07:00,026 - DEBUG - 原始生成文本: <triplet> 精度 <concept> 系统返 <misc> subclass of</s>
|
||
2025-06-11 11:07:00,026 - DEBUG - 处理后标记: ['<triplet>', '精度', '<concept>', '系统返', '<misc>', 'subclass of']
|
||
2025-06-11 11:07:00,026 - DEBUG - 添加三元组: 精度(concept) - subclass of - 系统返(misc)
|
||
2025-06-11 11:07:00,026 - DEBUG - 块 225 提取到 1 个三元组
|
||
2025-06-11 11:07:00,026 - DEBUG - 处理块 226/504: 回的正确答案数占系统返回的总答案数的比例 。 其
|
||
计算公式如下 :
|
||
precision(q)= |A...
|
||
2025-06-11 11:07:00,624 - DEBUG - 块 226 生成文本: <triplet> 召回率 <concept> 系统返 回的正确答案数占系统 <media> part of</s>
|
||
2025-06-11 11:07:00,624 - DEBUG - 原始生成文本: <triplet> 召回率 <concept> 系统返 回的正确答案数占系统 <media> part of</s>
|
||
2025-06-11 11:07:00,624 - DEBUG - 处理后标记: ['<triplet>', '召回率', '<concept>', '系统返 回的正确答案数占系统', '<media>', 'part of']
|
||
2025-06-11 11:07:00,624 - DEBUG - 添加三元组: 召回率(concept) - part of - 系统返 回的正确答案数占系统(media)
|
||
2025-06-11 11:07:00,624 - DEBUG - 块 226 提取到 1 个三元组
|
||
2025-06-11 11:07:00,624 - DEBUG - 处理块 227/504: recall(q)= |A⋂G|
|
||
||G ( 3)
|
||
5.1.4 F1
|
||
F1 值表示精度与召回率的加权...
|
||
2025-06-11 11:07:01,221 - DEBUG - 块 227 生成文本: <triplet> 加权平均 <concept> 精度 <misc> 性能 <media> <per> measured <triplet> F1=2×recall precision <unk> <loc> <eve> 系统 성능 <dis> subclass of</s>
|
||
2025-06-11 11:07:01,221 - DEBUG - 原始生成文本: <triplet> 加权平均 <concept> 精度 <misc> 性能 <media> <per> measured <triplet> F1=2×recall precision <unk> <loc> <eve> 系统 성능 <dis> subclass of</s>
|
||
2025-06-11 11:07:01,222 - DEBUG - 处理后标记: ['<triplet>', '加权平均', '<concept>', '精度', '<misc>', '性能', '<media>', '<per>', 'measured', '<triplet>', 'F1=2×recall precision', '<unk>', '<loc>', '<eve>', '系统 성능', '<dis>', 'subclass of']
|
||
2025-06-11 11:07:01,222 - DEBUG - 添加三元组: 加权平均(concept) - 性能 - 精度(misc)
|
||
2025-06-11 11:07:01,222 - DEBUG - 添加三元组: F1=2×recall precision(unk) - 系统 성능 - <loc>(eve)
|
||
2025-06-11 11:07:01,222 - DEBUG - 块 227 提取到 2 个三元组
|
||
2025-06-11 11:07:01,222 - DEBUG - 处理块 228/504: 对于上述 3 种指标 , 有分别对应的 precision@K 、
|
||
recall@K 和 F1@K ...
|
||
2025-06-11 11:07:01,892 - DEBUG - 块 228 生成文本: <triplet> ጊ X X D F B KP S H <media> 1859 <unk> افی ज़ा <concept> <cel> <misc> <dis> チャー <eve> <per> <date> point in time <triplet> F1@K <loc> <time> 략 <org> <num> width</s>
|
||
2025-06-11 11:07:01,892 - DEBUG - 原始生成文本: <triplet> ጊ X X D F B KP S H <media> 1859 <unk> افی ज़ा <concept> <cel> <misc> <dis> チャー <eve> <per> <date> point in time <triplet> F1@K <loc> <time> 략 <org> <num> width</s>
|
||
2025-06-11 11:07:01,892 - DEBUG - 处理后标记: ['<triplet>', 'ጊ X X D F B KP S H', '<media>', '1859', '<unk>', 'افی ज़ा', '<concept>', '<cel>', '<misc>', '<dis>', 'チャー', '<eve>', '<per>', '<date>', 'point in time', '<triplet>', 'F1@K', '<loc>', '<time>', '략', '<org>', '<num>', 'width']
|
||
2025-06-11 11:07:01,892 - DEBUG - 添加三元组: ጊ X X D F B KP S H(media) - افی ज़ा - 1859(unk)
|
||
2025-06-11 11:07:01,892 - DEBUG - 块 228 提取到 1 个三元组
|
||
2025-06-11 11:07:01,892 - DEBUG - 处理块 229/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:07:02,457 - DEBUG - 块 229 生成文本: <triplet> 系统的 F1 <misc> 计算机科学 <concept> part of</s>
|
||
2025-06-11 11:07:02,458 - DEBUG - 原始生成文本: <triplet> 系统的 F1 <misc> 计算机科学 <concept> part of</s>
|
||
2025-06-11 11:07:02,458 - DEBUG - 处理后标记: ['<triplet>', '系统的 F1', '<misc>', '计算机科学', '<concept>', 'part of']
|
||
2025-06-11 11:07:02,458 - DEBUG - 添加三元组: 系统的 F1(misc) - part of - 计算机科学(concept)
|
||
2025-06-11 11:07:02,458 - DEBUG - 块 229 提取到 1 个三元组
|
||
2025-06-11 11:07:02,458 - DEBUG - 处理块 230/504: micro-F 1 通过计算已回答问题
|
||
的精度与召回率的平均值获得 ; macro-F 1 则通过...
|
||
2025-06-11 11:07:03,044 - DEBUG - 块 230 生成文本: <triplet> 召回率 <concept> 系统返 回 <media> 精度 <misc> 评测指标 <eve> 4种 <loc> instance of</s>
|
||
2025-06-11 11:07:03,044 - DEBUG - 原始生成文本: <triplet> 召回率 <concept> 系统返 回 <media> 精度 <misc> 评测指标 <eve> 4种 <loc> instance of</s>
|
||
2025-06-11 11:07:03,044 - DEBUG - 处理后标记: ['<triplet>', '召回率', '<concept>', '系统返 回', '<media>', '精度', '<misc>', '评测指标', '<eve>', '4种', '<loc>', 'instance of']
|
||
2025-06-11 11:07:03,044 - DEBUG - 添加三元组: 召回率(concept) - 精度 - 系统返 回(media)
|
||
2025-06-11 11:07:03,044 - DEBUG - 块 230 提取到 1 个三元组
|
||
2025-06-11 11:07:03,044 - DEBUG - 处理块 231/504: 答案集优劣的评测指标 mAP( mean average precision)
|
||
与 MRR( mea...
|
||
2025-06-11 11:07:03,609 - DEBUG - 块 231 生成文本: <triplet> 答案集优劣 <concept> mAP <media> 计算系统 <misc> 回答列表中的相对位置评价 <unk> 评测指标 <eve> 等级 <per> instance of</s>
|
||
2025-06-11 11:07:03,609 - DEBUG - 原始生成文本: <triplet> 答案集优劣 <concept> mAP <media> 计算系统 <misc> 回答列表中的相对位置评价 <unk> 评测指标 <eve> 等级 <per> instance of</s>
|
||
2025-06-11 11:07:03,609 - DEBUG - 处理后标记: ['<triplet>', '答案集优劣', '<concept>', 'mAP', '<media>', '计算系统', '<misc>', '回答列表中的相对位置评价', '<unk>', '评测指标', '<eve>', '等级', '<per>', 'instance of']
|
||
2025-06-11 11:07:03,609 - DEBUG - 添加三元组: 答案集优劣(concept) - 计算系统 - mAP(media)
|
||
2025-06-11 11:07:03,609 - DEBUG - 块 231 提取到 1 个三元组
|
||
2025-06-11 11:07:03,609 - DEBUG - 处理块 232/504: 以各正确答案所在位置为下界 , 取下界以上部分为
|
||
子答案集计算所得精度的平均值 。 其计算公式如下 ...
|
||
2025-06-11 11:07:03,991 - DEBUG - 块 232 生成文本: <triplet> 正确答案所在位置 <concept> 子答案集 <media> part of</s>
|
||
2025-06-11 11:07:03,992 - DEBUG - 原始生成文本: <triplet> 正确答案所在位置 <concept> 子答案集 <media> part of</s>
|
||
2025-06-11 11:07:03,992 - DEBUG - 处理后标记: ['<triplet>', '正确答案所在位置', '<concept>', '子答案集', '<media>', 'part of']
|
||
2025-06-11 11:07:03,992 - DEBUG - 添加三元组: 正确答案所在位置(concept) - part of - 子答案集(media)
|
||
2025-06-11 11:07:03,992 - DEBUG - 块 232 提取到 1 个三元组
|
||
2025-06-11 11:07:03,992 - DEBUG - 处理块 233/504: MRR(Q)= 1
|
||
||Q∑
|
||
i=1
|
||
||Q
|
||
1
|
||
ranki
|
||
( 6)
|
||
假设以 “ 三原色是哪几种 ...
|
||
2025-06-11 11:07:04,278 - DEBUG - 块 233 生成文本: <triplet> 奔驰 <media> 德国 <loc> country</s>
|
||
2025-06-11 11:07:04,278 - DEBUG - 原始生成文本: <triplet> 奔驰 <media> 德国 <loc> country</s>
|
||
2025-06-11 11:07:04,278 - DEBUG - 处理后标记: ['<triplet>', '奔驰', '<media>', '德国', '<loc>', 'country']
|
||
2025-06-11 11:07:04,278 - DEBUG - 添加三元组: 奔驰(media) - country - 德国(loc)
|
||
2025-06-11 11:07:04,278 - DEBUG - 块 233 提取到 1 个三元组
|
||
2025-06-11 11:07:04,278 - DEBUG - 处理块 234/504: 这两个问题与问题集的评测指标值如图 23
|
||
所示 。
|
||
5.2 指标分析
|
||
通过对主流数据集的筛选分析 ...
|
||
2025-06-11 11:07:04,639 - DEBUG - 块 234 生成文本: <triplet> <concept> 数据集 <misc> subclass of</s>
|
||
2025-06-11 11:07:04,639 - DEBUG - 原始生成文本: <triplet> <concept> 数据集 <misc> subclass of</s>
|
||
2025-06-11 11:07:04,639 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '数据集', '<misc>', 'subclass of']
|
||
2025-06-11 11:07:04,639 - DEBUG - 处理块 235/504: 单个三元组即可解答 , 系统仅需给定候选实体与候
|
||
选关系中置信度最高的一个实体和一个关系 , 即可
|
||
...
|
||
2025-06-11 11:07:04,787 - DEBUG - 块 235 生成文本: <triplet> 复杂问 <concept> ComplexQuestions <media> part of</s>
|
||
2025-06-11 11:07:04,788 - DEBUG - 原始生成文本: <triplet> 复杂问 <concept> ComplexQuestions <media> part of</s>
|
||
2025-06-11 11:07:04,788 - DEBUG - 处理后标记: ['<triplet>', '复杂问', '<concept>', 'ComplexQuestions', '<media>', 'part of']
|
||
2025-06-11 11:07:04,788 - DEBUG - 添加三元组: 复杂问(concept) - part of - ComplexQuestions(media)
|
||
2025-06-11 11:07:04,788 - DEBUG - 块 235 提取到 1 个三元组
|
||
2025-06-11 11:07:04,788 - DEBUG - 处理块 236/504: 题 , 涉及多跳关系与多限制条件 , 回答难度较大 。
|
||
5.2.1 SimpleQuestions
|
||
...
|
||
2025-06-11 11:07:05,330 - DEBUG - 块 236 生成文本: <triplet> 记忆网络结构 <concept> <media> <misc> <org> MemNN <loc> part of</s>
|
||
2025-06-11 11:07:05,330 - DEBUG - 原始生成文本: <triplet> 记忆网络结构 <concept> <media> <misc> <org> MemNN <loc> part of</s>
|
||
2025-06-11 11:07:05,330 - DEBUG - 处理后标记: ['<triplet>', '记忆网络结构', '<concept>', '<media>', '<misc>', '<org>', 'MemNN', '<loc>', 'part of']
|
||
2025-06-11 11:07:05,330 - DEBUG - 添加三元组: 记忆网络结构(concept) - <org> - <media>(misc)
|
||
2025-06-11 11:07:05,330 - DEBUG - 块 236 提取到 1 个三元组
|
||
2025-06-11 11:07:05,331 - DEBUG - 处理块 237/504: 的设计初衷并
|
||
非用于解决开放领域问题 ; MemNNs
|
||
[24]
|
||
对 MemNN 进
|
||
行修 改使得系...
|
||
2025-06-11 11:07:05,500 - DEBUG - 块 237 生成文本: <triplet> 记忆网络 <concept> KG 预处理技 <media> use</s>
|
||
2025-06-11 11:07:05,500 - DEBUG - 原始生成文本: <triplet> 记忆网络 <concept> KG 预处理技 <media> use</s>
|
||
2025-06-11 11:07:05,500 - DEBUG - 处理后标记: ['<triplet>', '记忆网络', '<concept>', 'KG 预处理技', '<media>', 'use']
|
||
2025-06-11 11:07:05,500 - DEBUG - 添加三元组: 记忆网络(concept) - use - KG 预处理技(media)
|
||
2025-06-11 11:07:05,500 - DEBUG - 块 237 提取到 1 个三元组
|
||
2025-06-11 11:07:05,500 - DEBUG - 处理块 238/504: MemNN 方法 。 可见 , 将 KG 存储于记忆模块整体检
|
||
索的实际效果并不理想 。
|
||
如图 24...
|
||
2025-06-11 11:07:05,937 - DEBUG - 块 238 生成文本: <triplet> 词级 <concept> 编码器 <media> part of</s>
|
||
2025-06-11 11:07:05,937 - DEBUG - 原始生成文本: <triplet> 词级 <concept> 编码器 <media> part of</s>
|
||
2025-06-11 11:07:05,937 - DEBUG - 处理后标记: ['<triplet>', '词级', '<concept>', '编码器', '<media>', 'part of']
|
||
2025-06-11 11:07:05,937 - DEBUG - 添加三元组: 词级(concept) - part of - 编码器(media)
|
||
2025-06-11 11:07:05,937 - DEBUG - 块 238 提取到 1 个三元组
|
||
2025-06-11 11:07:05,937 - DEBUG - 处理块 239/504: 器在字符级与词级分别构建问题表示 , 并分别用于
|
||
实体链接与关系抽取环节的效果 , 比单纯在字符级
|
||
...
|
||
2025-06-11 11:07:06,469 - DEBUG - 块 239 生成文本: <triplet> 字符级 <concept> 神经网络的查询图方法 <media> 信息检索方 <misc> 实体链接与关系抽取环节 <unk> 词级分别构建问题 <org> part of</s>
|
||
2025-06-11 11:07:06,469 - DEBUG - 原始生成文本: <triplet> 字符级 <concept> 神经网络的查询图方法 <media> 信息检索方 <misc> 实体链接与关系抽取环节 <unk> 词级分别构建问题 <org> part of</s>
|
||
2025-06-11 11:07:06,469 - DEBUG - 处理后标记: ['<triplet>', '字符级', '<concept>', '神经网络的查询图方法', '<media>', '信息检索方', '<misc>', '实体链接与关系抽取环节', '<unk>', '词级分别构建问题', '<org>', 'part of']
|
||
2025-06-11 11:07:06,469 - DEBUG - 添加三元组: 字符级(concept) - 信息检索方 - 神经网络的查询图方法(media)
|
||
2025-06-11 11:07:06,469 - DEBUG - 块 239 提取到 1 个三元组
|
||
2025-06-11 11:07:06,469 - DEBUG - 处理块 240/504: 法 , 效果普遍更优 。 将神经网络模型抽取的特征用
|
||
于候选排序环节或用于实体 、 关系抽取环节 ,...
|
||
2025-06-11 11:07:06,766 - DEBUG - 块 240 生成文本: <triplet> 神经网络模型 <concept> MCCNN <media> part of</s>
|
||
2025-06-11 11:07:06,767 - DEBUG - 原始生成文本: <triplet> 神经网络模型 <concept> MCCNN <media> part of</s>
|
||
2025-06-11 11:07:06,767 - DEBUG - 处理后标记: ['<triplet>', '神经网络模型', '<concept>', 'MCCNN', '<media>', 'part of']
|
||
2025-06-11 11:07:06,767 - DEBUG - 添加三元组: 神经网络模型(concept) - part of - MCCNN(media)
|
||
2025-06-11 11:07:06,767 - DEBUG - 块 240 提取到 1 个三元组
|
||
2025-06-11 11:07:06,767 - DEBUG - 处理块 241/504: ˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S ...
|
||
2025-06-11 11:07:07,139 - DEBUG - 块 241 生成文本: <triplet> القضايا <concept> 陈子睿 <per> discoverer or inventor</s>
|
||
2025-06-11 11:07:07,139 - DEBUG - 原始生成文本: <triplet> القضايا <concept> 陈子睿 <per> discoverer or inventor</s>
|
||
2025-06-11 11:07:07,139 - DEBUG - 处理后标记: ['<triplet>', 'القضايا', '<concept>', '陈子睿', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:07:07,139 - DEBUG - 添加三元组: القضايا(concept) - discoverer or inventor - 陈子睿(per)
|
||
2025-06-11 11:07:07,139 - DEBUG - 块 241 提取到 1 个三元组
|
||
2025-06-11 11:07:07,139 - DEBUG - 处理块 242/504: 和关系两者与原问句相似度 ) 的效果好 。
|
||
5.2.2 WebQuestions
|
||
在 WebQues...
|
||
2025-06-11 11:07:07,746 - DEBUG - 块 242 生成文本: <triplet> 直接映射 <concept> 检索方法 <media> KGQA <org> standards body</s>
|
||
2025-06-11 11:07:07,746 - DEBUG - 原始生成文本: <triplet> 直接映射 <concept> 检索方法 <media> KGQA <org> standards body</s>
|
||
2025-06-11 11:07:07,746 - DEBUG - 处理后标记: ['<triplet>', '直接映射', '<concept>', '检索方法', '<media>', 'KGQA', '<org>', 'standards body']
|
||
2025-06-11 11:07:07,746 - DEBUG - 添加三元组: 直接映射(concept) - KGQA - 检索方法(media)
|
||
2025-06-11 11:07:07,746 - DEBUG - 块 242 提取到 1 个三元组
|
||
2025-06-11 11:07:07,746 - DEBUG - 处理块 243/504: 使用复述方法的传统语义解
|
||
析可提升一定的效果 , 但相比深度学习方法对系统
|
||
的提升而言 , 提升幅...
|
||
2025-06-11 11:07:07,915 - DEBUG - 块 243 生成文本: <triplet> 知识图谱嵌入 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:07:07,915 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 <concept> KGQA <media> part of</s>
|
||
2025-06-11 11:07:07,915 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入', '<concept>', 'KGQA', '<media>', 'part of']
|
||
2025-06-11 11:07:07,915 - DEBUG - 添加三元组: 知识图谱嵌入(concept) - part of - KGQA(media)
|
||
2025-06-11 11:07:07,915 - DEBUG - 块 243 提取到 1 个三元组
|
||
2025-06-11 11:07:07,915 - DEBUG - 处理块 244/504: 度不大 , 但省去了人工参与特征设置的步骤 , 证明了
|
||
深度学习方法的有效性 。
|
||
如图 25所示 ,...
|
||
2025-06-11 11:07:08,255 - DEBUG - 块 244 生成文本: <triplet> 深度学习 <concept> 人工参与特征设置 <media> 模板规则 <eve> <org> 神经网络模块 <misc> part of</s>
|
||
2025-06-11 11:07:08,255 - DEBUG - 原始生成文本: <triplet> 深度学习 <concept> 人工参与特征设置 <media> 模板规则 <eve> <org> 神经网络模块 <misc> part of</s>
|
||
2025-06-11 11:07:08,255 - DEBUG - 处理后标记: ['<triplet>', '深度学习', '<concept>', '人工参与特征设置', '<media>', '模板规则', '<eve>', '<org>', '神经网络模块', '<misc>', 'part of']
|
||
2025-06-11 11:07:08,255 - DEBUG - 添加三元组: 深度学习(concept) - 模板规则 - 人工参与特征设置(media)
|
||
2025-06-11 11:07:08,255 - DEBUG - 块 244 提取到 1 个三元组
|
||
2025-06-11 11:07:08,255 - DEBUG - 处理块 245/504: Fig.24 Accuracy of SimpleQuestions related systems...
|
||
2025-06-11 11:07:08,618 - DEBUG - 块 245 生成文本: <triplet> <concept> Fig.24 Accuracy of SimpleQuestions related systems <misc> related system</s>
|
||
2025-06-11 11:07:08,618 - DEBUG - 原始生成文本: <triplet> <concept> Fig.24 Accuracy of SimpleQuestions related systems <misc> related system</s>
|
||
2025-06-11 11:07:08,618 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Fig.24 Accuracy of SimpleQuestions related systems', '<misc>', 'related system']
|
||
2025-06-11 11:07:08,618 - DEBUG - 处理块 246/504: ˝…25 WebQuestions ˇà„Øˇµ˝‡F1 Öµ
|
||
1861
|
||
ˁ ଊ ጊ
|
||
X X X ...
|
||
2025-06-11 11:07:09,289 - DEBUG - 块 246 生成文本: <triplet> ጊ X X D F B KP S H Journal of Frontiers of Computer Science and Technology <media> 计算机科学与探索 <unk> <concept> <org> त्र <per> <eve> <loc> <date> point in time</s>
|
||
2025-06-11 11:07:09,289 - DEBUG - 原始生成文本: <triplet> ጊ X X D F B KP S H Journal of Frontiers of Computer Science and Technology <media> 计算机科学与探索 <unk> <concept> <org> त्र <per> <eve> <loc> <date> point in time</s>
|
||
2025-06-11 11:07:09,290 - DEBUG - 处理后标记: ['<triplet>', 'ጊ X X D F B KP S H Journal of Frontiers of Computer Science and Technology', '<media>', '计算机科学与探索', '<unk>', '<concept>', '<org>', 'त्र', '<per>', '<eve>', '<loc>', '<date>', 'point in time']
|
||
2025-06-11 11:07:09,290 - DEBUG - 添加三元组: ጊ X X D F B KP S H Journal of Frontiers of Computer Science and Technology(media) - <concept> - 计算机科学与探索(unk)
|
||
2025-06-11 11:07:09,290 - DEBUG - 块 246 提取到 1 个三元组
|
||
2025-06-11 11:07:09,290 - DEBUG - 处理块 247/504: 在基于神经网络的信息检索方法中 , 若神经网络
|
||
模型处理短语映射 , 则对应的性能指标介于 40.8...
|
||
2025-06-11 11:07:09,972 - DEBUG - 块 247 生成文本: <triplet> 基于神经网络的信息检索方法 <concept> CNN 结合问题特征与图特征排序语义查询图 <media> 网络的查询 <misc> 基站 <per> named after</s>
|
||
2025-06-11 11:07:09,972 - DEBUG - 原始生成文本: <triplet> 基于神经网络的信息检索方法 <concept> CNN 结合问题特征与图特征排序语义查询图 <media> 网络的查询 <misc> 基站 <per> named after</s>
|
||
2025-06-11 11:07:09,972 - DEBUG - 处理后标记: ['<triplet>', '基于神经网络的信息检索方法', '<concept>', 'CNN 结合问题特征与图特征排序语义查询图', '<media>', '网络的查询', '<misc>', '基站', '<per>', 'named after']
|
||
2025-06-11 11:07:09,972 - DEBUG - 添加三元组: 基于神经网络的信息检索方法(concept) - 网络的查询 - CNN 结合问题特征与图特征排序语义查询图(media)
|
||
2025-06-11 11:07:09,972 - DEBUG - 块 247 提取到 1 个三元组
|
||
2025-06-11 11:07:09,972 - DEBUG - 处理块 248/504: [89]
|
||
可获得本类方法目前的最高性能 。
|
||
可获得更优效果的方法包括 MCCNN
|
||
[28]
|
||
系统 ,...
|
||
2025-06-11 11:07:10,291 - DEBUG - 块 248 生成文本: <triplet> 实体类型打分 <concept> MCCNN [28] 系统 <misc> <media> <org> <eve> <per> author</s>
|
||
2025-06-11 11:07:10,291 - DEBUG - 原始生成文本: <triplet> 实体类型打分 <concept> MCCNN [28] 系统 <misc> <media> <org> <eve> <per> author</s>
|
||
2025-06-11 11:07:10,291 - DEBUG - 处理后标记: ['<triplet>', '实体类型打分', '<concept>', 'MCCNN [28] 系统', '<misc>', '<media>', '<org>', '<eve>', '<per>', 'author']
|
||
2025-06-11 11:07:10,291 - DEBUG - 添加三元组: 实体类型打分(concept) - <media> - MCCNN [28] 系统(misc)
|
||
2025-06-11 11:07:10,291 - DEBUG - 块 248 提取到 1 个三元组
|
||
2025-06-11 11:07:10,291 - DEBUG - 处理块 249/504: Dong 等人
|
||
[83]
|
||
使用复述方法 , 先对改写问题
|
||
与原问题的相似度打分 , 之后对答案与相...
|
||
2025-06-11 11:07:10,727 - DEBUG - 块 249 生成文本: <triplet> 复述方法 <concept> ComplexQuestions <media> part of</s>
|
||
2025-06-11 11:07:10,727 - DEBUG - 原始生成文本: <triplet> 复述方法 <concept> ComplexQuestions <media> part of</s>
|
||
2025-06-11 11:07:10,727 - DEBUG - 处理后标记: ['<triplet>', '复述方法', '<concept>', 'ComplexQuestions', '<media>', 'part of']
|
||
2025-06-11 11:07:10,727 - DEBUG - 添加三元组: 复述方法(concept) - part of - ComplexQuestions(media)
|
||
2025-06-11 11:07:10,727 - DEBUG - 块 249 提取到 1 个三元组
|
||
2025-06-11 11:07:10,727 - DEBUG - 处理块 250/504: 在 ComplexQuestions 数据集上进行实验的系统 ,
|
||
所得指标如图 26 所示 。
|
||
有效...
|
||
2025-06-11 11:07:11,474 - DEBUG - 块 250 生成文本: <triplet> 多跳 <concept> 图形化描述 <misc> ComplexQuestions <media> 数据集 <org> <loc> <eve> <per> danych <unk> <dis> <date> point in time <time> <cel> 神经网络的查询图方法 <triplet></s>
|
||
2025-06-11 11:07:11,474 - DEBUG - 原始生成文本: <triplet> 多跳 <concept> 图形化描述 <misc> ComplexQuestions <media> 数据集 <org> <loc> <eve> <per> danych <unk> <dis> <date> point in time <time> <cel> 神经网络的查询图方法 <triplet></s>
|
||
2025-06-11 11:07:11,475 - DEBUG - 处理后标记: ['<triplet>', '多跳', '<concept>', '图形化描述', '<misc>', 'ComplexQuestions', '<media>', '数据集', '<org>', '<loc>', '<eve>', '<per>', 'danych', '<unk>', '<dis>', '<date>', 'point in time', '<time>', '<cel>', '神经网络的查询图方法', '<triplet>']
|
||
2025-06-11 11:07:11,475 - DEBUG - 添加三元组: 多跳(concept) - ComplexQuestions - 图形化描述(misc)
|
||
2025-06-11 11:07:11,475 - DEBUG - 块 250 提取到 1 个三元组
|
||
2025-06-11 11:07:11,475 - DEBUG - 处理块 251/504: , 将
|
||
复杂问题分解为多个子问题逐个解决 , 子问题通过
|
||
同时检索 KG 与搜索引擎获得答案 , 问...
|
||
2025-06-11 11:07:12,274 - DEBUG - 块 251 生成文本: <triplet> 模 块 <concept> 语义查询图的排 序依据 <media> <misc> 神经网络 <unk> 图特征 <dis> 网 <per> <triplet>块抽取的问题特征和图 <loc> 勒网络的 <org> 复杂问题分解 <cel> 子问题 <eve> 面向 <date> <time> graphics</s>
|
||
2025-06-11 11:07:12,274 - DEBUG - 原始生成文本: <triplet> 模 块 <concept> 语义查询图的排 序依据 <media> <misc> 神经网络 <unk> 图特征 <dis> 网 <per> <triplet>块抽取的问题特征和图 <loc> 勒网络的 <org> 复杂问题分解 <cel> 子问题 <eve> 面向 <date> <time> graphics</s>
|
||
2025-06-11 11:07:12,274 - DEBUG - 处理后标记: ['<triplet>', '模 块', '<concept>', '语义查询图的排 序依据', '<media>', '<misc>', '神经网络', '<unk>', '图特征', '<dis>', '网', '<per>', '<triplet>', '块抽取的问题特征和图', '<loc>', '勒网络的', '<org>', '复杂问题分解', '<cel>', '子问题', '<eve>', '面向', '<date>', '<time>', 'graphics']
|
||
2025-06-11 11:07:12,274 - DEBUG - 添加三元组: 模 块(concept) - <misc> - 语义查询图的排 序依据(media)
|
||
2025-06-11 11:07:12,274 - DEBUG - 添加三元组: 块抽取的问题特征和图(loc) - 复杂问题分解 - 勒网络的(org)
|
||
2025-06-11 11:07:12,274 - DEBUG - 块 251 提取到 2 个三元组
|
||
2025-06-11 11:07:12,274 - DEBUG - 处理块 252/504: 用低召回 、 高精度方式完成的方法效果好
|
||
[43]
|
||
。 例如因
|
||
问题增加限制条件或关系个数而需要对语...
|
||
2025-06-11 11:07:12,936 - DEBUG - 块 252 生成文本: <triplet> 语义查询图 <concept> 排序模型的负 担 <misc> 问答效果 <media> 问题增加限制条件 <loc> <eve> 关系个数 <dis> <org> <per> studies</s>
|
||
2025-06-11 11:07:12,936 - DEBUG - 原始生成文本: <triplet> 语义查询图 <concept> 排序模型的负 担 <misc> 问答效果 <media> 问题增加限制条件 <loc> <eve> 关系个数 <dis> <org> <per> studies</s>
|
||
2025-06-11 11:07:12,936 - DEBUG - 处理后标记: ['<triplet>', '语义查询图', '<concept>', '排序模型的负 担', '<misc>', '问答效果', '<media>', '问题增加限制条件', '<loc>', '<eve>', '关系个数', '<dis>', '<org>', '<per>', 'studies']
|
||
2025-06-11 11:07:12,936 - DEBUG - 添加三元组: 语义查询图(concept) - 问答效果 - 排序模型的负 担(misc)
|
||
2025-06-11 11:07:12,936 - DEBUG - 块 252 提取到 1 个三元组
|
||
2025-06-11 11:07:12,936 - DEBUG - 处理块 253/504: 通过上述分析比较可以看出 , 开放领域知识图
|
||
谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱...
|
||
2025-06-11 11:07:13,202 - DEBUG - 块 253 生成文本: <triplet> 通用领域 <concept> KG <org> subclass of</s>
|
||
2025-06-11 11:07:13,202 - DEBUG - 原始生成文本: <triplet> 通用领域 <concept> KG <org> subclass of</s>
|
||
2025-06-11 11:07:13,202 - DEBUG - 处理后标记: ['<triplet>', '通用领域', '<concept>', 'KG', '<org>', 'subclass of']
|
||
2025-06-11 11:07:13,202 - DEBUG - 添加三元组: 通用领域(concept) - subclass of - KG(org)
|
||
2025-06-11 11:07:13,202 - DEBUG - 块 253 提取到 1 个三元组
|
||
2025-06-11 11:07:13,202 - DEBUG - 处理块 254/504: 的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本...
|
||
2025-06-11 11:07:13,820 - DEBUG - 块 254 生成文本: <triplet> 外部文本语料库 <concept> 知识库问答系统 <media> 通用领域 KG <misc> part of</s>
|
||
2025-06-11 11:07:13,820 - DEBUG - 原始生成文本: <triplet> 外部文本语料库 <concept> 知识库问答系统 <media> 通用领域 KG <misc> part of</s>
|
||
2025-06-11 11:07:13,820 - DEBUG - 处理后标记: ['<triplet>', '外部文本语料库', '<concept>', '知识库问答系统', '<media>', '通用领域 KG', '<misc>', 'part of']
|
||
2025-06-11 11:07:13,820 - DEBUG - 添加三元组: 外部文本语料库(concept) - 通用领域 KG - 知识库问答系统(media)
|
||
2025-06-11 11:07:13,820 - DEBUG - 块 254 提取到 1 个三元组
|
||
2025-06-11 11:07:13,820 - DEBUG - 处理块 255/504: 种是语料库所提供的数据作为 KGQA 各环节所利用
|
||
的特征信息 , 提高 KGQA 各环节的性能表现...
|
||
2025-06-11 11:07:14,032 - DEBUG - 块 255 生成文本: <triplet> 外部文本语料库 <media> <concept> KGQA <org> part of</s>
|
||
2025-06-11 11:07:14,033 - DEBUG - 原始生成文本: <triplet> 外部文本语料库 <media> <concept> KGQA <org> part of</s>
|
||
2025-06-11 11:07:14,033 - DEBUG - 处理后标记: ['<triplet>', '外部文本语料库', '<media>', '<concept>', 'KGQA', '<org>', 'part of']
|
||
2025-06-11 11:07:14,033 - DEBUG - 处理块 256/504: 为系统的唯一 KG, 或将 KG 与外部文本语料库信息
|
||
视为单个 KG 整体 , 如何更加充分利用彼...
|
||
2025-06-11 11:07:14,597 - DEBUG - 块 256 生成文本: <triplet> 知识图谱嵌入完 <concept> KG 推理方法 <misc> 信 息 <media> <org> <dis> <eve> 文本语料库 <loc> part of</s>
|
||
2025-06-11 11:07:14,597 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入完 <concept> KG 推理方法 <misc> 信 息 <media> <org> <dis> <eve> 文本语料库 <loc> part of</s>
|
||
2025-06-11 11:07:14,597 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入完', '<concept>', 'KG 推理方法', '<misc>', '信 息', '<media>', '<org>', '<dis>', '<eve>', '文本语料库', '<loc>', 'part of']
|
||
2025-06-11 11:07:14,597 - DEBUG - 添加三元组: 知识图谱嵌入完(concept) - 信 息 - KG 推理方法(misc)
|
||
2025-06-11 11:07:14,597 - DEBUG - 块 256 提取到 1 个三元组
|
||
2025-06-11 11:07:14,597 - DEBUG - 处理块 257/504: 成事实三元组的推理工作 , 但使用该技术预测缺失
|
||
事实的效果不佳 , 尤其对于包含长尾关系的三元
|
||
组...
|
||
2025-06-11 11:07:14,959 - DEBUG - 块 257 生成文本: <triplet> 知识图谱嵌入 方法 <concept> 统计关系学习 (statis-statistics- <media> GNN 模型 <misc> part of</s>
|
||
2025-06-11 11:07:14,959 - DEBUG - 原始生成文本: <triplet> 知识图谱嵌入 方法 <concept> 统计关系学习 (statis-statistics- <media> GNN 模型 <misc> part of</s>
|
||
2025-06-11 11:07:14,959 - DEBUG - 处理后标记: ['<triplet>', '知识图谱嵌入 方法', '<concept>', '统计关系学习 (statis-statistics-', '<media>', 'GNN 模型', '<misc>', 'part of']
|
||
2025-06-11 11:07:14,959 - DEBUG - 添加三元组: 知识图谱嵌入 方法(concept) - GNN 模型 - 统计关系学习 (statis-statistics-(media)
|
||
2025-06-11 11:07:14,959 - DEBUG - 块 257 提取到 1 个三元组
|
||
2025-06-11 11:07:14,959 - DEBUG - 处理块 258/504: tical relational learning, SRL) 等方法 , 这些工作都可
|
||
作为 KG...
|
||
2025-06-11 11:07:15,160 - DEBUG - 块 258 生成文本: <triplet> 精确提取语义信息 <concept> KGQA <org> standards body</s>
|
||
2025-06-11 11:07:15,161 - DEBUG - 原始生成文本: <triplet> 精确提取语义信息 <concept> KGQA <org> standards body</s>
|
||
2025-06-11 11:07:15,161 - DEBUG - 处理后标记: ['<triplet>', '精确提取语义信息', '<concept>', 'KGQA', '<org>', 'standards body']
|
||
2025-06-11 11:07:15,161 - DEBUG - 添加三元组: 精确提取语义信息(concept) - standards body - KGQA(org)
|
||
2025-06-11 11:07:15,161 - DEBUG - 块 258 提取到 1 个三元组
|
||
2025-06-11 11:07:15,161 - DEBUG - 处理块 259/504: Fig.26 F1 of ComplexQuestions related systems
|
||
˝…26...
|
||
2025-06-11 11:07:16,199 - DEBUG - 块 259 生成文本: <triplet> 략 <concept> <org> <media> <unk> <dis> <misc> <loc> <eve> <per> <time> <triplet>략설 <cel>략론 .com략법 ca_XX.컴컴. āti.c략가.cn.략략족.第.C략.개.</s>
|
||
2025-06-11 11:07:16,199 - DEBUG - 原始生成文本: <triplet> 략 <concept> <org> <media> <unk> <dis> <misc> <loc> <eve> <per> <time> <triplet>략설 <cel>략론 .com략법 ca_XX.컴컴. āti.c략가.cn.략략족.第.C략.개.</s>
|
||
2025-06-11 11:07:16,199 - DEBUG - 处理后标记: ['<triplet>', '략', '<concept>', '<org>', '<media>', '<unk>', '<dis>', '<misc>', '<loc>', '<eve>', '<per>', '<time>', '<triplet>', '략설', '<cel>', '략론 .com략법 ca_XX.컴컴. āti.c략가.cn.략략족.第.C략.개.']
|
||
2025-06-11 11:07:16,199 - DEBUG - 添加三元组: 략(concept) - <unk> - <org>(media)
|
||
2025-06-11 11:07:16,199 - DEBUG - 块 259 提取到 1 个三元组
|
||
2025-06-11 11:07:16,199 - DEBUG - 处理块 260/504: 信 息有限的自然语言问题 , 抽取出丰富且精确的语
|
||
义信息具有一定难度 。 对此 , 人们通常采用传...
|
||
2025-06-11 11:07:16,807 - DEBUG - 块 260 生成文本: <triplet> 实体与候选关系的召回率 <concept> 信 息有限的自然语言问题 <misc> 自然言語 <media> part of</s>
|
||
2025-06-11 11:07:16,807 - DEBUG - 原始生成文本: <triplet> 实体与候选关系的召回率 <concept> 信 息有限的自然语言问题 <misc> 自然言語 <media> part of</s>
|
||
2025-06-11 11:07:16,807 - DEBUG - 处理后标记: ['<triplet>', '实体与候选关系的召回率', '<concept>', '信 息有限的自然语言问题', '<misc>', '自然言語', '<media>', 'part of']
|
||
2025-06-11 11:07:16,807 - DEBUG - 添加三元组: 实体与候选关系的召回率(concept) - 自然言語 - 信 息有限的自然语言问题(misc)
|
||
2025-06-11 11:07:16,807 - DEBUG - 块 260 提取到 1 个三元组
|
||
2025-06-11 11:07:16,807 - DEBUG - 处理块 261/504: 这种方法不仅会造成含有
|
||
噪声的巨大搜索空间 , 降低系统精度 , 还将大幅提高
|
||
问答所需时长 。 ...
|
||
2025-06-11 11:07:17,161 - DEBUG - 块 261 生成文本: <triplet> 预训练模型 <concept> <media> 训练数据 <misc> use</s>
|
||
2025-06-11 11:07:17,161 - DEBUG - 原始生成文本: <triplet> 预训练模型 <concept> <media> 训练数据 <misc> use</s>
|
||
2025-06-11 11:07:17,161 - DEBUG - 处理后标记: ['<triplet>', '预训练模型', '<concept>', '<media>', '训练数据', '<misc>', 'use']
|
||
2025-06-11 11:07:17,161 - DEBUG - 处理块 262/504: 训练模型在 KGQA 问答训练数据较少的情况下 , 仍
|
||
可获得相对传统实体关系流水线方法更优的性能体...
|
||
2025-06-11 11:07:17,482 - DEBUG - 块 262 生成文本: <triplet> 多跳关系 <concept> 复杂问题 <media> subclass of</s>
|
||
2025-06-11 11:07:17,482 - DEBUG - 原始生成文本: <triplet> 多跳关系 <concept> 复杂问题 <media> subclass of</s>
|
||
2025-06-11 11:07:17,483 - DEBUG - 处理后标记: ['<triplet>', '多跳关系', '<concept>', '复杂问题', '<media>', 'subclass of']
|
||
2025-06-11 11:07:17,483 - DEBUG - 添加三元组: 多跳关系(concept) - subclass of - 复杂问题(media)
|
||
2025-06-11 11:07:17,483 - DEBUG - 块 262 提取到 1 个三元组
|
||
2025-06-11 11:07:17,483 - DEBUG - 处理块 263/504: 致用户提高了对系统语义分析能力的要求 。 针对复
|
||
杂问题语义分析难度大的情况 , 人们通常采用基于
|
||
...
|
||
2025-06-11 11:07:17,888 - DEBUG - 块 263 生成文本: <triplet> 语义分析 <concept> 神经网络的查询图方法 <media> 系统 <misc> 索引 <per></s>
|
||
2025-06-11 11:07:17,888 - DEBUG - 原始生成文本: <triplet> 语义分析 <concept> 神经网络的查询图方法 <media> 系统 <misc> 索引 <per></s>
|
||
2025-06-11 11:07:17,888 - DEBUG - 处理后标记: ['<triplet>', '语义分析', '<concept>', '神经网络的查询图方法', '<media>', '系统', '<misc>', '索引', '<per>']
|
||
2025-06-11 11:07:17,888 - DEBUG - 添加三元组: 语义分析(concept) - 系统 - 神经网络的查询图方法(media)
|
||
2025-06-11 11:07:17,888 - DEBUG - 块 263 提取到 1 个三元组
|
||
2025-06-11 11:07:17,888 - DEBUG - 处理块 264/504: 在语义查询图生成过程中及时完成剪枝工作的方
|
||
法 , 得到复杂问题的语义解析结果 。 但如 5.2.3...
|
||
2025-06-11 11:07:18,787 - DEBUG - 块 264 生成文本: <triplet> 语义查询图 <concept> KGQA <misc> <media> <org> 方法 <eve> <loc> <unk> <per> 法 <time> <date> <dis> <cel> مية <num> 그래 <triplet> ComplexQuestions 数据集的实验结果所示 ,但是如 5.2.3 小节 Complex Questions,以及小节 的数据集 danych</s>
|
||
2025-06-11 11:07:18,787 - DEBUG - 原始生成文本: <triplet> 语义查询图 <concept> KGQA <misc> <media> <org> 方法 <eve> <loc> <unk> <per> 法 <time> <date> <dis> <cel> مية <num> 그래 <triplet> ComplexQuestions 数据集的实验结果所示 ,但是如 5.2.3 小节 Complex Questions,以及小节 的数据集 danych</s>
|
||
2025-06-11 11:07:18,787 - DEBUG - 处理后标记: ['<triplet>', '语义查询图', '<concept>', 'KGQA', '<misc>', '<media>', '<org>', '方法', '<eve>', '<loc>', '<unk>', '<per>', '法', '<time>', '<date>', '<dis>', '<cel>', 'مية', '<num>', '그래', '<triplet>', 'ComplexQuestions 数据集的实验结果所示 ,但是如 5.2.3 小节 Complex Questions,以及小节 的数据集 danych']
|
||
2025-06-11 11:07:18,787 - DEBUG - 添加三元组: 语义查询图(concept) - <media> - KGQA(misc)
|
||
2025-06-11 11:07:18,787 - DEBUG - 块 264 提取到 1 个三元组
|
||
2025-06-11 11:07:18,787 - DEBUG - 处理块 265/504: 选数量 , 提高语义查询图的生成质量 , 是需要进一步
|
||
研究的问题 。
|
||
对于基于神经网络的信息检索方...
|
||
2025-06-11 11:07:19,289 - DEBUG - 块 265 生成文本: <triplet> 选数量 <concept> 语义查询图的生成质量 <misc> 神经网络的信息检索方法 <media> 子问题 <unk> <per> <eve> 信息 <org> 的方法</s>
|
||
2025-06-11 11:07:19,290 - DEBUG - 原始生成文本: <triplet> 选数量 <concept> 语义查询图的生成质量 <misc> 神经网络的信息检索方法 <media> 子问题 <unk> <per> <eve> 信息 <org> 的方法</s>
|
||
2025-06-11 11:07:19,290 - DEBUG - 处理后标记: ['<triplet>', '选数量', '<concept>', '语义查询图的生成质量', '<misc>', '神经网络的信息检索方法', '<media>', '子问题', '<unk>', '<per>', '<eve>', '信息', '<org>', '的方法']
|
||
2025-06-11 11:07:19,290 - DEBUG - 添加三元组: 选数量(concept) - 神经网络的信息检索方法 - 语义查询图的生成质量(misc)
|
||
2025-06-11 11:07:19,290 - DEBUG - 块 265 提取到 1 个三元组
|
||
2025-06-11 11:07:19,290 - DEBUG - 处理块 266/504: 合理地完成子问题分解 , 并充分结合基于神经网络
|
||
的信息检索方法在简单问题上的有效性 , 是未来的
|
||
...
|
||
2025-06-11 11:07:19,715 - DEBUG - 块 266 生成文本: <triplet> 通用领 域知识图谱 <concept> 问答系统 <media> 子问题分解 <misc> <org> 系统学 <loc> part of</s>
|
||
2025-06-11 11:07:19,716 - DEBUG - 原始生成文本: <triplet> 通用领 域知识图谱 <concept> 问答系统 <media> 子问题分解 <misc> <org> 系统学 <loc> part of</s>
|
||
2025-06-11 11:07:19,716 - DEBUG - 处理后标记: ['<triplet>', '通用领 域知识图谱', '<concept>', '问答系统', '<media>', '子问题分解', '<misc>', '<org>', '系统学', '<loc>', 'part of']
|
||
2025-06-11 11:07:19,716 - DEBUG - 添加三元组: 通用领 域知识图谱(concept) - 子问题分解 - 问答系统(media)
|
||
2025-06-11 11:07:19,716 - DEBUG - 块 266 提取到 1 个三元组
|
||
2025-06-11 11:07:19,716 - DEBUG - 处理块 267/504: 开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 ...
|
||
2025-06-11 11:07:20,045 - DEBUG - 块 267 生成文本: <triplet> 开放领域知识图谱问答 <media> 知识 <concept> subclass of</s>
|
||
2025-06-11 11:07:20,045 - DEBUG - 原始生成文本: <triplet> 开放领域知识图谱问答 <media> 知识 <concept> subclass of</s>
|
||
2025-06-11 11:07:20,045 - DEBUG - 处理后标记: ['<triplet>', '开放领域知识图谱问答', '<media>', '知识', '<concept>', 'subclass of']
|
||
2025-06-11 11:07:20,045 - DEBUG - 添加三元组: 开放领域知识图谱问答(media) - subclass of - 知识(concept)
|
||
2025-06-11 11:07:20,045 - DEBUG - 块 267 提取到 1 个三元组
|
||
2025-06-11 11:07:20,045 - DEBUG - 处理块 268/504: 后展望了开放领域知识图谱问答的未来研究方向 。
|
||
参考文献:
|
||
[1] SINGH V, DWIVEDI...
|
||
2025-06-11 11:07:20,205 - DEBUG - 块 268 生成文本: <triplet> 图谱 <concept> 问答 <media> subclass of</s>
|
||
2025-06-11 11:07:20,205 - DEBUG - 原始生成文本: <triplet> 图谱 <concept> 问答 <media> subclass of</s>
|
||
2025-06-11 11:07:20,205 - DEBUG - 处理后标记: ['<triplet>', '图谱', '<concept>', '问答', '<media>', 'subclass of']
|
||
2025-06-11 11:07:20,205 - DEBUG - 添加三元组: 图谱(concept) - subclass of - 问答(media)
|
||
2025-06-11 11:07:20,205 - DEBUG - 块 268 提取到 1 个三元组
|
||
2025-06-11 11:07:20,205 - DEBUG - 处理块 269/504: Information Retrieval Research, 2014, 4(3): 14-33....
|
||
2025-06-11 11:07:20,449 - DEBUG - 块 269 生成文本: <triplet> <org> Baseball <concept> sport <triplet> ALICE K W <per> Basebol <eve> sport</s>
|
||
2025-06-11 11:07:20,450 - DEBUG - 原始生成文本: <triplet> <org> Baseball <concept> sport <triplet> ALICE K W <per> Basebol <eve> sport</s>
|
||
2025-06-11 11:07:20,450 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Baseball', '<concept>', 'sport', '<triplet>', 'ALICE K W', '<per>', 'Basebol', '<eve>', 'sport']
|
||
2025-06-11 11:07:20,450 - DEBUG - 处理块 270/504: an automatic question- answerer[M]. New York: ACM,...
|
||
2025-06-11 11:07:20,812 - DEBUG - 块 270 生成文本: <triplet> <concept> WOODS <org> publisher</s>
|
||
2025-06-11 11:07:20,812 - DEBUG - 原始生成文本: <triplet> <concept> WOODS <org> publisher</s>
|
||
2025-06-11 11:07:20,812 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'WOODS', '<org>', 'publisher']
|
||
2025-06-11 11:07:20,812 - DEBUG - 处理块 271/504: an application to lunar geology[M]. New York: ACM,...
|
||
2025-06-11 11:07:21,174 - DEBUG - 块 271 生成文本: <triplet> <per> ACM <org> conferred <concept> instance of</s>
|
||
2025-06-11 11:07:21,174 - DEBUG - 原始生成文本: <triplet> <per> ACM <org> conferred <concept> instance of</s>
|
||
2025-06-11 11:07:21,174 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'ACM', '<org>', 'conferred', '<concept>', 'instance of']
|
||
2025-06-11 11:07:21,174 - DEBUG - 处理块 272/504: web[J]. Scientific American, 2001, 284(5): 34-43.
|
||
...
|
||
2025-06-11 11:07:21,429 - DEBUG - 块 272 生成文本: <triplet> <concept> SHADBOLT N <misc> studies</s>
|
||
2025-06-11 11:07:21,429 - DEBUG - 原始生成文本: <triplet> <concept> SHADBOLT N <misc> studies</s>
|
||
2025-06-11 11:07:21,429 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'SHADBOLT N', '<misc>', 'studies']
|
||
2025-06-11 11:07:21,430 - DEBUG - 处理块 273/504: web revisited[J]. IEEE Intelligent Systems,2006, 2...
|
||
2025-06-11 11:07:21,812 - DEBUG - 块 273 生成文本: <triplet> GETOOR L <per> IEEE Intelligent Systems <org> member of</s>
|
||
2025-06-11 11:07:21,812 - DEBUG - 原始生成文本: <triplet> GETOOR L <per> IEEE Intelligent Systems <org> member of</s>
|
||
2025-06-11 11:07:21,812 - DEBUG - 处理后标记: ['<triplet>', 'GETOOR L', '<per>', 'IEEE Intelligent Systems', '<org>', 'member of']
|
||
2025-06-11 11:07:21,812 - DEBUG - 添加三元组: GETOOR L(per) - member of - IEEE Intelligent Systems(org)
|
||
2025-06-11 11:07:21,812 - DEBUG - 块 273 提取到 1 个三元组
|
||
2025-06-11 11:07:21,812 - DEBUG - 处理块 274/504: identification[M]. Berlin: Springer, 2013: 542-557...
|
||
2025-06-11 11:07:22,123 - DEBUG - 块 274 生成文本: <triplet> identification[M].Berlin <loc> place of publication</s>
|
||
2025-06-11 11:07:22,123 - DEBUG - 原始生成文本: <triplet> identification[M].Berlin <loc> place of publication</s>
|
||
2025-06-11 11:07:22,123 - DEBUG - 处理后标记: ['<triplet>', 'identification[M].Berlin', '<loc>', 'place of publication']
|
||
2025-06-11 11:07:22,123 - DEBUG - 处理块 275/504: a collaboratively created graph database for struc...
|
||
2025-06-11 11:07:22,647 - DEBUG - 块 275 生成文本: <triplet> graph database for structuring human knowledge <concept> 2008 ACM SIGMOD <media> 2008 <misc> 2008 C <eve> instance</s>
|
||
2025-06-11 11:07:22,647 - DEBUG - 原始生成文本: <triplet> graph database for structuring human knowledge <concept> 2008 ACM SIGMOD <media> 2008 <misc> 2008 C <eve> instance</s>
|
||
2025-06-11 11:07:22,647 - DEBUG - 处理后标记: ['<triplet>', 'graph database for structuring human knowledge', '<concept>', '2008 ACM SIGMOD', '<media>', '2008', '<misc>', '2008 C', '<eve>', 'instance']
|
||
2025-06-11 11:07:22,647 - DEBUG - 添加三元组: graph database for structuring human knowledge(concept) - 2008 - 2008 ACM SIGMOD(media)
|
||
2025-06-11 11:07:22,647 - DEBUG - 块 275 提取到 1 个三元组
|
||
2025-06-11 11:07:22,647 - DEBUG - 处理块 276/504: International Conference on Management of Data, Va...
|
||
2025-06-11 11:07:23,072 - DEBUG - 块 276 生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:07:23,072 - DEBUG - 原始生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:07:23,072 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New York', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:23,072 - DEBUG - 处理块 277/504: [8] AUER S, BIZER C, KOBILAROV G, et al. DBpedia: ...
|
||
2025-06-11 11:07:23,381 - DEBUG - 块 277 生成文本: <triplet> <per> DBpedia <media> described by source</s>
|
||
2025-06-11 11:07:23,381 - DEBUG - 原始生成文本: <triplet> <per> DBpedia <media> described by source</s>
|
||
2025-06-11 11:07:23,381 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'DBpedia', '<media>', 'described by source']
|
||
2025-06-11 11:07:23,381 - DEBUG - 处理块 278/504: [9] SUCHANEK F M, KASNECI G, WEIKUM G. YAGO: a
|
||
cor...
|
||
2025-06-11 11:07:23,658 - DEBUG - 块 278 生成文本: <triplet> <concept> Wikipedia <media> different from <triplet> WordNet <misc> <org> <unk> <loc> part of</s>
|
||
2025-06-11 11:07:23,658 - DEBUG - 原始生成文本: <triplet> <concept> Wikipedia <media> different from <triplet> WordNet <misc> <org> <unk> <loc> part of</s>
|
||
2025-06-11 11:07:23,658 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Wikipedia', '<media>', 'different from', '<triplet>', 'WordNet', '<misc>', '<org>', '<unk>', '<loc>', 'part of']
|
||
2025-06-11 11:07:23,658 - DEBUG - 处理块 279/504: [C]//Proceedings of the 16th International Confere...
|
||
2025-06-11 11:07:23,806 - DEBUG - 块 279 生成文本: <triplet> 697 <concept> 2007 <date> point in time</s>
|
||
2025-06-11 11:07:23,806 - DEBUG - 原始生成文本: <triplet> 697 <concept> 2007 <date> point in time</s>
|
||
2025-06-11 11:07:23,807 - DEBUG - 处理后标记: ['<triplet>', '697', '<concept>', '2007', '<date>', 'point in time']
|
||
2025-06-11 11:07:23,807 - DEBUG - 添加三元组: 697(concept) - point in time - 2007(date)
|
||
2025-06-11 11:07:23,807 - DEBUG - 块 279 提取到 1 个三元组
|
||
2025-06-11 11:07:23,807 - DEBUG - 处理块 280/504: [10] WOOLDRIDGE M, JENNINGS N R. Intelligent agent...
|
||
2025-06-11 11:07:24,030 - DEBUG - 块 280 生成文本: <triplet> JENNINGS N R. <per> Intelligent agents <concept> field of work</s>
|
||
2025-06-11 11:07:24,030 - DEBUG - 原始生成文本: <triplet> JENNINGS N R. <per> Intelligent agents <concept> field of work</s>
|
||
2025-06-11 11:07:24,030 - DEBUG - 处理后标记: ['<triplet>', 'JENNINGS N R.', '<per>', 'Intelligent agents', '<concept>', 'field of work']
|
||
2025-06-11 11:07:24,030 - DEBUG - 添加三元组: JENNINGS N R.(per) - field of work - Intelligent agents(concept)
|
||
2025-06-11 11:07:24,030 - DEBUG - 块 280 提取到 1 个三元组
|
||
2025-06-11 11:07:24,030 - DEBUG - 处理块 281/504: [11] MLADEMIC D. Text-learning and related intelli...
|
||
2025-06-11 11:07:24,520 - DEBUG - 块 281 生成文本: <triplet> MLADEMIC D. Text-learning and related intelligent agents <concept> IEEE Intelligent Systems & Their Applications <org> 2002 <date> publication date of origin</s>
|
||
2025-06-11 11:07:24,520 - DEBUG - 原始生成文本: <triplet> MLADEMIC D. Text-learning and related intelligent agents <concept> IEEE Intelligent Systems & Their Applications <org> 2002 <date> publication date of origin</s>
|
||
2025-06-11 11:07:24,520 - DEBUG - 处理后标记: ['<triplet>', 'MLADEMIC D. Text-learning and related intelligent agents', '<concept>', 'IEEE Intelligent Systems & Their Applications', '<org>', '2002', '<date>', 'publication date of origin']
|
||
2025-06-11 11:07:24,520 - DEBUG - 添加三元组: MLADEMIC D. Text-learning and related intelligent agents(concept) - 2002 - IEEE Intelligent Systems & Their Applications(org)
|
||
2025-06-11 11:07:24,520 - DEBUG - 块 281 提取到 1 个三元组
|
||
2025-06-11 11:07:24,520 - DEBUG - 处理块 282/504: [12] FAST E, CHEN B, MENDELSOHN J, et al. Iris: ac...
|
||
2025-06-11 11:07:24,903 - DEBUG - 块 282 生成文本: <triplet> ጊ X X D F B KP S H <org> 1863 <date> inception</s>
|
||
2025-06-11 11:07:24,903 - DEBUG - 原始生成文本: <triplet> ጊ X X D F B KP S H <org> 1863 <date> inception</s>
|
||
2025-06-11 11:07:24,903 - DEBUG - 处理后标记: ['<triplet>', 'ጊ X X D F B KP S H', '<org>', '1863', '<date>', 'inception']
|
||
2025-06-11 11:07:24,903 - DEBUG - 添加三元组: ጊ X X D F B KP S H(org) - inception - 1863(date)
|
||
2025-06-11 11:07:24,903 - DEBUG - 块 282 提取到 1 个三元组
|
||
2025-06-11 11:07:24,903 - DEBUG - 处理块 283/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:07:25,104 - DEBUG - 块 283 生成文本: <triplet> <media> 计算机科学 <concept> main subject</s>
|
||
2025-06-11 11:07:25,105 - DEBUG - 原始生成文本: <triplet> <media> 计算机科学 <concept> main subject</s>
|
||
2025-06-11 11:07:25,105 - DEBUG - 处理后标记: ['<triplet>', '<media>', '计算机科学', '<concept>', 'main subject']
|
||
2025-06-11 11:07:25,105 - DEBUG - 处理块 284/504: [13] DIEFENBACH D, LOPEZ V, SINGH K, et al. Core t...
|
||
2025-06-11 11:07:25,489 - DEBUG - 块 284 生成文本: <triplet> <concept> question answering systems over knowledge bases <misc> studies</s>
|
||
2025-06-11 11:07:25,489 - DEBUG - 原始生成文本: <triplet> <concept> question answering systems over knowledge bases <misc> studies</s>
|
||
2025-06-11 11:07:25,489 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'question answering systems over knowledge bases', '<misc>', 'studies']
|
||
2025-06-11 11:07:25,489 - DEBUG - 处理块 285/504: a survey[J]. Knowledge and Information Systems,201...
|
||
2025-06-11 11:07:25,755 - DEBUG - 块 285 生成文本: <triplet> <concept> CHAKRABORTY N <per> author</s>
|
||
2025-06-11 11:07:25,755 - DEBUG - 原始生成文本: <triplet> <concept> CHAKRABORTY N <per> author</s>
|
||
2025-06-11 11:07:25,755 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'CHAKRABORTY N', '<per>', 'author']
|
||
2025-06-11 11:07:25,755 - DEBUG - 处理块 286/504: et al. Introduction to neural network based approa...
|
||
2025-06-11 11:07:25,882 - DEBUG - 块 286 生成文本: <triplet> <concept> knowledge graphs <misc> studies</s>
|
||
2025-06-11 11:07:25,882 - DEBUG - 原始生成文本: <triplet> <concept> knowledge graphs <misc> studies</s>
|
||
2025-06-11 11:07:25,882 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge graphs', '<misc>', 'studies']
|
||
2025-06-11 11:07:25,883 - DEBUG - 处理块 287/504: [15] FU B, QIU Y, TANG C, et al. A survey on compl...
|
||
2025-06-11 11:07:26,116 - DEBUG - 块 287 生成文本: <triplet> TANG C <per> FU <org> educated at</s>
|
||
2025-06-11 11:07:26,116 - DEBUG - 原始生成文本: <triplet> TANG C <per> FU <org> educated at</s>
|
||
2025-06-11 11:07:26,116 - DEBUG - 处理后标记: ['<triplet>', 'TANG C', '<per>', 'FU', '<org>', 'educated at']
|
||
2025-06-11 11:07:26,116 - DEBUG - 添加三元组: TANG C(per) - educated at - FU(org)
|
||
2025-06-11 11:07:26,116 - DEBUG - 块 287 提取到 1 个三元组
|
||
2025-06-11 11:07:26,116 - DEBUG - 处理块 288/504: [J]. arXiv:2007.13069, 2020.
|
||
[16] DENG C Y, ZENG G...
|
||
2025-06-11 11:07:26,638 - DEBUG - 块 288 生成文本: <triplet> [16] DENG C Y, ZENG G F, CAI X Q, et al. A survey of knowledge based question answering with deep learning <concept> field of deep <media> part of</s>
|
||
2025-06-11 11:07:26,639 - DEBUG - 原始生成文本: <triplet> [16] DENG C Y, ZENG G F, CAI X Q, et al. A survey of knowledge based question answering with deep learning <concept> field of deep <media> part of</s>
|
||
2025-06-11 11:07:26,639 - DEBUG - 处理后标记: ['<triplet>', '[16] DENG C Y, ZENG G F, CAI X Q, et al. A survey of knowledge based question answering with deep learning', '<concept>', 'field of deep', '<media>', 'part of']
|
||
2025-06-11 11:07:26,639 - DEBUG - 添加三元组: [16] DENG C Y, ZENG G F, CAI X Q, et al. A survey of knowledge based question answering with deep learning(concept) - part of - field of deep(media)
|
||
2025-06-11 11:07:26,639 - DEBUG - 块 288 提取到 1 个三元组
|
||
2025-06-11 11:07:26,639 - DEBUG - 处理块 289/504: Journal on Artificial Intelligence,2020, 2(4): 157...
|
||
2025-06-11 11:07:26,873 - DEBUG - 块 289 生成文本: <triplet> <concept> Journal on Artificial Intelligence <media> published in</s>
|
||
2025-06-11 11:07:26,873 - DEBUG - 原始生成文本: <triplet> <concept> Journal on Artificial Intelligence <media> published in</s>
|
||
2025-06-11 11:07:26,873 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Journal on Artificial Intelligence', '<media>', 'published in']
|
||
2025-06-11 11:07:26,873 - DEBUG - 处理块 290/504: on Freebase from question-answer pairs[C]//Proceed...
|
||
2025-06-11 11:07:27,375 - DEBUG - 块 290 生成文本: <triplet> <concept> Conference on Empirical Methods in Natural <media> facet of the 2013 <eve> 2013 Conference <org> participant</s>
|
||
2025-06-11 11:07:27,375 - DEBUG - 原始生成文本: <triplet> <concept> Conference on Empirical Methods in Natural <media> facet of the 2013 <eve> 2013 Conference <org> participant</s>
|
||
2025-06-11 11:07:27,375 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Conference on Empirical Methods in Natural', '<media>', 'facet of the 2013', '<eve>', '2013 Conference', '<org>', 'participant']
|
||
2025-06-11 11:07:27,375 - DEBUG - 处理块 291/504: Language Processing, Seattle, Oct18-21, 2013. Stro...
|
||
2025-06-11 11:07:27,769 - DEBUG - 块 291 生成文本: <triplet> <per> KWIATKOWSKI T, CHOI E, ARTZI Y, et al. Scaling semantic <concept> field of work</s>
|
||
2025-06-11 11:07:27,769 - DEBUG - 原始生成文本: <triplet> <per> KWIATKOWSKI T, CHOI E, ARTZI Y, et al. Scaling semantic <concept> field of work</s>
|
||
2025-06-11 11:07:27,769 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'KWIATKOWSKI T, CHOI E, ARTZI Y, et al. Scaling semantic', '<concept>', 'field of work']
|
||
2025-06-11 11:07:27,769 - DEBUG - 处理块 292/504: parsers with on-the-fly ontology matching[C]//Proc...
|
||
2025-06-11 11:07:28,045 - DEBUG - 块 292 生成文本: <triplet> <concept> Empirical Methods in Natural <media> studies</s>
|
||
2025-06-11 11:07:28,045 - DEBUG - 原始生成文本: <triplet> <concept> Empirical Methods in Natural <media> studies</s>
|
||
2025-06-11 11:07:28,045 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Empirical Methods in Natural', '<media>', 'studies']
|
||
2025-06-11 11:07:28,045 - DEBUG - 处理块 293/504: Language Processing, Seattle, Oct18-21, 2013. Stro...
|
||
2025-06-11 11:07:28,386 - DEBUG - 块 293 生成文本: <triplet> BORDES A <per> CHOPRA S, WESTON J. Question answering <concept> significant event</s>
|
||
2025-06-11 11:07:28,386 - DEBUG - 原始生成文本: <triplet> BORDES A <per> CHOPRA S, WESTON J. Question answering <concept> significant event</s>
|
||
2025-06-11 11:07:28,386 - DEBUG - 处理后标记: ['<triplet>', 'BORDES A', '<per>', 'CHOPRA S, WESTON J. Question answering', '<concept>', 'significant event']
|
||
2025-06-11 11:07:28,386 - DEBUG - 添加三元组: BORDES A(per) - significant event - CHOPRA S, WESTON J. Question answering(concept)
|
||
2025-06-11 11:07:28,386 - DEBUG - 块 293 提取到 1 个三元组
|
||
2025-06-11 11:07:28,386 - DEBUG - 处理块 294/504: with subgraph embeddings[C]//Proceedings of the 20...
|
||
2025-06-11 11:07:28,737 - DEBUG - 块 294 生成文本: <triplet> embeddings <concept> subgraph <misc> instance of the 2014 Conference on Empirical Methods in Natural Language <eve> 2014 <date> publication date</s>
|
||
2025-06-11 11:07:28,738 - DEBUG - 原始生成文本: <triplet> embeddings <concept> subgraph <misc> instance of the 2014 Conference on Empirical Methods in Natural Language <eve> 2014 <date> publication date</s>
|
||
2025-06-11 11:07:28,738 - DEBUG - 处理后标记: ['<triplet>', 'embeddings', '<concept>', 'subgraph', '<misc>', 'instance of the 2014 Conference on Empirical Methods in Natural Language', '<eve>', '2014', '<date>', 'publication date']
|
||
2025-06-11 11:07:28,738 - DEBUG - 添加三元组: embeddings(concept) - instance of the 2014 Conference on Empirical Methods in Natural Language - subgraph(misc)
|
||
2025-06-11 11:07:28,738 - DEBUG - 块 294 提取到 1 个三元组
|
||
2025-06-11 11:07:28,738 - DEBUG - 处理块 295/504: Processing, Doha, Oct25-29, 2014. Stroudsburg: ACL...
|
||
2025-06-11 11:07:28,950 - DEBUG - 块 295 生成文本: <triplet> DURME B <misc> Information extraction <concept> instance of</s>
|
||
2025-06-11 11:07:28,950 - DEBUG - 原始生成文本: <triplet> DURME B <misc> Information extraction <concept> instance of</s>
|
||
2025-06-11 11:07:28,950 - DEBUG - 处理后标记: ['<triplet>', 'DURME B', '<misc>', 'Information extraction', '<concept>', 'instance of']
|
||
2025-06-11 11:07:28,950 - DEBUG - 添加三元组: DURME B(misc) - instance of - Information extraction(concept)
|
||
2025-06-11 11:07:28,950 - DEBUG - 块 295 提取到 1 个三元组
|
||
2025-06-11 11:07:28,950 - DEBUG - 处理块 296/504: structured data: question answering with Freebase[...
|
||
2025-06-11 11:07:29,195 - DEBUG - 块 296 生成文本: <triplet> <org> Association <concept> part of <triplet> Annual Meeting of the Association</s>
|
||
2025-06-11 11:07:29,195 - DEBUG - 原始生成文本: <triplet> <org> Association <concept> part of <triplet> Annual Meeting of the Association</s>
|
||
2025-06-11 11:07:29,195 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Association', '<concept>', 'part of', '<triplet>', 'Annual Meeting of the Association']
|
||
2025-06-11 11:07:29,195 - DEBUG - 处理块 297/504: for Computational Linguistics, Baltimore, Jun 22-2...
|
||
2025-06-11 11:07:29,364 - DEBUG - 块 297 生成文本: <triplet> <org> Stroudsburg <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:29,364 - DEBUG - 原始生成文本: <triplet> <org> Stroudsburg <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:29,364 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Stroudsburg', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:07:29,364 - DEBUG - 处理块 298/504: [21] YIH W T, HE X D, MEEK C. Semantic parsing for...
|
||
2025-06-11 11:07:29,811 - DEBUG - 块 298 生成文本: <triplet> <concept> Semantic parsing for single- relation question answering[C]//Proceedings of the 52nd <media> follows</s>
|
||
2025-06-11 11:07:29,811 - DEBUG - 原始生成文本: <triplet> <concept> Semantic parsing for single- relation question answering[C]//Proceedings of the 52nd <media> follows</s>
|
||
2025-06-11 11:07:29,811 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Semantic parsing for single- relation question answering[C]//Proceedings of the 52nd', '<media>', 'follows']
|
||
2025-06-11 11:07:29,811 - DEBUG - 处理块 299/504: Annual Meeting of the Association for Computationa...
|
||
2025-06-11 11:07:30,268 - DEBUG - 块 299 生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:07:30,268 - DEBUG - 原始生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:07:30,269 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Stroudsburg', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:30,269 - DEBUG - 处理块 300/504: [22] BAO J W, DUAN N, ZHOU M, et al. Knowledge- ba...
|
||
2025-06-11 11:07:30,695 - DEBUG - 块 300 生成文本: <triplet> ZHOU M <per> BAO J W <concept> field of work</s>
|
||
2025-06-11 11:07:30,695 - DEBUG - 原始生成文本: <triplet> ZHOU M <per> BAO J W <concept> field of work</s>
|
||
2025-06-11 11:07:30,695 - DEBUG - 处理后标记: ['<triplet>', 'ZHOU M', '<per>', 'BAO J W', '<concept>', 'field of work']
|
||
2025-06-11 11:07:30,695 - DEBUG - 添加三元组: ZHOU M(per) - field of work - BAO J W(concept)
|
||
2025-06-11 11:07:30,695 - DEBUG - 块 300 提取到 1 个三元组
|
||
2025-06-11 11:07:30,695 - DEBUG - 处理块 301/504: the 52nd Annual Meeting of the Association for Com...
|
||
2025-06-11 11:07:31,110 - DEBUG - 块 301 生成文本: <triplet> 967-976 <concept> 2014 <date> point in time</s>
|
||
2025-06-11 11:07:31,111 - DEBUG - 原始生成文本: <triplet> 967-976 <concept> 2014 <date> point in time</s>
|
||
2025-06-11 11:07:31,111 - DEBUG - 处理后标记: ['<triplet>', '967-976', '<concept>', '2014', '<date>', 'point in time']
|
||
2025-06-11 11:07:31,111 - DEBUG - 添加三元组: 967-976(concept) - point in time - 2014(date)
|
||
2025-06-11 11:07:31,111 - DEBUG - 块 301 提取到 1 个三元组
|
||
2025-06-11 11:07:31,111 - DEBUG - 处理块 302/504: [23] BERANT J, LIANG P. Semantic parsing via parap...
|
||
2025-06-11 11:07:31,398 - DEBUG - 块 302 生成文本: <triplet> <org> Semantic <concept> field of work</s>
|
||
2025-06-11 11:07:31,398 - DEBUG - 原始生成文本: <triplet> <org> Semantic <concept> field of work</s>
|
||
2025-06-11 11:07:31,398 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Semantic', '<concept>', 'field of work']
|
||
2025-06-11 11:07:31,398 - DEBUG - 处理块 303/504: for Computational Linguistics, Baltimore, Jun 22- ...
|
||
2025-06-11 11:07:31,770 - DEBUG - 块 303 生成文本: <triplet> BORDES A <per> USUNIER N, CHOPRA S, et al. Large-scale <concept> field of this field</s>
|
||
2025-06-11 11:07:31,771 - DEBUG - 原始生成文本: <triplet> BORDES A <per> USUNIER N, CHOPRA S, et al. Large-scale <concept> field of this field</s>
|
||
2025-06-11 11:07:31,771 - DEBUG - 处理后标记: ['<triplet>', 'BORDES A', '<per>', 'USUNIER N, CHOPRA S, et al. Large-scale', '<concept>', 'field of this field']
|
||
2025-06-11 11:07:31,771 - DEBUG - 添加三元组: BORDES A(per) - field of this field - USUNIER N, CHOPRA S, et al. Large-scale(concept)
|
||
2025-06-11 11:07:31,771 - DEBUG - 块 303 提取到 1 个三元组
|
||
2025-06-11 11:07:31,771 - DEBUG - 处理块 304/504: simple question answering with memory networks[J]....
|
||
2025-06-11 11:07:32,025 - DEBUG - 块 304 生成文本: <triplet> <concept> BAST H <per> discoverer or inventor</s>
|
||
2025-06-11 11:07:32,026 - DEBUG - 原始生成文本: <triplet> <concept> BAST H <per> discoverer or inventor</s>
|
||
2025-06-11 11:07:32,026 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'BAST H', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:07:32,026 - DEBUG - 处理块 305/504: on Freebase[C]//Proceedings of the 24th ACM Intern...
|
||
2025-06-11 11:07:32,376 - DEBUG - 块 305 生成文本: <triplet> <media> ACM International <org> part of</s>
|
||
2025-06-11 11:07:32,376 - DEBUG - 原始生成文本: <triplet> <media> ACM International <org> part of</s>
|
||
2025-06-11 11:07:32,376 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'ACM International', '<org>', 'part of']
|
||
2025-06-11 11:07:32,376 - DEBUG - 处理块 306/504: Melbourne, Oct 2015. New York: ACM,2015: 1431-1440...
|
||
2025-06-11 11:07:32,610 - DEBUG - 块 306 生成文本: <triplet> LAPATA M <misc> ACM <org> member of</s>
|
||
2025-06-11 11:07:32,610 - DEBUG - 原始生成文本: <triplet> LAPATA M <misc> ACM <org> member of</s>
|
||
2025-06-11 11:07:32,610 - DEBUG - 处理后标记: ['<triplet>', 'LAPATA M', '<misc>', 'ACM', '<org>', 'member of']
|
||
2025-06-11 11:07:32,610 - DEBUG - 添加三元组: LAPATA M(misc) - member of - ACM(org)
|
||
2025-06-11 11:07:32,610 - DEBUG - 块 306 提取到 1 个三元组
|
||
2025-06-11 11:07:32,610 - DEBUG - 处理块 307/504: antic parsing without question-answer pairs[J]. Tr...
|
||
2025-06-11 11:07:33,145 - DEBUG - 块 307 生成文本: <triplet> antic parsing without question-answer pairs[J. Transactionsof the Association for Computational Linguistics <media> Association <org> <concept> studies</s>
|
||
2025-06-11 11:07:33,145 - DEBUG - 原始生成文本: <triplet> antic parsing without question-answer pairs[J. Transactionsof the Association for Computational Linguistics <media> Association <org> <concept> studies</s>
|
||
2025-06-11 11:07:33,145 - DEBUG - 处理后标记: ['<triplet>', 'antic parsing without question-answer pairs[J. Transactionsof the Association for Computational Linguistics', '<media>', 'Association', '<org>', '<concept>', 'studies']
|
||
2025-06-11 11:07:33,145 - DEBUG - 添加三元组: antic parsing without question-answer pairs[J. Transactionsof the Association for Computational Linguistics(media) - <concept> - Association(org)
|
||
2025-06-11 11:07:33,145 - DEBUG - 块 307 提取到 1 个三元组
|
||
2025-06-11 11:07:33,145 - DEBUG - 处理块 308/504: [27] YIH W T, CHANG M W, HE X, et al. Semantic par...
|
||
2025-06-11 11:07:33,549 - DEBUG - 块 308 生成文本: <triplet> graph generation <concept> YIH W T, CHANG M W, HE X,HE X <media> Semantic parsing <misc> use</s>
|
||
2025-06-11 11:07:33,550 - DEBUG - 原始生成文本: <triplet> graph generation <concept> YIH W T, CHANG M W, HE X,HE X <media> Semantic parsing <misc> use</s>
|
||
2025-06-11 11:07:33,550 - DEBUG - 处理后标记: ['<triplet>', 'graph generation', '<concept>', 'YIH W T, CHANG M W, HE X,HE X', '<media>', 'Semantic parsing', '<misc>', 'use']
|
||
2025-06-11 11:07:33,550 - DEBUG - 添加三元组: graph generation(concept) - Semantic parsing - YIH W T, CHANG M W, HE X,HE X(media)
|
||
2025-06-11 11:07:33,550 - DEBUG - 块 308 提取到 1 个三元组
|
||
2025-06-11 11:07:33,550 - DEBUG - 处理块 309/504: knowledge base[C]//Proceedings of the53rd Annual M...
|
||
2025-06-11 11:07:34,060 - DEBUG - 块 309 生成文本: <triplet> <concept> Association for Computational Linguistics and the <org> member of <triplet> Annual Meeting of the Association <eve> the53rd <date> point in time</s>
|
||
2025-06-11 11:07:34,061 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics and the <org> member of <triplet> Annual Meeting of the Association <eve> the53rd <date> point in time</s>
|
||
2025-06-11 11:07:34,061 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics and the', '<org>', 'member of', '<triplet>', 'Annual Meeting of the Association', '<eve>', 'the53rd', '<date>', 'point in time']
|
||
2025-06-11 11:07:34,061 - DEBUG - 处理块 310/504: 7th International Joint Conference on Natural Lang...
|
||
2025-06-11 11:07:34,241 - DEBUG - 块 310 生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:07:34,241 - DEBUG - 原始生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:07:34,241 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Stroudsburg', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:34,241 - DEBUG - 处理块 311/504: [28] XU K, REDDY S, FENG Y, et al. Question answer...
|
||
2025-06-11 11:07:34,731 - DEBUG - 块 311 生成文本: <triplet> XU K, REDDY S, FENG Y, et al. Question answering on Freebase via relation extraction and textual evidence <concept> <misc> studies</s>
|
||
2025-06-11 11:07:34,731 - DEBUG - 原始生成文本: <triplet> XU K, REDDY S, FENG Y, et al. Question answering on Freebase via relation extraction and textual evidence <concept> <misc> studies</s>
|
||
2025-06-11 11:07:34,731 - DEBUG - 处理后标记: ['<triplet>', 'XU K, REDDY S, FENG Y, et al. Question answering on Freebase via relation extraction and textual evidence', '<concept>', '<misc>', 'studies']
|
||
2025-06-11 11:07:34,731 - DEBUG - 处理块 312/504: Proceedings of the 54th Annual Meeting of the Asso...
|
||
2025-06-11 11:07:35,233 - DEBUG - 块 312 生成文本: <triplet> <concept> Association for Computational Linguistics <org> Berlin <loc> location</s>
|
||
2025-06-11 11:07:35,233 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> Berlin <loc> location</s>
|
||
2025-06-11 11:07:35,233 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'Berlin', '<loc>', 'location']
|
||
2025-06-11 11:07:35,233 - DEBUG - 处理块 313/504: [29] LIANG C, BERANT J, LE Q, et al. Neural symbol...
|
||
2025-06-11 11:07:35,424 - DEBUG - 块 313 生成文本: <triplet> <concept> semantic parser <misc> subclass of</s>
|
||
2025-06-11 11:07:35,424 - DEBUG - 原始生成文本: <triplet> <concept> semantic parser <misc> subclass of</s>
|
||
2025-06-11 11:07:35,424 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'semantic parser', '<misc>', 'subclass of']
|
||
2025-06-11 11:07:35,424 - DEBUG - 处理块 314/504: supervision[C]//Proceedings of the 55th Annual Mee...
|
||
2025-06-11 11:07:35,668 - DEBUG - 块 314 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:35,668 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:35,668 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:07:35,668 - DEBUG - 处理块 315/504: Jul 30-Aug 4, 2017. Stroudsburg: ACL,2017: 23-33.
|
||
...
|
||
2025-06-11 11:07:35,848 - DEBUG - 块 315 生成文本: <triplet> XU K <per> 30Aug 4,2017 <date> date of death</s>
|
||
2025-06-11 11:07:35,848 - DEBUG - 原始生成文本: <triplet> XU K <per> 30Aug 4,2017 <date> date of death</s>
|
||
2025-06-11 11:07:35,848 - DEBUG - 处理后标记: ['<triplet>', 'XU K', '<per>', '30Aug 4,2017', '<date>', 'date of death']
|
||
2025-06-11 11:07:35,848 - DEBUG - 添加三元组: XU K(per) - date of death - 30Aug 4,2017(date)
|
||
2025-06-11 11:07:35,848 - DEBUG - 块 315 提取到 1 个三元组
|
||
2025-06-11 11:07:35,848 - DEBUG - 处理块 316/504: over knowledge base and free text[C]//Proceedings ...
|
||
2025-06-11 11:07:36,156 - DEBUG - 块 316 生成文本: <triplet> <concept> International Conference on Computational Linguistics <org> part of</s>
|
||
2025-06-11 11:07:36,156 - DEBUG - 原始生成文本: <triplet> <concept> International Conference on Computational Linguistics <org> part of</s>
|
||
2025-06-11 11:07:36,156 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Conference on Computational Linguistics', '<org>', 'part of']
|
||
2025-06-11 11:07:36,156 - DEBUG - 处理块 317/504: Osaka, Dec11-16, 2016. Stroudsburg: ACL,2016: 2397...
|
||
2025-06-11 11:07:36,304 - DEBUG - 块 317 生成文本: <triplet> <org> Osaka <loc> headquarters location</s>
|
||
2025-06-11 11:07:36,305 - DEBUG - 原始生成文本: <triplet> <org> Osaka <loc> headquarters location</s>
|
||
2025-06-11 11:07:36,305 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Osaka', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:36,305 - DEBUG - 处理块 318/504: to compose neural networks for question answering[...
|
||
2025-06-11 11:07:36,559 - DEBUG - 块 318 生成文本: <triplet> <concept> Conference of the North American <org> publisher</s>
|
||
2025-06-11 11:07:36,559 - DEBUG - 原始生成文本: <triplet> <concept> Conference of the North American <org> publisher</s>
|
||
2025-06-11 11:07:36,559 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Conference of the North American', '<org>', 'publisher']
|
||
2025-06-11 11:07:36,559 - DEBUG - 处理块 319/504: Chapter of the Association for Computational Lingu...
|
||
2025-06-11 11:07:36,910 - DEBUG - 块 319 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:36,910 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:36,910 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:07:36,910 - DEBUG - 处理块 320/504: [32] MILLER A H, FISCH A, DODGE J, et al. Key-valu...
|
||
2025-06-11 11:07:37,058 - DEBUG - 块 320 生成文本: <triplet> <org> directly reading <concept> field of work</s>
|
||
2025-06-11 11:07:37,058 - DEBUG - 原始生成文本: <triplet> <org> directly reading <concept> field of work</s>
|
||
2025-06-11 11:07:37,059 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'directly reading', '<concept>', 'field of work']
|
||
2025-06-11 11:07:37,059 - DEBUG - 处理块 321/504: of the 2016 Conference on Empirical Methods in Nat...
|
||
2025-06-11 11:07:37,548 - DEBUG - 块 321 生成文本: <triplet> ጊ X X D F B KP S H 陈子睿 <unk> пин <concept> ज़ा <eve> <org> 团 <media> 2016 Conference on Empirical Methods in Natural 1864 <time> studies</s>
|
||
2025-06-11 11:07:37,548 - DEBUG - 原始生成文本: <triplet> ጊ X X D F B KP S H 陈子睿 <unk> пин <concept> ज़ा <eve> <org> 团 <media> 2016 Conference on Empirical Methods in Natural 1864 <time> studies</s>
|
||
2025-06-11 11:07:37,548 - DEBUG - 处理后标记: ['<triplet>', 'ጊ X X D F B KP S H 陈子睿', '<unk>', 'пин', '<concept>', 'ज़ा', '<eve>', '<org>', '团', '<media>', '2016 Conference on Empirical Methods in Natural 1864', '<time>', 'studies']
|
||
2025-06-11 11:07:37,548 - DEBUG - 添加三元组: ጊ X X D F B KP S H 陈子睿(unk) - ज़ा - пин(concept)
|
||
2025-06-11 11:07:37,548 - DEBUG - 块 321 提取到 1 个三元组
|
||
2025-06-11 11:07:37,548 - DEBUG - 处理块 322/504: Language Processing, Austin, Nov 1-4, 2016. Stroud...
|
||
2025-06-11 11:07:37,898 - DEBUG - 块 322 生成文本: <triplet> ZHANG Y, <per> KOZAREV A Z, et al. Variational reasoning <concept> instance of</s>
|
||
2025-06-11 11:07:37,899 - DEBUG - 原始生成文本: <triplet> ZHANG Y, <per> KOZAREV A Z, et al. Variational reasoning <concept> instance of</s>
|
||
2025-06-11 11:07:37,899 - DEBUG - 处理后标记: ['<triplet>', 'ZHANG Y,', '<per>', 'KOZAREV A Z, et al. Variational reasoning', '<concept>', 'instance of']
|
||
2025-06-11 11:07:37,899 - DEBUG - 添加三元组: ZHANG Y,(per) - instance of - KOZAREV A Z, et al. Variational reasoning(concept)
|
||
2025-06-11 11:07:37,899 - DEBUG - 块 322 提取到 1 个三元组
|
||
2025-06-11 11:07:37,899 - DEBUG - 处理块 323/504: for question answering with knowledge graph[J]. ar...
|
||
2025-06-11 11:07:38,154 - DEBUG - 块 323 生成文本: <triplet> <concept> CUI W <per> discoverer or inventor</s>
|
||
2025-06-11 11:07:38,154 - DEBUG - 原始生成文本: <triplet> <concept> CUI W <per> discoverer or inventor</s>
|
||
2025-06-11 11:07:38,154 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'CUI W', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:07:38,154 - DEBUG - 处理块 324/504: answering over QA corpora and knowledge bases[J]. ...
|
||
2025-06-11 11:07:38,484 - DEBUG - 块 324 生成文本: <triplet> YU M, YIN W, HASAN K S, <per> V, K. <concept> K</s>
|
||
2025-06-11 11:07:38,484 - DEBUG - 原始生成文本: <triplet> YU M, YIN W, HASAN K S, <per> V, K. <concept> K</s>
|
||
2025-06-11 11:07:38,484 - DEBUG - 处理后标记: ['<triplet>', 'YU M, YIN W, HASAN K S,', '<per>', 'V, K.', '<concept>', 'K']
|
||
2025-06-11 11:07:38,484 - DEBUG - 添加三元组: YU M, YIN W, HASAN K S,(per) - K - V, K.(concept)
|
||
2025-06-11 11:07:38,484 - DEBUG - 块 324 提取到 1 个三元组
|
||
2025-06-11 11:07:38,484 - DEBUG - 处理块 325/504: relation detection for knowledge base question ans...
|
||
2025-06-11 11:07:38,611 - DEBUG - 块 325 生成文本: <triplet> <org> Association <concept> instance of <triplet> Association</s>
|
||
2025-06-11 11:07:38,612 - DEBUG - 原始生成文本: <triplet> <org> Association <concept> instance of <triplet> Association</s>
|
||
2025-06-11 11:07:38,612 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Association', '<concept>', 'instance of', '<triplet>', 'Association']
|
||
2025-06-11 11:07:38,612 - DEBUG - 处理块 326/504: for Computational Linguistics, Vancouver, Jul 30- ...
|
||
2025-06-11 11:07:38,941 - DEBUG - 块 326 生成文本: <triplet> GUREVYCH I. Modeling semantics with <concept> SOROKIN D, <per> participant</s>
|
||
2025-06-11 11:07:38,941 - DEBUG - 原始生成文本: <triplet> GUREVYCH I. Modeling semantics with <concept> SOROKIN D, <per> participant</s>
|
||
2025-06-11 11:07:38,941 - DEBUG - 处理后标记: ['<triplet>', 'GUREVYCH I. Modeling semantics with', '<concept>', 'SOROKIN D,', '<per>', 'participant']
|
||
2025-06-11 11:07:38,941 - DEBUG - 添加三元组: GUREVYCH I. Modeling semantics with(concept) - participant - SOROKIN D,(per)
|
||
2025-06-11 11:07:38,941 - DEBUG - 块 326 提取到 1 个三元组
|
||
2025-06-11 11:07:38,941 - DEBUG - 处理块 327/504: gated graph neural networks for knowledge base que...
|
||
2025-06-11 11:07:39,709 - DEBUG - 块 327 生成文本: <triplet> graph neural networks <concept> knowledge base question answering <media> part of the27th International Conference <eve> main <org> main subject <per> main the 27th <misc> main stream <triplet> knowledgebase question <unk> knowledge <loc> mainland <dis> main event <time> main body</s>
|
||
2025-06-11 11:07:39,709 - DEBUG - 原始生成文本: <triplet> graph neural networks <concept> knowledge base question answering <media> part of the27th International Conference <eve> main <org> main subject <per> main the 27th <misc> main stream <triplet> knowledgebase question <unk> knowledge <loc> mainland <dis> main event <time> main body</s>
|
||
2025-06-11 11:07:39,709 - DEBUG - 处理后标记: ['<triplet>', 'graph neural networks', '<concept>', 'knowledge base question answering', '<media>', 'part of the27th International Conference', '<eve>', 'main', '<org>', 'main subject', '<per>', 'main the 27th', '<misc>', 'main stream', '<triplet>', 'knowledgebase question', '<unk>', 'knowledge', '<loc>', 'mainland', '<dis>', 'main event', '<time>', 'main body']
|
||
2025-06-11 11:07:39,709 - DEBUG - 添加三元组: graph neural networks(concept) - part of the27th International Conference - knowledge base question answering(media)
|
||
2025-06-11 11:07:39,709 - DEBUG - 添加三元组: knowledgebase question(unk) - mainland - knowledge(loc)
|
||
2025-06-11 11:07:39,709 - DEBUG - 块 327 提取到 2 个三元组
|
||
2025-06-11 11:07:39,709 - DEBUG - 处理块 328/504: on Computational Linguistics, Santa Fe, Aug 20-26,...
|
||
2025-06-11 11:07:39,964 - DEBUG - 块 328 生成文本: <triplet> <loc> Open domain <concept> instance of <triplet> DHINGRA B <media> Open a list of</s>
|
||
2025-06-11 11:07:39,965 - DEBUG - 原始生成文本: <triplet> <loc> Open domain <concept> instance of <triplet> DHINGRA B <media> Open a list of</s>
|
||
2025-06-11 11:07:39,965 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'Open domain', '<concept>', 'instance of', '<triplet>', 'DHINGRA B', '<media>', 'Open a list of']
|
||
2025-06-11 11:07:39,965 - DEBUG - 处理块 329/504: question answering using early fusion of knowledge...
|
||
2025-06-11 11:07:40,443 - DEBUG - 块 329 生成文本: <triplet> <media> Conference on Empirical <concept> instance of the 2018 <eve> Conference On <per> instance</s>
|
||
2025-06-11 11:07:40,443 - DEBUG - 原始生成文本: <triplet> <media> Conference on Empirical <concept> instance of the 2018 <eve> Conference On <per> instance</s>
|
||
2025-06-11 11:07:40,443 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Conference on Empirical', '<concept>', 'instance of the 2018', '<eve>', 'Conference On', '<per>', 'instance']
|
||
2025-06-11 11:07:40,443 - DEBUG - 处理块 330/504: Methods in Natural Language Processing, Brussels, ...
|
||
2025-06-11 11:07:40,718 - DEBUG - 块 330 生成文本: <triplet> <loc> Brussels <org> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:40,719 - DEBUG - 原始生成文本: <triplet> <loc> Brussels <org> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:40,719 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'Brussels', '<org>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:07:40,719 - DEBUG - 处理块 331/504: [38] TALMOR A, BERANT J. The web as a knowledge-ba...
|
||
2025-06-11 11:07:41,197 - DEBUG - 块 331 生成文本: <triplet> <org> TALMOR A <media> based on</s>
|
||
2025-06-11 11:07:41,197 - DEBUG - 原始生成文本: <triplet> <org> TALMOR A <media> based on</s>
|
||
2025-06-11 11:07:41,197 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'TALMOR A', '<media>', 'based on']
|
||
2025-06-11 11:07:41,197 - DEBUG - 处理块 332/504: Conference of the North American Chapter of the As...
|
||
2025-06-11 11:07:41,614 - DEBUG - 块 332 生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> Conference of the North American Chapter <media> <loc> country</s>
|
||
2025-06-11 11:07:41,614 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> Conference of the North American Chapter <media> <loc> country</s>
|
||
2025-06-11 11:07:41,614 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'part of', '<triplet>', 'Conference of the North American Chapter', '<media>', '<loc>', 'country']
|
||
2025-06-11 11:07:41,614 - DEBUG - 处理块 333/504: New Orleans, Jun1-6, 2018. Stroudsburg: ACL,2018: ...
|
||
2025-06-11 11:07:42,018 - DEBUG - 块 333 生成文本: <triplet> XU K, LAI Y X, FENG Y S, et al. Enhancing key- value <concept> instance of</s>
|
||
2025-06-11 11:07:42,018 - DEBUG - 原始生成文本: <triplet> XU K, LAI Y X, FENG Y S, et al. Enhancing key- value <concept> instance of</s>
|
||
2025-06-11 11:07:42,019 - DEBUG - 处理后标记: ['<triplet>', 'XU K, LAI Y X, FENG Y S, et al. Enhancing key- value', '<concept>', 'instance of']
|
||
2025-06-11 11:07:42,019 - DEBUG - 处理块 334/504: memory neural networks for knowledge based questio...
|
||
2025-06-11 11:07:42,305 - DEBUG - 块 334 生成文本: <triplet> <concept> knowledge based question answering <misc> studies</s>
|
||
2025-06-11 11:07:42,305 - DEBUG - 原始生成文本: <triplet> <concept> knowledge based question answering <misc> studies</s>
|
||
2025-06-11 11:07:42,306 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge based question answering', '<misc>', 'studies']
|
||
2025-06-11 11:07:42,306 - DEBUG - 处理块 335/504: North American Chapter of the Association for Comp...
|
||
2025-06-11 11:07:42,667 - DEBUG - 块 335 生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> Minneapolis, Jun2019 <time> 2019 <date> point in time</s>
|
||
2025-06-11 11:07:42,667 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> part of <triplet> Minneapolis, Jun2019 <time> 2019 <date> point in time</s>
|
||
2025-06-11 11:07:42,667 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'part of', '<triplet>', 'Minneapolis, Jun2019', '<time>', '2019', '<date>', 'point in time']
|
||
2025-06-11 11:07:42,667 - DEBUG - 处理块 336/504: [40] MAHESHWARI G, TRIVEDI P, LUKOVNIKOV D, et al....
|
||
2025-06-11 11:07:42,816 - DEBUG - 块 336 生成文本: <triplet> graphs <concept> complex question answering <misc> studies</s>
|
||
2025-06-11 11:07:42,816 - DEBUG - 原始生成文本: <triplet> graphs <concept> complex question answering <misc> studies</s>
|
||
2025-06-11 11:07:42,816 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'complex question answering', '<misc>', 'studies']
|
||
2025-06-11 11:07:42,816 - DEBUG - 添加三元组: graphs(concept) - studies - complex question answering(misc)
|
||
2025-06-11 11:07:42,816 - DEBUG - 块 336 提取到 1 个三元组
|
||
2025-06-11 11:07:42,816 - DEBUG - 处理块 337/504: over knowledge graphs[C]//LNCS 11778: Proceedings ...
|
||
2025-06-11 11:07:42,986 - DEBUG - 块 337 生成文本: <triplet> <concept> International Semantic Web Conference <media> part of</s>
|
||
2025-06-11 11:07:42,986 - DEBUG - 原始生成文本: <triplet> <concept> International Semantic Web Conference <media> part of</s>
|
||
2025-06-11 11:07:42,986 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Semantic Web Conference', '<media>', 'part of']
|
||
2025-06-11 11:07:42,986 - DEBUG - 处理块 338/504: Oct 26-30, 2019. Cham: Springer,2019: 487-504.
|
||
[41...
|
||
2025-06-11 11:07:43,263 - DEBUG - 块 338 生成文本: <triplet> 487-504 <concept> 2019 <date> point in time</s>
|
||
2025-06-11 11:07:43,263 - DEBUG - 原始生成文本: <triplet> 487-504 <concept> 2019 <date> point in time</s>
|
||
2025-06-11 11:07:43,263 - DEBUG - 处理后标记: ['<triplet>', '487-504', '<concept>', '2019', '<date>', 'point in time']
|
||
2025-06-11 11:07:43,263 - DEBUG - 添加三元组: 487-504(concept) - point in time - 2019(date)
|
||
2025-06-11 11:07:43,263 - DEBUG - 块 338 提取到 1 个三元组
|
||
2025-06-11 11:07:43,263 - DEBUG - 处理块 339/504: domain question answering with iterative retrieval...
|
||
2025-06-11 11:07:43,881 - DEBUG - 块 339 生成文本: <triplet> ledge base <concept> domain question answering with iterative base</s>
|
||
2025-06-11 11:07:43,881 - DEBUG - 原始生成文本: <triplet> ledge base <concept> domain question answering with iterative base</s>
|
||
2025-06-11 11:07:43,881 - DEBUG - 处理后标记: ['<triplet>', 'ledge base', '<concept>', 'domain question answering with iterative base']
|
||
2025-06-11 11:07:43,881 - DEBUG - 处理块 340/504: on Empirical Methods in Natural Language Processin...
|
||
2025-06-11 11:07:44,040 - DEBUG - 块 340 生成文本: <triplet> <media> Natural Language Processing <concept> main subject</s>
|
||
2025-06-11 11:07:44,040 - DEBUG - 原始生成文本: <triplet> <media> Natural Language Processing <concept> main subject</s>
|
||
2025-06-11 11:07:44,040 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Natural Language Processing', '<concept>', 'main subject']
|
||
2025-06-11 11:07:44,040 - DEBUG - 处理块 341/504: Processing, Hong Kong, China, Nov3-7, 2019. Stroud...
|
||
2025-06-11 11:07:44,306 - DEBUG - 块 341 生成文本: <triplet> <org> Hong Kong <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:44,306 - DEBUG - 原始生成文本: <triplet> <org> Hong Kong <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:44,306 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Hong Kong', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:07:44,306 - DEBUG - 处理块 342/504: hop question answering over knowledge graphs using...
|
||
2025-06-11 11:07:44,970 - DEBUG - 块 342 生成文本: <triplet> graphs <concept> know- ledge base embeddings</s>
|
||
2025-06-11 11:07:44,970 - DEBUG - 原始生成文本: <triplet> graphs <concept> know- ledge base embeddings</s>
|
||
2025-06-11 11:07:44,970 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'know- ledge base embeddings']
|
||
2025-06-11 11:07:44,970 - DEBUG - 处理块 343/504: Meeting of the Association for Computational Lingu...
|
||
2025-06-11 11:07:45,427 - DEBUG - 块 343 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:45,428 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:45,428 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:07:45,428 - DEBUG - 处理块 344/504: [43] LAN Y S, JIANG J. Query graph generation for ...
|
||
2025-06-11 11:07:45,917 - DEBUG - 块 344 生成文本: <triplet> graph generation for answering multi- hop complex questions from knowledge bases <concept> J.J.Query <media> part of <misc> J <per> named</s>
|
||
2025-06-11 11:07:45,917 - DEBUG - 原始生成文本: <triplet> graph generation for answering multi- hop complex questions from knowledge bases <concept> J.J.Query <media> part of <misc> J <per> named</s>
|
||
2025-06-11 11:07:45,917 - DEBUG - 处理后标记: ['<triplet>', 'graph generation for answering multi- hop complex questions from knowledge bases', '<concept>', 'J.J.Query', '<media>', 'part of', '<misc>', 'J', '<per>', 'named']
|
||
2025-06-11 11:07:45,917 - DEBUG - 添加三元组: graph generation for answering multi- hop complex questions from knowledge bases(concept) - part of - J.J.Query(media)
|
||
2025-06-11 11:07:45,917 - DEBUG - 块 344 提取到 1 个三元组
|
||
2025-06-11 11:07:45,917 - DEBUG - 处理块 345/504: Proceedings of the 58th Annual Meeting of the Asso...
|
||
2025-06-11 11:07:46,097 - DEBUG - 块 345 生成文本: <triplet> 969-974 <concept> 2020 <date> point in time</s>
|
||
2025-06-11 11:07:46,097 - DEBUG - 原始生成文本: <triplet> 969-974 <concept> 2020 <date> point in time</s>
|
||
2025-06-11 11:07:46,097 - DEBUG - 处理后标记: ['<triplet>', '969-974', '<concept>', '2020', '<date>', 'point in time']
|
||
2025-06-11 11:07:46,097 - DEBUG - 添加三元组: 969-974(concept) - point in time - 2020(date)
|
||
2025-06-11 11:07:46,097 - DEBUG - 块 345 提取到 1 个三元组
|
||
2025-06-11 11:07:46,097 - DEBUG - 处理块 346/504: [44] WANG X, ZOU L, WANG C K, et al. Research on k...
|
||
2025-06-11 11:07:46,491 - DEBUG - 块 346 生成文本: <triplet> <concept> graph data management <unk> studies</s>
|
||
2025-06-11 11:07:46,491 - DEBUG - 原始生成文本: <triplet> <concept> graph data management <unk> studies</s>
|
||
2025-06-11 11:07:46,491 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'graph data management', '<unk>', 'studies']
|
||
2025-06-11 11:07:46,491 - DEBUG - 处理块 347/504: 王鑫 , 邹磊 , 王朝坤 , 等 . 知识图谱数据管理研究综述 [J].
|
||
软件学报 , 2019,...
|
||
2025-06-11 11:07:46,843 - DEBUG - 块 347 生成文本: <triplet> 邹磊 <per> 知识图谱 <concept> field of work</s>
|
||
2025-06-11 11:07:46,843 - DEBUG - 原始生成文本: <triplet> 邹磊 <per> 知识图谱 <concept> field of work</s>
|
||
2025-06-11 11:07:46,843 - DEBUG - 处理后标记: ['<triplet>', '邹磊', '<per>', '知识图谱', '<concept>', 'field of work']
|
||
2025-06-11 11:07:46,843 - DEBUG - 添加三元组: 邹磊(per) - field of work - 知识图谱(concept)
|
||
2025-06-11 11:07:46,843 - DEBUG - 块 347 提取到 1 个三元组
|
||
2025-06-11 11:07:46,843 - DEBUG - 处理块 348/504: [J]. arXiv:1309.4408, 2013.
|
||
[46] WONG Y, MOONEY R....
|
||
2025-06-11 11:07:46,980 - DEBUG - 块 348 生成文本: <triplet> <concept> semantic parsing <media> studies</s>
|
||
2025-06-11 11:07:46,981 - DEBUG - 原始生成文本: <triplet> <concept> semantic parsing <media> studies</s>
|
||
2025-06-11 11:07:46,981 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'semantic parsing', '<media>', 'studies']
|
||
2025-06-11 11:07:46,981 - DEBUG - 处理块 349/504: of the45th Annual Meeting of the Association for C...
|
||
2025-06-11 11:07:47,129 - DEBUG - 块 349 生成文本: <triplet> 960-967 <concept> 2007 <date> point in time</s>
|
||
2025-06-11 11:07:47,129 - DEBUG - 原始生成文本: <triplet> 960-967 <concept> 2007 <date> point in time</s>
|
||
2025-06-11 11:07:47,129 - DEBUG - 处理后标记: ['<triplet>', '960-967', '<concept>', '2007', '<date>', 'point in time']
|
||
2025-06-11 11:07:47,129 - DEBUG - 添加三元组: 960-967(concept) - point in time - 2007(date)
|
||
2025-06-11 11:07:47,130 - DEBUG - 块 349 提取到 1 个三元组
|
||
2025-06-11 11:07:47,130 - DEBUG - 处理块 350/504: [47] KWIATKOWKSI T, ZETTLEMOYER L, GOLDWATER S,
|
||
et...
|
||
2025-06-11 11:07:47,278 - DEBUG - 块 350 生成文本: <triplet> <concept> CCG grammar <org> subclass of</s>
|
||
2025-06-11 11:07:47,278 - DEBUG - 原始生成文本: <triplet> <concept> CCG grammar <org> subclass of</s>
|
||
2025-06-11 11:07:47,278 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'CCG grammar', '<org>', 'subclass of']
|
||
2025-06-11 11:07:47,278 - DEBUG - 处理块 351/504: form with higher- order unification[C]//Proceeding...
|
||
2025-06-11 11:07:47,788 - DEBUG - 块 351 生成文本: <triplet> <concept> Conference on Empirical Methods in Natural Language <media> part of the 2010 <eve> 2010 Conference <org> participant</s>
|
||
2025-06-11 11:07:47,788 - DEBUG - 原始生成文本: <triplet> <concept> Conference on Empirical Methods in Natural Language <media> part of the 2010 <eve> 2010 Conference <org> participant</s>
|
||
2025-06-11 11:07:47,789 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Conference on Empirical Methods in Natural Language', '<media>', 'part of the 2010', '<eve>', '2010 Conference', '<org>', 'participant']
|
||
2025-06-11 11:07:47,789 - DEBUG - 处理块 352/504: Processing, Cambridge, Oct 9-11, 2010. Stroudsburg...
|
||
2025-06-11 11:07:48,108 - DEBUG - 块 352 生成文本: <triplet> <media> Learning to map <concept> facet of</s>
|
||
2025-06-11 11:07:48,108 - DEBUG - 原始生成文本: <triplet> <media> Learning to map <concept> facet of</s>
|
||
2025-06-11 11:07:48,108 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Learning to map', '<concept>', 'facet of']
|
||
2025-06-11 11:07:48,108 - DEBUG - 处理块 353/504: sentences to logical form: structured classificati...
|
||
2025-06-11 11:07:48,450 - DEBUG - 块 353 生成文本: <triplet> <concept> sentences to logical form <unk> instance of</s>
|
||
2025-06-11 11:07:48,450 - DEBUG - 原始生成文本: <triplet> <concept> sentences to logical form <unk> instance of</s>
|
||
2025-06-11 11:07:48,450 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'sentences to logical form', '<unk>', 'instance of']
|
||
2025-06-11 11:07:48,450 - DEBUG - 处理块 354/504: [49] YAHYA M, BERBERICH K, ELBASSUONI S, et al.
|
||
Na...
|
||
2025-06-11 11:07:49,080 - DEBUG - 块 354 生成文本: <triplet> YAHYA M, BERBERICH K, ELBASSUONI S <per> Natural language questions for the web of natural language <concept> web <media> part of the Internet <unk> <misc> part <org> <loc> published</s>
|
||
2025-06-11 11:07:49,080 - DEBUG - 原始生成文本: <triplet> YAHYA M, BERBERICH K, ELBASSUONI S <per> Natural language questions for the web of natural language <concept> web <media> part of the Internet <unk> <misc> part <org> <loc> published</s>
|
||
2025-06-11 11:07:49,080 - DEBUG - 处理后标记: ['<triplet>', 'YAHYA M, BERBERICH K, ELBASSUONI S', '<per>', 'Natural language questions for the web of natural language', '<concept>', 'web', '<media>', 'part of the Internet', '<unk>', '<misc>', 'part', '<org>', '<loc>', 'published']
|
||
2025-06-11 11:07:49,080 - DEBUG - 添加三元组: YAHYA M, BERBERICH K, ELBASSUONI S(per) - web - Natural language questions for the web of natural language(concept)
|
||
2025-06-11 11:07:49,080 - DEBUG - 块 354 提取到 1 个三元组
|
||
2025-06-11 11:07:49,080 - DEBUG - 处理块 355/504: of the 2012 Joint Conference on Empirical Methods ...
|
||
2025-06-11 11:07:49,526 - DEBUG - 块 355 生成文本: <triplet> <concept> 2012 <date> point in time <triplet> 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural <media> 2012</s>
|
||
2025-06-11 11:07:49,526 - DEBUG - 原始生成文本: <triplet> <concept> 2012 <date> point in time <triplet> 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural <media> 2012</s>
|
||
2025-06-11 11:07:49,526 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '2012', '<date>', 'point in time', '<triplet>', '2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural', '<media>', '2012']
|
||
2025-06-11 11:07:49,526 - DEBUG - 处理块 356/504: Language Learning, Jeju Island, Jul12-14, 2012. St...
|
||
2025-06-11 11:07:50,016 - DEBUG - 块 356 生成文本: <triplet> YAHYA M, BERBERICH K, SSUONI S E B <per> SIU <concept> <unk> <misc> <media> follows</s>
|
||
2025-06-11 11:07:50,016 - DEBUG - 原始生成文本: <triplet> YAHYA M, BERBERICH K, SSUONI S E B <per> SIU <concept> <unk> <misc> <media> follows</s>
|
||
2025-06-11 11:07:50,016 - DEBUG - 处理后标记: ['<triplet>', 'YAHYA M, BERBERICH K, SSUONI S E B', '<per>', 'SIU', '<concept>', '<unk>', '<misc>', '<media>', 'follows']
|
||
2025-06-11 11:07:50,016 - DEBUG - 添加三元组: YAHYA M, BERBERICH K, SSUONI S E B(per) - <unk> - SIU(concept)
|
||
2025-06-11 11:07:50,016 - DEBUG - 块 356 提取到 1 个三元组
|
||
2025-06-11 11:07:50,016 - DEBUG - 处理块 357/504: question answering over the web of linked data[C]/...
|
||
2025-06-11 11:07:50,537 - DEBUG - 块 357 生成文本: <triplet> <concept> International Conference on Informa- <org> subclass of the 22nd ACM <eve> 22th <media> follows</s>
|
||
2025-06-11 11:07:50,537 - DEBUG - 原始生成文本: <triplet> <concept> International Conference on Informa- <org> subclass of the 22nd ACM <eve> 22th <media> follows</s>
|
||
2025-06-11 11:07:50,538 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Conference on Informa-', '<org>', 'subclass of the 22nd ACM', '<eve>', '22th', '<media>', 'follows']
|
||
2025-06-11 11:07:50,538 - DEBUG - 处理块 358/504: tion and Knowledge Management, New York, Oct 2013....
|
||
2025-06-11 11:07:50,697 - DEBUG - 块 358 生成文本: <triplet> <org> New York <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:50,697 - DEBUG - 原始生成文本: <triplet> <org> New York <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:07:50,697 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New York', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:07:50,697 - DEBUG - 处理块 359/504: semantic parsers[J]. Transactions of the Associati...
|
||
2025-06-11 11:07:51,144 - DEBUG - 块 359 生成文本: <triplet> منظوری ጊ X X D F B KP S H <org> member of</s>
|
||
2025-06-11 11:07:51,144 - DEBUG - 原始生成文本: <triplet> منظوری ጊ X X D F B KP S H <org> member of</s>
|
||
2025-06-11 11:07:51,144 - DEBUG - 处理后标记: ['<triplet>', 'منظوری ጊ X X D F B KP S H', '<org>', 'member of']
|
||
2025-06-11 11:07:51,144 - DEBUG - 处理块 360/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:07:51,463 - DEBUG - 块 360 生成文本: <triplet> <media> 计算机科学 <concept> main subject</s>
|
||
2025-06-11 11:07:51,463 - DEBUG - 原始生成文本: <triplet> <media> 计算机科学 <concept> main subject</s>
|
||
2025-06-11 11:07:51,463 - DEBUG - 处理后标记: ['<triplet>', '<media>', '计算机科学', '<concept>', 'main subject']
|
||
2025-06-11 11:07:51,463 - DEBUG - 处理块 361/504: [52] REDDY S, TCKSTRM O, COLLINS M, et al. Transfo...
|
||
2025-06-11 11:07:51,633 - DEBUG - 块 361 生成文本: <triplet> <misc> dependency structure <concept> subclass of</s>
|
||
2025-06-11 11:07:51,633 - DEBUG - 原始生成文本: <triplet> <misc> dependency structure <concept> subclass of</s>
|
||
2025-06-11 11:07:51,633 - DEBUG - 处理后标记: ['<triplet>', '<misc>', 'dependency structure', '<concept>', 'subclass of']
|
||
2025-06-11 11:07:51,633 - DEBUG - 处理块 362/504: [J]. Transactions of the Association for Computati...
|
||
2025-06-11 11:07:52,156 - DEBUG - 块 362 生成文本: <triplet> <per> REDDY S, TCKSTRM O, PETROV S <media> part of</s>
|
||
2025-06-11 11:07:52,156 - DEBUG - 原始生成文本: <triplet> <per> REDDY S, TCKSTRM O, PETROV S <media> part of</s>
|
||
2025-06-11 11:07:52,156 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'REDDY S, TCKSTRM O, PETROV S', '<media>', 'part of']
|
||
2025-06-11 11:07:52,156 - DEBUG - 处理块 363/504: semantic parsing[C]//Proceedings of the 2017 Confe...
|
||
2025-06-11 11:07:52,336 - DEBUG - 块 363 生成文本: <triplet> <concept> Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:07:52,336 - DEBUG - 原始生成文本: <triplet> <concept> Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:07:52,336 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Empirical Methods in Natural Language Processing', '<media>', 'studies']
|
||
2025-06-11 11:07:52,336 - DEBUG - 处理块 364/504: Copenhagen, Sep9-11, 2017. Stroudsburg: ACL,2017: ...
|
||
2025-06-11 11:07:52,528 - DEBUG - 块 364 生成文本: <triplet> <org> O. Open question <concept> instance of</s>
|
||
2025-06-11 11:07:52,528 - DEBUG - 原始生成文本: <triplet> <org> O. Open question <concept> instance of</s>
|
||
2025-06-11 11:07:52,528 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'O. Open question', '<concept>', 'instance of']
|
||
2025-06-11 11:07:52,528 - DEBUG - 处理块 365/504: answering over curated and extracted knowledge bas...
|
||
2025-06-11 11:07:52,676 - DEBUG - 块 365 生成文本: <triplet> <concept> SIGKDD International <org> part of</s>
|
||
2025-06-11 11:07:52,677 - DEBUG - 原始生成文本: <triplet> <concept> SIGKDD International <org> part of</s>
|
||
2025-06-11 11:07:52,677 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'SIGKDD International', '<org>', 'part of']
|
||
2025-06-11 11:07:52,677 - DEBUG - 处理块 366/504: erence on Knowledge Discovery and Data Mining, New...
|
||
2025-06-11 11:07:52,952 - DEBUG - 块 366 生成文本: <triplet> <per> ACM <org> member of <triplet> ASM <loc> ACB <media> part of</s>
|
||
2025-06-11 11:07:52,952 - DEBUG - 原始生成文本: <triplet> <per> ACM <org> member of <triplet> ASM <loc> ACB <media> part of</s>
|
||
2025-06-11 11:07:52,952 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'ACM', '<org>', 'member of', '<triplet>', 'ASM', '<loc>', 'ACB', '<media>', 'part of']
|
||
2025-06-11 11:07:52,952 - DEBUG - 处理块 367/504: [55] LOPEZ V, MOTTA E. Ontology-driven question an...
|
||
2025-06-11 11:07:53,133 - DEBUG - 块 367 生成文本: <triplet> <concept> LNCS 3136 <dis> studies</s>
|
||
2025-06-11 11:07:53,133 - DEBUG - 原始生成文本: <triplet> <concept> LNCS 3136 <dis> studies</s>
|
||
2025-06-11 11:07:53,134 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'LNCS 3136', '<dis>', 'studies']
|
||
2025-06-11 11:07:53,134 - DEBUG - 处理块 368/504: national Conference on Applications of Natural Lan...
|
||
2025-06-11 11:07:53,293 - DEBUG - 块 368 生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:07:53,293 - DEBUG - 原始生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:07:53,293 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Berlin', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:53,293 - DEBUG - 处理块 369/504: Heidelberg: Springer, 2004: 89-102.
|
||
[56] LOPEZ V, ...
|
||
2025-06-11 11:07:53,601 - DEBUG - 块 369 生成文本: <triplet> <media> ontology <concept> facet of</s>
|
||
2025-06-11 11:07:53,601 - DEBUG - 原始生成文本: <triplet> <media> ontology <concept> facet of</s>
|
||
2025-06-11 11:07:53,601 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'ontology', '<concept>', 'facet of']
|
||
2025-06-11 11:07:53,601 - DEBUG - 处理块 370/504: semantic intranets[J]. Social Science Electronic P...
|
||
2025-06-11 11:07:53,814 - DEBUG - 块 370 生成文本: <triplet> DAMLJANOVIC D <media> semantic intranets <concept> instance of</s>
|
||
2025-06-11 11:07:53,814 - DEBUG - 原始生成文本: <triplet> DAMLJANOVIC D <media> semantic intranets <concept> instance of</s>
|
||
2025-06-11 11:07:53,814 - DEBUG - 处理后标记: ['<triplet>', 'DAMLJANOVIC D', '<media>', 'semantic intranets', '<concept>', 'instance of']
|
||
2025-06-11 11:07:53,814 - DEBUG - 添加三元组: DAMLJANOVIC D(media) - instance of - semantic intranets(concept)
|
||
2025-06-11 11:07:53,814 - DEBUG - 块 370 提取到 1 个三元组
|
||
2025-06-11 11:07:53,814 - DEBUG - 处理块 371/504: Natural language interfaces to ontologies: combini...
|
||
2025-06-11 11:07:54,080 - DEBUG - 块 371 生成文本: <triplet> <concept> ontologies <media> part of</s>
|
||
2025-06-11 11:07:54,080 - DEBUG - 原始生成文本: <triplet> <concept> ontologies <media> part of</s>
|
||
2025-06-11 11:07:54,080 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ontologies', '<media>', 'part of']
|
||
2025-06-11 11:07:54,080 - DEBUG - 处理块 372/504: interaction[M]. Berlin: Springer, 2010: 106-120.
|
||
[...
|
||
2025-06-11 11:07:54,356 - DEBUG - 块 372 生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:07:54,356 - DEBUG - 原始生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:07:54,356 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Berlin', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:54,356 - DEBUG - 处理块 373/504: Reduce: a“ naive” but domain-independent natural l...
|
||
2025-06-11 11:07:54,632 - DEBUG - 块 373 生成文本: <triplet> <concept> domain-independent natural language interface for querying ontologies</s>
|
||
2025-06-11 11:07:54,633 - DEBUG - 原始生成文本: <triplet> <concept> domain-independent natural language interface for querying ontologies</s>
|
||
2025-06-11 11:07:54,633 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'domain-independent natural language interface for querying ontologies']
|
||
2025-06-11 11:07:54,633 - DEBUG - 处理块 374/504: European Semantic Web Conference, Innsbruck, Jan20...
|
||
2025-06-11 11:07:54,749 - DEBUG - 块 374 生成文本: <triplet> <media> ontology <concept> facet of</s>
|
||
2025-06-11 11:07:54,749 - DEBUG - 原始生成文本: <triplet> <media> ontology <concept> facet of</s>
|
||
2025-06-11 11:07:54,749 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'ontology', '<concept>', 'facet of']
|
||
2025-06-11 11:07:54,749 - DEBUG - 处理块 375/504: query answering on the semantic web: an initial ev...
|
||
2025-06-11 11:07:54,876 - DEBUG - 块 375 生成文本: <triplet> <concept> semantic web <misc> facet of</s>
|
||
2025-06-11 11:07:54,876 - DEBUG - 原始生成文本: <triplet> <concept> semantic web <misc> facet of</s>
|
||
2025-06-11 11:07:54,876 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'semantic web', '<misc>', 'facet of']
|
||
2025-06-11 11:07:54,876 - DEBUG - 处理块 376/504: Knowledge Capture, Redondo Beach, Sep 1-4, 2009. N...
|
||
2025-06-11 11:07:55,345 - DEBUG - 块 376 生成文本: <triplet> <media> Knowledge Capture <org> based on</s>
|
||
2025-06-11 11:07:55,345 - DEBUG - 原始生成文本: <triplet> <media> Knowledge Capture <org> based on</s>
|
||
2025-06-11 11:07:55,345 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Knowledge Capture', '<org>', 'based on']
|
||
2025-06-11 11:07:55,345 - DEBUG - 处理块 377/504: Younger-Kasami algorithm[J]. Computer Languages, 1...
|
||
2025-06-11 11:07:55,557 - DEBUG - 块 377 生成文本: <triplet> <concept> J. <per> named after</s>
|
||
2025-06-11 11:07:55,557 - DEBUG - 原始生成文本: <triplet> <concept> J. <per> named after</s>
|
||
2025-06-11 11:07:55,557 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'J.', '<per>', 'named after']
|
||
2025-06-11 11:07:55,557 - DEBUG - 处理块 378/504: translation[C]//Proceedings of the 41st Annual Mee...
|
||
2025-06-11 11:07:55,780 - DEBUG - 块 378 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:55,780 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:07:55,780 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:07:55,780 - DEBUG - 处理块 379/504: 7-12, 2003. Stroudsburg: ACL,2003: 160-167.
|
||
[62] Y...
|
||
2025-06-11 11:07:55,940 - DEBUG - 块 379 生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:07:55,940 - DEBUG - 原始生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:07:55,940 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Stroudsburg', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:55,940 - DEBUG - 处理块 380/504: complex semantic constraints on open knowledge bas...
|
||
2025-06-11 11:07:56,153 - DEBUG - 块 380 生成文本: <triplet> <concept> ACM International Conference on <media> part of</s>
|
||
2025-06-11 11:07:56,153 - DEBUG - 原始生成文本: <triplet> <concept> ACM International Conference on <media> part of</s>
|
||
2025-06-11 11:07:56,153 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM International Conference on', '<media>', 'part of']
|
||
2025-06-11 11:07:56,153 - DEBUG - 处理块 381/504: Information and Knowledge Management, Melbourne, O...
|
||
2025-06-11 11:07:56,439 - DEBUG - 块 381 生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:07:56,439 - DEBUG - 原始生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:07:56,439 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New York', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:56,440 - DEBUG - 处理块 382/504: [63] BOS J, CLARK S, STEEDMAN M, et al. Wide- cove...
|
||
2025-06-11 11:07:56,577 - DEBUG - 块 382 生成文本: <triplet> <media> semantic representation <concept> subclass of</s>
|
||
2025-06-11 11:07:56,577 - DEBUG - 原始生成文本: <triplet> <media> semantic representation <concept> subclass of</s>
|
||
2025-06-11 11:07:56,578 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'semantic representation', '<concept>', 'subclass of']
|
||
2025-06-11 11:07:56,578 - DEBUG - 处理块 383/504: of the 20th International Conference on Computatio...
|
||
2025-06-11 11:07:56,810 - DEBUG - 块 383 生成文本: <triplet> <concept> International Conference on Computational Lin- guistics <org> Geneva <loc> location</s>
|
||
2025-06-11 11:07:56,810 - DEBUG - 原始生成文本: <triplet> <concept> International Conference on Computational Lin- guistics <org> Geneva <loc> location</s>
|
||
2025-06-11 11:07:56,810 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Conference on Computational Lin- guistics', '<org>', 'Geneva', '<loc>', 'location']
|
||
2025-06-11 11:07:56,810 - DEBUG - 处理块 384/504: [64] LEI Z, HUANG R, WANG H, et al. Natural langua...
|
||
2025-06-11 11:07:57,815 - DEBUG - 块 384 生成文本: <triplet> graph data driven approach <concept> Natural language question answering over RDF—a <media> Natural Language question <org> natural language <eve> natural <misc> Natural <per> Naturality <loc> Naturally <triplet> Natural expression <time> Natural distribution <dis> Natural machine questioning <cel> Natural field of <unk> 그래미 <date> point and natural distribution of data <num> approach</s>
|
||
2025-06-11 11:07:57,815 - DEBUG - 原始生成文本: <triplet> graph data driven approach <concept> Natural language question answering over RDF—a <media> Natural Language question <org> natural language <eve> natural <misc> Natural <per> Naturality <loc> Naturally <triplet> Natural expression <time> Natural distribution <dis> Natural machine questioning <cel> Natural field of <unk> 그래미 <date> point and natural distribution of data <num> approach</s>
|
||
2025-06-11 11:07:57,815 - DEBUG - 处理后标记: ['<triplet>', 'graph data driven approach', '<concept>', 'Natural language question answering over RDF—a', '<media>', 'Natural Language question', '<org>', 'natural language', '<eve>', 'natural', '<misc>', 'Natural', '<per>', 'Naturality', '<loc>', 'Naturally', '<triplet>', 'Natural expression', '<time>', 'Natural distribution', '<dis>', 'Natural machine questioning', '<cel>', 'Natural field of', '<unk>', '그래미', '<date>', 'point and natural distribution of data', '<num>', 'approach']
|
||
2025-06-11 11:07:57,815 - DEBUG - 添加三元组: graph data driven approach(concept) - Natural Language question - Natural language question answering over RDF—a(media)
|
||
2025-06-11 11:07:57,815 - DEBUG - 添加三元组: Natural expression(time) - Natural machine questioning - Natural distribution(dis)
|
||
2025-06-11 11:07:57,815 - DEBUG - 块 384 提取到 2 个三元组
|
||
2025-06-11 11:07:57,815 - DEBUG - 处理块 385/504: [C]//Proceedings of the 2014 ACM SIGMOD Internatio...
|
||
2025-06-11 11:07:58,198 - DEBUG - 块 385 生成文本: <triplet> <loc> ACM <org> part of <triplet> SIGMOD International Conference on Management of Data <media> 2014 <date> point in time</s>
|
||
2025-06-11 11:07:58,198 - DEBUG - 原始生成文本: <triplet> <loc> ACM <org> part of <triplet> SIGMOD International Conference on Management of Data <media> 2014 <date> point in time</s>
|
||
2025-06-11 11:07:58,198 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'ACM', '<org>', 'part of', '<triplet>', 'SIGMOD International Conference on Management of Data', '<media>', '2014', '<date>', 'point in time']
|
||
2025-06-11 11:07:58,198 - DEBUG - 处理块 386/504: [65] SHEKARPOUR S, MARX E, NGOMO A C, et al. SINA:...
|
||
2025-06-11 11:07:58,613 - DEBUG - 块 386 生成文本: <triplet> <concept> semantic interpretation of user queries for question answering <media> instance</s>
|
||
2025-06-11 11:07:58,613 - DEBUG - 原始生成文本: <triplet> <concept> semantic interpretation of user queries for question answering <media> instance</s>
|
||
2025-06-11 11:07:58,613 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'semantic interpretation of user queries for question answering', '<media>', 'instance']
|
||
2025-06-11 11:07:58,613 - DEBUG - 处理块 387/504: on interlinked data[J]. Journal of Web Semantics,2...
|
||
2025-06-11 11:07:58,901 - DEBUG - 块 387 生成文本: <triplet> ZHENG W, LEI Z, XIANG L, et al. How to build templates <concept> studies</s>
|
||
2025-06-11 11:07:58,901 - DEBUG - 原始生成文本: <triplet> ZHENG W, LEI Z, XIANG L, et al. How to build templates <concept> studies</s>
|
||
2025-06-11 11:07:58,901 - DEBUG - 处理后标记: ['<triplet>', 'ZHENG W, LEI Z, XIANG L, et al. How to build templates', '<concept>', 'studies']
|
||
2025-06-11 11:07:58,901 - DEBUG - 处理块 388/504: for RDF question/answering: an uncertain graph sim...
|
||
2025-06-11 11:07:59,498 - DEBUG - 块 388 生成文本: <triplet> <concept> SIGMOD <media> part of</s>
|
||
2025-06-11 11:07:59,498 - DEBUG - 原始生成文本: <triplet> <concept> SIGMOD <media> part of</s>
|
||
2025-06-11 11:07:59,498 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'SIGMOD', '<media>', 'part of']
|
||
2025-06-11 11:07:59,498 - DEBUG - 处理块 389/504: International Conference on Management of Data, Me...
|
||
2025-06-11 11:07:59,817 - DEBUG - 块 389 生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:07:59,818 - DEBUG - 原始生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:07:59,818 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New York', '<loc>', 'headquarters location']
|
||
2025-06-11 11:07:59,818 - DEBUG - 处理块 390/504: [67] SAVENKOV D, AGICHTEIN E. When a knowledge bas...
|
||
2025-06-11 11:08:00,083 - DEBUG - 块 390 生成文本: <triplet> <concept> When a knowledge base is not enough <misc> studies</s>
|
||
2025-06-11 11:08:00,083 - DEBUG - 原始生成文本: <triplet> <concept> When a knowledge base is not enough <misc> studies</s>
|
||
2025-06-11 11:08:00,083 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'When a knowledge base is not enough', '<misc>', 'studies']
|
||
2025-06-11 11:08:00,083 - DEBUG - 处理块 391/504: with external text data[C]//Proceedings of the39th...
|
||
2025-06-11 11:08:00,583 - DEBUG - 块 391 生成文本: <triplet> <concept> International ACM SIGIR Conference on Research and Development in <media> part of the organization</s>
|
||
2025-06-11 11:08:00,583 - DEBUG - 原始生成文本: <triplet> <concept> International ACM SIGIR Conference on Research and Development in <media> part of the organization</s>
|
||
2025-06-11 11:08:00,583 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International ACM SIGIR Conference on Research and Development in', '<media>', 'part of the organization']
|
||
2025-06-11 11:08:00,583 - DEBUG - 处理块 392/504: Information Retrieval, Pisa, Jul 17- 21, 2016. New...
|
||
2025-06-11 11:08:00,806 - DEBUG - 块 392 生成文本: <triplet> <concept> ACM <org> standards body</s>
|
||
2025-06-11 11:08:00,806 - DEBUG - 原始生成文本: <triplet> <concept> ACM <org> standards body</s>
|
||
2025-06-11 11:08:00,806 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM', '<org>', 'standards body']
|
||
2025-06-11 11:08:00,806 - DEBUG - 处理块 393/504: matching and lexicon extension[C]//Proceedings of ...
|
||
2025-06-11 11:08:01,135 - DEBUG - 块 393 生成文本: <triplet> <concept> Association for Computational <org> part of</s>
|
||
2025-06-11 11:08:01,136 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational <org> part of</s>
|
||
2025-06-11 11:08:01,136 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational', '<org>', 'part of']
|
||
2025-06-11 11:08:01,136 - DEBUG - 处理块 394/504: Linguistics, Sofia, Aug 4-9, 2013. Stroudsburg: AC...
|
||
2025-06-11 11:08:01,391 - DEBUG - 块 394 生成文本: <triplet> <per> Linguistics <concept> field of work</s>
|
||
2025-06-11 11:08:01,391 - DEBUG - 原始生成文本: <triplet> <per> Linguistics <concept> field of work</s>
|
||
2025-06-11 11:08:01,391 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'Linguistics', '<concept>', 'field of work']
|
||
2025-06-11 11:08:01,391 - DEBUG - 处理块 395/504: driven learning for open question answering[C]//Pr...
|
||
2025-06-11 11:08:01,710 - DEBUG - 块 395 生成文本: <triplet> <concept> Association for Computational <org> part of</s>
|
||
2025-06-11 11:08:01,710 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational <org> part of</s>
|
||
2025-06-11 11:08:01,710 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational', '<org>', 'part of']
|
||
2025-06-11 11:08:01,710 - DEBUG - 处理块 396/504: Linguistics, Sofia, Aug 4-9, 2013. Stroudsburg: AC...
|
||
2025-06-11 11:08:02,018 - DEBUG - 块 396 生成文本: <triplet> <concept> 4 <num> duration <triplet> NGOMO A <per> 4-9 <dis> follows</s>
|
||
2025-06-11 11:08:02,018 - DEBUG - 原始生成文本: <triplet> <concept> 4 <num> duration <triplet> NGOMO A <per> 4-9 <dis> follows</s>
|
||
2025-06-11 11:08:02,018 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '4', '<num>', 'duration', '<triplet>', 'NGOMO A', '<per>', '4-9', '<dis>', 'follows']
|
||
2025-06-11 11:08:02,018 - DEBUG - 处理块 397/504: hybrid question answering using linked data[C]//LN...
|
||
2025-06-11 11:08:02,561 - DEBUG - 块 397 生成文本: <triplet> <concept> 12th European Semantic Web <misc> used by</s>
|
||
2025-06-11 11:08:02,562 - DEBUG - 原始生成文本: <triplet> <concept> 12th European Semantic Web <misc> used by</s>
|
||
2025-06-11 11:08:02,562 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '12th European Semantic Web', '<misc>', 'used by']
|
||
2025-06-11 11:08:02,562 - DEBUG - 处理块 398/504: Conference, Portoroz, May 31-Jun 4, 2015. Cham: Sp...
|
||
2025-06-11 11:08:02,912 - DEBUG - 块 398 生成文本: <triplet> <media> Lean <concept> facet of <triplet> Lean question answering over Freebase from <eve> Lean Question <per> is a list of</s>
|
||
2025-06-11 11:08:02,912 - DEBUG - 原始生成文本: <triplet> <media> Lean <concept> facet of <triplet> Lean question answering over Freebase from <eve> Lean Question <per> is a list of</s>
|
||
2025-06-11 11:08:02,912 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Lean', '<concept>', 'facet of', '<triplet>', 'Lean question answering over Freebase from', '<eve>', 'Lean Question', '<per>', 'is a list of']
|
||
2025-06-11 11:08:02,912 - DEBUG - 处理块 399/504: scratch[C]//Proceedings of the2015 Conference of t...
|
||
2025-06-11 11:08:03,488 - DEBUG - 块 399 生成文本: <triplet> <media> Association for Computational <org> part of the North American Chapter <concept> instance</s>
|
||
2025-06-11 11:08:03,488 - DEBUG - 原始生成文本: <triplet> <media> Association for Computational <org> part of the North American Chapter <concept> instance</s>
|
||
2025-06-11 11:08:03,488 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Association for Computational', '<org>', 'part of the North American Chapter', '<concept>', 'instance']
|
||
2025-06-11 11:08:03,488 - DEBUG - 处理块 400/504: Linguistics, Denver, May31-Jun 5, 2015. Stroudsbur...
|
||
2025-06-11 11:08:04,322 - DEBUG - 块 400 生成文本: <triplet> рика <concept> 知识图谱问答研究综述 <media> 陈子睿 <per> <org> <unk> <dis> <misc> <eve> <loc> <cel></s>
|
||
2025-06-11 11:08:04,322 - DEBUG - 原始生成文本: <triplet> рика <concept> 知识图谱问答研究综述 <media> 陈子睿 <per> <org> <unk> <dis> <misc> <eve> <loc> <cel></s>
|
||
2025-06-11 11:08:04,322 - DEBUG - 处理后标记: ['<triplet>', 'рика', '<concept>', '知识图谱问答研究综述', '<media>', '陈子睿', '<per>', '<org>', '<unk>', '<dis>', '<misc>', '<eve>', '<loc>', '<cel>']
|
||
2025-06-11 11:08:04,322 - DEBUG - 添加三元组: рика(concept) - 陈子睿 - 知识图谱问答研究综述(media)
|
||
2025-06-11 11:08:04,322 - DEBUG - 块 400 提取到 1 个三元组
|
||
2025-06-11 11:08:04,322 - DEBUG - 处理块 401/504: [72] UNGER C, BUHMANN L, LEHMANN J, et al. Templat...
|
||
2025-06-11 11:08:04,578 - DEBUG - 块 401 生成文本: <triplet> <concept> RDF <misc> used by <triplet> C++ <media> <dis> <org> programming language of</s>
|
||
2025-06-11 11:08:04,578 - DEBUG - 原始生成文本: <triplet> <concept> RDF <misc> used by <triplet> C++ <media> <dis> <org> programming language of</s>
|
||
2025-06-11 11:08:04,578 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'RDF', '<misc>', 'used by', '<triplet>', 'C++', '<media>', '<dis>', '<org>', 'programming language of']
|
||
2025-06-11 11:08:04,578 - DEBUG - 处理块 402/504: of the 21st International Conference on World Wide...
|
||
2025-06-11 11:08:04,715 - DEBUG - 块 402 生成文本: <triplet> 648 <concept> 2012 <date> point in time</s>
|
||
2025-06-11 11:08:04,715 - DEBUG - 原始生成文本: <triplet> 648 <concept> 2012 <date> point in time</s>
|
||
2025-06-11 11:08:04,715 - DEBUG - 处理后标记: ['<triplet>', '648', '<concept>', '2012', '<date>', 'point in time']
|
||
2025-06-11 11:08:04,716 - DEBUG - 添加三元组: 648(concept) - point in time - 2012(date)
|
||
2025-06-11 11:08:04,716 - DEBUG - 块 402 提取到 1 个三元组
|
||
2025-06-11 11:08:04,716 - DEBUG - 处理块 403/504: [73] ABUJABAL A, YAHYA M, RIEDEWALD M, et al. Auto...
|
||
2025-06-11 11:08:05,195 - DEBUG - 块 403 生成文本: <triplet> YAHYA M <per> RIEDEWALD M, et al. Auto- mated template generation for question answering over <concept> use</s>
|
||
2025-06-11 11:08:05,195 - DEBUG - 原始生成文本: <triplet> YAHYA M <per> RIEDEWALD M, et al. Auto- mated template generation for question answering over <concept> use</s>
|
||
2025-06-11 11:08:05,195 - DEBUG - 处理后标记: ['<triplet>', 'YAHYA M', '<per>', 'RIEDEWALD M, et al. Auto- mated template generation for question answering over', '<concept>', 'use']
|
||
2025-06-11 11:08:05,195 - DEBUG - 添加三元组: YAHYA M(per) - use - RIEDEWALD M, et al. Auto- mated template generation for question answering over(concept)
|
||
2025-06-11 11:08:05,195 - DEBUG - 块 403 提取到 1 个三元组
|
||
2025-06-11 11:08:05,195 - DEBUG - 处理块 404/504: knowledge graphs[C]//Proceedings of the 26th Inter...
|
||
2025-06-11 11:08:05,471 - DEBUG - 块 404 生成文本: <triplet> <concept> International Conference on World Wide Web <org> part of</s>
|
||
2025-06-11 11:08:05,472 - DEBUG - 原始生成文本: <triplet> <concept> International Conference on World Wide Web <org> part of</s>
|
||
2025-06-11 11:08:05,472 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Conference on World Wide Web', '<org>', 'part of']
|
||
2025-06-11 11:08:05,472 - DEBUG - 处理块 405/504: [74] HU S, ZOU L, YU J X, et al. Answering natural...
|
||
2025-06-11 11:08:05,875 - DEBUG - 块 405 生成文本: <triplet> graphs <concept> subgraph matching over knowledge <media> studies</s>
|
||
2025-06-11 11:08:05,875 - DEBUG - 原始生成文本: <triplet> graphs <concept> subgraph matching over knowledge <media> studies</s>
|
||
2025-06-11 11:08:05,875 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'subgraph matching over knowledge', '<media>', 'studies']
|
||
2025-06-11 11:08:05,875 - DEBUG - 添加三元组: graphs(concept) - studies - subgraph matching over knowledge(media)
|
||
2025-06-11 11:08:05,875 - DEBUG - 块 405 提取到 1 个三元组
|
||
2025-06-11 11:08:05,875 - DEBUG - 处理块 406/504: IEEE Transactions on Knowledge and Data Engineerin...
|
||
2025-06-11 11:08:06,312 - DEBUG - 块 406 生成文本: <triplet> BORDES A <per> WESTON J, USUNIER N. Open question <concept> <unk> <eve> instance of <media> instance</s>
|
||
2025-06-11 11:08:06,312 - DEBUG - 原始生成文本: <triplet> BORDES A <per> WESTON J, USUNIER N. Open question <concept> <unk> <eve> instance of <media> instance</s>
|
||
2025-06-11 11:08:06,312 - DEBUG - 处理后标记: ['<triplet>', 'BORDES A', '<per>', 'WESTON J, USUNIER N. Open question', '<concept>', '<unk>', '<eve>', 'instance of', '<media>', 'instance']
|
||
2025-06-11 11:08:06,312 - DEBUG - 添加三元组: BORDES A(per) - <unk> - WESTON J, USUNIER N. Open question(concept)
|
||
2025-06-11 11:08:06,312 - DEBUG - 块 406 提取到 1 个三元组
|
||
2025-06-11 11:08:06,312 - DEBUG - 处理块 407/504: answering with weakly supervised embedding models[...
|
||
2025-06-11 11:08:06,503 - DEBUG - 块 407 生成文本: <triplet> LNCS 8724 <dis> 2014 European Conference <media> organizer</s>
|
||
2025-06-11 11:08:06,504 - DEBUG - 原始生成文本: <triplet> LNCS 8724 <dis> 2014 European Conference <media> organizer</s>
|
||
2025-06-11 11:08:06,504 - DEBUG - 处理后标记: ['<triplet>', 'LNCS 8724', '<dis>', '2014 European Conference', '<media>', 'organizer']
|
||
2025-06-11 11:08:06,504 - DEBUG - 添加三元组: LNCS 8724(dis) - organizer - 2014 European Conference(media)
|
||
2025-06-11 11:08:06,504 - DEBUG - 块 407 提取到 1 个三元组
|
||
2025-06-11 11:08:06,504 - DEBUG - 处理块 408/504: on Machine Learning and Knowledge Discovery in Dat...
|
||
2025-06-11 11:08:06,780 - DEBUG - 块 408 生成文本: <triplet> <per> Machine Learning <concept> field of work</s>
|
||
2025-06-11 11:08:06,780 - DEBUG - 原始生成文本: <triplet> <per> Machine Learning <concept> field of work</s>
|
||
2025-06-11 11:08:06,780 - DEBUG - 处理后标记: ['<triplet>', '<per>', 'Machine Learning', '<concept>', 'field of work']
|
||
2025-06-11 11:08:06,780 - DEBUG - 处理块 409/504: [76] ZHOU M, HUANG M, ZHU X. An interpretable reas...
|
||
2025-06-11 11:08:07,174 - DEBUG - 块 409 生成文本: <triplet> ZHOU M <misc> Interpretable reasoning network <concept> instance of <triplet> HUANG M</s>
|
||
2025-06-11 11:08:07,174 - DEBUG - 原始生成文本: <triplet> ZHOU M <misc> Interpretable reasoning network <concept> instance of <triplet> HUANG M</s>
|
||
2025-06-11 11:08:07,174 - DEBUG - 处理后标记: ['<triplet>', 'ZHOU M', '<misc>', 'Interpretable reasoning network', '<concept>', 'instance of', '<triplet>', 'HUANG M']
|
||
2025-06-11 11:08:07,174 - DEBUG - 添加三元组: ZHOU M(misc) - instance of - Interpretable reasoning network(concept)
|
||
2025-06-11 11:08:07,174 - DEBUG - 块 409 提取到 1 个三元组
|
||
2025-06-11 11:08:07,174 - DEBUG - 处理块 410/504: of the 27th International Conference on Computatio...
|
||
2025-06-11 11:08:07,739 - DEBUG - 块 410 生成文本: <triplet> <eve> International Conference on Computational Lin- guistics <media> instance of the 27th <concept> International conference on <org> Santa Fe <loc> <per> International <time> <date> point</s>
|
||
2025-06-11 11:08:07,739 - DEBUG - 原始生成文本: <triplet> <eve> International Conference on Computational Lin- guistics <media> instance of the 27th <concept> International conference on <org> Santa Fe <loc> <per> International <time> <date> point</s>
|
||
2025-06-11 11:08:07,739 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'International Conference on Computational Lin- guistics', '<media>', 'instance of the 27th', '<concept>', 'International conference on', '<org>', 'Santa Fe', '<loc>', '<per>', 'International', '<time>', '<date>', 'point']
|
||
2025-06-11 11:08:07,739 - DEBUG - 处理块 411/504: [77] SUN H, ARNOLD A O, BEDRAX-WEISS T, et al. Fai...
|
||
2025-06-11 11:08:08,197 - DEBUG - 块 411 生成文本: <triplet> embeddings for knowledge base queries <concept> query <media> subclass of <triplet> querie <misc> knowledge bases <org> subfamily <unk> subtype of the same name</s>
|
||
2025-06-11 11:08:08,198 - DEBUG - 原始生成文本: <triplet> embeddings for knowledge base queries <concept> query <media> subclass of <triplet> querie <misc> knowledge bases <org> subfamily <unk> subtype of the same name</s>
|
||
2025-06-11 11:08:08,198 - DEBUG - 处理后标记: ['<triplet>', 'embeddings for knowledge base queries', '<concept>', 'query', '<media>', 'subclass of', '<triplet>', 'querie', '<misc>', 'knowledge bases', '<org>', 'subfamily', '<unk>', 'subtype of the same name']
|
||
2025-06-11 11:08:08,198 - DEBUG - 添加三元组: embeddings for knowledge base queries(concept) - subclass of - query(media)
|
||
2025-06-11 11:08:08,198 - DEBUG - 添加三元组: querie(misc) - subfamily - knowledge bases(org)
|
||
2025-06-11 11:08:08,198 - DEBUG - 块 411 提取到 2 个三元组
|
||
2025-06-11 11:08:08,198 - DEBUG - 处理块 412/504: Neural Information Processing Systems 33: Proceedi...
|
||
2025-06-11 11:08:08,484 - DEBUG - 块 412 生成文本: <triplet> <media> Neural Information Processing Systems <concept> main subject</s>
|
||
2025-06-11 11:08:08,484 - DEBUG - 原始生成文本: <triplet> <media> Neural Information Processing Systems <concept> main subject</s>
|
||
2025-06-11 11:08:08,484 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'Neural Information Processing Systems', '<concept>', 'main subject']
|
||
2025-06-11 11:08:08,484 - DEBUG - 处理块 413/504: [78] WESTON J, CHOPRA S, BORDES A. Memory networks...
|
||
2025-06-11 11:08:08,633 - DEBUG - 块 413 生成文本: <triplet> BORDES <misc> knowledge base <concept> instance of</s>
|
||
2025-06-11 11:08:08,633 - DEBUG - 原始生成文本: <triplet> BORDES <misc> knowledge base <concept> instance of</s>
|
||
2025-06-11 11:08:08,633 - DEBUG - 处理后标记: ['<triplet>', 'BORDES', '<misc>', 'knowledge base', '<concept>', 'instance of']
|
||
2025-06-11 11:08:08,633 - DEBUG - 添加三元组: BORDES(misc) - instance of - knowledge base(concept)
|
||
2025-06-11 11:08:08,633 - DEBUG - 块 413 提取到 1 个三元组
|
||
2025-06-11 11:08:08,633 - DEBUG - 处理块 414/504: factual memory networks[C]//Proceedings of the 201...
|
||
2025-06-11 11:08:09,015 - DEBUG - 块 414 生成文本: <triplet> <concept> Associationfor <org> part of <triplet> Con- ference of the North American Chapter <media> Association for <loc> country</s>
|
||
2025-06-11 11:08:09,015 - DEBUG - 原始生成文本: <triplet> <concept> Associationfor <org> part of <triplet> Con- ference of the North American Chapter <media> Association for <loc> country</s>
|
||
2025-06-11 11:08:09,016 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Associationfor', '<org>', 'part of', '<triplet>', 'Con- ference of the North American Chapter', '<media>', 'Association for', '<loc>', 'country']
|
||
2025-06-11 11:08:09,016 - DEBUG - 处理块 415/504: Computational Linguistics: Human Language Technolo...
|
||
2025-06-11 11:08:09,302 - DEBUG - 块 415 生成文本: <triplet> <concept> Computational Linguistics <media> part of</s>
|
||
2025-06-11 11:08:09,303 - DEBUG - 原始生成文本: <triplet> <concept> Computational Linguistics <media> part of</s>
|
||
2025-06-11 11:08:09,303 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Computational Linguistics', '<media>', 'part of']
|
||
2025-06-11 11:08:09,303 - DEBUG - 处理块 416/504: [80] HE X D, GOLUB D. Character- level question an...
|
||
2025-06-11 11:08:09,802 - DEBUG - 块 416 生成文本: <triplet> GOLUB D. Character-level question answering with attention[C]//Proceedings of the 2016 Conference on <eve> 2016 <date> point in time</s>
|
||
2025-06-11 11:08:09,803 - DEBUG - 原始生成文本: <triplet> GOLUB D. Character-level question answering with attention[C]//Proceedings of the 2016 Conference on <eve> 2016 <date> point in time</s>
|
||
2025-06-11 11:08:09,803 - DEBUG - 处理后标记: ['<triplet>', 'GOLUB D. Character-level question answering with attention[C]//Proceedings of the 2016 Conference on', '<eve>', '2016', '<date>', 'point in time']
|
||
2025-06-11 11:08:09,803 - DEBUG - 添加三元组: GOLUB D. Character-level question answering with attention[C]//Proceedings of the 2016 Conference on(eve) - point in time - 2016(date)
|
||
2025-06-11 11:08:09,803 - DEBUG - 块 416 提取到 1 个三元组
|
||
2025-06-11 11:08:09,803 - DEBUG - 处理块 417/504: Empirical Methods in Natural Language Processing, ...
|
||
2025-06-11 11:08:10,123 - DEBUG - 块 417 生成文本: <triplet> <org> Austin <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:10,123 - DEBUG - 原始生成文本: <triplet> <org> Austin <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:10,123 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Austin', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:08:10,123 - DEBUG - 处理块 418/504: [81] CHEN Z Y , LIAO J Z, ZHAO X, et al. Incorpora...
|
||
2025-06-11 11:08:10,540 - DEBUG - 块 418 生成文本: <triplet> CHEN Z Y <per> LIAO J Z, ZHAO X, et al. Incorporating subgraph structure knowledge base question answering via neural <concept> instance of</s>
|
||
2025-06-11 11:08:10,540 - DEBUG - 原始生成文本: <triplet> CHEN Z Y <per> LIAO J Z, ZHAO X, et al. Incorporating subgraph structure knowledge base question answering via neural <concept> instance of</s>
|
||
2025-06-11 11:08:10,540 - DEBUG - 处理后标记: ['<triplet>', 'CHEN Z Y', '<per>', 'LIAO J Z, ZHAO X, et al. Incorporating subgraph structure knowledge base question answering via neural', '<concept>', 'instance of']
|
||
2025-06-11 11:08:10,540 - DEBUG - 添加三元组: CHEN Z Y(per) - instance of - LIAO J Z, ZHAO X, et al. Incorporating subgraph structure knowledge base question answering via neural(concept)
|
||
2025-06-11 11:08:10,540 - DEBUG - 块 418 提取到 1 个三元组
|
||
2025-06-11 11:08:10,540 - DEBUG - 处理块 419/504: reasoning[J]. Journal of Frontiers of Computer Sci...
|
||
2025-06-11 11:08:10,967 - DEBUG - 块 419 生成文本: <triplet> 融合子图结构的神经推理式知 <concept> 陈子阳 <per> discoverer or inventor</s>
|
||
2025-06-11 11:08:10,967 - DEBUG - 原始生成文本: <triplet> 融合子图结构的神经推理式知 <concept> 陈子阳 <per> discoverer or inventor</s>
|
||
2025-06-11 11:08:10,967 - DEBUG - 处理后标记: ['<triplet>', '融合子图结构的神经推理式知', '<concept>', '陈子阳', '<per>', 'discoverer or inventor']
|
||
2025-06-11 11:08:10,967 - DEBUG - 添加三元组: 融合子图结构的神经推理式知(concept) - discoverer or inventor - 陈子阳(per)
|
||
2025-06-11 11:08:10,967 - DEBUG - 块 419 提取到 1 个三元组
|
||
2025-06-11 11:08:10,967 - DEBUG - 处理块 420/504: 识库问答方法 [J]. 计算机科学与探索 , 2021, 15(10): 1870-
|
||
1879.
|
||
[...
|
||
2025-06-11 11:08:11,393 - DEBUG - 块 420 生成文本: <triplet> 识库问答方法 <concept> 计算机科学与探索 <media> described</s>
|
||
2025-06-11 11:08:11,393 - DEBUG - 原始生成文本: <triplet> 识库问答方法 <concept> 计算机科学与探索 <media> described</s>
|
||
2025-06-11 11:08:11,393 - DEBUG - 处理后标记: ['<triplet>', '识库问答方法', '<concept>', '计算机科学与探索', '<media>', 'described']
|
||
2025-06-11 11:08:11,393 - DEBUG - 添加三元组: 识库问答方法(concept) - described - 计算机科学与探索(media)
|
||
2025-06-11 11:08:11,393 - DEBUG - 块 420 提取到 1 个三元组
|
||
2025-06-11 11:08:11,393 - DEBUG - 处理块 421/504: via answer type inference[C]//Proceedings of the20...
|
||
2025-06-11 11:08:11,680 - DEBUG - 块 421 生成文本: <triplet> <concept> Con- ference on Empirical Methods in Natural Language Proce- <misc> studies</s>
|
||
2025-06-11 11:08:11,681 - DEBUG - 原始生成文本: <triplet> <concept> Con- ference on Empirical Methods in Natural Language Proce- <misc> studies</s>
|
||
2025-06-11 11:08:11,681 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Con- ference on Empirical Methods in Natural Language Proce-', '<misc>', 'studies']
|
||
2025-06-11 11:08:11,681 - DEBUG - 处理块 422/504: ssing, Austin, Nov1-4, 2016. Stroudsburg: ACL,2016...
|
||
2025-06-11 11:08:12,042 - DEBUG - 块 422 生成文本: <triplet> ssing, Austin, Nov1,2016 <unk> 2016 <concept> 16 <per> 16</s>
|
||
2025-06-11 11:08:12,042 - DEBUG - 原始生成文本: <triplet> ssing, Austin, Nov1,2016 <unk> 2016 <concept> 16 <per> 16</s>
|
||
2025-06-11 11:08:12,042 - DEBUG - 处理后标记: ['<triplet>', 'ssing, Austin, Nov1,2016', '<unk>', '2016', '<concept>', '16', '<per>', '16']
|
||
2025-06-11 11:08:12,042 - DEBUG - 添加三元组: ssing, Austin, Nov1,2016(unk) - 16 - 2016(concept)
|
||
2025-06-11 11:08:12,042 - DEBUG - 块 422 提取到 1 个三元组
|
||
2025-06-11 11:08:12,042 - DEBUG - 处理块 423/504: paraphrase for question answering[C]//Proceedings ...
|
||
2025-06-11 11:08:12,532 - DEBUG - 块 423 生成文本: <triplet> <concept> Conference on Empirical Methods in Natural Language <media> part of the 2017 <eve> 2017</s>
|
||
2025-06-11 11:08:12,532 - DEBUG - 原始生成文本: <triplet> <concept> Conference on Empirical Methods in Natural Language <media> part of the 2017 <eve> 2017</s>
|
||
2025-06-11 11:08:12,532 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Conference on Empirical Methods in Natural Language', '<media>', 'part of the 2017', '<eve>', '2017']
|
||
2025-06-11 11:08:12,532 - DEBUG - 处理块 424/504: Processing, Copenhagen, Sep9-11, 2017. Stroudsburg...
|
||
2025-06-11 11:08:12,947 - DEBUG - 块 424 生成文本: <triplet> ANSARI G A <per> SAHA A, KUMAR V, et al. Neural program <concept> field of work</s>
|
||
2025-06-11 11:08:12,947 - DEBUG - 原始生成文本: <triplet> ANSARI G A <per> SAHA A, KUMAR V, et al. Neural program <concept> field of work</s>
|
||
2025-06-11 11:08:12,947 - DEBUG - 处理后标记: ['<triplet>', 'ANSARI G A', '<per>', 'SAHA A, KUMAR V, et al. Neural program', '<concept>', 'field of work']
|
||
2025-06-11 11:08:12,947 - DEBUG - 添加三元组: ANSARI G A(per) - field of work - SAHA A, KUMAR V, et al. Neural program(concept)
|
||
2025-06-11 11:08:12,947 - DEBUG - 块 424 提取到 1 个三元组
|
||
2025-06-11 11:08:12,947 - DEBUG - 处理块 425/504: induction for KBQA without gold programs or query
|
||
...
|
||
2025-06-11 11:08:13,170 - DEBUG - 块 425 生成文本: <triplet> <concept> International Joint <org> part of</s>
|
||
2025-06-11 11:08:13,170 - DEBUG - 原始生成文本: <triplet> <concept> International Joint <org> part of</s>
|
||
2025-06-11 11:08:13,170 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Joint', '<org>', 'part of']
|
||
2025-06-11 11:08:13,170 - DEBUG - 处理块 426/504: Conference on Artificial Intelligence, Macao, Chin...
|
||
2025-06-11 11:08:13,447 - DEBUG - 块 426 生成文本: <triplet> ANSARI G A <per> LADDHA A, et al. Complex <concept> participant</s>
|
||
2025-06-11 11:08:13,447 - DEBUG - 原始生成文本: <triplet> ANSARI G A <per> LADDHA A, et al. Complex <concept> participant</s>
|
||
2025-06-11 11:08:13,447 - DEBUG - 处理后标记: ['<triplet>', 'ANSARI G A', '<per>', 'LADDHA A, et al. Complex', '<concept>', 'participant']
|
||
2025-06-11 11:08:13,447 - DEBUG - 添加三元组: ANSARI G A(per) - participant - LADDHA A, et al. Complex(concept)
|
||
2025-06-11 11:08:13,447 - DEBUG - 块 426 提取到 1 个三元组
|
||
2025-06-11 11:08:13,447 - DEBUG - 处理块 427/504: program induction for querying knowledge bases in ...
|
||
2025-06-11 11:08:13,766 - DEBUG - 块 427 生成文本: <triplet> <concept> program induction for querying knowledge bases in the <media> studies</s>
|
||
2025-06-11 11:08:13,766 - DEBUG - 原始生成文本: <triplet> <concept> program induction for querying knowledge bases in the <media> studies</s>
|
||
2025-06-11 11:08:13,766 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'program induction for querying knowledge bases in the', '<media>', 'studies']
|
||
2025-06-11 11:08:13,766 - DEBUG - 处理块 428/504: for Computational Linguistics, 2019, 7: 185-200.
|
||
[...
|
||
2025-06-11 11:08:14,106 - DEBUG - 块 428 生成文本: <triplet> <concept> Computational Linguistics <media> part of</s>
|
||
2025-06-11 11:08:14,107 - DEBUG - 原始生成文本: <triplet> <concept> Computational Linguistics <media> part of</s>
|
||
2025-06-11 11:08:14,107 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Computational Linguistics', '<media>', 'part of']
|
||
2025-06-11 11:08:14,107 - DEBUG - 处理块 429/504: knowledge base question answering via meta reinfor...
|
||
2025-06-11 11:08:14,596 - DEBUG - 块 429 生成文本: <triplet> <concept> knowledge base question answering via meta reinforcement learning <media> knowledgebase question <unk> knowledge bases <misc> knowledge <per> knowledge based on question</s>
|
||
2025-06-11 11:08:14,596 - DEBUG - 原始生成文本: <triplet> <concept> knowledge base question answering via meta reinforcement learning <media> knowledgebase question <unk> knowledge bases <misc> knowledge <per> knowledge based on question</s>
|
||
2025-06-11 11:08:14,596 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge base question answering via meta reinforcement learning', '<media>', 'knowledgebase question', '<unk>', 'knowledge bases', '<misc>', 'knowledge', '<per>', 'knowledge based on question']
|
||
2025-06-11 11:08:14,596 - DEBUG - 处理块 430/504: Methods in Natural Language Processing, Nov16-20, ...
|
||
2025-06-11 11:08:14,755 - DEBUG - 块 430 生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:08:14,755 - DEBUG - 原始生成文本: <triplet> <org> Stroudsburg <loc> headquarters location</s>
|
||
2025-06-11 11:08:14,755 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Stroudsburg', '<loc>', 'headquarters location']
|
||
2025-06-11 11:08:14,756 - DEBUG - 处理块 431/504: [87] YHA D, YFL B, GQA C, et al. Less is more: dat...
|
||
2025-06-11 11:08:14,872 - DEBUG - 块 431 生成文本: <triplet> <concept> Less is more <media> studies</s>
|
||
2025-06-11 11:08:14,872 - DEBUG - 原始生成文本: <triplet> <concept> Less is more <media> studies</s>
|
||
2025-06-11 11:08:14,872 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Less is more', '<media>', 'studies']
|
||
2025-06-11 11:08:14,872 - DEBUG - 处理块 432/504: of Web Semantics,2020, 65: 100612.
|
||
[88] HU S, ZOU ...
|
||
2025-06-11 11:08:15,492 - DEBUG - 块 432 生成文本: <triplet> ZHANG X B.A <misc> state-transition framework to answer complex questions over knowledge base <media> state <concept> subclass of knowledgebase <unk> <per> <org> state</s>
|
||
2025-06-11 11:08:15,493 - DEBUG - 原始生成文本: <triplet> ZHANG X B.A <misc> state-transition framework to answer complex questions over knowledge base <media> state <concept> subclass of knowledgebase <unk> <per> <org> state</s>
|
||
2025-06-11 11:08:15,493 - DEBUG - 处理后标记: ['<triplet>', 'ZHANG X B.A', '<misc>', 'state-transition framework to answer complex questions over knowledge base', '<media>', 'state', '<concept>', 'subclass of knowledgebase', '<unk>', '<per>', '<org>', 'state']
|
||
2025-06-11 11:08:15,493 - DEBUG - 添加三元组: ZHANG X B.A(misc) - state - state-transition framework to answer complex questions over knowledge base(media)
|
||
2025-06-11 11:08:15,493 - DEBUG - 块 432 提取到 1 个三元组
|
||
2025-06-11 11:08:15,493 - DEBUG - 处理块 433/504: Proceedings of the 2018 Conference on Empirical Me...
|
||
2025-06-11 11:08:15,780 - DEBUG - 块 433 生成文本: <triplet> <concept> 4 <num> number of parts of this work</s>
|
||
2025-06-11 11:08:15,780 - DEBUG - 原始生成文本: <triplet> <concept> 4 <num> number of parts of this work</s>
|
||
2025-06-11 11:08:15,780 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '4', '<num>', 'number of parts of this work']
|
||
2025-06-11 11:08:15,780 - DEBUG - 处理块 434/504: 2018. Stroudsburg: ACL,2018: 2098-2108.
|
||
[89] BAO J...
|
||
2025-06-11 11:08:16,173 - DEBUG - 块 434 生成文本: <triplet> YAN Z <per> BAO J W <concept> doctoral <media> follows</s>
|
||
2025-06-11 11:08:16,174 - DEBUG - 原始生成文本: <triplet> YAN Z <per> BAO J W <concept> doctoral <media> follows</s>
|
||
2025-06-11 11:08:16,174 - DEBUG - 处理后标记: ['<triplet>', 'YAN Z', '<per>', 'BAO J W', '<concept>', 'doctoral', '<media>', 'follows']
|
||
2025-06-11 11:08:16,174 - DEBUG - 添加三元组: YAN Z(per) - doctoral - BAO J W(concept)
|
||
2025-06-11 11:08:16,174 - DEBUG - 块 434 提取到 1 个三元组
|
||
2025-06-11 11:08:16,174 - DEBUG - 处理块 435/504: answering with knowledge graph[C]//Proceedings of ...
|
||
2025-06-11 11:08:16,898 - DEBUG - 块 435 生成文本: <triplet> graph <concept> International Conference on Computational Linguistics <media> part of the 26th <org> International <eve> International Convention on International Lingus <per> International Association <loc> member of <triplet> International Meeting on C <unk> <date> member(C)</s>
|
||
2025-06-11 11:08:16,898 - DEBUG - 原始生成文本: <triplet> graph <concept> International Conference on Computational Linguistics <media> part of the 26th <org> International <eve> International Convention on International Lingus <per> International Association <loc> member of <triplet> International Meeting on C <unk> <date> member(C)</s>
|
||
2025-06-11 11:08:16,898 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'International Conference on Computational Linguistics', '<media>', 'part of the 26th', '<org>', 'International', '<eve>', 'International Convention on International Lingus', '<per>', 'International Association', '<loc>', 'member of', '<triplet>', 'International Meeting on C', '<unk>', '<date>', 'member(C)']
|
||
2025-06-11 11:08:16,898 - DEBUG - 添加三元组: graph(concept) - part of the 26th - International Conference on Computational Linguistics(media)
|
||
2025-06-11 11:08:16,898 - DEBUG - 块 435 提取到 1 个三元组
|
||
2025-06-11 11:08:16,898 - DEBUG - 处理块 436/504: Osaka, Dec11-16, 2016. Stroudsburg: ACL,2016: 2503...
|
||
2025-06-11 11:08:17,218 - DEBUG - 块 436 生成文本: <triplet> LIN F, LUO X, et al. <concept> Knowledge base question</s>
|
||
2025-06-11 11:08:17,218 - DEBUG - 原始生成文本: <triplet> LIN F, LUO X, et al. <concept> Knowledge base question</s>
|
||
2025-06-11 11:08:17,218 - DEBUG - 处理后标记: ['<triplet>', 'LIN F, LUO X, et al.', '<concept>', 'Knowledge base question']
|
||
2025-06-11 11:08:17,218 - DEBUG - 处理块 437/504: answering via encoding of complex query graphs[C]/...
|
||
2025-06-11 11:08:17,632 - DEBUG - 块 437 生成文本: <triplet> graphs <concept> answering via encoding of complex query <misc> studies</s>
|
||
2025-06-11 11:08:17,632 - DEBUG - 原始生成文本: <triplet> graphs <concept> answering via encoding of complex query <misc> studies</s>
|
||
2025-06-11 11:08:17,632 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'answering via encoding of complex query', '<misc>', 'studies']
|
||
2025-06-11 11:08:17,632 - DEBUG - 添加三元组: graphs(concept) - studies - answering via encoding of complex query(misc)
|
||
2025-06-11 11:08:17,633 - DEBUG - 块 437 提取到 1 个三元组
|
||
2025-06-11 11:08:17,633 - DEBUG - 处理块 438/504: in Natural Language Processing, Brussels, Oct 31- ...
|
||
2025-06-11 11:08:17,855 - DEBUG - 块 438 生成文本: <triplet> <loc> Brussels <org> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:17,855 - DEBUG - 原始生成文本: <triplet> <loc> Brussels <org> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:17,855 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'Brussels', '<org>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:08:17,855 - DEBUG - 处理块 439/504: [91] XU K, WU L, WANG Z, et al. Exploiting rich sy...
|
||
2025-06-11 11:08:19,160 - DEBUG - 块 439 生成文本: <triplet> graph- to- sequence <concept> semantic parsing with <media> syntactic information <misc> syntax <eve> syntaktics <org> syntag <loc> syntátic information</s>
|
||
2025-06-11 11:08:19,160 - DEBUG - 原始生成文本: <triplet> graph- to- sequence <concept> semantic parsing with <media> syntactic information <misc> syntax <eve> syntaktics <org> syntag <loc> syntátic information</s>
|
||
2025-06-11 11:08:19,160 - DEBUG - 处理后标记: ['<triplet>', 'graph- to- sequence', '<concept>', 'semantic parsing with', '<media>', 'syntactic information', '<misc>', 'syntax', '<eve>', 'syntaktics', '<org>', 'syntag', '<loc>', 'syntátic information']
|
||
2025-06-11 11:08:19,160 - DEBUG - 添加三元组: graph- to- sequence(concept) - syntactic information - semantic parsing with(media)
|
||
2025-06-11 11:08:19,160 - DEBUG - 块 439 提取到 1 个三元组
|
||
2025-06-11 11:08:19,160 - DEBUG - 处理块 440/504: model[C]//Proceedings of the 2018 Conference on Em...
|
||
2025-06-11 11:08:19,488 - DEBUG - 块 440 生成文本: <triplet> <concept> Conference on Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:08:19,489 - DEBUG - 原始生成文本: <triplet> <concept> Conference on Empirical Methods in Natural Language Processing <media> studies</s>
|
||
2025-06-11 11:08:19,489 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Conference on Empirical Methods in Natural Language Processing', '<media>', 'studies']
|
||
2025-06-11 11:08:19,489 - DEBUG - 处理块 441/504: Nov 4, 2018. Stroudsburg: ACL,2018: 918-924.
|
||
1867
|
||
...
|
||
2025-06-11 11:08:19,692 - DEBUG - 块 441 生成文本: <triplet> ଊ X X D F B KP S H <org> 1867 <date> inception</s>
|
||
2025-06-11 11:08:19,692 - DEBUG - 原始生成文本: <triplet> ଊ X X D F B KP S H <org> 1867 <date> inception</s>
|
||
2025-06-11 11:08:19,692 - DEBUG - 处理后标记: ['<triplet>', 'ଊ X X D F B KP S H', '<org>', '1867', '<date>', 'inception']
|
||
2025-06-11 11:08:19,692 - DEBUG - 添加三元组: ଊ X X D F B KP S H(org) - inception - 1867(date)
|
||
2025-06-11 11:08:19,692 - DEBUG - 块 441 提取到 1 个三元组
|
||
2025-06-11 11:08:19,692 - DEBUG - 处理块 442/504: Journal of Frontiers of Computer Science and Techn...
|
||
2025-06-11 11:08:20,034 - DEBUG - 块 442 生成文本: <triplet> ZHOU M <per> 计算机科学 <concept> field of work</s>
|
||
2025-06-11 11:08:20,034 - DEBUG - 原始生成文本: <triplet> ZHOU M <per> 计算机科学 <concept> field of work</s>
|
||
2025-06-11 11:08:20,034 - DEBUG - 处理后标记: ['<triplet>', 'ZHOU M', '<per>', '计算机科学', '<concept>', 'field of work']
|
||
2025-06-11 11:08:20,034 - DEBUG - 添加三元组: ZHOU M(per) - field of work - 计算机科学(concept)
|
||
2025-06-11 11:08:20,034 - DEBUG - 块 442 提取到 1 个三元组
|
||
2025-06-11 11:08:20,034 - DEBUG - 处理块 443/504: over Freebase with multi-column convolutional neur...
|
||
2025-06-11 11:08:20,193 - DEBUG - 块 443 生成文本: <triplet> <concept> convolutional neural networks</s>
|
||
2025-06-11 11:08:20,193 - DEBUG - 原始生成文本: <triplet> <concept> convolutional neural networks</s>
|
||
2025-06-11 11:08:20,193 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'convolutional neural networks']
|
||
2025-06-11 11:08:20,193 - DEBUG - 处理块 444/504: for Computational Linguistics and the 7th Internat...
|
||
2025-06-11 11:08:20,363 - DEBUG - 块 444 生成文本: <triplet> <org> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:08:20,363 - DEBUG - 原始生成文本: <triplet> <org> Computational Linguistics <concept> main subject</s>
|
||
2025-06-11 11:08:20,363 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Computational Linguistics', '<concept>', 'main subject']
|
||
2025-06-11 11:08:20,363 - DEBUG - 处理块 445/504: Jul 26-31, 2015. Stroudsburg: ACL,2015: 260-269.
|
||
[...
|
||
2025-06-11 11:08:20,639 - DEBUG - 块 445 生成文本: <triplet> ZHANG Y <per> KANG L, et al. An end-to-end model <concept> instance of</s>
|
||
2025-06-11 11:08:20,639 - DEBUG - 原始生成文本: <triplet> ZHANG Y <per> KANG L, et al. An end-to-end model <concept> instance of</s>
|
||
2025-06-11 11:08:20,640 - DEBUG - 处理后标记: ['<triplet>', 'ZHANG Y', '<per>', 'KANG L, et al. An end-to-end model', '<concept>', 'instance of']
|
||
2025-06-11 11:08:20,640 - DEBUG - 添加三元组: ZHANG Y(per) - instance of - KANG L, et al. An end-to-end model(concept)
|
||
2025-06-11 11:08:20,640 - DEBUG - 块 445 提取到 1 个三元组
|
||
2025-06-11 11:08:20,640 - DEBUG - 处理块 446/504: for question answering over knowledge base with cr...
|
||
2025-06-11 11:08:21,150 - DEBUG - 块 446 生成文本: <triplet> <concept> question answering over knowledge base with cross- attention combining global knowledge</s>
|
||
2025-06-11 11:08:21,150 - DEBUG - 原始生成文本: <triplet> <concept> question answering over knowledge base with cross- attention combining global knowledge</s>
|
||
2025-06-11 11:08:21,150 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'question answering over knowledge base with cross- attention combining global knowledge']
|
||
2025-06-11 11:08:21,151 - DEBUG - 处理块 447/504: the 55th Annual Meeting of the Association for Com...
|
||
2025-06-11 11:08:21,683 - DEBUG - 块 447 生成文本: <triplet> <concept> Annual Meeting of the Association for Computational Linguistics <eve> ACL <org> ACM <media> instance of</s>
|
||
2025-06-11 11:08:21,683 - DEBUG - 原始生成文本: <triplet> <concept> Annual Meeting of the Association for Computational Linguistics <eve> ACL <org> ACM <media> instance of</s>
|
||
2025-06-11 11:08:21,683 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Annual Meeting of the Association for Computational Linguistics', '<eve>', 'ACL', '<org>', 'ACM', '<media>', 'instance of']
|
||
2025-06-11 11:08:21,684 - DEBUG - 处理块 448/504: [94] MOHAMMED S, SHI P, LIN J. Strong baselines fo...
|
||
2025-06-11 11:08:22,419 - DEBUG - 块 448 生成文本: <triplet> graphs with and without <concept> MOHAMMED S, SHI P, <per> named after assembly of knowledge <misc> strong baselines for simple question answering over knowledge baseline <media> based on <triplet> knowledge distribution <unk> LIN <eve> <org> owned <date> <dis> <loc> .</s>
|
||
2025-06-11 11:08:22,419 - DEBUG - 原始生成文本: <triplet> graphs with and without <concept> MOHAMMED S, SHI P, <per> named after assembly of knowledge <misc> strong baselines for simple question answering over knowledge baseline <media> based on <triplet> knowledge distribution <unk> LIN <eve> <org> owned <date> <dis> <loc> .</s>
|
||
2025-06-11 11:08:22,419 - DEBUG - 处理后标记: ['<triplet>', 'graphs with and without', '<concept>', 'MOHAMMED S, SHI P,', '<per>', 'named after assembly of knowledge', '<misc>', 'strong baselines for simple question answering over knowledge baseline', '<media>', 'based on', '<triplet>', 'knowledge distribution', '<unk>', 'LIN', '<eve>', '<org>', 'owned', '<date>', '<dis>', '<loc>', '.']
|
||
2025-06-11 11:08:22,419 - DEBUG - 添加三元组: graphs with and without(concept) - named after assembly of knowledge - MOHAMMED S, SHI P,(per)
|
||
2025-06-11 11:08:22,419 - DEBUG - 添加三元组: knowledge distribution(unk) - <org> - LIN(eve)
|
||
2025-06-11 11:08:22,419 - DEBUG - 块 448 提取到 2 个三元组
|
||
2025-06-11 11:08:22,419 - DEBUG - 处理块 449/504: neural networks[C]//Proceedings of the 2018 Confer...
|
||
2025-06-11 11:08:22,812 - DEBUG - 块 449 生成文本: <triplet> <concept> Association for Compu- <org> part of</s>
|
||
2025-06-11 11:08:22,812 - DEBUG - 原始生成文本: <triplet> <concept> Association for Compu- <org> part of</s>
|
||
2025-06-11 11:08:22,812 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Compu-', '<org>', 'part of']
|
||
2025-06-11 11:08:22,812 - DEBUG - 处理块 450/504: tational Linguistics: Human Language Technologies ...
|
||
2025-06-11 11:08:22,960 - DEBUG - 块 450 生成文本: <triplet> <org> New Orleans <loc> headquarters location</s>
|
||
2025-06-11 11:08:22,961 - DEBUG - 原始生成文本: <triplet> <org> New Orleans <loc> headquarters location</s>
|
||
2025-06-11 11:08:22,961 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New Orleans', '<loc>', 'headquarters location']
|
||
2025-06-11 11:08:22,961 - DEBUG - 处理块 451/504: [95] YANG M C, NAN D, MING Z, et al. Joint relatio...
|
||
2025-06-11 11:08:23,279 - DEBUG - 块 451 生成文本: <triplet> NAN D <per> MING Z <media> participant</s>
|
||
2025-06-11 11:08:23,279 - DEBUG - 原始生成文本: <triplet> NAN D <per> MING Z <media> participant</s>
|
||
2025-06-11 11:08:23,279 - DEBUG - 处理后标记: ['<triplet>', 'NAN D', '<per>', 'MING Z', '<media>', 'participant']
|
||
2025-06-11 11:08:23,280 - DEBUG - 添加三元组: NAN D(per) - participant - MING Z(media)
|
||
2025-06-11 11:08:23,280 - DEBUG - 块 451 提取到 1 个三元组
|
||
2025-06-11 11:08:23,280 - DEBUG - 处理块 452/504: dings of the 2014 Conference on Empirical Methods ...
|
||
2025-06-11 11:08:23,598 - DEBUG - 块 452 生成文本: <triplet> <org> Doha <loc> headquarters location</s>
|
||
2025-06-11 11:08:23,598 - DEBUG - 原始生成文本: <triplet> <org> Doha <loc> headquarters location</s>
|
||
2025-06-11 11:08:23,598 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Doha', '<loc>', 'headquarters location']
|
||
2025-06-11 11:08:23,598 - DEBUG - 处理块 453/504: [96] YIN W P, YU M, XIANG B, et al. Simple questio...
|
||
2025-06-11 11:08:24,109 - DEBUG - 块 453 生成文本: <triplet> YU M, XIANG B, et al. Simple question answering by attentive convolutional.ar <concept> YIN W P, <per> author</s>
|
||
2025-06-11 11:08:24,109 - DEBUG - 原始生成文本: <triplet> YU M, XIANG B, et al. Simple question answering by attentive convolutional.ar <concept> YIN W P, <per> author</s>
|
||
2025-06-11 11:08:24,109 - DEBUG - 处理后标记: ['<triplet>', 'YU M, XIANG B, et al. Simple question answering by attentive convolutional.ar', '<concept>', 'YIN W P,', '<per>', 'author']
|
||
2025-06-11 11:08:24,109 - DEBUG - 添加三元组: YU M, XIANG B, et al. Simple question answering by attentive convolutional.ar(concept) - author - YIN W P,(per)
|
||
2025-06-11 11:08:24,109 - DEBUG - 块 453 提取到 1 个三元组
|
||
2025-06-11 11:08:24,109 - DEBUG - 处理块 454/504: [97] ZHANG Y Z, LIU K, HE S Z, et al. Question ans...
|
||
2025-06-11 11:08:24,687 - DEBUG - 块 454 生成文本: <triplet> ZHANG Y Z <per> LIU K, HE S Z, et al. Question answering over knowledge base with neural attention combining global <concept> studies</s>
|
||
2025-06-11 11:08:24,687 - DEBUG - 原始生成文本: <triplet> ZHANG Y Z <per> LIU K, HE S Z, et al. Question answering over knowledge base with neural attention combining global <concept> studies</s>
|
||
2025-06-11 11:08:24,687 - DEBUG - 处理后标记: ['<triplet>', 'ZHANG Y Z', '<per>', 'LIU K, HE S Z, et al. Question answering over knowledge base with neural attention combining global', '<concept>', 'studies']
|
||
2025-06-11 11:08:24,687 - DEBUG - 添加三元组: ZHANG Y Z(per) - studies - LIU K, HE S Z, et al. Question answering over knowledge base with neural attention combining global(concept)
|
||
2025-06-11 11:08:24,687 - DEBUG - 块 454 提取到 1 个三元组
|
||
2025-06-11 11:08:24,687 - DEBUG - 处理块 455/504: knowledge information[J]. arXiv:1606.00979, 2016.
|
||
...
|
||
2025-06-11 11:08:24,997 - DEBUG - 块 455 生成文本: <triplet> <concept> M <misc> part of <triplet> A <media> M. Retrieved <org> follows</s>
|
||
2025-06-11 11:08:24,997 - DEBUG - 原始生成文本: <triplet> <concept> M <misc> part of <triplet> A <media> M. Retrieved <org> follows</s>
|
||
2025-06-11 11:08:24,997 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'M', '<misc>', 'part of', '<triplet>', 'A', '<media>', 'M. Retrieved', '<org>', 'follows']
|
||
2025-06-11 11:08:24,997 - DEBUG - 处理块 456/504: and re- rank: a simple and effective IR approach t...
|
||
2025-06-11 11:08:25,368 - DEBUG - 块 456 生成文本: <triplet> graphs <concept> IR approach to simple question answering over knowledge <unk> IR <misc> studies</s>
|
||
2025-06-11 11:08:25,368 - DEBUG - 原始生成文本: <triplet> graphs <concept> IR approach to simple question answering over knowledge <unk> IR <misc> studies</s>
|
||
2025-06-11 11:08:25,368 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'IR approach to simple question answering over knowledge', '<unk>', 'IR', '<misc>', 'studies']
|
||
2025-06-11 11:08:25,369 - DEBUG - 添加三元组: graphs(concept) - IR - IR approach to simple question answering over knowledge(unk)
|
||
2025-06-11 11:08:25,369 - DEBUG - 块 456 提取到 1 个三元组
|
||
2025-06-11 11:08:25,369 - DEBUG - 处理块 457/504: of the 1st Workshop on Fact Extraction and verific...
|
||
2025-06-11 11:08:25,645 - DEBUG - 块 457 生成文本: <triplet> ZHANG Y Y, QIAN S S, FANG Q, et al. Multi- modal <per> author</s>
|
||
2025-06-11 11:08:25,645 - DEBUG - 原始生成文本: <triplet> ZHANG Y Y, QIAN S S, FANG Q, et al. Multi- modal <per> author</s>
|
||
2025-06-11 11:08:25,645 - DEBUG - 处理后标记: ['<triplet>', 'ZHANG Y Y, QIAN S S, FANG Q, et al. Multi- modal', '<per>', 'author']
|
||
2025-06-11 11:08:25,645 - DEBUG - 处理块 458/504: knowledge-aware attention network for question ans...
|
||
2025-06-11 11:08:25,910 - DEBUG - 块 458 生成文本: <triplet> <concept> Journal of Computer Research and Development <media> publisher</s>
|
||
2025-06-11 11:08:25,910 - DEBUG - 原始生成文本: <triplet> <concept> Journal of Computer Research and Development <media> publisher</s>
|
||
2025-06-11 11:08:25,910 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Journal of Computer Research and Development', '<media>', 'publisher']
|
||
2025-06-11 11:08:25,910 - DEBUG - 处理块 459/504: 张莹莹 , 钱胜胜 , 方全 , 等 . 基于多模态知识感知注意力机
|
||
制的问答方法 [J]. 计算机...
|
||
2025-06-11 11:08:26,400 - DEBUG - 块 459 生成文本: <triplet> 张莹莹 <concept> 多模态知识感知注意力机 制的问答方法 <unk> 问 <misc> facet of</s>
|
||
2025-06-11 11:08:26,400 - DEBUG - 原始生成文本: <triplet> 张莹莹 <concept> 多模态知识感知注意力机 制的问答方法 <unk> 问 <misc> facet of</s>
|
||
2025-06-11 11:08:26,400 - DEBUG - 处理后标记: ['<triplet>', '张莹莹', '<concept>', '多模态知识感知注意力机 制的问答方法', '<unk>', '问', '<misc>', 'facet of']
|
||
2025-06-11 11:08:26,400 - DEBUG - 添加三元组: 张莹莹(concept) - 问 - 多模态知识感知注意力机 制的问答方法(unk)
|
||
2025-06-11 11:08:26,401 - DEBUG - 块 459 提取到 1 个三元组
|
||
2025-06-11 11:08:26,401 - DEBUG - 处理块 460/504: graph convolutional network for educational knowle...
|
||
2025-06-11 11:08:27,397 - DEBUG - 块 460 生成文本: <triplet> graph <concept> convolutional network for educational knowledge base question answering[J.Journal of knowledgebase question answereding.James.computer.Jr.convolutionary question <unk> field viewinginstruction.Computer <misc> convolvolution <triplet> knowledge bases <media> knowledge based onJ <eve> knowledge Base question ответing(J)</s>
|
||
2025-06-11 11:08:27,397 - DEBUG - 原始生成文本: <triplet> graph <concept> convolutional network for educational knowledge base question answering[J.Journal of knowledgebase question answereding.James.computer.Jr.convolutionary question <unk> field viewinginstruction.Computer <misc> convolvolution <triplet> knowledge bases <media> knowledge based onJ <eve> knowledge Base question ответing(J)</s>
|
||
2025-06-11 11:08:27,397 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'convolutional network for educational knowledge base question answering[J.Journal of knowledgebase question answereding.James.computer.Jr.convolutionary question', '<unk>', 'field viewinginstruction.Computer', '<misc>', 'convolvolution', '<triplet>', 'knowledge bases', '<media>', 'knowledge based onJ', '<eve>', 'knowledge Base question ответing(J)']
|
||
2025-06-11 11:08:27,397 - DEBUG - 添加三元组: graph(concept) - field viewinginstruction.Computer - convolutional network for educational knowledge base question answering[J.Journal of knowledgebase question answereding.James.computer.Jr.convolutionary question(unk)
|
||
2025-06-11 11:08:27,397 - DEBUG - 添加三元组: knowledge bases(media) - knowledge Base question ответing(J) - knowledge based onJ(eve)
|
||
2025-06-11 11:08:27,398 - DEBUG - 块 460 提取到 2 个三元组
|
||
2025-06-11 11:08:27,398 - DEBUG - 处理块 461/504: Science and Technology,2021, 15(10): 1880-1887.
|
||
蔺奇...
|
||
2025-06-11 11:08:27,664 - DEBUG - 块 461 生成文本: <triplet> 蔺奇卡 <unk> 张玲玲 <concept> student</s>
|
||
2025-06-11 11:08:27,664 - DEBUG - 原始生成文本: <triplet> 蔺奇卡 <unk> 张玲玲 <concept> student</s>
|
||
2025-06-11 11:08:27,664 - DEBUG - 处理后标记: ['<triplet>', '蔺奇卡', '<unk>', '张玲玲', '<concept>', 'student']
|
||
2025-06-11 11:08:27,664 - DEBUG - 添加三元组: 蔺奇卡(unk) - student - 张玲玲(concept)
|
||
2025-06-11 11:08:27,664 - DEBUG - 块 461 提取到 1 个三元组
|
||
2025-06-11 11:08:27,664 - DEBUG - 处理块 462/504: [101] XIONG W H, YU M, CHANG S Y, et al. Improving...
|
||
2025-06-11 11:08:28,379 - DEBUG - 块 462 生成文本: <triplet> YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S <concept> knowledge <misc> knowledge of knowledge</s>
|
||
2025-06-11 11:08:28,379 - DEBUG - 原始生成文本: <triplet> YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S <concept> knowledge <misc> knowledge of knowledge</s>
|
||
2025-06-11 11:08:28,379 - DEBUG - 处理后标记: ['<triplet>', 'YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S', '<concept>', 'knowledge', '<misc>', 'knowledge of knowledge']
|
||
2025-06-11 11:08:28,379 - DEBUG - 添加三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S(concept) - knowledge of knowledge - knowledge(misc)
|
||
2025-06-11 11:08:28,379 - DEBUG - 块 462 提取到 1 个三元组
|
||
2025-06-11 11:08:28,379 - DEBUG - 处理块 463/504: [102] FELLBAUM C, MILLER G. WordNet: an electronic...
|
||
2025-06-11 11:08:28,655 - DEBUG - 块 463 生成文本: <triplet> <media> MIT Press <org> owned by</s>
|
||
2025-06-11 11:08:28,655 - DEBUG - 原始生成文本: <triplet> <media> MIT Press <org> owned by</s>
|
||
2025-06-11 11:08:28,655 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'MIT Press', '<org>', 'owned by']
|
||
2025-06-11 11:08:28,655 - DEBUG - 处理块 464/504: [103] VRANDECIC D, KRTOETZSCH M. Wikidata: a free
|
||
...
|
||
2025-06-11 11:08:29,061 - DEBUG - 块 464 生成文本: <triplet> <concept> ACM <org> standards body</s>
|
||
2025-06-11 11:08:29,062 - DEBUG - 原始生成文本: <triplet> <concept> ACM <org> standards body</s>
|
||
2025-06-11 11:08:29,062 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM', '<org>', 'standards body']
|
||
2025-06-11 11:08:29,062 - DEBUG - 处理块 465/504: [104] SERBAN I V, GARCIA-DURAN A, GULCEHRE C, et a...
|
||
2025-06-11 11:08:29,252 - DEBUG - 块 465 生成文本: <triplet> GARCIA-DURAN A <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:29,253 - DEBUG - 原始生成文本: <triplet> GARCIA-DURAN A <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:29,253 - DEBUG - 处理后标记: ['<triplet>', 'GARCIA-DURAN A', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:08:29,253 - DEBUG - 处理块 466/504: works: the 30M factoid question- answer corpus[C]/...
|
||
2025-06-11 11:08:29,677 - DEBUG - 块 466 生成文本: <triplet> <media> factoid <concept> instance of <triplet> Pro- ceedings of the 54th Annual Meeting <eve> Associationfor <org> facet <per> participant</s>
|
||
2025-06-11 11:08:29,678 - DEBUG - 原始生成文本: <triplet> <media> factoid <concept> instance of <triplet> Pro- ceedings of the 54th Annual Meeting <eve> Associationfor <org> facet <per> participant</s>
|
||
2025-06-11 11:08:29,678 - DEBUG - 处理后标记: ['<triplet>', '<media>', 'factoid', '<concept>', 'instance of', '<triplet>', 'Pro- ceedings of the 54th Annual Meeting', '<eve>', 'Associationfor', '<org>', 'facet', '<per>', 'participant']
|
||
2025-06-11 11:08:29,678 - DEBUG - 处理块 467/504: Computational Linguistics, Berlin, Aug 7-12, 2016....
|
||
2025-06-11 11:08:30,018 - DEBUG - 块 467 生成文本: <triplet> YAN Z <per> Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:08:30,018 - DEBUG - 原始生成文本: <triplet> YAN Z <per> Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:08:30,018 - DEBUG - 处理后标记: ['<triplet>', 'YAN Z', '<per>', 'Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:08:30,018 - DEBUG - 添加三元组: YAN Z(per) - member of - Computational Linguistics(org)
|
||
2025-06-11 11:08:30,018 - DEBUG - 块 467 提取到 1 个三元组
|
||
2025-06-11 11:08:30,018 - DEBUG - 处理块 468/504: question answering with knowledge graph[C]//Procee...
|
||
2025-06-11 11:08:30,187 - DEBUG - 块 468 生成文本: <triplet> graph <concept> International Conference on Computational <org> part of</s>
|
||
2025-06-11 11:08:30,187 - DEBUG - 原始生成文本: <triplet> graph <concept> International Conference on Computational <org> part of</s>
|
||
2025-06-11 11:08:30,187 - DEBUG - 处理后标记: ['<triplet>', 'graph', '<concept>', 'International Conference on Computational', '<org>', 'part of']
|
||
2025-06-11 11:08:30,187 - DEBUG - 添加三元组: graph(concept) - part of - International Conference on Computational(org)
|
||
2025-06-11 11:08:30,187 - DEBUG - 块 468 提取到 1 个三元组
|
||
2025-06-11 11:08:30,187 - DEBUG - 处理块 469/504: Linguistics, Osaka, Dec 11- 16, 2016. Stroudsburg:...
|
||
2025-06-11 11:08:30,475 - DEBUG - 块 469 生成文本: <triplet> <concept> YIN P, DUAN N, KAO B <per> participant</s>
|
||
2025-06-11 11:08:30,475 - DEBUG - 原始生成文本: <triplet> <concept> YIN P, DUAN N, KAO B <per> participant</s>
|
||
2025-06-11 11:08:30,475 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'YIN P, DUAN N, KAO B', '<per>', 'participant']
|
||
2025-06-11 11:08:30,475 - DEBUG - 处理块 470/504: complex semantic constraints on open knowledge bas...
|
||
2025-06-11 11:08:30,644 - DEBUG - 块 470 生成文本: <triplet> <concept> ACM International Conference <org> part of</s>
|
||
2025-06-11 11:08:30,644 - DEBUG - 原始生成文本: <triplet> <concept> ACM International Conference <org> part of</s>
|
||
2025-06-11 11:08:30,644 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'ACM International Conference', '<org>', 'part of']
|
||
2025-06-11 11:08:30,644 - DEBUG - 处理块 471/504: on Information and Knowledge Management, Melbourne...
|
||
2025-06-11 11:08:30,931 - DEBUG - 块 471 生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:08:30,931 - DEBUG - 原始生成文本: <triplet> <org> New York <loc> headquarters location</s>
|
||
2025-06-11 11:08:30,931 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'New York', '<loc>', 'headquarters location']
|
||
2025-06-11 11:08:30,931 - DEBUG - 处理块 472/504: [107] YIH W T, RICHARDSON M, MEEK C, et al. The va...
|
||
2025-06-11 11:08:31,197 - DEBUG - 块 472 生成文本: <triplet> <concept> knowledge base question <misc> subclass of</s>
|
||
2025-06-11 11:08:31,197 - DEBUG - 原始生成文本: <triplet> <concept> knowledge base question <misc> subclass of</s>
|
||
2025-06-11 11:08:31,197 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'knowledge base question', '<misc>', 'subclass of']
|
||
2025-06-11 11:08:31,197 - DEBUG - 处理块 473/504: answering[C]//Proceedings of the 54th Annual Meeti...
|
||
2025-06-11 11:08:31,525 - DEBUG - 块 473 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:08:31,526 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:08:31,526 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:08:31,526 - DEBUG - 处理块 474/504: Aug 7-12, 2016. Stroudsburg: ACL,2016: 201-206.
|
||
[1...
|
||
2025-06-11 11:08:31,653 - DEBUG - 块 474 生成文本: <triplet> <loc> knowledge- base <concept> instance of</s>
|
||
2025-06-11 11:08:31,653 - DEBUG - 原始生成文本: <triplet> <loc> knowledge- base <concept> instance of</s>
|
||
2025-06-11 11:08:31,653 - DEBUG - 处理后标记: ['<triplet>', '<loc>', 'knowledge- base', '<concept>', 'instance of']
|
||
2025-06-11 11:08:31,653 - DEBUG - 处理块 475/504: for answering complex questions[C]//Proceedings of...
|
||
2025-06-11 11:08:31,940 - DEBUG - 块 475 生成文本: <triplet> <org> Conference of the North American <media> subsidiary</s>
|
||
2025-06-11 11:08:31,940 - DEBUG - 原始生成文本: <triplet> <org> Conference of the North American <media> subsidiary</s>
|
||
2025-06-11 11:08:31,940 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Conference of the North American', '<media>', 'subsidiary']
|
||
2025-06-11 11:08:31,940 - DEBUG - 处理块 476/504: Association for Computational Linguistics, New Orl...
|
||
2025-06-11 11:08:32,194 - DEBUG - 块 476 生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:08:32,194 - DEBUG - 原始生成文本: <triplet> <concept> Association for Computational Linguistics <org> member of</s>
|
||
2025-06-11 11:08:32,194 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Association for Computational Linguistics', '<org>', 'member of']
|
||
2025-06-11 11:08:32,194 - DEBUG - 处理块 477/504: [109] YU S, SUN H, SADLER B, et al. On generating ...
|
||
2025-06-11 11:08:32,460 - DEBUG - 块 477 生成文本: <triplet> QA evaluation <concept> question sets <media> subclass of <unk> questionsets</s>
|
||
2025-06-11 11:08:32,460 - DEBUG - 原始生成文本: <triplet> QA evaluation <concept> question sets <media> subclass of <unk> questionsets</s>
|
||
2025-06-11 11:08:32,460 - DEBUG - 处理后标记: ['<triplet>', 'QA evaluation', '<concept>', 'question sets', '<media>', 'subclass of', '<unk>', 'questionsets']
|
||
2025-06-11 11:08:32,460 - DEBUG - 添加三元组: QA evaluation(concept) - subclass of - question sets(media)
|
||
2025-06-11 11:08:32,461 - DEBUG - 块 477 提取到 1 个三元组
|
||
2025-06-11 11:08:32,461 - DEBUG - 处理块 478/504: the 2016 Conference on Empirical Methods in Natura...
|
||
2025-06-11 11:08:32,908 - DEBUG - 块 478 生成文本: <triplet> <org> Austin <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:32,908 - DEBUG - 原始生成文本: <triplet> <org> Austin <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:32,908 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Austin', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:08:32,908 - DEBUG - 处理块 479/504: [110] ZHOU M, HUANG M, ZHU X. An interpretable rea...
|
||
2025-06-11 11:08:33,344 - DEBUG - 块 479 生成文本: <triplet> ZHOU M <misc> interpretable reasoning network <concept> use</s>
|
||
2025-06-11 11:08:33,344 - DEBUG - 原始生成文本: <triplet> ZHOU M <misc> interpretable reasoning network <concept> use</s>
|
||
2025-06-11 11:08:33,344 - DEBUG - 处理后标记: ['<triplet>', 'ZHOU M', '<misc>', 'interpretable reasoning network', '<concept>', 'use']
|
||
2025-06-11 11:08:33,344 - DEBUG - 添加三元组: ZHOU M(misc) - use - interpretable reasoning network(concept)
|
||
2025-06-11 11:08:33,344 - DEBUG - 块 479 提取到 1 个三元组
|
||
2025-06-11 11:08:33,344 - DEBUG - 处理块 480/504: dings of the 27th International Conference on Comp...
|
||
2025-06-11 11:08:33,803 - DEBUG - 块 480 生成文本: <triplet> <concept> International Conference on Computa- tional Linguistics</s>
|
||
2025-06-11 11:08:33,803 - DEBUG - 原始生成文本: <triplet> <concept> International Conference on Computa- tional Linguistics</s>
|
||
2025-06-11 11:08:33,803 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'International Conference on Computa- tional Linguistics']
|
||
2025-06-11 11:08:33,803 - DEBUG - 处理块 481/504: [111] CIMIANO P, LOPEZ V, UNGER C, et al. Multilin...
|
||
2025-06-11 11:08:33,952 - DEBUG - 块 481 生成文本: <triplet> 菲律宾 <loc> 平方公里 <concept> instance of</s>
|
||
2025-06-11 11:08:33,952 - DEBUG - 原始生成文本: <triplet> 菲律宾 <loc> 平方公里 <concept> instance of</s>
|
||
2025-06-11 11:08:33,952 - DEBUG - 处理后标记: ['<triplet>', '菲律宾', '<loc>', '平方公里', '<concept>', 'instance of']
|
||
2025-06-11 11:08:33,952 - DEBUG - 添加三元组: 菲律宾(loc) - instance of - 平方公里(concept)
|
||
2025-06-11 11:08:33,952 - DEBUG - 块 481 提取到 1 个三元组
|
||
2025-06-11 11:08:33,952 - DEBUG - 处理块 482/504: question answering over linked data (QALD-3): lab ...
|
||
2025-06-11 11:08:34,314 - DEBUG - 块 482 生成文本: <triplet> LNCS 8138 <dis> lab over-view <concept> instance of the 4th Interna- <misc> instance</s>
|
||
2025-06-11 11:08:34,314 - DEBUG - 原始生成文本: <triplet> LNCS 8138 <dis> lab over-view <concept> instance of the 4th Interna- <misc> instance</s>
|
||
2025-06-11 11:08:34,314 - DEBUG - 处理后标记: ['<triplet>', 'LNCS 8138', '<dis>', 'lab over-view', '<concept>', 'instance of the 4th Interna-', '<misc>', 'instance']
|
||
2025-06-11 11:08:34,314 - DEBUG - 添加三元组: LNCS 8138(dis) - instance of the 4th Interna- - lab over-view(concept)
|
||
2025-06-11 11:08:34,314 - DEBUG - 块 482 提取到 1 个三元组
|
||
2025-06-11 11:08:34,314 - DEBUG - 处理块 483/504: tional Conference of theCross-Language Evaluation ...
|
||
2025-06-11 11:08:34,771 - DEBUG - 块 483 生成文本: <triplet> tional Conference of theCross-Language Evaluation Forum for European Languages <org> <media> instance of <triplet> Information Access <eve> <concept> instance <per> <misc> instance</s>
|
||
2025-06-11 11:08:34,771 - DEBUG - 原始生成文本: <triplet> tional Conference of theCross-Language Evaluation Forum for European Languages <org> <media> instance of <triplet> Information Access <eve> <concept> instance <per> <misc> instance</s>
|
||
2025-06-11 11:08:34,772 - DEBUG - 处理后标记: ['<triplet>', 'tional Conference of theCross-Language Evaluation Forum for European Languages', '<org>', '<media>', 'instance of', '<triplet>', 'Information Access', '<eve>', '<concept>', 'instance', '<per>', '<misc>', 'instance']
|
||
2025-06-11 11:08:34,772 - DEBUG - 处理块 484/504: Multilinguality, Multimodality, and Visualization,...
|
||
2025-06-11 11:08:34,995 - DEBUG - 块 484 生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:08:34,995 - DEBUG - 原始生成文本: <triplet> <org> Berlin <loc> headquarters location</s>
|
||
2025-06-11 11:08:34,995 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Berlin', '<loc>', 'headquarters location']
|
||
2025-06-11 11:08:34,995 - DEBUG - 处理块 485/504: [112] UNGER C, FORASCU C, LOPEZ V, et al. Question...
|
||
2025-06-11 11:08:35,154 - DEBUG - 块 485 生成文本: <triplet> <concept> QALD-4 <misc> studies</s>
|
||
2025-06-11 11:08:35,154 - DEBUG - 原始生成文本: <triplet> <concept> QALD-4 <misc> studies</s>
|
||
2025-06-11 11:08:35,155 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'QALD-4', '<misc>', 'studies']
|
||
2025-06-11 11:08:35,155 - DEBUG - 处理块 486/504: for CLEF 2014 Conference, Sheffield, Sep 15- 18, 2...
|
||
2025-06-11 11:08:35,495 - DEBUG - 块 486 生成文本: <triplet> <org> Sheffield <loc> headquarters location</s>
|
||
2025-06-11 11:08:35,495 - DEBUG - 原始生成文本: <triplet> <org> Sheffield <loc> headquarters location</s>
|
||
2025-06-11 11:08:35,495 - DEBUG - 处理后标记: ['<triplet>', '<org>', 'Sheffield', '<loc>', 'headquarters location']
|
||
2025-06-11 11:08:35,495 - DEBUG - 处理块 487/504: answering over linked data (QALD-5)[C]//Working No...
|
||
2025-06-11 11:08:35,836 - DEBUG - 块 487 生成文本: <triplet> <concept> 2015 <date> point in time <triplet> CLEF2015 <eve> CLef <media> part of the Evaluation Forum <org> participant</s>
|
||
2025-06-11 11:08:35,836 - DEBUG - 原始生成文本: <triplet> <concept> 2015 <date> point in time <triplet> CLEF2015 <eve> CLef <media> part of the Evaluation Forum <org> participant</s>
|
||
2025-06-11 11:08:35,836 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '2015', '<date>', 'point in time', '<triplet>', 'CLEF2015', '<eve>', 'CLef', '<media>', 'part of the Evaluation Forum', '<org>', 'participant']
|
||
2025-06-11 11:08:35,836 - DEBUG - 处理块 488/504: [114] UNGER C, NGOMO A, CABRIO E. 6th open challen...
|
||
2025-06-11 11:08:36,325 - DEBUG - 块 488 生成文本: <triplet> <concept> 6 <num> quantity <triplet> 6th open challenge on question answering over linked data (QALD-6th <eve> 6st <date> point in time</s>
|
||
2025-06-11 11:08:36,325 - DEBUG - 原始生成文本: <triplet> <concept> 6 <num> quantity <triplet> 6th open challenge on question answering over linked data (QALD-6th <eve> 6st <date> point in time</s>
|
||
2025-06-11 11:08:36,325 - DEBUG - 处理后标记: ['<triplet>', '<concept>', '6', '<num>', 'quantity', '<triplet>', '6th open challenge on question answering over linked data (QALD-6th', '<eve>', '6st', '<date>', 'point in time']
|
||
2025-06-11 11:08:36,325 - DEBUG - 处理块 489/504: Semantic Web Challenges: 3rd SemWebEval Challenge ...
|
||
2025-06-11 11:08:36,463 - DEBUG - 块 489 生成文本: <triplet> <eve> Semantic Web <misc> facet of</s>
|
||
2025-06-11 11:08:36,463 - DEBUG - 原始生成文本: <triplet> <eve> Semantic Web <misc> facet of</s>
|
||
2025-06-11 11:08:36,463 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'Semantic Web', '<misc>', 'facet of']
|
||
2025-06-11 11:08:36,463 - DEBUG - 处理块 490/504: [115] USBECK R, NGOMO A, HAARMANN B, et al. Open
|
||
c...
|
||
2025-06-11 11:08:36,943 - DEBUG - 块 490 生成文本: <triplet> <concept> question answering over linked data (QALD- <media> part of the series <triplet> question <org> QAD <misc> part <unk> list of</s>
|
||
2025-06-11 11:08:36,943 - DEBUG - 原始生成文本: <triplet> <concept> question answering over linked data (QALD- <media> part of the series <triplet> question <org> QAD <misc> part <unk> list of</s>
|
||
2025-06-11 11:08:36,943 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'question answering over linked data (QALD-', '<media>', 'part of the series', '<triplet>', 'question', '<org>', 'QAD', '<misc>', 'part', '<unk>', 'list of']
|
||
2025-06-11 11:08:36,943 - DEBUG - 处理块 491/504: 7)[C]//Semantic Web Challenges:4th SemWebEval Chal...
|
||
2025-06-11 11:08:37,081 - DEBUG - 块 491 生成文本: <triplet> <eve> Semantic Web <misc> facet of</s>
|
||
2025-06-11 11:08:37,081 - DEBUG - 原始生成文本: <triplet> <eve> Semantic Web <misc> facet of</s>
|
||
2025-06-11 11:08:37,081 - DEBUG - 处理后标记: ['<triplet>', '<eve>', 'Semantic Web', '<misc>', 'facet of']
|
||
2025-06-11 11:08:37,081 - DEBUG - 处理块 492/504: [116] TRIVEDI P , MAHESHWARI G, DUBEY M, et al. LC...
|
||
2025-06-11 11:08:37,229 - DEBUG - 块 492 生成文本: <triplet> LC-QuAD <media> corpus <concept> instance of</s>
|
||
2025-06-11 11:08:37,229 - DEBUG - 原始生成文本: <triplet> LC-QuAD <media> corpus <concept> instance of</s>
|
||
2025-06-11 11:08:37,230 - DEBUG - 处理后标记: ['<triplet>', 'LC-QuAD', '<media>', 'corpus', '<concept>', 'instance of']
|
||
2025-06-11 11:08:37,230 - DEBUG - 添加三元组: LC-QuAD(media) - instance of - corpus(concept)
|
||
2025-06-11 11:08:37,230 - DEBUG - 块 492 提取到 1 个三元组
|
||
2025-06-11 11:08:37,230 - DEBUG - 处理块 493/504: graphs[C]//LNCS 10588: Proceedings of the16th Inte...
|
||
2025-06-11 11:08:37,442 - DEBUG - 块 493 生成文本: <triplet> graphs <concept> Semantic Web Conference <media> instance of</s>
|
||
2025-06-11 11:08:37,442 - DEBUG - 原始生成文本: <triplet> graphs <concept> Semantic Web Conference <media> instance of</s>
|
||
2025-06-11 11:08:37,442 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'Semantic Web Conference', '<media>', 'instance of']
|
||
2025-06-11 11:08:37,442 - DEBUG - 添加三元组: graphs(concept) - instance of - Semantic Web Conference(media)
|
||
2025-06-11 11:08:37,442 - DEBUG - 块 493 提取到 1 个三元组
|
||
2025-06-11 11:08:37,442 - DEBUG - 处理块 494/504: [117] DUBEY M, BANERJEE D, ABDELKAWI A, et al. LC-...
|
||
2025-06-11 11:08:37,675 - DEBUG - 块 494 生成文本: <triplet> LC- QuAD 2.0 <misc> large dataset <concept> instance of</s>
|
||
2025-06-11 11:08:37,676 - DEBUG - 原始生成文本: <triplet> LC- QuAD 2.0 <misc> large dataset <concept> instance of</s>
|
||
2025-06-11 11:08:37,676 - DEBUG - 处理后标记: ['<triplet>', 'LC- QuAD 2.0', '<misc>', 'large dataset', '<concept>', 'instance of']
|
||
2025-06-11 11:08:37,676 - DEBUG - 添加三元组: LC- QuAD 2.0(misc) - instance of - large dataset(concept)
|
||
2025-06-11 11:08:37,676 - DEBUG - 块 494 提取到 1 个三元组
|
||
2025-06-11 11:08:37,676 - DEBUG - 处理块 495/504: ing over Wikidata and DBpedia[C]//LNCS11779: Proce...
|
||
2025-06-11 11:08:38,048 - DEBUG - 块 495 生成文本: <triplet> LNCS11779 <eve> International Semantic Web Conference <media> instance of</s>
|
||
2025-06-11 11:08:38,049 - DEBUG - 原始生成文本: <triplet> LNCS11779 <eve> International Semantic Web Conference <media> instance of</s>
|
||
2025-06-11 11:08:38,049 - DEBUG - 处理后标记: ['<triplet>', 'LNCS11779', '<eve>', 'International Semantic Web Conference', '<media>', 'instance of']
|
||
2025-06-11 11:08:38,049 - DEBUG - 添加三元组: LNCS11779(eve) - instance of - International Semantic Web Conference(media)
|
||
2025-06-11 11:08:38,049 - DEBUG - 块 495 提取到 1 个三元组
|
||
2025-06-11 11:08:38,049 - DEBUG - 处理块 496/504: Auckland, Oct 26-30, 2019. Cham: Springer,2019: 69...
|
||
2025-06-11 11:08:38,540 - DEBUG - 块 496 生成文本: <triplet> 陈子睿 <concept> 克拉玛依 <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:38,540 - DEBUG - 原始生成文本: <triplet> 陈子睿 <concept> 克拉玛依 <loc> located in the administrative territorial entity</s>
|
||
2025-06-11 11:08:38,540 - DEBUG - 处理后标记: ['<triplet>', '陈子睿', '<concept>', '克拉玛依', '<loc>', 'located in the administrative territorial entity']
|
||
2025-06-11 11:08:38,540 - DEBUG - 添加三元组: 陈子睿(concept) - located in the administrative territorial entity - 克拉玛依(loc)
|
||
2025-06-11 11:08:38,540 - DEBUG - 块 496 提取到 1 个三元组
|
||
2025-06-11 11:08:38,540 - DEBUG - 处理块 497/504: CHEN Zirui, born in1998, M.S. candidate, stu-
|
||
dent...
|
||
2025-06-11 11:08:38,720 - DEBUG - 块 497 生成文本: <triplet> CHEN Zirui <per> 1998 <date> date of birth</s>
|
||
2025-06-11 11:08:38,720 - DEBUG - 原始生成文本: <triplet> CHEN Zirui <per> 1998 <date> date of birth</s>
|
||
2025-06-11 11:08:38,720 - DEBUG - 处理后标记: ['<triplet>', 'CHEN Zirui', '<per>', '1998', '<date>', 'date of birth']
|
||
2025-06-11 11:08:38,720 - DEBUG - 添加三元组: CHEN Zirui(per) - date of birth - 1998(date)
|
||
2025-06-11 11:08:38,720 - DEBUG - 块 497 提取到 1 个三元组
|
||
2025-06-11 11:08:38,720 - DEBUG - 处理块 498/504: knowledge graph question answering.
|
||
王鑫 (1981—) ,男,...
|
||
2025-06-11 11:08:38,890 - DEBUG - 块 498 生成文本: <triplet> 大数据分布式处理 <concept> <media> field of work</s>
|
||
2025-06-11 11:08:38,890 - DEBUG - 原始生成文本: <triplet> 大数据分布式处理 <concept> <media> field of work</s>
|
||
2025-06-11 11:08:38,890 - DEBUG - 处理后标记: ['<triplet>', '大数据分布式处理', '<concept>', '<media>', 'field of work']
|
||
2025-06-11 11:08:38,890 - DEBUG - 处理块 499/504: WANG Xin,born in1981, Ph.D., professor, Ph.D.
|
||
supe...
|
||
2025-06-11 11:08:39,081 - DEBUG - 块 499 生成文本: <triplet> graphs <concept> knowledge <misc> studies</s>
|
||
2025-06-11 11:08:39,081 - DEBUG - 原始生成文本: <triplet> graphs <concept> knowledge <misc> studies</s>
|
||
2025-06-11 11:08:39,081 - DEBUG - 处理后标记: ['<triplet>', 'graphs', '<concept>', 'knowledge', '<misc>', 'studies']
|
||
2025-06-11 11:08:39,081 - DEBUG - 添加三元组: graphs(concept) - studies - knowledge(misc)
|
||
2025-06-11 11:08:39,081 - DEBUG - 块 499 提取到 1 个三元组
|
||
2025-06-11 11:08:39,081 - DEBUG - 处理块 500/504: date management, graph databases and bigdata
|
||
distr...
|
||
2025-06-11 11:08:39,325 - DEBUG - 块 500 生成文本: <triplet> 人工智能 <concept> 大数据 <media> studies</s>
|
||
2025-06-11 11:08:39,326 - DEBUG - 原始生成文本: <triplet> 人工智能 <concept> 大数据 <media> studies</s>
|
||
2025-06-11 11:08:39,326 - DEBUG - 处理后标记: ['<triplet>', '人工智能', '<concept>', '大数据', '<media>', 'studies']
|
||
2025-06-11 11:08:39,326 - DEBUG - 添加三元组: 人工智能(concept) - studies - 大数据(media)
|
||
2025-06-11 11:08:39,326 - DEBUG - 块 500 提取到 1 个三元组
|
||
2025-06-11 11:08:39,326 - DEBUG - 处理块 501/504: WANG Lin, born in 1981, Ph.D., professional
|
||
member...
|
||
2025-06-11 11:08:39,634 - DEBUG - 块 501 生成文本: <triplet> <concept> bigdata application <unk> studies <triplet> big data application and artificial intelligence <media> <per> occupation</s>
|
||
2025-06-11 11:08:39,634 - DEBUG - 原始生成文本: <triplet> <concept> bigdata application <unk> studies <triplet> big data application and artificial intelligence <media> <per> occupation</s>
|
||
2025-06-11 11:08:39,634 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'bigdata application', '<unk>', 'studies', '<triplet>', 'big data application and artificial intelligence', '<media>', '<per>', 'occupation']
|
||
2025-06-11 11:08:39,634 - DEBUG - 处理块 502/504: 徐大为 (1989—) ,男,博士,CCF 专业会员 ,主
|
||
要研究方向为人工智能 、自然语言处理。
|
||
...
|
||
2025-06-11 11:08:39,814 - DEBUG - 块 502 生成文本: <triplet> 徐大为 <concept> 1989 <date> date of birth</s>
|
||
2025-06-11 11:08:39,814 - DEBUG - 原始生成文本: <triplet> 徐大为 <concept> 1989 <date> date of birth</s>
|
||
2025-06-11 11:08:39,814 - DEBUG - 处理后标记: ['<triplet>', '徐大为', '<concept>', '1989', '<date>', 'date of birth']
|
||
2025-06-11 11:08:39,814 - DEBUG - 添加三元组: 徐大为(concept) - date of birth - 1989(date)
|
||
2025-06-11 11:08:39,814 - DEBUG - 块 502 提取到 1 个三元组
|
||
2025-06-11 11:08:39,814 - DEBUG - 处理块 503/504: artificial intelligence and natural language pro -...
|
||
2025-06-11 11:08:39,995 - DEBUG - 块 503 生成文本: <triplet> 贾勇哲 <per> 人工智能 <concept> field of work</s>
|
||
2025-06-11 11:08:39,995 - DEBUG - 原始生成文本: <triplet> 贾勇哲 <per> 人工智能 <concept> field of work</s>
|
||
2025-06-11 11:08:39,995 - DEBUG - 处理后标记: ['<triplet>', '贾勇哲', '<per>', '人工智能', '<concept>', 'field of work']
|
||
2025-06-11 11:08:39,995 - DEBUG - 添加三元组: 贾勇哲(per) - field of work - 人工智能(concept)
|
||
2025-06-11 11:08:39,995 - DEBUG - 块 503 提取到 1 个三元组
|
||
2025-06-11 11:08:39,995 - DEBUG - 处理块 504/504: JIA Yongzhe, born in1987, Ph.D., professional
|
||
memb...
|
||
2025-06-11 11:08:40,239 - DEBUG - 块 504 生成文本: <triplet> intelligence <concept> artificial <org> part of</s>
|
||
2025-06-11 11:08:40,239 - DEBUG - 原始生成文本: <triplet> intelligence <concept> artificial <org> part of</s>
|
||
2025-06-11 11:08:40,239 - DEBUG - 处理后标记: ['<triplet>', 'intelligence', '<concept>', 'artificial', '<org>', 'part of']
|
||
2025-06-11 11:08:40,239 - DEBUG - 添加三元组: intelligence(concept) - part of - artificial(org)
|
||
2025-06-11 11:08:40,239 - DEBUG - 块 504 提取到 1 个三元组
|
||
2025-06-11 11:08:40,265 - INFO - 文档 842b6180-667a-4ac8-b051-5c225c859011 的 329 个三元组已保存到: /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt
|
||
2025-06-11 11:08:40,265 - INFO - 文档 842b6180-667a-4ac8-b051-5c225c859011 三元组抽取完成,耗时: 190.03 秒
|
||
2025-06-11 11:08:40,265 - INFO - 文件 /share/wangmeihua/rag/data/zongshu.pdf 成功嵌入到数据库 ragdb_textdb
|
||
2025-06-11 11:13:56,876 - INFO -
|
||
测试 2:列出所有 db_types 和文档映射
|
||
2025-06-11 11:13:57,736 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:13:57,737 - DEBUG - 处理集合: ragdb_textdb (db_type: textdb)
|
||
2025-06-11 11:13:57,825 - DEBUG - 集合 ragdb_textdb 中找到用户和文档映射: {'testuser1': ['842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}
|
||
2025-06-11 11:13:57,825 - DEBUG - 可用 db_types 和数据: {'textdb': {'userids': {'testuser1': ['842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-11 11:13:57,825 - INFO - 可用 db_types 和文档: {'textdb': {'userids': {'testuser1': ['842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-11 11:13:57,825 - INFO -
|
||
测试 3:查看 userid testuser1 的所有集合
|
||
2025-06-11 11:13:57,825 - DEBUG - 正在查看 userid testuser1 的集合
|
||
2025-06-11 11:13:57,825 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 11:13:57,834 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的文档数: 88
|
||
2025-06-11 11:13:57,834 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的内容:
|
||
2025-06-11 11:13:57,834 - DEBUG - 文档 1: 内容: 开元云(北京)科技有限公司,是一家注册于2020年的高科技企业,在上海、南京、深圳、济南等地设有分支机构,创始团队核心成员来自一流的云计算公司及电信运营商,拥有云计算、超算、智算和网络运营专业经验,在企业市场均拥有超过十年以上行业经验,服务客户超过2万家。公司以自主研发的业务操作支撑系统(KBoss)为底座,打造开放算力应用服务平台(open-computing),将云计算、算力资源和算力应用进行..., 元数据: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 11:13:57,834 - DEBUG - 文档 2: 内容: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 3: 内容: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 4: 内容: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 5: 内容: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 6: 内容: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 7: 内容: 因此, 投影矩阵仅由关系决定是不合理的; ③ 与TransE和TransH相比, 矩阵-向量乘法使TransR模型参数急剧增
|
||
加, 因此, TransR难以应用于大规模知识图谱.
|
||
Mrh
|
||
Mrt
|
||
whi
|
||
wti
|
||
(i = 1;2;3)
|
||
wr
|
||
hi⊥
|
||
ti⊥
|
||
hi⊥ +r ≈ ti⊥
|
||
(i = 1;2;3)
|
||
(h;r;t)
|
||
wh
|
||
wt ∈ Rd
|
||
wr ∈ Rk
|
||
Mrh
|
||
Mrt ∈ Rk×d
|
||
为此, ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 8: 内容: 系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体的数量, 表示
|
||
中的最大数. 投影矩阵的稀疏度为:
|
||
l
|
||
r = 1−(1− min)Nl
|
||
r=Nl∗
|
||
r∗ (12)
|
||
|
||
投影向量定义为:
|
||
h⊥ = Mh
|
||
r
|
||
(
|
||
h
|
||
r
|
||
)
|
||
h;t⊥ = Mt
|
||
r
|
||
( t
|
||
r
|
||
)t (13)
|
||
|
||
(h;r;t)
|
||
wr
|
||
● TransM: Tr..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 9: 内容: 过程中除了学习嵌入之外还引入了学习关系相关候选对象与关系相关注意力两个任务. 而以往的模型(如TransH,
|
||
TransR, TranSparse)无法学习细粒度的注意力.
|
||
由此, Qian等人[52]提出TransAt模型来同时学习嵌入, 关系相关候选对象和关系相关注意力. TransAt的评分
|
||
函数定义如下:
|
||
fr (h;t)= Pr ( (rh)h)+r− Pr ( (rt)t) (18..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - DEBUG - 文档 10: 内容: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,835 - INFO -
|
||
测试 5:获取 userid testuser1 在textdb数据库的文档映射
|
||
2025-06-11 11:13:57,836 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,842 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,843 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:13:57,844 - DEBUG - 找到 3 个文档的映射
|
||
2025-06-11 11:13:57,845 - INFO - 文档映射: {'29c93db6-c633-42cc-a9b0-1fa83a49d8bc': {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}, '796af784-5a60-47f1-a4e2-3d73643fd4c5': {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}, '842b6180-667a-4ac8-b051-5c225c859011': {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}}
|
||
2025-06-11 11:17:33,833 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 11:17:33,833 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 11:17:33,842 - ERROR - 嵌入文件 /share/wangmeihua/rag/data/text.docx 失败: 文件 /share/wangmeihua/rag/data/text.docx 不存在
|
||
2025-06-11 11:18:55,061 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 11:18:55,061 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-11 11:18:55,069 - INFO - 生成 document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41 for file: /share/wangmeihua/rag/data/test.docx
|
||
2025-06-11 11:18:55,069 - INFO - 开始处理文件 /share/wangmeihua/rag/data/test.docx,userid: testuser1,db_type: textdb
|
||
2025-06-11 11:18:55,069 - DEBUG - 检查文件: /share/wangmeihua/rag/data/test.docx, 大小: 25158 字节
|
||
2025-06-11 11:18:55,069 - DEBUG - 文件扩展名: docx
|
||
2025-06-11 11:18:55,069 - DEBUG - 开始加载文件
|
||
2025-06-11 11:18:55,085 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-11 11:18:55,085 - DEBUG - 分割完成,生成 4 个文档块
|
||
2025-06-11 11:18:55,085 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:18:55,085 - DEBUG - 生成文档块 1: metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:18:55,085 - DEBUG - 生成文档块 2: metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:18:55,085 - DEBUG - 生成文档块 3: metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:18:55,086 - DEBUG - 文件 /share/wangmeihua/rag/data/test.docx 加载并分割为 4 个文档块,document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41
|
||
2025-06-11 11:18:55,086 - DEBUG - 处理文件 /share/wangmeihua/rag/data/test.docx,生成 4 个文档块
|
||
2025-06-11 11:18:55,086 - DEBUG - 第一个文档块: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现
|
||
2025-06-11 11:18:55,829 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:19:01,556 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-11 11:19:01,556 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-11 11:19:01,559 - DEBUG - 检查集合 ragdb_textdb 的 schema: 字段匹配=True, vector_field存在=True, dtype=101, dim=1024
|
||
2025-06-11 11:19:01,637 - DEBUG - 集合 ragdb_textdb 已存在并加载成功
|
||
2025-06-11 11:19:01,645 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-11 11:19:01,646 - DEBUG - 正在为 userid testuser1 插入 4 个文档到 ragdb_textdb
|
||
2025-06-11 11:19:01,646 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:19:01,646 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:19:01,646 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:19:01,646 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-11 11:19:01,808 - DEBUG - 成功插入 4 个文档
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104512, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104513, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104514, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104515, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104516, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104517, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104518, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104519, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 插入后查询结果: pk=458649953127104520, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:19:01,814 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 11:19:04,847 - INFO - 开始抽取文档 75e18e23-6f5a-4697-a1bb-ee53c6507a41 的三元组,userid: testuser1
|
||
2025-06-11 11:19:04,848 - DEBUG - 分割为 44 个文本块
|
||
2025-06-11 11:19:04,848 - DEBUG - 处理块 1/44: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教...
|
||
2025-06-11 11:19:05,464 - DEBUG - 块 1 生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-11 11:19:05,465 - DEBUG - 原始生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-11 11:19:05,465 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Google搜索', '<media>', 'part of', '<triplet>', 'Google', '<org>', '聊天机器人', '<misc>', 'industry']
|
||
2025-06-11 11:19:05,465 - DEBUG - 处理块 2/44: 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及...
|
||
2025-06-11 11:19:05,695 - DEBUG - 块 2 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-11 11:19:05,695 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-11 11:19:05,695 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-11 11:19:05,695 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-11 11:19:05,695 - DEBUG - 块 2 提取到 1 个三元组
|
||
2025-06-11 11:19:05,695 - DEBUG - 处理块 3/44: 目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析...
|
||
2025-06-11 11:19:06,039 - DEBUG - 块 3 生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-11 11:19:06,039 - DEBUG - 原始生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-11 11:19:06,039 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Web语义知识库', '<media>', 'part of']
|
||
2025-06-11 11:19:06,039 - DEBUG - 处理块 4/44: 知识图谱以其强大的语义处理能力与开放互联能力,可为万维网上的知识互联奠定扎实的基础,使Web 3.0...
|
||
2025-06-11 11:19:06,679 - DEBUG - 块 4 生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-11 11:19:06,680 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-11 11:19:06,680 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '万维网', '<media>', 'Web 3.0', '<eve>', '愿景', '<org>', '世界', '<misc>', 'part of', '<triplet>', 'Web', '<unk>', '网的', '<time>', 'is a list of']
|
||
2025-06-11 11:19:06,680 - DEBUG - 添加三元组: 知识图谱(concept) - Web 3.0 - 万维网(media)
|
||
2025-06-11 11:19:06,680 - DEBUG - 添加三元组: Web(unk) - is a list of - 网的(time)
|
||
2025-06-11 11:19:06,680 - DEBUG - 块 4 提取到 2 个三元组
|
||
2025-06-11 11:19:06,680 - DEBUG - 处理块 5/44: 知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”...
|
||
2025-06-11 11:19:07,166 - DEBUG - 块 5 生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-11 11:19:07,167 - DEBUG - 原始生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-11 11:19:07,167 - DEBUG - 处理后标记: ['<triplet>', '自顶向下', '<concept>', '结构化数据源', '<media>', '百科类网站', '<org>', '知识库', '<misc>', 'part of']
|
||
2025-06-11 11:19:07,167 - DEBUG - 添加三元组: 自顶向下(concept) - 百科类网站 - 结构化数据源(media)
|
||
2025-06-11 11:19:07,167 - DEBUG - 块 5 提取到 1 个三元组
|
||
2025-06-11 11:19:07,167 - DEBUG - 处理块 6/44: 所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模...
|
||
2025-06-11 11:19:07,761 - DEBUG - 块 6 生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-11 11:19:07,762 - DEBUG - 原始生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-11 11:19:07,762 - DEBUG - 处理后标记: ['<triplet>', '结构化数据', '<concept>', '关系数据库', '<media>', '<org>', '知识库', '<misc>', '数据类型和存储方式', '<unk>', '<loc>', '的数据类型']
|
||
2025-06-11 11:19:07,762 - DEBUG - 添加三元组: 结构化数据(concept) - <org> - 关系数据库(media)
|
||
2025-06-11 11:19:07,762 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-11 11:19:07,762 - DEBUG - 处理块 7/44: 半结构化数据(Semi-Structed Data):如XML、JSON、百科
|
||
非结构化数据(UnS...
|
||
2025-06-11 11:19:07,923 - DEBUG - 块 7 生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-11 11:19:07,924 - DEBUG - 原始生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-11 11:19:07,924 - DEBUG - 处理后标记: ['<triplet>', '非结构化数据', '<concept>', 'XML', '<org>', 'subclass of']
|
||
2025-06-11 11:19:07,924 - DEBUG - 添加三元组: 非结构化数据(concept) - subclass of - XML(org)
|
||
2025-06-11 11:19:07,924 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-11 11:19:07,924 - DEBUG - 处理块 8/44: 一般有两种选择,一个是通过RDF(资源描述框架)这样的规范存储格式来进行存储,还有一种方法,就是使用...
|
||
2025-06-11 11:19:08,213 - DEBUG - 块 8 生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-11 11:19:08,214 - DEBUG - 原始生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-11 11:19:08,214 - DEBUG - 处理后标记: ['<triplet>', '模式层', '<concept>', '知识图谱', '<media>', 'subclass of']
|
||
2025-06-11 11:19:08,214 - DEBUG - 添加三元组: 模式层(concept) - subclass of - 知识图谱(media)
|
||
2025-06-11 11:19:08,214 - DEBUG - 块 8 提取到 1 个三元组
|
||
2025-06-11 11:19:08,214 - DEBUG - 处理块 9/44: 模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的...
|
||
2025-06-11 11:19:08,593 - DEBUG - 块 9 生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-11 11:19:08,593 - DEBUG - 原始生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-11 11:19:08,593 - DEBUG - 处理后标记: ['<triplet>', '结构化知识库', '<concept>', '知识图谱', '<misc>', 'subclass of']
|
||
2025-06-11 11:19:08,593 - DEBUG - 添加三元组: 结构化知识库(concept) - subclass of - 知识图谱(misc)
|
||
2025-06-11 11:19:08,593 - DEBUG - 块 9 提取到 1 个三元组
|
||
2025-06-11 11:19:08,593 - DEBUG - 处理块 10/44: 如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储...
|
||
2025-06-11 11:19:09,022 - DEBUG - 块 10 生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-11 11:19:09,022 - DEBUG - 原始生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-11 11:19:09,022 - DEBUG - 处理后标记: ['<triplet>', '比尔盖茨', '<per>', '微软', '<org>', 'employer', '<triplet>', '5 信息抽取', '<media>', '数据层', '<concept>', 'facet of']
|
||
2025-06-11 11:19:09,022 - DEBUG - 添加三元组: 比尔盖茨(per) - employer - 微软(org)
|
||
2025-06-11 11:19:09,022 - DEBUG - 添加三元组: 5 信息抽取(media) - facet of - 数据层(concept)
|
||
2025-06-11 11:19:09,022 - DEBUG - 块 10 提取到 2 个三元组
|
||
2025-06-11 11:19:09,023 - DEBUG - 处理块 11/44: 信息抽取(infromation extraction)是知识图谱构建的第1步,其中的关键问题是:如...
|
||
2025-06-11 11:19:09,337 - DEBUG - 块 11 生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-11 11:19:09,337 - DEBUG - 原始生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-11 11:19:09,337 - DEBUG - 处理后标记: ['<triplet>', '信息抽取', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-11 11:19:09,337 - DEBUG - 添加三元组: 信息抽取(concept) - part of - 知识图谱(media)
|
||
2025-06-11 11:19:09,337 - DEBUG - 块 11 提取到 1 个三元组
|
||
2025-06-11 11:19:09,337 - DEBUG - 处理块 12/44: 5.1 实体抽取(Entity Extraction)
|
||
实体抽取又称为命名实体识别(named en...
|
||
2025-06-11 11:19:09,510 - DEBUG - 块 12 生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-11 11:19:09,510 - DEBUG - 原始生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-11 11:19:09,510 - DEBUG - 处理后标记: ['<triplet>', '实体识别', '<concept>', '信息抽取', '<media>', 'subclass of']
|
||
2025-06-11 11:19:09,510 - DEBUG - 添加三元组: 实体识别(concept) - subclass of - 信息抽取(media)
|
||
2025-06-11 11:19:09,510 - DEBUG - 块 12 提取到 1 个三元组
|
||
2025-06-11 11:19:09,510 - DEBUG - 处理块 13/44: 2012年Ling等人归纳出112种实体类别,并基于条件随机场CRF进行实体边界识别,最后采用自适应...
|
||
2025-06-11 11:19:09,864 - DEBUG - 块 13 生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-11 11:19:09,864 - DEBUG - 原始生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-11 11:19:09,864 - DEBUG - 处理后标记: ['<triplet>', '实体分类体系', '<concept>', '112种实体类别', '<misc>', 'part of']
|
||
2025-06-11 11:19:09,864 - DEBUG - 添加三元组: 实体分类体系(concept) - part of - 112种实体类别(misc)
|
||
2025-06-11 11:19:09,864 - DEBUG - 块 13 提取到 1 个三元组
|
||
2025-06-11 11:19:09,864 - DEBUG - 处理块 14/44: 在面向开放域的实体识别和分类研究中,不需要(也不可能)为每个领域或者每个实体类别建立单独的语料库作为...
|
||
2025-06-11 11:19:10,156 - DEBUG - 块 14 生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-11 11:19:10,156 - DEBUG - 原始生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-11 11:19:10,156 - DEBUG - 处理后标记: ['<triplet>', '分类研究', '<concept>', '面向开放域的实体识别', '<media>', '实体类别', '<misc>', 'studies']
|
||
2025-06-11 11:19:10,156 - DEBUG - 添加三元组: 分类研究(concept) - 实体类别 - 面向开放域的实体识别(media)
|
||
2025-06-11 11:19:10,156 - DEBUG - 块 14 提取到 1 个三元组
|
||
2025-06-11 11:19:10,156 - DEBUG - 处理块 15/44: 一种思路是根据已知的实体实例进行特征建模,利用该模型处理海量数据集得到新的命名实体列表,然后针对新实...
|
||
2025-06-11 11:19:10,629 - DEBUG - 块 15 生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-11 11:19:10,629 - DEBUG - 原始生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-11 11:19:10,629 - DEBUG - 处理后标记: ['<triplet>', '服务器日志', '<concept>', '搜索引擎', '<org>', '特征建模', '<media>', '<misc>', '算法', '<unk>', '<eve>', '<per>', '分类', '<loc>', '<time>', '<dis>', '<cel>', '语义特征']
|
||
2025-06-11 11:19:10,629 - DEBUG - 添加三元组: 服务器日志(concept) - 特征建模 - 搜索引擎(org)
|
||
2025-06-11 11:19:10,629 - DEBUG - 块 15 提取到 1 个三元组
|
||
2025-06-11 11:19:10,629 - DEBUG - 处理块 16/44: 5.2 关系抽取(Relation Extraction)
|
||
...
|
||
2025-06-11 11:19:10,801 - DEBUG - 块 16 生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-11 11:19:10,801 - DEBUG - 原始生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-11 11:19:10,801 - DEBUG - 处理后标记: ['<triplet>', '关系抽取', '<concept>', 'Relation Extraction', '<unk>', 'subclass of']
|
||
2025-06-11 11:19:10,801 - DEBUG - 添加三元组: 关系抽取(concept) - subclass of - Relation Extraction(unk)
|
||
2025-06-11 11:19:10,801 - DEBUG - 块 16 提取到 1 个三元组
|
||
2025-06-11 11:19:10,801 - DEBUG - 处理块 17/44: 文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体...
|
||
2025-06-11 11:19:11,037 - DEBUG - 块 17 生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-11 11:19:11,037 - DEBUG - 原始生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-11 11:19:11,037 - DEBUG - 处理后标记: ['<triplet>', '模式匹配', '<concept>', '语料', '<media>', '实体', '<misc>', 'subclass of']
|
||
2025-06-11 11:19:11,037 - DEBUG - 添加三元组: 模式匹配(concept) - 实体 - 语料(media)
|
||
2025-06-11 11:19:11,037 - DEBUG - 块 17 提取到 1 个三元组
|
||
2025-06-11 11:19:11,037 - DEBUG - 处理块 18/44: 2.统计机器学习方法
|
||
3.基于特征向量或核函数的有监督学习方法
|
||
4.研究重点转向半监督和无监督
|
||
5....
|
||
2025-06-11 11:19:11,619 - DEBUG - 块 18 生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-11 11:19:11,619 - DEBUG - 原始生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-11 11:19:11,619 - DEBUG - 处理后标记: ['<triplet>', '属性抽取', '<concept>', '统计机器学习', '<media>', '<misc>', '面向开放域的信息抽', '<unk>', '<eve>', '信息抽式', '<org>', '統計', '<time>', '<dis>', 'part of']
|
||
2025-06-11 11:19:11,619 - DEBUG - 添加三元组: 属性抽取(concept) - <misc> - 统计机器学习(media)
|
||
2025-06-11 11:19:11,619 - DEBUG - 块 18 提取到 1 个三元组
|
||
2025-06-11 11:19:11,619 - DEBUG - 处理块 19/44: 属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物,可以从网络公开信息中得到...
|
||
2025-06-11 11:19:11,790 - DEBUG - 块 19 生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-11 11:19:11,790 - DEBUG - 原始生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-11 11:19:11,790 - DEBUG - 处理后标记: ['<triplet>', '属性', '<concept>', '实体', '<misc>', 'subclass of']
|
||
2025-06-11 11:19:11,790 - DEBUG - 添加三元组: 属性(concept) - subclass of - 实体(misc)
|
||
2025-06-11 11:19:11,790 - DEBUG - 块 19 提取到 1 个三元组
|
||
2025-06-11 11:19:11,790 - DEBUG - 处理块 20/44: 基于规则和启发式算法,抽取结构化数据
|
||
基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训...
|
||
2025-06-11 11:19:11,983 - DEBUG - 块 20 生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-11 11:19:11,983 - DEBUG - 原始生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-11 11:19:11,983 - DEBUG - 处理后标记: ['<triplet>', '数据挖掘', '<concept>', '结构化数据', '<media>', 'subclass of']
|
||
2025-06-11 11:19:11,983 - DEBUG - 添加三元组: 数据挖掘(concept) - subclass of - 结构化数据(media)
|
||
2025-06-11 11:19:11,983 - DEBUG - 块 20 提取到 1 个三元组
|
||
2025-06-11 11:19:11,983 - DEBUG - 处理块 21/44: 通过信息抽取,我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。
|
||
如果我们...
|
||
2025-06-11 11:19:12,693 - DEBUG - 块 21 生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-11 11:19:12,693 - DEBUG - 原始生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-11 11:19:12,693 - DEBUG - 处理后标记: ['<triplet>', '拼图碎片', '<concept>', '信息抽取', '<media>', '非结构化', '<misc>', '数据', '<unk>', '<org>', '的数据', '<eve>', '<per>', '<loc>']
|
||
2025-06-11 11:19:12,693 - DEBUG - 添加三元组: 拼图碎片(concept) - 非结构化 - 信息抽取(media)
|
||
2025-06-11 11:19:12,693 - DEBUG - 块 21 提取到 1 个三元组
|
||
2025-06-11 11:19:12,693 - DEBUG - 处理块 22/44: 拼图(知识)中还存在大量冗杂和错误的拼图碎片(信息)
|
||
那么如何解决这一问题,就是在知识融合这一步里我...
|
||
2025-06-11 11:19:13,037 - DEBUG - 块 22 生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-11 11:19:13,037 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-11 11:19:13,037 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<unk>', '知识库', '<media>', 'part of']
|
||
2025-06-11 11:19:13,037 - DEBUG - 处理块 23/44:
|
||
其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链...
|
||
2025-06-11 11:19:13,531 - DEBUG - 块 23 生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-11 11:19:13,531 - DEBUG - 原始生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-11 11:19:13,531 - DEBUG - 处理后标记: ['<triplet>', '实体指称项', '<concept>', '<unk>', '知识库', '<media>', 'part of the series', '<loc>', '<org>', '<misc>', '库中', '<eve>', '<dis>', '<cel>', '<per>', '<time>', '<triplet>']
|
||
2025-06-11 11:19:13,531 - DEBUG - 处理块 24/44: 即集成实体链接(collective entity linking)
|
||
实体链接的流程:
|
||
1.从文本中...
|
||
2025-06-11 11:19:13,715 - DEBUG - 块 24 生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-11 11:19:13,715 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-11 11:19:13,715 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<org>', 'subclass of']
|
||
2025-06-11 11:19:13,716 - DEBUG - 处理块 25/44: 在确认知识库中对应的正确实体对象之后,将该实体指称项链接到知识库中对应实体。
|
||
实体消歧:专门用于解决...
|
||
2025-06-11 11:19:14,080 - DEBUG - 块 25 生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-11 11:19:14,080 - DEBUG - 原始生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-11 11:19:14,080 - DEBUG - 处理后标记: ['<triplet>', '歧义', '<concept>', '实体消歧', '<media>', 'used by', '<triplet>']
|
||
2025-06-11 11:19:14,080 - DEBUG - 添加三元组: 歧义(concept) - used by - 实体消歧(media)
|
||
2025-06-11 11:19:14,080 - DEBUG - 块 25 提取到 1 个三元组
|
||
2025-06-11 11:19:14,080 - DEBUG - 处理块 26/44: 共指消解:主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象...
|
||
2025-06-11 11:19:14,631 - DEBUG - 块 26 生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-11 11:19:14,631 - DEBUG - 原始生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-11 11:19:14,631 - DEBUG - 处理后标记: ['<triplet>', '共指消解', '<concept>', '信息检索', '<misc>', '自然语言处理', '<media>', '语言', '<org>', '指称对应同一实体', '<unk>', '实体对象', '<per>', 'subclass of']
|
||
2025-06-11 11:19:14,631 - DEBUG - 添加三元组: 共指消解(concept) - 自然语言处理 - 信息检索(misc)
|
||
2025-06-11 11:19:14,631 - DEBUG - 块 26 提取到 1 个三元组
|
||
2025-06-11 11:19:14,631 - DEBUG - 处理块 27/44: 共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。
|
||
|
||
6.2 知识合并
|
||
在构建知识图谱时...
|
||
2025-06-11 11:19:14,996 - DEBUG - 块 27 生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-11 11:19:14,996 - DEBUG - 原始生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-11 11:19:14,996 - DEBUG - 处理后标记: ['<triplet>', '外部知识库', '<concept>', '知识图谱', '<media>', '结构化数据', '<org>', '库产品', '<unk>', '合并', '<misc>', 'subclass of']
|
||
2025-06-11 11:19:14,996 - DEBUG - 添加三元组: 外部知识库(concept) - 结构化数据 - 知识图谱(media)
|
||
2025-06-11 11:19:14,996 - DEBUG - 块 27 提取到 1 个三元组
|
||
2025-06-11 11:19:14,996 - DEBUG - 处理块 28/44: 数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,...
|
||
2025-06-11 11:19:15,631 - DEBUG - 块 28 生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-11 11:19:15,631 - DEBUG - 原始生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-11 11:19:15,631 - DEBUG - 处理后标记: ['<triplet>', '数据层的融合', '<concept>', '关系数据库', '<media>', '模式层', '<org>', '本体库', '<misc>', '实体的指称', '<unk>', '<loc>', '<per>', '实例以及关系的冲突问题,造成不必要的冗余', '<eve>', '合并关系', '<time>', 'facet of']
|
||
2025-06-11 11:19:15,631 - DEBUG - 添加三元组: 数据层的融合(concept) - 模式层 - 关系数据库(media)
|
||
2025-06-11 11:19:15,631 - DEBUG - 块 28 提取到 1 个三元组
|
||
2025-06-11 11:19:15,631 - DEBUG - 处理块 29/44: 为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界...
|
||
2025-06-11 11:19:16,193 - DEBUG - 块 29 生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-11 11:19:16,193 - DEBUG - 原始生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-11 11:19:16,194 - DEBUG - 处理后标记: ['<triplet>', '资源描述框架', '<concept>', '本体构建本体', '<org>', '<media>', '<misc>', '<unk>', '<per>', '<loc>', '<eve>', '<time>', '<dis>', '<triplet>', 'DB2RDF', '<cel>', '结构化的历史数据', '<date>', 'subclass of']
|
||
2025-06-11 11:19:16,194 - DEBUG - 添加三元组: 资源描述框架(concept) - <media> - 本体构建本体(org)
|
||
2025-06-11 11:19:16,194 - DEBUG - 添加三元组: DB2RDF(cel) - subclass of - 结构化的历史数据(date)
|
||
2025-06-11 11:19:16,194 - DEBUG - 块 29 提取到 2 个三元组
|
||
2025-06-11 11:19:16,194 - DEBUG - 处理块 30/44: 本体可以采用人工编辑的方式手动构建(借助本体编辑软件),也可以以数据驱动的自动化方式构建本体。因为人...
|
||
2025-06-11 11:19:16,840 - DEBUG - 块 30 生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-11 11:19:16,840 - DEBUG - 原始生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-11 11:19:16,840 - DEBUG - 处理后标记: ['<triplet>', '自动化本体构建过程', '<concept>', '数据驱动的自动化方式', '<media>', '本体库', '<misc>', '全局', '<org>', '库产品', '<unk>', '软件', '<loc>', 'part of']
|
||
2025-06-11 11:19:16,841 - DEBUG - 添加三元组: 自动化本体构建过程(concept) - 本体库 - 数据驱动的自动化方式(media)
|
||
2025-06-11 11:19:16,841 - DEBUG - 块 30 提取到 1 个三元组
|
||
2025-06-11 11:19:16,841 - DEBUG - 处理块 31/44: 1.实体并列关系相似度计算
|
||
2.实体上下位关系抽取
|
||
3.本体的生成
|
||
比如对下面这个例子,当知识图谱刚...
|
||
2025-06-11 11:19:17,023 - DEBUG - 块 31 生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-11 11:19:17,023 - DEBUG - 原始生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-11 11:19:17,023 - DEBUG - 处理后标记: ['<triplet>', '阿里', '<org>', '阿里巴巴', '<media>', 'owned by']
|
||
2025-06-11 11:19:17,023 - DEBUG - 添加三元组: 阿里(org) - owned by - 阿里巴巴(media)
|
||
2025-06-11 11:19:17,024 - DEBUG - 块 31 提取到 1 个三元组
|
||
2025-06-11 11:19:17,024 - DEBUG - 处理块 32/44: 这就是第一步的作用,但这样下来,知识图谱实际上还是没有一个上下层的概念,它还是不知道,阿里巴巴和手机...
|
||
2025-06-11 11:19:17,422 - DEBUG - 块 32 生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-11 11:19:17,423 - DEBUG - 原始生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-11 11:19:17,423 - DEBUG - 处理后标记: ['<triplet>', '上下位关系', '<concept>', '图谱', '<media>', '阿里巴巴', '<org>', 'owned by']
|
||
2025-06-11 11:19:17,423 - DEBUG - 添加三元组: 上下位关系(concept) - 阿里巴巴 - 图谱(media)
|
||
2025-06-11 11:19:17,423 - DEBUG - 块 32 提取到 1 个三元组
|
||
2025-06-11 11:19:17,423 - DEBUG - 处理块 33/44: 当三步结束后,这个知识图谱可能就会明白,“阿里巴巴和腾讯,其实都是公司这样一个实体下的细分实体。它们...
|
||
2025-06-11 11:19:17,583 - DEBUG - 块 33 生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-11 11:19:17,583 - DEBUG - 原始生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-11 11:19:17,583 - DEBUG - 处理后标记: ['<triplet>', '腾讯', '<org>', '阿里巴巴', '<concept>', 'owned by']
|
||
2025-06-11 11:19:17,583 - DEBUG - 添加三元组: 腾讯(org) - owned by - 阿里巴巴(concept)
|
||
2025-06-11 11:19:17,583 - DEBUG - 块 33 提取到 1 个三元组
|
||
2025-06-11 11:19:17,583 - DEBUG - 处理块 34/44: 但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识...
|
||
2025-06-11 11:19:18,098 - DEBUG - 块 34 生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-11 11:19:18,098 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-11 11:19:18,098 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '城市', '<loc>', 'location']
|
||
2025-06-11 11:19:18,098 - DEBUG - 添加三元组: 知识图谱(concept) - location - 城市(loc)
|
||
2025-06-11 11:19:18,098 - DEBUG - 块 34 提取到 1 个三元组
|
||
2025-06-11 11:19:18,098 - DEBUG - 处理块 35/44: 根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,那么我们就可以将AD...
|
||
2025-06-11 11:19:18,692 - DEBUG - 块 35 生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-11 11:19:18,692 - DEBUG - 原始生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-11 11:19:18,692 - DEBUG - 处理后标记: ['<triplet>', '串联', '<concept>', '推理策略的一环', '<media>', '规则', '<misc>', '图里', '<org>', '<eve>', '<unk>', '<per>', 'C', '<loc>', 'part of']
|
||
2025-06-11 11:19:18,692 - DEBUG - 添加三元组: 串联(concept) - 规则 - 推理策略的一环(media)
|
||
2025-06-11 11:19:18,692 - DEBUG - 块 35 提取到 1 个三元组
|
||
2025-06-11 11:19:18,692 - DEBUG - 处理块 36/44: 当然知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。
|
||
推理属性值...
|
||
2025-06-11 11:19:19,025 - DEBUG - 块 36 生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-11 11:19:19,025 - DEBUG - 原始生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-11 11:19:19,025 - DEBUG - 处理后标记: ['<triplet>', '猫科', '<concept>', '老虎,科,目,食肉目']
|
||
2025-06-11 11:19:19,025 - DEBUG - 处理块 37/44: 这一块的算法主要可以分为3大类,基于逻辑的推理、基于图的推理和基于深度学习的推理。
|
||
7.3 质量评估...
|
||
2025-06-11 11:19:19,402 - DEBUG - 块 37 生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-11 11:19:19,403 - DEBUG - 原始生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-11 11:19:19,403 - DEBUG - 处理后标记: ['<triplet>', '算法', '<concept>', '知识库', '<media>', 'part of']
|
||
2025-06-11 11:19:19,403 - DEBUG - 添加三元组: 算法(concept) - part of - 知识库(media)
|
||
2025-06-11 11:19:19,403 - DEBUG - 块 37 提取到 1 个三元组
|
||
2025-06-11 11:19:19,403 - DEBUG - 处理块 38/44: 从逻辑上看,知识库的更新包括概念层的更新和数据层的更新。
|
||
概念层的更新是指新增数据后获得了新的概念,...
|
||
2025-06-11 11:19:19,735 - DEBUG - 块 38 生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-11 11:19:19,735 - DEBUG - 原始生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-11 11:19:19,735 - DEBUG - 处理后标记: ['<triplet>', '知识库的更新', '<concept>', '概念层', '<media>', 'subclass of']
|
||
2025-06-11 11:19:19,735 - DEBUG - 添加三元组: 知识库的更新(concept) - subclass of - 概念层(media)
|
||
2025-06-11 11:19:19,735 - DEBUG - 块 38 提取到 1 个三元组
|
||
2025-06-11 11:19:19,735 - DEBUG - 处理块 39/44: 数据层的更新主要是新增或更新实体、关系、属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性...
|
||
2025-06-11 11:19:20,164 - DEBUG - 块 39 生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-11 11:19:20,164 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-11 11:19:20,164 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '数据层', '<media>', 'part of']
|
||
2025-06-11 11:19:20,164 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 数据层(media)
|
||
2025-06-11 11:19:20,164 - DEBUG - 块 39 提取到 1 个三元组
|
||
2025-06-11 11:19:20,164 - DEBUG - 处理块 40/44: 这种方法比较简单,但资源消耗大,而且需要耗费大量人力资源进行系统维护;
|
||
增量更新:以当前新增数据为输...
|
||
2025-06-11 11:19:20,325 - DEBUG - 块 40 生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-11 11:19:20,326 - DEBUG - 原始生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-11 11:19:20,326 - DEBUG - 处理后标记: ['<triplet>', '总结', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-11 11:19:20,326 - DEBUG - 添加三元组: 总结(concept) - part of - 知识图谱(media)
|
||
2025-06-11 11:19:20,326 - DEBUG - 块 40 提取到 1 个三元组
|
||
2025-06-11 11:19:20,326 - DEBUG - 处理块 41/44: 通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和...
|
||
2025-06-11 11:19:20,983 - DEBUG - 块 41 生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-11 11:19:20,983 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-11 11:19:20,983 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '智能语义搜索', '<media>', '移动个人助理(Siri', '<misc>', '互联网信息', '<org>', 'owned by', '<triplet>', '(Sri)', '<eve>', '的知识', '<unk>', 'subclass of']
|
||
2025-06-11 11:19:20,983 - DEBUG - 添加三元组: 知识图谱(concept) - 移动个人助理(Siri - 智能语义搜索(media)
|
||
2025-06-11 11:19:20,983 - DEBUG - 添加三元组: (Sri)(eve) - subclass of - 的知识(unk)
|
||
2025-06-11 11:19:20,983 - DEBUG - 块 41 提取到 2 个三元组
|
||
2025-06-11 11:19:20,983 - DEBUG - 处理块 42/44: 在智能语义搜索中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键词进行解析和推理,进...
|
||
2025-06-11 11:19:21,144 - DEBUG - 块 42 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-11 11:19:21,144 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-11 11:19:21,144 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-11 11:19:21,144 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-11 11:19:21,144 - DEBUG - 块 42 提取到 1 个三元组
|
||
2025-06-11 11:19:21,144 - DEBUG - 处理块 43/44: 在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析...
|
||
2025-06-11 11:19:21,660 - DEBUG - 块 43 生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-11 11:19:21,660 - DEBUG - 原始生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-11 11:19:21,660 - DEBUG - 处理后标记: ['<triplet>', '病毒', '<concept>', '埃博拉病毒的症状有哪些', '<media>', '知识图谱', '<misc>', '深度问答应用中', '<org>', '<unk>', '系统', '<eve>', 'مية']
|
||
2025-06-11 11:19:21,660 - DEBUG - 添加三元组: 病毒(concept) - 知识图谱 - 埃博拉病毒的症状有哪些(media)
|
||
2025-06-11 11:19:21,660 - DEBUG - 块 43 提取到 1 个三元组
|
||
2025-06-11 11:19:21,660 - DEBUG - 处理块 44/44: 』,然后再进行推理变换,最终形成等价的三元组查询语句,如(埃博拉,症状,?)和(埃博拉,征兆,?)等...
|
||
2025-06-11 11:19:21,981 - DEBUG - 块 44 生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:19:21,981 - DEBUG - 原始生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-11 11:19:21,981 - DEBUG - 处理后标记: ['<triplet>', '症状', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-11 11:19:21,982 - DEBUG - 添加三元组: 症状(concept) - part of - 三元组(misc)
|
||
2025-06-11 11:19:21,982 - DEBUG - 块 44 提取到 1 个三元组
|
||
2025-06-11 11:19:21,988 - INFO - 文档 75e18e23-6f5a-4697-a1bb-ee53c6507a41 的 41 个三元组已保存到: /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt
|
||
2025-06-11 11:19:21,988 - INFO - 文档 75e18e23-6f5a-4697-a1bb-ee53c6507a41 三元组抽取完成,耗时: 17.14 秒
|
||
2025-06-11 11:19:21,988 - INFO - 文件 /share/wangmeihua/rag/data/test.docx 成功嵌入到数据库 ragdb_textdb
|
||
2025-06-11 11:22:46,028 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 11:22:46,575 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 11:22:47,573 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:22:50,583 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 11:22:50,599 - DEBUG - 查询向量维度: 1024
|
||
2025-06-11 11:22:50,599 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 11:22:50,701 - DEBUG - 加载集合: ragdb_textdb
|
||
2025-06-11 11:22:50,701 - DEBUG - 搜索参数: {'metric_type': 'COSINE', 'params': {'nprobe': 10}}, 表达式: userid == 'testuser1' and (filename == 'test.docx' or filename == 'zongshu.pdf' or filename == 'qianru.pdf'), limit: 5, offset: 0
|
||
2025-06-11 11:22:50,706 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.7479630708694458, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:50,706 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.7013792991638184, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:50,706 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6933318376541138, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:22:50,707 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.685930609703064, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:22:50,707 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6831154227256775, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:50,707 - DEBUG - 搜索完成,返回 5 条结果
|
||
2025-06-11 11:22:50,708 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 11:22:53,712 - INFO - RAG 检索返回 5 条结果
|
||
2025-06-11 11:22:53,717 - DEBUG - 已连接到 Milvus Lite,路径: /d/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:22:53,727 - INFO - 找到 3 个文档: ['test.docx', 'zongshu.pdf', 'qianru.pdf']
|
||
2025-06-11 11:22:53,795 - DEBUG - NER 结果: []
|
||
2025-06-11 11:22:53,795 - DEBUG - 合并连续名词: 知识图谱, 子词: ['知识', '图谱']
|
||
2025-06-11 11:22:53,795 - DEBUG - 合并连续名词: 技术, 子词: ['技术']
|
||
2025-06-11 11:22:53,795 - DEBUG - 连续名词子词集合: {'技术', '知识', '图谱'}
|
||
2025-06-11 11:22:53,795 - INFO - 从查询中提取到 4 个唯一实体: ['知识图谱', '技术', '构建', '需要']
|
||
2025-06-11 11:22:53,795 - DEBUG - 处理文档: document_id=75e18e23-6f5a-4697-a1bb-ee53c6507a41, filename=test.docx
|
||
2025-06-11 11:22:53,797 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 11:22:53,967 - DEBUG - 匹配三元组: 知识图谱 - Web 3.0 - 万维网 (entity=知识图谱, head_sim=1.00, tail_sim=0.43)
|
||
2025-06-11 11:22:54,130 - DEBUG - 匹配三元组: 模式层 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.46, tail_sim=1.00)
|
||
2025-06-11 11:22:54,163 - DEBUG - 匹配三元组: 结构化知识库 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 11:22:54,259 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=知识图谱, head_sim=0.57, tail_sim=1.00)
|
||
2025-06-11 11:22:54,677 - DEBUG - 匹配三元组: 外部知识库 - 结构化数据 - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 11:22:54,872 - DEBUG - 匹配三元组: 上下位关系 - 阿里巴巴 - 图谱 (entity=知识图谱, head_sim=0.42, tail_sim=0.82)
|
||
2025-06-11 11:22:54,937 - DEBUG - 匹配三元组: 知识图谱 - location - 城市 (entity=知识图谱, head_sim=1.00, tail_sim=0.47)
|
||
2025-06-11 11:22:55,066 - DEBUG - 匹配三元组: 知识图谱 - part of - 数据层 (entity=知识图谱, head_sim=1.00, tail_sim=0.55)
|
||
2025-06-11 11:22:55,099 - DEBUG - 匹配三元组: 总结 - part of - 知识图谱 (entity=知识图谱, head_sim=0.48, tail_sim=1.00)
|
||
2025-06-11 11:22:55,132 - DEBUG - 匹配三元组: 知识图谱 - 移动个人助理(Siri - 智能语义搜索 (entity=知识图谱, head_sim=1.00, tail_sim=0.53)
|
||
2025-06-11 11:22:59,168 - DEBUG - 搜索三元组: 知识图谱 Web 3.0 万维网 (文档: test.docx)
|
||
2025-06-11 11:22:59,184 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%万维网%'
|
||
2025-06-11 11:22:59,191 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.622643232345581, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,191 - DEBUG - 搜索三元组: 模式层 subclass of 知识图谱 (文档: test.docx)
|
||
2025-06-11 11:22:59,207 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%模式层%知识图谱%'
|
||
2025-06-11 11:22:59,211 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.567072868347168, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,211 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.5059496164321899, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,211 - DEBUG - 搜索三元组: 结构化知识库 subclass of 知识图谱 (文档: test.docx)
|
||
2025-06-11 11:22:59,227 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%结构化知识库%知识图谱%'
|
||
2025-06-11 11:22:59,230 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.6059292554855347, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,230 - DEBUG - 搜索三元组: 信息抽取 part of 知识图谱 (文档: test.docx)
|
||
2025-06-11 11:22:59,247 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%信息抽取%知识图谱%'
|
||
2025-06-11 11:22:59,250 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.6285881400108337, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,250 - DEBUG - 搜索三元组: 外部知识库 结构化数据 知识图谱 (文档: test.docx)
|
||
2025-06-11 11:22:59,266 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%外部知识库%知识图谱%'
|
||
2025-06-11 11:22:59,269 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6099985837936401, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,270 - DEBUG - 搜索三元组: 上下位关系 阿里巴巴 图谱 (文档: test.docx)
|
||
2025-06-11 11:22:59,286 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%上下位关系%图谱%'
|
||
2025-06-11 11:22:59,289 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.5227455496788025, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,289 - DEBUG - 搜索三元组: 知识图谱 location 城市 (文档: test.docx)
|
||
2025-06-11 11:22:59,305 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%城市%'
|
||
2025-06-11 11:22:59,312 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.5877416133880615, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,312 - DEBUG - 搜索三元组: 知识图谱 part of 数据层 (文档: test.docx)
|
||
2025-06-11 11:22:59,328 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%数据层%'
|
||
2025-06-11 11:22:59,334 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.677775502204895, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,334 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.6638458371162415, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,334 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6140748262405396, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,334 - DEBUG - 搜索三元组: 总结 part of 知识图谱 (文档: test.docx)
|
||
2025-06-11 11:22:59,350 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%总结%知识图谱%'
|
||
2025-06-11 11:22:59,354 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.5805757641792297, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,354 - DEBUG - 搜索三元组: 知识图谱 移动个人助理(Siri 智能语义搜索 (文档: test.docx)
|
||
2025-06-11 11:22:59,371 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%智能语义搜索%'
|
||
2025-06-11 11:22:59,377 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.6165111064910889, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:22:59,377 - DEBUG - 处理文档: document_id=842b6180-667a-4ac8-b051-5c225c859011, filename=zongshu.pdf
|
||
2025-06-11 11:22:59,379 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 11:22:59,588 - DEBUG - 匹配三元组: 规则模板 - 问答方法 - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 11:23:00,039 - DEBUG - 匹配三元组: 语 言 - KG - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 11:23:00,108 - DEBUG - 匹配三元组: 知识图谱 - part of - 深度学习 (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 11:23:00,140 - DEBUG - 匹配三元组: 知识图谱 - graph question answering - 库问答 (entity=知识图谱, head_sim=1.00, tail_sim=0.50)
|
||
2025-06-11 11:23:00,173 - DEBUG - 匹配三元组: 知识图谱问答 - use - 搜索引擎 (entity=知识图谱, head_sim=0.87, tail_sim=0.50)
|
||
2025-06-11 11:23:00,237 - DEBUG - 匹配三元组: 子知识图谱 - standards body - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 11:23:00,301 - DEBUG - 匹配三元组: 知识图谱 - used by - KGQA (entity=知识图谱, head_sim=1.00, tail_sim=0.31)
|
||
2025-06-11 11:23:00,778 - DEBUG - 匹配三元组: 析、查询图和信息检索方法 - Fig.1 Framework of knowledge graph question - 知识图谱问答 (entity=知识图谱, head_sim=0.64, tail_sim=0.87)
|
||
2025-06-11 11:23:00,909 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识图谱, head_sim=0.87, tail_sim=0.74)
|
||
2025-06-11 11:23:01,007 - DEBUG - 匹配三元组: 知识图谱问答 - 通用领域 - 语义解析与信息检索细化 (entity=知识图谱, head_sim=0.87, tail_sim=0.55)
|
||
2025-06-11 11:23:01,072 - DEBUG - 匹配三元组: 信息检索 - part of - 知识图谱 G (entity=知识图谱, head_sim=0.63, tail_sim=0.82)
|
||
2025-06-11 11:23:02,165 - DEBUG - 匹配三元组: 匹配方法 - Web- Questions 基线的最高精确度指标 - 知识图谱问答 (entity=知识图谱, head_sim=0.45, tail_sim=0.87)
|
||
2025-06-11 11:23:03,394 - DEBUG - 匹配三元组: 知识图谱嵌入 - subclass of - 深度学习 (entity=知识图谱, head_sim=0.81, tail_sim=0.48)
|
||
2025-06-11 11:23:04,742 - DEBUG - 匹配三元组: 知识图谱 - <misc> - 神经网络的查询图 (entity=知识图谱, head_sim=1.00, tail_sim=0.62)
|
||
2025-06-11 11:23:04,774 - DEBUG - 匹配三元组: 知识图谱 - part of - 记忆网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.57)
|
||
2025-06-11 11:23:04,901 - DEBUG - 匹配三元组: 知识图谱 - <media> - 记忆组 件存储 KG (entity=知识图谱, head_sim=1.00, tail_sim=0.42)
|
||
2025-06-11 11:23:05,349 - DEBUG - 匹配三元组: 知识图谱 - part of - Wikidata (entity=知识图谱, head_sim=1.00, tail_sim=0.44)
|
||
2025-06-11 11:23:06,474 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 11:23:07,212 - DEBUG - 匹配三元组: 图谱 - subclass of - 问答 (entity=知识图谱, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 11:23:08,150 - DEBUG - 匹配三元组: 邹磊 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.28, tail_sim=1.00)
|
||
2025-06-11 11:23:08,375 - DEBUG - 匹配三元组: рика - 陈子睿 - 知识图谱问答研究综述 (entity=知识图谱, head_sim=0.29, tail_sim=0.81)
|
||
2025-06-11 11:23:41,735 - DEBUG - 搜索三元组: 规则模板 问答方法 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,751 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%规则模板%知识图谱%'
|
||
2025-06-11 11:23:41,756 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.7196816802024841, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,756 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.6338689923286438, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,756 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6320828199386597, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,757 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6310024857521057, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,757 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6165626049041748, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,757 - DEBUG - 搜索三元组: 语 言 KG 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,773 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%语 言%知识图谱%'
|
||
2025-06-11 11:23:41,776 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.5706815719604492, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,776 - DEBUG - 搜索三元组: 知识图谱 part of 深度学习 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,793 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%深度学习%'
|
||
2025-06-11 11:23:41,798 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.6626743674278259, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,799 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6333552002906799, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,799 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6285597681999207, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,799 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6233670115470886, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,799 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.6035276055335999, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,799 - DEBUG - 搜索三元组: 知识图谱 graph question answering 库问答 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,815 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%库问答%'
|
||
2025-06-11 11:23:41,821 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.662022054195404, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,822 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6436327695846558, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,822 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.5916442275047302, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,822 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5819114446640015, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,822 - DEBUG - 搜索三元组: 知识图谱问答 use 搜索引擎 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,838 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱问答%搜索引擎%'
|
||
2025-06-11 11:23:41,842 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.6104249954223633, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,842 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.6058603525161743, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,842 - DEBUG - 命中: text: YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接所得的三元组准确
|
||
率平均达 97%。这使得 YAGO 本体既从维基百科的
|
||
海量数据获益 ,又利用了 WordNet 清晰的概念分类 。
|
||
Wikidata
|
||
[103]
|
||
的目标是构建一个免费开放 、多语
|
||
..., 距离: 0.5500432848930359, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,842 - DEBUG - 搜索三元组: 子知识图谱 standards body KGQA (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,858 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%子知识图谱%KGQA%'
|
||
2025-06-11 11:23:41,862 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.635985255241394, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,862 - DEBUG - 搜索三元组: 知识图谱 used by KGQA (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,878 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%KGQA%'
|
||
2025-06-11 11:23:41,883 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.7099630236625671, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,883 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.7005059719085693, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,883 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.6842584013938904, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,883 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6733513474464417, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,883 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6565587520599365, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,884 - DEBUG - 搜索三元组: 析、查询图和信息检索方法 Fig.1 Framework of knowledge graph question 知识图谱问答 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,900 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%析、查询图和信息检索方法%知识图谱问答%'
|
||
2025-06-11 11:23:41,903 - DEBUG - 搜索三元组: 知 识图谱 知識 知识 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,919 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知 识图谱%知识%'
|
||
2025-06-11 11:23:41,923 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6105901598930359, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,923 - DEBUG - 搜索三元组: 知识图谱问答 通用领域 语义解析与信息检索细化 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,939 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱问答%语义解析与信息检索细化%'
|
||
2025-06-11 11:23:41,943 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6384718418121338, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,943 - DEBUG - 搜索三元组: 信息检索 part of 知识图谱 G (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,959 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%信息检索%知识图谱 G%'
|
||
2025-06-11 11:23:41,962 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6183342933654785, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,962 - DEBUG - 命中: text: 答案部分 , 这也是两类方法的区别所在 。 开放领域
|
||
知识图谱问答 , 则是知识图谱 G 为通用领域知识图
|
||
谱 , 问题 q为开放领域问题的知识图谱问答情况 。
|
||
定义 2( 知识图谱问答 ) 给定知识图谱 G , 自然
|
||
语言问题 q, 返回正确答案集 A, 其中 A为 E 的子集 。
|
||
语义解析 ( semantic parsing, SP) : 得到查询语句
|
||
或查询语句的逻辑形式 , 在 KG 上..., 距离: 0.565437376499176, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,962 - DEBUG - 搜索三元组: 匹配方法 Web- Questions 基线的最高精确度指标 知识图谱问答 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,979 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%匹配方法%知识图谱问答%'
|
||
2025-06-11 11:23:41,983 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.5744408369064331, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,983 - DEBUG - 命中: text: PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空间模型作为复述模型对自然语言 -
|
||
逻辑形式元组 (c,z) 打分 , 使用得分最高元组的逻辑
|
||
形式 z 检索 KG 获得答案 。
|
||
OQA 系统
|
||
[54]
|
||
使用预先定义的操作符与模板 , 将
|
||
用户问题提..., 距离: 0.5386887788772583, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:41,983 - DEBUG - 搜索三元组: 知识图谱嵌入 subclass of 深度学习 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:41,999 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱嵌入%深度学习%'
|
||
2025-06-11 11:23:42,003 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.626388430595398, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,003 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.5887572765350342, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,004 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.562717616558075, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,004 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5601789355278015, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,004 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5475433468818665, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,004 - DEBUG - 搜索三元组: 知识图谱 <misc> 神经网络的查询图 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,020 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%神经网络的查询图%'
|
||
2025-06-11 11:23:42,026 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.6379419565200806, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,026 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.603220522403717, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,026 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5959279537200928, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,026 - DEBUG - 命中: text: 合位置编码的方法表示问题 q, 在 WebQuestions 数据
|
||
集上获得了更优的效果 ; Xu 等人
|
||
[39]
|
||
以 KV-MemNN 为
|
||
基础 , 通过引入 STOP 策略 , 设计一种新式查询更新
|
||
策略 , 屏蔽已寻址的内存信息 , 使得 KV-MemNN 能
|
||
够处理复杂问题 。
|
||
3.3 基于神经网络的语义解析
|
||
本节方法使用神经网络模块对传统语义解析 、
|
||
话语模板的查询图 、 传统信息检索方..., 距离: 0.57700115442276, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,026 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5637367963790894, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,026 - DEBUG - 搜索三元组: 知识图谱 part of 记忆网络 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,043 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%记忆网络%'
|
||
2025-06-11 11:23:42,048 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6457532048225403, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,048 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.6223066449165344, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,049 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.5924555659294128, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,049 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5907570123672485, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,049 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.589214563369751, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,049 - DEBUG - 搜索三元组: 知识图谱 <media> 记忆组 件存储 KG (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,065 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%记忆组 件存储 KG%'
|
||
2025-06-11 11:23:42,070 - DEBUG - 搜索三元组: 知识图谱 part of Wikidata (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,087 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%Wikidata%'
|
||
2025-06-11 11:23:42,091 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.54942387342453, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,091 - DEBUG - 命中: text: YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接所得的三元组准确
|
||
率平均达 97%。这使得 YAGO 本体既从维基百科的
|
||
海量数据获益 ,又利用了 WordNet 清晰的概念分类 。
|
||
Wikidata
|
||
[103]
|
||
的目标是构建一个免费开放 、多语
|
||
..., 距离: 0.5443771481513977, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,091 - DEBUG - 搜索三元组: 知识图谱嵌入 part of KGQA (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,108 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱嵌入%KGQA%'
|
||
2025-06-11 11:23:42,112 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.696393609046936, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,112 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6650101542472839, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,112 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6290625929832458, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,112 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6236797571182251, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,112 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5795214176177979, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,112 - DEBUG - 搜索三元组: 图谱 subclass of 问答 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,128 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%图谱%问答%'
|
||
2025-06-11 11:23:42,135 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.5989567041397095, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,135 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.5713517665863037, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,135 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5577582120895386, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,135 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.5508726239204407, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,135 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.5355452299118042, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,135 - DEBUG - 搜索三元组: 邹磊 field of work 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,151 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%邹磊%知识图谱%'
|
||
2025-06-11 11:23:42,154 - DEBUG - 命中: text: Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPATHI A, TALUKDAR P. Improving multi-
|
||
hop question answering over knowledge graphs using know-
|
||
ledge ba..., 距离: 0.4557343125343323, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:23:42,154 - DEBUG - 搜索三元组: рика 陈子睿 知识图谱问答研究综述 (文档: zongshu.pdf)
|
||
2025-06-11 11:23:42,170 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%рика%知识图谱问答研究综述%'
|
||
2025-06-11 11:23:42,173 - DEBUG - 处理文档: document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, filename=qianru.pdf
|
||
2025-06-11 11:23:42,176 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 11:23:42,319 - DEBUG - 匹配三元组: 知识图谱嵌入 - instance of - 图模型 (entity=知识图谱, head_sim=0.81, tail_sim=0.65)
|
||
2025-06-11 11:23:42,351 - DEBUG - 匹配三元组: 种被广泛采用的知识表示方法 - 结构 - 知识图谱 (entity=知识图谱, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 11:23:42,415 - DEBUG - 匹配三元组: 知识图谱嵌入 - 分类 - 中图法分类号: TP182 (entity=知识图谱, head_sim=0.81, tail_sim=0.47)
|
||
2025-06-11 11:23:42,798 - DEBUG - 匹配三元组: 知识图谱 - subclass of - 人工智能 (entity=知识图谱, head_sim=1.00, tail_sim=0.46)
|
||
2025-06-11 11:23:42,830 - DEBUG - 匹配三元组: 知识图谱 - part of - 三 (entity=知识图谱, head_sim=1.00, tail_sim=0.38)
|
||
2025-06-11 11:23:42,862 - DEBUG - 匹配三元组: 元组 - part of - 知识图谱 (entity=知识图谱, head_sim=0.36, tail_sim=1.00)
|
||
2025-06-11 11:23:42,893 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KG (entity=知识图谱, head_sim=0.81, tail_sim=0.32)
|
||
2025-06-11 11:23:43,117 - DEBUG - 匹配三元组: 统计关系学习 - studies - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 11:23:43,213 - DEBUG - 匹配三元组: 知识图谱嵌入 - G= (E;R;S) E={e1;e2;E|E - 定义几 (entity=知识图谱, head_sim=0.81, tail_sim=0.34)
|
||
2025-06-11 11:23:43,277 - DEBUG - 匹配三元组: 种基本符号 - 软件学报 2023年第 34卷第 1期 - 知识图谱 (entity=知识图谱, head_sim=0.47, tail_sim=1.00)
|
||
2025-06-11 11:23:43,341 - DEBUG - 匹配三元组: 嵌入三元组 - <media> - 知识图谱 S (entity=知识图谱, head_sim=0.39, tail_sim=0.85)
|
||
2025-06-11 11:23:45,291 - DEBUG - 匹配三元组: 知识图谱 - 生成模型 - TransG (entity=知识图谱, head_sim=1.00, tail_sim=0.34)
|
||
2025-06-11 11:23:49,612 - DEBUG - 匹配三元组: 静态知识图谱 - <media> - 形式的三元组 (entity=知识图谱, head_sim=0.81, tail_sim=0.43)
|
||
2025-06-11 11:23:49,994 - DEBUG - 匹配三元组: 知识图谱嵌入 - <misc> - 静态知识 (entity=知识图谱, head_sim=0.81, tail_sim=0.62)
|
||
2025-06-11 11:23:50,283 - DEBUG - 匹配三元组: 结构化信息 - part of - 知识图谱 (entity=知识图谱, head_sim=0.56, tail_sim=1.00)
|
||
2025-06-11 11:23:50,347 - DEBUG - 匹配三元组: 知识图谱 - TransE[15] - 的知识表示学习模型 (entity=知识图谱, head_sim=1.00, tail_sim=0.61)
|
||
2025-06-11 11:23:50,636 - DEBUG - 匹配三元组: 知识图谱 - part of - 学习模型RPJE (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 11:23:50,891 - DEBUG - 匹配三元组: 基于知识图谱的问答 - part of - QA-KG (entity=知识图谱, head_sim=0.84, tail_sim=0.35)
|
||
2025-06-11 11:23:51,627 - DEBUG - 匹配三元组: 张天成 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.18, tail_sim=1.00)
|
||
2025-06-11 11:23:51,818 - DEBUG - 匹配三元组: 类 - part of - 知识图 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 11:23:52,169 - DEBUG - 匹配三元组: 可扩展性 - 神经逻辑模型 - 大规模知识图谱中 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 11:23:52,234 - DEBUG - 匹配三元组: 认知智能 - aggregator - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 11:23:52,266 - DEBUG - 匹配三元组: 知识图谱 - instance of - 语义网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.58)
|
||
2025-06-11 11:23:52,330 - DEBUG - 匹配三元组: 知识图谱嵌入 - studies - KGE (entity=知识图谱, head_sim=0.81, tail_sim=0.29)
|
||
2025-06-11 11:24:41,832 - DEBUG - 搜索三元组: 知识图谱嵌入 instance of 图模型 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,848 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%图模型%'
|
||
2025-06-11 11:24:41,854 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.619387149810791, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,854 - DEBUG - 搜索三元组: 种被广泛采用的知识表示方法 结构 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,870 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%种被广泛采用的知识表示方法%知识图谱%'
|
||
2025-06-11 11:24:41,874 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5766963362693787, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,874 - DEBUG - 搜索三元组: 知识图谱嵌入 分类 中图法分类号: TP182 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,890 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%中图法分类号: TP182%'
|
||
2025-06-11 11:24:41,894 - DEBUG - 搜索三元组: 知识图谱 subclass of 人工智能 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,910 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%人工智能%'
|
||
2025-06-11 11:24:41,916 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.5648460984230042, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,916 - DEBUG - 搜索三元组: 知识图谱 part of 三 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,932 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%三%'
|
||
2025-06-11 11:24:41,939 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.5404534935951233, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,939 - DEBUG - 命中: text: 来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能而需要进一步探索的内部和外部信息.
|
||
● 知识类型: 不同的KGE方法在处理1-1, 1-N, N-1和N-N关系时具有不同的性能, 这表明针对不同类型的
|
||
知识或关系需要设计不同的KGE框架. 然而, ..., 距离: 0.5116069316864014, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,939 - DEBUG - 命中: text: (61)
|
||
|
||
N (h) = {t′|(h;t′ ∉ D)}∪{t}
|
||
h
|
||
其中, 是 的负例集.
|
||
M ¨obius
|
||
M ¨obius
|
||
实际上, 多关系知识图谱往往表现出多个层次结构, 为了解决这一问题, 提出了MuRP模型[89]. MuRP相对于
|
||
Poincare模型而言更加完善, 它是一种在双曲空间的Poincare ball模型中嵌入分层多关系数据的方法, 通过
|
||
矩阵-向量乘法..., 距离: 0.5078161358833313, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,939 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.505243718624115, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,939 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.4985816180706024, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,939 - DEBUG - 搜索三元组: 元组 part of 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,955 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%元组%知识图谱%'
|
||
2025-06-11 11:24:41,961 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.5568493604660034, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,961 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.534630537033081, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,961 - DEBUG - 命中: text: 的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[28]、
|
||
ATEKE[101]等.
|
||
4.3 逻辑规则
|
||
∀x;y:HasWi f e(x;y)⇒ HasSpouse(x;y)
|
||
逻辑规则(这里所说的逻辑规则主要指一阶Horn子句, 例如: , 表明任
|
||
何有两个HasWife关系相连的实体都有HasSpouse关系)包含丰富的背景信息. 目..., 距离: 0.5223005414009094, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,961 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5001960396766663, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,961 - DEBUG - 命中: text: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 距离: 0.4811737537384033, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,961 - DEBUG - 搜索三元组: 知识图谱嵌入 part of KG (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,977 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%KG%'
|
||
2025-06-11 11:24:41,982 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.7103158235549927, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,983 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.693242609500885, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,983 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.672911524772644, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,983 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.6270386576652527, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,983 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6173073053359985, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:41,983 - DEBUG - 搜索三元组: 统计关系学习 studies 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:41,999 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%统计关系学习%知识图谱%'
|
||
2025-06-11 11:24:42,002 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5219854712486267, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,002 - DEBUG - 搜索三元组: 知识图谱嵌入 G= (E;R;S) E={e1;e2;E|E 定义几 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,019 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%定义几%'
|
||
2025-06-11 11:24:42,023 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.6373600363731384, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,023 - DEBUG - 搜索三元组: 种基本符号 软件学报 2023年第 34卷第 1期 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,039 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%种基本符号%知识图谱%'
|
||
2025-06-11 11:24:42,042 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.4899718463420868, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,042 - DEBUG - 搜索三元组: 嵌入三元组 <media> 知识图谱 S (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,059 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%嵌入三元组%知识图谱 S%'
|
||
2025-06-11 11:24:42,062 - DEBUG - 搜索三元组: 知识图谱 生成模型 TransG (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,078 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%TransG%'
|
||
2025-06-11 11:24:42,082 - DEBUG - 命中: text: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 距离: 0.5846441388130188, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,082 - DEBUG - 搜索三元组: 静态知识图谱 <media> 形式的三元组 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,099 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%静态知识图谱%形式的三元组%'
|
||
2025-06-11 11:24:42,101 - DEBUG - 搜索三元组: 知识图谱嵌入 <misc> 静态知识 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,117 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%静态知识%'
|
||
2025-06-11 11:24:42,121 - DEBUG - 命中: text: 表 4 最新的知识图谱嵌入模型总结
|
||
类别 模型 实体嵌入 关系嵌入 评分函数 fr (h , t)
|
||
卷积神经网络
|
||
ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
Mr ∈ Rdw×dh
|
||
(vec(([Mh;Mr] ∗!))W)t
|
||
ConvKB [ 81 ]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
concat(g([h;r;t] ∗!))w..., 距离: 0.5579541921615601, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,121 - DEBUG - 命中: text: wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. 将在时间 投影到时间特定的超平面 上, 分别得到投影向量 , , .
|
||
|
||
P (h)+ P (r)≈ P (t)
|
||
与transH类似, HyTE期望在时间 处有效的三..., 距离: 0.525954008102417, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,121 - DEBUG - 命中: text: TransR[43] 2015 优点: 不仅考虑关系的多样性, 而且考虑实体;
|
||
缺点: 计算复杂, 忽略头、尾实体不同的类型和属性
|
||
TransD[44] 2015 优点: 计算简单、参数少;
|
||
缺点: 并非所有新事实都可以从存在的情况中推论得出
|
||
STransE[45] 2016 优点: 对每个关系使用两个投影矩阵, 性能优于TransE;
|
||
缺点: 容易出现数据稀疏问题
|
||
TranSparse[46] ..., 距离: 0.4252125918865204, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,122 - DEBUG - 搜索三元组: 结构化信息 part of 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,137 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%结构化信息%知识图谱%'
|
||
2025-06-11 11:24:42,141 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.5296695232391357, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,141 - DEBUG - 搜索三元组: 知识图谱 TransE[15] 的知识表示学习模型 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,157 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%的知识表示学习模型%'
|
||
2025-06-11 11:24:42,163 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.6241539716720581, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,163 - DEBUG - 搜索三元组: 知识图谱 part of 学习模型RPJE (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,179 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%学习模型RPJE%'
|
||
2025-06-11 11:24:42,185 - DEBUG - 搜索三元组: 基于知识图谱的问答 part of QA-KG (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,201 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%基于知识图谱的问答%QA-KG%'
|
||
2025-06-11 11:24:42,205 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.6780429482460022, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,205 - DEBUG - 搜索三元组: 张天成 field of work 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,221 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%张天成%知识图谱%'
|
||
2025-06-11 11:24:42,226 - DEBUG - 命中: text: [162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoning. In: Proc. of the 31st Int’l Conf. on
|
||
Neural Information Processing Systems (NIPS). Long Beach: C..., 距离: 0.6330105066299438, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,226 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5296636819839478, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,226 - DEBUG - 命中: text: [46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational mapping properties. In: Proc. of the
|
||
28th Pacific Asia Conf. on Language, Information and Computing (P..., 距离: 0.49077513813972473, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,226 - DEBUG - 命中: text: In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on Research and Development
|
||
in Information Retrieval. Paris: CEUR-WS, 2019.
|
||
[133]
|
||
张天成 等: 知识图谱嵌入技术研究综述 ..., 距离: 0.4850553274154663, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,226 - DEBUG - 命中: text: Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for Computing Machinery, 2019.
|
||
96–104. [doi: 10.1145/3289600.3291014]
|
||
[91]
|
||
Jiang TS, Liu TY, Ge T, Sha L,..., 距离: 0.4574166238307953, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,226 - DEBUG - 搜索三元组: 类 part of 知识图 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,242 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%类%知识图%'
|
||
2025-06-11 11:24:42,248 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5143213868141174, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,248 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.5086515545845032, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,248 - DEBUG - 命中: text: [162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoning. In: Proc. of the 31st Int’l Conf. on
|
||
Neural Information Processing Systems (NIPS). Long Beach: C..., 距离: 0.5007524490356445, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,248 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.46770092844963074, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,248 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.46138644218444824, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,248 - DEBUG - 搜索三元组: 可扩展性 神经逻辑模型 大规模知识图谱中 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,265 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%可扩展性%大规模知识图谱中%'
|
||
2025-06-11 11:24:42,268 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.674469530582428, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,268 - DEBUG - 搜索三元组: 认知智能 aggregator 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,284 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%认知智能%知识图谱%'
|
||
2025-06-11 11:24:42,288 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6310679912567139, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,288 - DEBUG - 搜索三元组: 知识图谱 instance of 语义网络 (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,304 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%语义网络%'
|
||
2025-06-11 11:24:42,309 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.5649134516716003, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,309 - DEBUG - 搜索三元组: 知识图谱嵌入 studies KGE (文档: qianru.pdf)
|
||
2025-06-11 11:24:42,325 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%KGE%'
|
||
2025-06-11 11:24:42,330 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.7633196115493774, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,330 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.7493860125541687, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,330 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.7469873428344727, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,330 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6985411047935486, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,330 - DEBUG - 命中: text: 最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., 距离: 0.6820932030677795, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:42,330 - INFO - 返回 5 条唯一结果
|
||
2025-06-11 11:24:42,332 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 11:24:45,335 - INFO - 三元组检索返回 5 条结果
|
||
2025-06-11 11:24:45,336 - DEBUG - 三元组结果 1: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 三元组结果 2: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 三元组结果 3: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.7470, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 三元组结果 4: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 三元组结果 5: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 合并前结果:
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 1 (rag): text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., distance=0.7480, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 2 (rag): text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., distance=0.7014, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 3 (rag): text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., distance=0.6933, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 4 (rag): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.6859, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 5 (rag): text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., distance=0.6831, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 6 (triplet): text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 7 (triplet): text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 8 (triplet): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.7470, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 9 (triplet): text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:45,336 - DEBUG - 结果 10 (triplet): text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:46,355 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.978010, source=triplet
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., rerank_score=0.971238, source=rag
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.949201, source=rag
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.860721, source=rag
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.858244, source=triplet
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., rerank_score=0.752559, source=rag
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., rerank_score=0.415670, source=triplet
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., rerank_score=0.359027, source=triplet
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., rerank_score=0.220007, source=rag
|
||
2025-06-11 11:24:46,997 - DEBUG - 重排序结果: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., rerank_score=0.220007, source=triplet
|
||
2025-06-11 11:24:46,998 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 11:24:47,826 - DEBUG - 重排序后结果:
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 1 (triplet): text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, rerank_score=0.978010, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 2 (rag): text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., distance=0.7014, rerank_score=0.971238, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 3 (rag): text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., distance=0.6831, rerank_score=0.949201, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 4 (rag): text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., distance=0.6933, rerank_score=0.860721, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 5 (triplet): text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, rerank_score=0.858244, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 6 (rag): text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., distance=0.7480, rerank_score=0.752559, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 7 (triplet): text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, rerank_score=0.415670, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 8 (triplet): text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, rerank_score=0.359027, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,827 - DEBUG - 排序结果 9 (rag): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.6859, rerank_score=0.220007, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 排序结果 10 (triplet): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.7470, rerank_score=0.220007, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重后结果:
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 1 (triplet): text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, rerank_score=0.978010, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 2 (rag): text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., distance=0.7014, rerank_score=0.971238, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 3 (rag): text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., distance=0.6831, rerank_score=0.949201, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 4 (rag): text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., distance=0.6933, rerank_score=0.860721, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 5 (triplet): text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, rerank_score=0.858244, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 6 (rag): text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., distance=0.7480, rerank_score=0.752559, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 7 (triplet): text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, rerank_score=0.415670, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 8 (triplet): text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, rerank_score=0.359027, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - DEBUG - 去重结果 9 (rag): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.6859, rerank_score=0.220007, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 11:24:47,828 - INFO - 合并后返回 9 条唯一结果
|
||
2025-06-11 11:47:55,438 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 11:47:55,439 - WARNING - 本地模型路径 /mnt/models/LTP/small 不存在,尝试使用 Hugging Face 模型 'hit-scir/ltp-small'
|
||
2025-06-11 11:48:05,522 - ERROR - 加载 LTP 模型失败: config.json not found in hit-scir/ltp-small
|
||
2025-06-11 11:49:07,416 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 11:49:07,416 - WARNING - 本地模型路径 /mnt/models/LTP/small 不存在,尝试使用 Hugging Face 模型 'hit-scir/ltp-small'
|
||
2025-06-11 11:49:17,431 - ERROR - 加载 LTP 模型失败: config.json not found in hit-scir/ltp-small
|
||
2025-06-11 11:50:26,064 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 11:50:26,641 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 11:50:27,425 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 11:50:27,534 - INFO - 找到 3 个文档: ['test.docx', 'zongshu.pdf', 'qianru.pdf']
|
||
2025-06-11 11:50:27,598 - DEBUG - NER 结果: []
|
||
2025-06-11 11:50:27,598 - DEBUG - 合并连续名词: 知识图谱, 子词: ['知识', '图谱']
|
||
2025-06-11 11:50:27,598 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 11:50:27,598 - DEBUG - 连续名词子词集合: {'图谱', '知识'}
|
||
2025-06-11 11:50:27,598 - INFO - 从查询中提取到 4 个唯一实体: ['知识图谱', '知识', '是', '抽取']
|
||
2025-06-11 11:50:27,598 - DEBUG - 处理文档: document_id=75e18e23-6f5a-4697-a1bb-ee53c6507a41, filename=test.docx
|
||
2025-06-11 11:50:27,599 - WARNING - 三元组文件 /share/wangmeihua/rag/triples/test.docx_testuser1.txt 不存在
|
||
2025-06-11 11:50:27,599 - DEBUG - 文档 test.docx 无三元组
|
||
2025-06-11 11:50:27,599 - DEBUG - 文档 test.docx 未找到匹配的三元组
|
||
2025-06-11 11:50:27,599 - DEBUG - 处理文档: document_id=842b6180-667a-4ac8-b051-5c225c859011, filename=zongshu.pdf
|
||
2025-06-11 11:50:27,599 - WARNING - 三元组文件 /share/wangmeihua/rag/triples/zongshu.pdf_testuser1.txt 不存在
|
||
2025-06-11 11:50:27,599 - DEBUG - 文档 zongshu.pdf 无三元组
|
||
2025-06-11 11:50:27,599 - DEBUG - 文档 zongshu.pdf 未找到匹配的三元组
|
||
2025-06-11 11:50:27,600 - DEBUG - 处理文档: document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, filename=qianru.pdf
|
||
2025-06-11 11:50:27,600 - WARNING - 三元组文件 /share/wangmeihua/rag/triples/qianru.pdf_testuser1.txt 不存在
|
||
2025-06-11 11:50:27,600 - DEBUG - 文档 qianru.pdf 无三元组
|
||
2025-06-11 11:50:27,600 - DEBUG - 文档 qianru.pdf 未找到匹配的三元组
|
||
2025-06-11 11:50:27,600 - INFO - 返回 0 条唯一结果
|
||
2025-06-11 11:50:27,627 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 13:51:20,545 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 13:51:21,009 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 13:51:21,788 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 13:51:21,900 - INFO - 找到 3 个文档: ['test.docx', 'zongshu.pdf', 'qianru.pdf']
|
||
2025-06-11 13:51:21,949 - DEBUG - NER 结果: []
|
||
2025-06-11 13:51:21,949 - DEBUG - 合并连续名词: 知识图谱, 子词: ['知识', '图谱']
|
||
2025-06-11 13:51:21,949 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 13:51:21,949 - DEBUG - 连续名词子词集合: {'知识', '图谱'}
|
||
2025-06-11 13:51:21,949 - INFO - 从查询中提取到 4 个唯一实体: ['知识图谱', '知识', '是', '抽取']
|
||
2025-06-11 13:51:21,949 - DEBUG - 处理文档: document_id=75e18e23-6f5a-4697-a1bb-ee53c6507a41, filename=test.docx
|
||
2025-06-11 13:51:21,952 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 13:51:22,104 - DEBUG - 匹配三元组: 知识图谱 - Web 3.0 - 万维网 (entity=知识图谱, head_sim=1.00, tail_sim=0.43)
|
||
2025-06-11 13:51:22,267 - DEBUG - 匹配三元组: 模式层 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.46, tail_sim=1.00)
|
||
2025-06-11 13:51:22,300 - DEBUG - 匹配三元组: 结构化知识库 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 13:51:22,396 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=知识图谱, head_sim=0.57, tail_sim=1.00)
|
||
2025-06-11 13:51:22,814 - DEBUG - 匹配三元组: 外部知识库 - 结构化数据 - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 13:51:23,007 - DEBUG - 匹配三元组: 上下位关系 - 阿里巴巴 - 图谱 (entity=知识图谱, head_sim=0.42, tail_sim=0.82)
|
||
2025-06-11 13:51:23,076 - DEBUG - 匹配三元组: 知识图谱 - location - 城市 (entity=知识图谱, head_sim=1.00, tail_sim=0.47)
|
||
2025-06-11 13:51:23,205 - DEBUG - 匹配三元组: 知识图谱 - part of - 数据层 (entity=知识图谱, head_sim=1.00, tail_sim=0.55)
|
||
2025-06-11 13:51:23,237 - DEBUG - 匹配三元组: 总结 - part of - 知识图谱 (entity=知识图谱, head_sim=0.48, tail_sim=1.00)
|
||
2025-06-11 13:51:23,269 - DEBUG - 匹配三元组: 知识图谱 - 移动个人助理(Siri - 智能语义搜索 (entity=知识图谱, head_sim=1.00, tail_sim=0.53)
|
||
2025-06-11 13:51:24,623 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 13:51:26,361 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 13:51:26,393 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 13:51:26,586 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 13:51:26,682 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 13:51:27,324 - INFO - 找到 14 个匹配的三元组
|
||
2025-06-11 13:51:27,325 - DEBUG - 搜索三元组: 知识图谱 Web 3.0 万维网 (文档: test.docx)
|
||
2025-06-11 13:51:27,341 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%万维网%'
|
||
2025-06-11 13:51:27,350 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.622643232345581, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,350 - DEBUG - 搜索三元组: 模式层 subclass of 知识图谱 (文档: test.docx)
|
||
2025-06-11 13:51:27,367 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%模式层%知识图谱%'
|
||
2025-06-11 13:51:27,369 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.567072868347168, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,369 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.5059496164321899, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,369 - DEBUG - 搜索三元组: 结构化知识库 subclass of 知识图谱 (文档: test.docx)
|
||
2025-06-11 13:51:27,385 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%结构化知识库%知识图谱%'
|
||
2025-06-11 13:51:27,387 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.6059292554855347, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,387 - DEBUG - 搜索三元组: 信息抽取 part of 知识图谱 (文档: test.docx)
|
||
2025-06-11 13:51:27,403 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%信息抽取%知识图谱%'
|
||
2025-06-11 13:51:27,405 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.6285881400108337, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,405 - DEBUG - 搜索三元组: 外部知识库 结构化数据 知识图谱 (文档: test.docx)
|
||
2025-06-11 13:51:27,421 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%外部知识库%知识图谱%'
|
||
2025-06-11 13:51:27,423 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6099985837936401, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,423 - DEBUG - 搜索三元组: 上下位关系 阿里巴巴 图谱 (文档: test.docx)
|
||
2025-06-11 13:51:27,440 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%上下位关系%图谱%'
|
||
2025-06-11 13:51:27,441 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.5227455496788025, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,441 - DEBUG - 搜索三元组: 知识图谱 location 城市 (文档: test.docx)
|
||
2025-06-11 13:51:27,458 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%城市%'
|
||
2025-06-11 13:51:27,461 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.5877416133880615, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,461 - DEBUG - 搜索三元组: 知识图谱 part of 数据层 (文档: test.docx)
|
||
2025-06-11 13:51:27,479 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%数据层%'
|
||
2025-06-11 13:51:27,482 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.677775502204895, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,482 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.6638458371162415, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,482 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6140748262405396, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,482 - DEBUG - 搜索三元组: 总结 part of 知识图谱 (文档: test.docx)
|
||
2025-06-11 13:51:27,498 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%总结%知识图谱%'
|
||
2025-06-11 13:51:27,500 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.5805757641792297, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,500 - DEBUG - 搜索三元组: 知识图谱 移动个人助理(Siri 智能语义搜索 (文档: test.docx)
|
||
2025-06-11 13:51:27,517 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%智能语义搜索%'
|
||
2025-06-11 13:51:27,520 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.6165111064910889, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,520 - DEBUG - 搜索三元组: (Sri) subclass of 的知识 (文档: test.docx)
|
||
2025-06-11 13:51:27,537 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%(Sri)%的知识%'
|
||
2025-06-11 13:51:27,538 - DEBUG - 搜索三元组: 实体识别 subclass of 信息抽取 (文档: test.docx)
|
||
2025-06-11 13:51:27,554 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%实体识别%信息抽取%'
|
||
2025-06-11 13:51:27,556 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.5339474678039551, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 13:51:27,556 - DEBUG - 搜索三元组: 属性抽取 <misc> 统计机器学习 (文档: test.docx)
|
||
2025-06-11 13:51:27,572 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%属性抽取%统计机器学习%'
|
||
2025-06-11 13:51:27,574 - DEBUG - 搜索三元组: 拼图碎片 非结构化 信息抽取 (文档: test.docx)
|
||
2025-06-11 13:51:27,590 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%拼图碎片%信息抽取%'
|
||
2025-06-11 13:51:27,592 - DEBUG - 处理文档: document_id=842b6180-667a-4ac8-b051-5c225c859011, filename=zongshu.pdf
|
||
2025-06-11 13:51:27,594 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 13:51:27,788 - DEBUG - 匹配三元组: 规则模板 - 问答方法 - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 13:51:28,237 - DEBUG - 匹配三元组: 语 言 - KG - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 13:51:28,302 - DEBUG - 匹配三元组: 知识图谱 - part of - 深度学习 (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 13:51:28,334 - DEBUG - 匹配三元组: 知识图谱 - graph question answering - 库问答 (entity=知识图谱, head_sim=1.00, tail_sim=0.50)
|
||
2025-06-11 13:51:28,370 - DEBUG - 匹配三元组: 知识图谱问答 - use - 搜索引擎 (entity=知识图谱, head_sim=0.87, tail_sim=0.50)
|
||
2025-06-11 13:51:28,434 - DEBUG - 匹配三元组: 子知识图谱 - standards body - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 13:51:28,498 - DEBUG - 匹配三元组: 知识图谱 - used by - KGQA (entity=知识图谱, head_sim=1.00, tail_sim=0.31)
|
||
2025-06-11 13:51:28,980 - DEBUG - 匹配三元组: 析、查询图和信息检索方法 - Fig.1 Framework of knowledge graph question - 知识图谱问答 (entity=知识图谱, head_sim=0.64, tail_sim=0.87)
|
||
2025-06-11 13:51:29,109 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识图谱, head_sim=0.87, tail_sim=0.74)
|
||
2025-06-11 13:51:29,209 - DEBUG - 匹配三元组: 知识图谱问答 - 通用领域 - 语义解析与信息检索细化 (entity=知识图谱, head_sim=0.87, tail_sim=0.55)
|
||
2025-06-11 13:51:29,273 - DEBUG - 匹配三元组: 信息检索 - part of - 知识图谱 G (entity=知识图谱, head_sim=0.63, tail_sim=0.82)
|
||
2025-06-11 13:51:30,368 - DEBUG - 匹配三元组: 匹配方法 - Web- Questions 基线的最高精确度指标 - 知识图谱问答 (entity=知识图谱, head_sim=0.45, tail_sim=0.87)
|
||
2025-06-11 13:51:31,589 - DEBUG - 匹配三元组: 知识图谱嵌入 - subclass of - 深度学习 (entity=知识图谱, head_sim=0.81, tail_sim=0.48)
|
||
2025-06-11 13:51:32,937 - DEBUG - 匹配三元组: 知识图谱 - <misc> - 神经网络的查询图 (entity=知识图谱, head_sim=1.00, tail_sim=0.62)
|
||
2025-06-11 13:51:32,969 - DEBUG - 匹配三元组: 知识图谱 - part of - 记忆网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.57)
|
||
2025-06-11 13:51:33,097 - DEBUG - 匹配三元组: 知识图谱 - <media> - 记忆组 件存储 KG (entity=知识图谱, head_sim=1.00, tail_sim=0.42)
|
||
2025-06-11 13:51:33,552 - DEBUG - 匹配三元组: 知识图谱 - part of - Wikidata (entity=知识图谱, head_sim=1.00, tail_sim=0.44)
|
||
2025-06-11 13:51:34,678 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 13:51:35,416 - DEBUG - 匹配三元组: 图谱 - subclass of - 问答 (entity=知识图谱, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 13:51:36,348 - DEBUG - 匹配三元组: 邹磊 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.28, tail_sim=1.00)
|
||
2025-06-11 13:51:36,574 - DEBUG - 匹配三元组: рика - 陈子睿 - 知识图谱问答研究综述 (entity=知识图谱, head_sim=0.29, tail_sim=0.81)
|
||
2025-06-11 13:51:38,532 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 13:51:38,564 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 13:51:38,789 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 13:51:39,686 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 13:51:45,940 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 13:51:46,741 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 13:51:48,248 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 13:51:48,664 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 13:52:09,907 - INFO - 找到 28 个匹配的三元组
|
||
2025-06-11 13:52:09,907 - DEBUG - 搜索三元组: 规则模板 问答方法 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:09,923 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%规则模板%知识图谱%'
|
||
2025-06-11 13:52:09,929 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.7196816802024841, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,929 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.6338689923286438, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,929 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6320828199386597, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,929 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6310024857521057, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,929 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6165626049041748, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,929 - DEBUG - 搜索三元组: 语 言 KG 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:09,946 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%语 言%知识图谱%'
|
||
2025-06-11 13:52:09,947 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.5706815719604492, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,948 - DEBUG - 搜索三元组: 知识图谱 part of 深度学习 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:09,964 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%深度学习%'
|
||
2025-06-11 13:52:09,967 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.6626743674278259, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,967 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6333552002906799, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,967 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6285597681999207, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,967 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6233670115470886, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,967 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.6035276055335999, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,967 - DEBUG - 搜索三元组: 知识图谱 graph question answering 库问答 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:09,983 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%库问答%'
|
||
2025-06-11 13:52:09,987 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.662022054195404, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,987 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6436327695846558, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,987 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.5916442275047302, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,987 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5819114446640015, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:09,987 - DEBUG - 搜索三元组: 知识图谱问答 use 搜索引擎 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,003 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱问答%搜索引擎%'
|
||
2025-06-11 13:52:10,005 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.6104249954223633, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,005 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.6058603525161743, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,006 - DEBUG - 命中: text: YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接所得的三元组准确
|
||
率平均达 97%。这使得 YAGO 本体既从维基百科的
|
||
海量数据获益 ,又利用了 WordNet 清晰的概念分类 。
|
||
Wikidata
|
||
[103]
|
||
的目标是构建一个免费开放 、多语
|
||
..., 距离: 0.5500432848930359, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,006 - DEBUG - 搜索三元组: 子知识图谱 standards body KGQA (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,022 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%子知识图谱%KGQA%'
|
||
2025-06-11 13:52:10,024 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.635985255241394, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,024 - DEBUG - 搜索三元组: 知识图谱 used by KGQA (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,040 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%KGQA%'
|
||
2025-06-11 13:52:10,043 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.7099630236625671, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,043 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.7005059719085693, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,043 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.6842584013938904, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,043 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6733513474464417, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,043 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6565587520599365, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,043 - DEBUG - 搜索三元组: 析、查询图和信息检索方法 Fig.1 Framework of knowledge graph question 知识图谱问答 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,060 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%析、查询图和信息检索方法%知识图谱问答%'
|
||
2025-06-11 13:52:10,062 - DEBUG - 搜索三元组: 知 识图谱 知識 知识 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,078 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知 识图谱%知识%'
|
||
2025-06-11 13:52:10,079 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6105901598930359, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,080 - DEBUG - 搜索三元组: 知识图谱问答 通用领域 语义解析与信息检索细化 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,096 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱问答%语义解析与信息检索细化%'
|
||
2025-06-11 13:52:10,098 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6384718418121338, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,098 - DEBUG - 搜索三元组: 信息检索 part of 知识图谱 G (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,114 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%信息检索%知识图谱 G%'
|
||
2025-06-11 13:52:10,116 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6183342933654785, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,116 - DEBUG - 命中: text: 答案部分 , 这也是两类方法的区别所在 。 开放领域
|
||
知识图谱问答 , 则是知识图谱 G 为通用领域知识图
|
||
谱 , 问题 q为开放领域问题的知识图谱问答情况 。
|
||
定义 2( 知识图谱问答 ) 给定知识图谱 G , 自然
|
||
语言问题 q, 返回正确答案集 A, 其中 A为 E 的子集 。
|
||
语义解析 ( semantic parsing, SP) : 得到查询语句
|
||
或查询语句的逻辑形式 , 在 KG 上..., 距离: 0.565437376499176, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,116 - DEBUG - 搜索三元组: 匹配方法 Web- Questions 基线的最高精确度指标 知识图谱问答 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,133 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%匹配方法%知识图谱问答%'
|
||
2025-06-11 13:52:10,135 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.5744408369064331, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,135 - DEBUG - 命中: text: PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空间模型作为复述模型对自然语言 -
|
||
逻辑形式元组 (c,z) 打分 , 使用得分最高元组的逻辑
|
||
形式 z 检索 KG 获得答案 。
|
||
OQA 系统
|
||
[54]
|
||
使用预先定义的操作符与模板 , 将
|
||
用户问题提..., 距离: 0.5386887788772583, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,135 - DEBUG - 搜索三元组: 知识图谱嵌入 subclass of 深度学习 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,151 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱嵌入%深度学习%'
|
||
2025-06-11 13:52:10,156 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.626388430595398, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,156 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.5887572765350342, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,156 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.562717616558075, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,156 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5601789355278015, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,157 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5475433468818665, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,157 - DEBUG - 搜索三元组: 知识图谱 <misc> 神经网络的查询图 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,173 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%神经网络的查询图%'
|
||
2025-06-11 13:52:10,179 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.6379419565200806, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,179 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.603220522403717, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,179 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5959279537200928, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,179 - DEBUG - 命中: text: 合位置编码的方法表示问题 q, 在 WebQuestions 数据
|
||
集上获得了更优的效果 ; Xu 等人
|
||
[39]
|
||
以 KV-MemNN 为
|
||
基础 , 通过引入 STOP 策略 , 设计一种新式查询更新
|
||
策略 , 屏蔽已寻址的内存信息 , 使得 KV-MemNN 能
|
||
够处理复杂问题 。
|
||
3.3 基于神经网络的语义解析
|
||
本节方法使用神经网络模块对传统语义解析 、
|
||
话语模板的查询图 、 传统信息检索方..., 距离: 0.57700115442276, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,179 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5637367963790894, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,179 - DEBUG - 搜索三元组: 知识图谱 part of 记忆网络 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,196 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%记忆网络%'
|
||
2025-06-11 13:52:10,199 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6457532048225403, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,199 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.6223066449165344, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,199 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.5924555659294128, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,199 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5907570123672485, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,199 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.589214563369751, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,199 - DEBUG - 搜索三元组: 知识图谱 <media> 记忆组 件存储 KG (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,215 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%记忆组 件存储 KG%'
|
||
2025-06-11 13:52:10,218 - DEBUG - 搜索三元组: 知识图谱 part of Wikidata (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,234 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%Wikidata%'
|
||
2025-06-11 13:52:10,237 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.54942387342453, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,237 - DEBUG - 命中: text: YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接所得的三元组准确
|
||
率平均达 97%。这使得 YAGO 本体既从维基百科的
|
||
海量数据获益 ,又利用了 WordNet 清晰的概念分类 。
|
||
Wikidata
|
||
[103]
|
||
的目标是构建一个免费开放 、多语
|
||
..., 距离: 0.5443771481513977, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,237 - DEBUG - 搜索三元组: 知识图谱嵌入 part of KGQA (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,253 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱嵌入%KGQA%'
|
||
2025-06-11 13:52:10,255 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.696393609046936, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,255 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6650101542472839, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,255 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6290625929832458, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,255 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6236797571182251, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,256 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5795214176177979, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,256 - DEBUG - 搜索三元组: 图谱 subclass of 问答 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,272 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%图谱%问答%'
|
||
2025-06-11 13:52:10,275 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.5989567041397095, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,275 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.5713517665863037, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,275 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5577582120895386, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,275 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.5508726239204407, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,275 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.5355452299118042, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,275 - DEBUG - 搜索三元组: 邹磊 field of work 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,292 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%邹磊%知识图谱%'
|
||
2025-06-11 13:52:10,293 - DEBUG - 命中: text: Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPATHI A, TALUKDAR P. Improving multi-
|
||
hop question answering over knowledge graphs using know-
|
||
ledge ba..., 距离: 0.4557343125343323, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,293 - DEBUG - 搜索三元组: рика 陈子睿 知识图谱问答研究综述 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,310 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%рика%知识图谱问答研究综述%'
|
||
2025-06-11 13:52:10,311 - DEBUG - 搜索三元组: Knowledge instance of natural язык question (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,327 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%Knowledge%natural язык question%'
|
||
2025-06-11 13:52:10,329 - DEBUG - 搜索三元组: graph part of KG knowledge (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,345 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%graph%knowledge%'
|
||
2025-06-11 13:52:10,348 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5468645691871643, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,348 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.5445511937141418, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,348 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.5339106917381287, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,348 - DEBUG - 命中: text: for Computational Linguistics, Vancouver, Jul 30- Aug 4,
|
||
2017. Stroudsburg: ACL,2017: 571-581.
|
||
[36] SOROKIN D, GUREVYCH I. Modeling semantics with
|
||
gated graph neural networks for knowledge base questi..., 距离: 0.5256006121635437, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,348 - DEBUG - 命中: text: Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPATHI A, TALUKDAR P. Improving multi-
|
||
hop question answering over knowledge graphs using know-
|
||
ledge ba..., 距离: 0.5208092331886292, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,348 - DEBUG - 搜索三元组: 限定领 域知识库 subclass of 知识 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,364 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%限定领 域知识库%知识%'
|
||
2025-06-11 13:52:10,366 - DEBUG - 搜索三元组: 开放领域知识图谱问答 subclass of 知识 (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,382 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%开放领域知识图谱问答%知识%'
|
||
2025-06-11 13:52:10,384 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.6157804727554321, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,384 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5683380961418152, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,384 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.5566666126251221, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,384 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.5446227192878723, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,384 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.5443547964096069, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,384 - DEBUG - 搜索三元组: knowledgebase question mainland knowledge (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,401 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%knowledgebase question%knowledge%'
|
||
2025-06-11 13:52:10,402 - DEBUG - 搜索三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,419 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S%knowledge%'
|
||
2025-06-11 13:52:10,420 - DEBUG - 搜索三元组: graphs studies knowledge (文档: zongshu.pdf)
|
||
2025-06-11 13:52:10,436 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%graphs%knowledge%'
|
||
2025-06-11 13:52:10,438 - DEBUG - 命中: text: for Computational Linguistics, Vancouver, Jul 30- Aug 4,
|
||
2017. Stroudsburg: ACL,2017: 571-581.
|
||
[36] SOROKIN D, GUREVYCH I. Modeling semantics with
|
||
gated graph neural networks for knowledge base questi..., 距离: 0.6149809956550598, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,438 - DEBUG - 命中: text: Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P, LIN J. Strong baselines for simple
|
||
question answering over knowledge graphs with and without
|
||
neura..., 距离: 0.6140579581260681, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,438 - DEBUG - 命中: text: Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPATHI A, TALUKDAR P. Improving multi-
|
||
hop question answering over knowledge graphs using know-
|
||
ledge ba..., 距离: 0.6046038269996643, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,438 - DEBUG - 命中: text: of Web Semantics,2020, 65: 100612.
|
||
[88] HU S, ZOU L, ZHANG X B. A state-transition framework
|
||
to answer complex questions over knowledge base[C]//
|
||
Proceedings of the 2018 Conference on Empirical Method..., 距离: 0.5894018411636353, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,439 - DEBUG - 命中: text: a corpus for complex question answering over knowledge
|
||
graphs[C]//LNCS 10588: Proceedings of the16th Interna-
|
||
tional Semantic Web Conference, Vienna, Oct 21- 25,
|
||
2017. Cham:Springer, 2017: 210-218.
|
||
[1..., 距离: 0.5787296891212463, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 13:52:10,439 - DEBUG - 处理文档: document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, filename=qianru.pdf
|
||
2025-06-11 13:52:10,442 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 13:52:10,571 - DEBUG - 匹配三元组: 知识图谱嵌入 - instance of - 图模型 (entity=知识图谱, head_sim=0.81, tail_sim=0.65)
|
||
2025-06-11 13:52:10,603 - DEBUG - 匹配三元组: 种被广泛采用的知识表示方法 - 结构 - 知识图谱 (entity=知识图谱, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 13:52:10,667 - DEBUG - 匹配三元组: 知识图谱嵌入 - 分类 - 中图法分类号: TP182 (entity=知识图谱, head_sim=0.81, tail_sim=0.47)
|
||
2025-06-11 13:52:11,052 - DEBUG - 匹配三元组: 知识图谱 - subclass of - 人工智能 (entity=知识图谱, head_sim=1.00, tail_sim=0.46)
|
||
2025-06-11 13:52:11,084 - DEBUG - 匹配三元组: 知识图谱 - part of - 三 (entity=知识图谱, head_sim=1.00, tail_sim=0.38)
|
||
2025-06-11 13:52:11,116 - DEBUG - 匹配三元组: 元组 - part of - 知识图谱 (entity=知识图谱, head_sim=0.36, tail_sim=1.00)
|
||
2025-06-11 13:52:11,148 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KG (entity=知识图谱, head_sim=0.81, tail_sim=0.32)
|
||
2025-06-11 13:52:11,373 - DEBUG - 匹配三元组: 统计关系学习 - studies - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 13:52:11,469 - DEBUG - 匹配三元组: 知识图谱嵌入 - G= (E;R;S) E={e1;e2;E|E - 定义几 (entity=知识图谱, head_sim=0.81, tail_sim=0.34)
|
||
2025-06-11 13:52:11,534 - DEBUG - 匹配三元组: 种基本符号 - 软件学报 2023年第 34卷第 1期 - 知识图谱 (entity=知识图谱, head_sim=0.47, tail_sim=1.00)
|
||
2025-06-11 13:52:11,598 - DEBUG - 匹配三元组: 嵌入三元组 - <media> - 知识图谱 S (entity=知识图谱, head_sim=0.39, tail_sim=0.85)
|
||
2025-06-11 13:52:13,560 - DEBUG - 匹配三元组: 知识图谱 - 生成模型 - TransG (entity=知识图谱, head_sim=1.00, tail_sim=0.34)
|
||
2025-06-11 13:52:17,894 - DEBUG - 匹配三元组: 静态知识图谱 - <media> - 形式的三元组 (entity=知识图谱, head_sim=0.81, tail_sim=0.43)
|
||
2025-06-11 13:52:18,279 - DEBUG - 匹配三元组: 知识图谱嵌入 - <misc> - 静态知识 (entity=知识图谱, head_sim=0.81, tail_sim=0.62)
|
||
2025-06-11 13:52:18,568 - DEBUG - 匹配三元组: 结构化信息 - part of - 知识图谱 (entity=知识图谱, head_sim=0.56, tail_sim=1.00)
|
||
2025-06-11 13:52:18,632 - DEBUG - 匹配三元组: 知识图谱 - TransE[15] - 的知识表示学习模型 (entity=知识图谱, head_sim=1.00, tail_sim=0.61)
|
||
2025-06-11 13:52:18,921 - DEBUG - 匹配三元组: 知识图谱 - part of - 学习模型RPJE (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 13:52:19,178 - DEBUG - 匹配三元组: 基于知识图谱的问答 - part of - QA-KG (entity=知识图谱, head_sim=0.84, tail_sim=0.35)
|
||
2025-06-11 13:52:19,917 - DEBUG - 匹配三元组: 张天成 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.18, tail_sim=1.00)
|
||
2025-06-11 13:52:20,110 - DEBUG - 匹配三元组: 类 - part of - 知识图 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 13:52:20,462 - DEBUG - 匹配三元组: 可扩展性 - 神经逻辑模型 - 大规模知识图谱中 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 13:52:20,527 - DEBUG - 匹配三元组: 认知智能 - aggregator - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 13:52:20,559 - DEBUG - 匹配三元组: 知识图谱 - instance of - 语义网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.58)
|
||
2025-06-11 13:52:20,623 - DEBUG - 匹配三元组: 知识图谱嵌入 - studies - KGE (entity=知识图谱, head_sim=0.81, tail_sim=0.29)
|
||
2025-06-11 13:52:25,734 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 13:52:25,766 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 13:52:32,288 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 13:52:34,956 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 13:52:37,365 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 13:52:38,425 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 13:52:38,810 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 13:53:10,369 - INFO - 找到 31 个匹配的三元组
|
||
2025-06-11 13:53:10,369 - DEBUG - 搜索三元组: 知识图谱嵌入 instance of 图模型 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,385 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%图模型%'
|
||
2025-06-11 13:53:10,389 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.619387149810791, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,389 - DEBUG - 搜索三元组: 种被广泛采用的知识表示方法 结构 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,406 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%种被广泛采用的知识表示方法%知识图谱%'
|
||
2025-06-11 13:53:10,409 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5766963362693787, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,409 - DEBUG - 搜索三元组: 知识图谱嵌入 分类 中图法分类号: TP182 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,426 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%中图法分类号: TP182%'
|
||
2025-06-11 13:53:10,428 - DEBUG - 搜索三元组: 知识图谱 subclass of 人工智能 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,444 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%人工智能%'
|
||
2025-06-11 13:53:10,447 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.5648460984230042, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,447 - DEBUG - 搜索三元组: 知识图谱 part of 三 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,463 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%三%'
|
||
2025-06-11 13:53:10,466 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.5404534935951233, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,467 - DEBUG - 命中: text: 来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能而需要进一步探索的内部和外部信息.
|
||
● 知识类型: 不同的KGE方法在处理1-1, 1-N, N-1和N-N关系时具有不同的性能, 这表明针对不同类型的
|
||
知识或关系需要设计不同的KGE框架. 然而, ..., 距离: 0.5116069316864014, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,467 - DEBUG - 命中: text: (61)
|
||
|
||
N (h) = {t′|(h;t′ ∉ D)}∪{t}
|
||
h
|
||
其中, 是 的负例集.
|
||
M ¨obius
|
||
M ¨obius
|
||
实际上, 多关系知识图谱往往表现出多个层次结构, 为了解决这一问题, 提出了MuRP模型[89]. MuRP相对于
|
||
Poincare模型而言更加完善, 它是一种在双曲空间的Poincare ball模型中嵌入分层多关系数据的方法, 通过
|
||
矩阵-向量乘法..., 距离: 0.5078161358833313, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,467 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.505243718624115, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,467 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.4985816180706024, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,467 - DEBUG - 搜索三元组: 元组 part of 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,483 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%元组%知识图谱%'
|
||
2025-06-11 13:53:10,486 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.5568493604660034, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,486 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.534630537033081, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,486 - DEBUG - 命中: text: 的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[28]、
|
||
ATEKE[101]等.
|
||
4.3 逻辑规则
|
||
∀x;y:HasWi f e(x;y)⇒ HasSpouse(x;y)
|
||
逻辑规则(这里所说的逻辑规则主要指一阶Horn子句, 例如: , 表明任
|
||
何有两个HasWife关系相连的实体都有HasSpouse关系)包含丰富的背景信息. 目..., 距离: 0.5223005414009094, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,486 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5001960396766663, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,486 - DEBUG - 命中: text: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 距离: 0.4811737537384033, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,486 - DEBUG - 搜索三元组: 知识图谱嵌入 part of KG (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,503 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%KG%'
|
||
2025-06-11 13:53:10,505 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.7103158235549927, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,505 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.693242609500885, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,505 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.672911524772644, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,506 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.6270386576652527, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,506 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6173073053359985, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,506 - DEBUG - 搜索三元组: 统计关系学习 studies 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,522 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%统计关系学习%知识图谱%'
|
||
2025-06-11 13:53:10,524 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5219854712486267, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,524 - DEBUG - 搜索三元组: 知识图谱嵌入 G= (E;R;S) E={e1;e2;E|E 定义几 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,540 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%定义几%'
|
||
2025-06-11 13:53:10,542 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.6373600363731384, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,543 - DEBUG - 搜索三元组: 种基本符号 软件学报 2023年第 34卷第 1期 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,559 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%种基本符号%知识图谱%'
|
||
2025-06-11 13:53:10,561 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.4899718463420868, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,561 - DEBUG - 搜索三元组: 嵌入三元组 <media> 知识图谱 S (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,577 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%嵌入三元组%知识图谱 S%'
|
||
2025-06-11 13:53:10,579 - DEBUG - 搜索三元组: 知识图谱 生成模型 TransG (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,595 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%TransG%'
|
||
2025-06-11 13:53:10,597 - DEBUG - 命中: text: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 距离: 0.5846441388130188, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,598 - DEBUG - 搜索三元组: 静态知识图谱 <media> 形式的三元组 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,614 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%静态知识图谱%形式的三元组%'
|
||
2025-06-11 13:53:10,615 - DEBUG - 搜索三元组: 知识图谱嵌入 <misc> 静态知识 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,632 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%静态知识%'
|
||
2025-06-11 13:53:10,634 - DEBUG - 命中: text: 表 4 最新的知识图谱嵌入模型总结
|
||
类别 模型 实体嵌入 关系嵌入 评分函数 fr (h , t)
|
||
卷积神经网络
|
||
ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
Mr ∈ Rdw×dh
|
||
(vec(([Mh;Mr] ∗!))W)t
|
||
ConvKB [ 81 ]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
concat(g([h;r;t] ∗!))w..., 距离: 0.5579541921615601, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,634 - DEBUG - 命中: text: wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. 将在时间 投影到时间特定的超平面 上, 分别得到投影向量 , , .
|
||
|
||
P (h)+ P (r)≈ P (t)
|
||
与transH类似, HyTE期望在时间 处有效的三..., 距离: 0.525954008102417, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,634 - DEBUG - 命中: text: TransR[43] 2015 优点: 不仅考虑关系的多样性, 而且考虑实体;
|
||
缺点: 计算复杂, 忽略头、尾实体不同的类型和属性
|
||
TransD[44] 2015 优点: 计算简单、参数少;
|
||
缺点: 并非所有新事实都可以从存在的情况中推论得出
|
||
STransE[45] 2016 优点: 对每个关系使用两个投影矩阵, 性能优于TransE;
|
||
缺点: 容易出现数据稀疏问题
|
||
TranSparse[46] ..., 距离: 0.4252125918865204, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,634 - DEBUG - 搜索三元组: 结构化信息 part of 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,650 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%结构化信息%知识图谱%'
|
||
2025-06-11 13:53:10,652 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.5296695232391357, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,652 - DEBUG - 搜索三元组: 知识图谱 TransE[15] 的知识表示学习模型 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,668 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%的知识表示学习模型%'
|
||
2025-06-11 13:53:10,671 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.6241539716720581, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,671 - DEBUG - 搜索三元组: 知识图谱 part of 学习模型RPJE (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,687 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%学习模型RPJE%'
|
||
2025-06-11 13:53:10,690 - DEBUG - 搜索三元组: 基于知识图谱的问答 part of QA-KG (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,707 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%基于知识图谱的问答%QA-KG%'
|
||
2025-06-11 13:53:10,709 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.6780429482460022, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,709 - DEBUG - 搜索三元组: 张天成 field of work 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,725 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%张天成%知识图谱%'
|
||
2025-06-11 13:53:10,729 - DEBUG - 命中: text: [162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoning. In: Proc. of the 31st Int’l Conf. on
|
||
Neural Information Processing Systems (NIPS). Long Beach: C..., 距离: 0.6330105066299438, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,729 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5296636819839478, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,729 - DEBUG - 命中: text: [46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational mapping properties. In: Proc. of the
|
||
28th Pacific Asia Conf. on Language, Information and Computing (P..., 距离: 0.49077513813972473, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,729 - DEBUG - 命中: text: In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on Research and Development
|
||
in Information Retrieval. Paris: CEUR-WS, 2019.
|
||
[133]
|
||
张天成 等: 知识图谱嵌入技术研究综述 ..., 距离: 0.4850553274154663, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,730 - DEBUG - 命中: text: Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for Computing Machinery, 2019.
|
||
96–104. [doi: 10.1145/3289600.3291014]
|
||
[91]
|
||
Jiang TS, Liu TY, Ge T, Sha L,..., 距离: 0.4574166238307953, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,730 - DEBUG - 搜索三元组: 类 part of 知识图 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,746 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%类%知识图%'
|
||
2025-06-11 13:53:10,749 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5143213868141174, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,749 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.5086515545845032, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,749 - DEBUG - 命中: text: [162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoning. In: Proc. of the 31st Int’l Conf. on
|
||
Neural Information Processing Systems (NIPS). Long Beach: C..., 距离: 0.5007524490356445, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,749 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.46770092844963074, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,749 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.46138644218444824, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,749 - DEBUG - 搜索三元组: 可扩展性 神经逻辑模型 大规模知识图谱中 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,766 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%可扩展性%大规模知识图谱中%'
|
||
2025-06-11 13:53:10,768 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.674469530582428, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,768 - DEBUG - 搜索三元组: 认知智能 aggregator 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,784 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%认知智能%知识图谱%'
|
||
2025-06-11 13:53:10,786 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6310679912567139, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,786 - DEBUG - 搜索三元组: 知识图谱 instance of 语义网络 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,802 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%语义网络%'
|
||
2025-06-11 13:53:10,805 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.5649134516716003, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,805 - DEBUG - 搜索三元组: 知识图谱嵌入 studies KGE (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,821 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%KGE%'
|
||
2025-06-11 13:53:10,824 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.7633196115493774, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,824 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.7493860125541687, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,824 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.7469873428344727, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,824 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6985411047935486, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,824 - DEBUG - 命中: text: 最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., 距离: 0.6820932030677795, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,824 - DEBUG - 搜索三元组: graph part of technology that uses Knowledge (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,840 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%graph%Knowledge%'
|
||
2025-06-11 13:53:10,842 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.6605234742164612, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,843 - DEBUG - 命中: text: [46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational mapping properties. In: Proc. of the
|
||
28th Pacific Asia Conf. on Language, Information and Computing (P..., 距离: 0.6288890242576599, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,843 - DEBUG - 命中: text: extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP). Seattle: Association for
|
||
Computational Linguistics (ACL), 2013. 1366–1371.
|
||
[140]
|
||
Han X, Liu ZY, Sun..., 距离: 0.6167539358139038, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,843 - DEBUG - 命中: text: 47(4): 77–83 (in Chinese with English abstract). [doi: 10.19678/j.issn.1000-3428.0057353]
|
||
[98]
|
||
Zhang DX, Yuan B, Wang D, Liu R. Joint semantic relevance learning with text data and graph knowledge..., 距离: 0.6087696552276611, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,843 - DEBUG - 命中: text: [39]
|
||
Mikolov T, Sutskever I, Chen K, Corrado G, Dean J. Distributed representations of words and phrases and their compositionality. In:
|
||
Proc. of the 26th Int’l Conf. on Neural Information Processing ..., 距离: 0.608599841594696, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,843 - DEBUG - 搜索三元组: knowledge <dis> Knowledge models (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,859 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%knowledge%Knowledge models%'
|
||
2025-06-11 13:53:10,861 - DEBUG - 搜索三元组: 动态知识图谱嵌入 subclass of 知识 (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,877 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%动态知识图谱嵌入%知识%'
|
||
2025-06-11 13:53:10,879 - DEBUG - 命中: text: wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. 将在时间 投影到时间特定的超平面 上, 分别得到投影向量 , , .
|
||
|
||
P (h)+ P (r)≈ P (t)
|
||
与transH类似, HyTE期望在时间 处有效的三..., 距离: 0.5689828395843506, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,879 - DEBUG - 命中: text: 表 4 最新的知识图谱嵌入模型总结
|
||
类别 模型 实体嵌入 关系嵌入 评分函数 fr (h , t)
|
||
卷积神经网络
|
||
ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
Mr ∈ Rdw×dh
|
||
(vec(([Mh;Mr] ∗!))W)t
|
||
ConvKB [ 81 ]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
concat(g([h;r;t] ∗!))w..., 距离: 0.5497679710388184, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,879 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5229254364967346, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,879 - DEBUG - 搜索三元组: 知识类型 part of KGE (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,895 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识类型%KGE%'
|
||
2025-06-11 13:53:10,897 - DEBUG - 命中: text: 来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能而需要进一步探索的内部和外部信息.
|
||
● 知识类型: 不同的KGE方法在处理1-1, 1-N, N-1和N-N关系时具有不同的性能, 这表明针对不同类型的
|
||
知识或关系需要设计不同的KGE框架. 然而, ..., 距离: 0.5971621870994568, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,897 - DEBUG - 命中: text: 最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., 距离: 0.564428985118866, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,897 - DEBUG - 搜索三元组: graphs studies knowledge (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,914 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%graphs%knowledge%'
|
||
2025-06-11 13:53:10,916 - DEBUG - 命中: text: in Natural Language Processing (EMNLP). Doha: Association for Computational Linguistics (ACL), 2014. 1591–1601. [doi: 10.3115/
|
||
v1/D14-1167]
|
||
[25]
|
||
Zhong HP, Zhang JW, Wang Z, Wan H, Chen Z. Aligning kno..., 距离: 0.6414145231246948, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,916 - DEBUG - 命中: text: Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B, Guo L. Jointly embedding knowledge graphs and logical rules. In: Proc. of the 2016 Conf. on
|
||
Empiric..., 距离: 0.6265611052513123, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,916 - DEBUG - 命中: text: [105]
|
||
Niu GL, Zhang YF, Li B, Cui P, Liu S, Li JY, Zhang XW. Rule-guided compositional representation learning on knowledge graphs. In:
|
||
Proc. of the 34th AAAI Conf. on Artificial Intelligence (AAAI). ..., 距离: 0.6085627675056458, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,916 - DEBUG - 命中: text: [119]
|
||
Hao YC, Zhang YZ, Liu K, He SZ, Liu ZY, Wu H, Zhao J. An end-to-end model for question answering over knowledge base with
|
||
cross-attention combining global knowledge. In: Proc. of the 55th Annual..., 距离: 0.6082791090011597, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,916 - DEBUG - 命中: text: 47(4): 77–83 (in Chinese with English abstract). [doi: 10.19678/j.issn.1000-3428.0057353]
|
||
[98]
|
||
Zhang DX, Yuan B, Wang D, Liu R. Joint semantic relevance learning with text data and graph knowledge..., 距离: 0.6069682240486145, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 13:53:10,916 - DEBUG - 搜索三元组: graph completion part of knowledge (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,932 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%graph completion%knowledge%'
|
||
2025-06-11 13:53:10,934 - DEBUG - 搜索三元组: Knowledge LinYG, HY Lin J.computer.de (文档: qianru.pdf)
|
||
2025-06-11 13:53:10,950 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%Knowledge%Lin J.computer.de%'
|
||
2025-06-11 13:53:10,951 - INFO - 返回 5 条唯一结果
|
||
2025-06-11 13:53:10,953 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 14:24:55,630 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 14:24:56,348 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 14:24:59,583 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 14:24:59,583 - INFO - 开始融合搜索: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 14:25:00,360 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 14:25:00,453 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 14:25:00,539 - DEBUG - NER 结果: []
|
||
2025-06-11 14:25:00,539 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 14:25:00,539 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 14:25:00,539 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 14:25:00,539 - DEBUG - 提取实体: ['知识', '是', '抽取']
|
||
2025-06-11 14:25:00,539 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 14:25:00,542 - DEBUG - 找到 document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41
|
||
2025-06-11 14:25:00,544 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 14:25:01,874 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 14:25:03,628 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 14:25:03,661 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 14:25:03,855 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 14:25:03,955 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 14:25:04,604 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 14:25:04,604 - DEBUG - 匹配三元组: [{'head': '(Sri)', 'head_type': 'eve', 'type': 'subclass of', 'tail': '的知识', 'tail_type': 'unk'}, {'head': '信息抽取', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '实体识别', 'head_type': 'concept', 'type': 'subclass of', 'tail': '信息抽取', 'tail_type': 'media'}, {'head': '属性抽取', 'head_type': 'concept', 'type': '<misc>', 'tail': '统计机器学习', 'tail_type': 'media'}, {'head': '拼图碎片', 'head_type': 'concept', 'type': '非结构化', 'tail': '信息抽取', 'tail_type': 'media'}]
|
||
2025-06-11 14:25:04,604 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识
|
||
2025-06-11 14:25:04,621 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:04,627 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.5715863704681396
|
||
2025-06-11 14:25:04,627 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.5588797926902771
|
||
2025-06-11 14:25:04,627 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.5362521409988403
|
||
2025-06-11 14:25:04,627 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5207943916320801
|
||
2025-06-11 14:25:04,627 - DEBUG - 融合文本: 什么是知识抽取? 信息抽取 part of 知识图谱
|
||
2025-06-11 14:25:04,644 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:04,646 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.6601064205169678
|
||
2025-06-11 14:25:04,646 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6173519492149353
|
||
2025-06-11 14:25:04,646 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6093563437461853
|
||
2025-06-11 14:25:04,647 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5635331869125366
|
||
2025-06-11 14:25:04,647 - DEBUG - 融合文本: 什么是知识抽取? 实体识别 subclass of 信息抽取
|
||
2025-06-11 14:25:04,663 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:04,666 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.678648054599762
|
||
2025-06-11 14:25:04,666 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.6525882482528687
|
||
2025-06-11 14:25:04,666 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5814113616943359
|
||
2025-06-11 14:25:04,666 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.5588864684104919
|
||
2025-06-11 14:25:04,666 - DEBUG - 融合文本: 什么是知识抽取? 属性抽取 <misc> 统计机器学习
|
||
2025-06-11 14:25:04,683 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:04,685 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.604001522064209
|
||
2025-06-11 14:25:04,685 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.5698158740997314
|
||
2025-06-11 14:25:04,685 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.5510827898979187
|
||
2025-06-11 14:25:04,685 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5068711638450623
|
||
2025-06-11 14:25:04,685 - DEBUG - 融合文本: 什么是知识抽取? 拼图碎片 非结构化 信息抽取
|
||
2025-06-11 14:25:04,701 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:04,703 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6352877616882324
|
||
2025-06-11 14:25:04,703 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.633567214012146
|
||
2025-06-11 14:25:04,704 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.596519947052002
|
||
2025-06-11 14:25:04,704 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5522883534431458
|
||
2025-06-11 14:25:04,704 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 14:25:04,705 - DEBUG - 找到 document_id: 842b6180-667a-4ac8-b051-5c225c859011
|
||
2025-06-11 14:25:04,707 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 14:25:05,048 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 14:25:05,080 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:25:05,308 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 14:25:06,220 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 14:25:12,546 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 14:25:13,365 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 14:25:14,901 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 14:25:15,326 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:25:36,803 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 14:25:36,804 - DEBUG - 匹配三元组: [{'head': 'Knowledge', 'head_type': 'misc', 'type': 'instance of', 'tail': 'natural язык question', 'tail_type': 'eve'}, {'head': 'graph', 'head_type': 'concept', 'type': 'part of KG', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': '限定领 域知识库', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知 识图谱', 'head_type': 'concept', 'type': '知識', 'tail': '知识', 'tail_type': 'media'}, {'head': '开放领域知识图谱问答', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': 'knowledgebase question', 'head_type': 'unk', 'type': 'mainland', 'tail': 'knowledge', 'tail_type': 'loc'}, {'head': 'YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S', 'head_type': 'concept', 'type': 'knowledge of knowledge', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}]
|
||
2025-06-11 14:25:36,804 - DEBUG - 融合文本: 什么是知识抽取? Knowledge instance of natural язык question
|
||
2025-06-11 14:25:36,822 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,825 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.5658652782440186
|
||
2025-06-11 14:25:36,825 - DEBUG - 召回: text=summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional s..., distance=0.5381088256835938
|
||
2025-06-11 14:25:36,825 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.5340774655342102
|
||
2025-06-11 14:25:36,826 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.5297415256500244
|
||
2025-06-11 14:25:36,826 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.5274895429611206
|
||
2025-06-11 14:25:36,826 - DEBUG - 融合文本: 什么是知识抽取? graph part of KG knowledge
|
||
2025-06-11 14:25:36,842 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,845 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.5932672023773193
|
||
2025-06-11 14:25:36,845 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.5891145467758179
|
||
2025-06-11 14:25:36,845 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.5871264338493347
|
||
2025-06-11 14:25:36,845 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.582119345664978
|
||
2025-06-11 14:25:36,845 - DEBUG - 召回: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.5691097974777222
|
||
2025-06-11 14:25:36,845 - DEBUG - 融合文本: 什么是知识抽取? 限定领 域知识库 subclass of 知识
|
||
2025-06-11 14:25:36,862 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,864 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.5553375482559204
|
||
2025-06-11 14:25:36,864 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.5452382564544678
|
||
2025-06-11 14:25:36,864 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.5440995097160339
|
||
2025-06-11 14:25:36,864 - DEBUG - 召回: text=summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional s..., distance=0.5370678305625916
|
||
2025-06-11 14:25:36,864 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.5209176540374756
|
||
2025-06-11 14:25:36,864 - DEBUG - 融合文本: 什么是知识抽取? 知 识图谱 知識 知识
|
||
2025-06-11 14:25:36,881 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,883 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6326132416725159
|
||
2025-06-11 14:25:36,883 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6090805530548096
|
||
2025-06-11 14:25:36,883 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6073380708694458
|
||
2025-06-11 14:25:36,883 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.602685809135437
|
||
2025-06-11 14:25:36,883 - DEBUG - 召回: text=神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-..., distance=0.5783995389938354
|
||
2025-06-11 14:25:36,883 - DEBUG - 融合文本: 什么是知识抽取? 开放领域知识图谱问答 subclass of 知识
|
||
2025-06-11 14:25:36,900 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,902 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6502188444137573
|
||
2025-06-11 14:25:36,902 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6050256490707397
|
||
2025-06-11 14:25:36,902 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.59820955991745
|
||
2025-06-11 14:25:36,902 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.5898182392120361
|
||
2025-06-11 14:25:36,902 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.5803160071372986
|
||
2025-06-11 14:25:36,902 - DEBUG - 融合文本: 什么是知识抽取? knowledgebase question mainland knowledge
|
||
2025-06-11 14:25:36,919 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,921 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.5910511612892151
|
||
2025-06-11 14:25:36,921 - DEBUG - 召回: text=summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional s..., distance=0.5848156809806824
|
||
2025-06-11 14:25:36,921 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.5661318302154541
|
||
2025-06-11 14:25:36,921 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.5638113617897034
|
||
2025-06-11 14:25:36,921 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.5621007680892944
|
||
2025-06-11 14:25:36,921 - DEBUG - 融合文本: 什么是知识抽取? YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge
|
||
2025-06-11 14:25:36,939 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,941 - DEBUG - 召回: text=[101] XIONG W H, YU M, CHANG S Y, et al. Improving
|
||
question answering over incomplete KBs with knowl..., distance=0.6745944619178772
|
||
2025-06-11 14:25:36,941 - DEBUG - 召回: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.6070694327354431
|
||
2025-06-11 14:25:36,941 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6050748825073242
|
||
2025-06-11 14:25:36,941 - DEBUG - 召回: text=rich question sets for QA evaluation[C]//Proceedings of
|
||
the 2016 Conference on Empirical Methods in ..., distance=0.5835307240486145
|
||
2025-06-11 14:25:36,941 - DEBUG - 召回: text=[80] HE X D, GOLUB D. Character- level question answering
|
||
with attention[C]//Proceedings of the 2016..., distance=0.5832056999206543
|
||
2025-06-11 14:25:36,941 - DEBUG - 融合文本: 什么是知识抽取? graphs studies knowledge
|
||
2025-06-11 14:25:36,957 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:25:36,959 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.5923877358436584
|
||
2025-06-11 14:25:36,959 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.5871415734291077
|
||
2025-06-11 14:25:36,959 - DEBUG - 召回: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.5793519616127014
|
||
2025-06-11 14:25:36,959 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.5766763687133789
|
||
2025-06-11 14:25:36,959 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.5599706172943115
|
||
2025-06-11 14:25:36,960 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 14:25:36,961 - DEBUG - 找到 document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5
|
||
2025-06-11 14:25:36,964 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 14:25:37,271 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 14:25:37,303 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 14:25:43,877 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 14:25:46,563 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 14:25:48,990 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:25:50,058 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 14:25:50,446 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 14:26:22,220 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 14:26:22,221 - DEBUG - 匹配三元组: [{'head': 'graph', 'head_type': 'concept', 'type': 'part of technology that uses', 'tail': 'Knowledge', 'tail_type': 'media'}, {'head': 'knowledge', 'head_type': 'per', 'type': '<dis>', 'tail': 'Knowledge models', 'tail_type': 'unk'}, {'head': '动态知识图谱嵌入', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知识类型', 'head_type': 'concept', 'type': 'part of', 'tail': 'KGE', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graph completion', 'head_type': 'concept', 'type': 'part of', 'tail': 'knowledge', 'tail_type': 'media'}, {'head': 'Knowledge', 'head_type': 'media', 'type': 'LinYG, HY', 'tail': 'Lin J.computer.de', 'tail_type': 'eve'}]
|
||
2025-06-11 14:26:22,221 - DEBUG - 融合文本: 什么是知识抽取? graph part of technology that uses Knowledge
|
||
2025-06-11 14:26:22,238 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,242 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.621277928352356
|
||
2025-06-11 14:26:22,242 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6089928150177002
|
||
2025-06-11 14:26:22,242 - DEBUG - 召回: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.6067556142807007
|
||
2025-06-11 14:26:22,242 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.5940187573432922
|
||
2025-06-11 14:26:22,242 - DEBUG - 召回: text=[39]
|
||
Mikolov T, Sutskever I, Chen K, Corrado G, Dean J. Distributed representations of words and phr..., distance=0.5789708495140076
|
||
2025-06-11 14:26:22,242 - DEBUG - 融合文本: 什么是知识抽取? knowledge <dis> Knowledge models
|
||
2025-06-11 14:26:22,259 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,261 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.5759987235069275
|
||
2025-06-11 14:26:22,261 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.541093111038208
|
||
2025-06-11 14:26:22,261 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.5383037328720093
|
||
2025-06-11 14:26:22,261 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.5331267714500427
|
||
2025-06-11 14:26:22,261 - DEBUG - 召回: text=[162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoni..., distance=0.5298194885253906
|
||
2025-06-11 14:26:22,261 - DEBUG - 融合文本: 什么是知识抽取? 动态知识图谱嵌入 subclass of 知识
|
||
2025-06-11 14:26:22,278 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,280 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6323738098144531
|
||
2025-06-11 14:26:22,280 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6004970669746399
|
||
2025-06-11 14:26:22,280 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.5952354669570923
|
||
2025-06-11 14:26:22,280 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.5894348621368408
|
||
2025-06-11 14:26:22,281 - DEBUG - 召回: text=wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. ..., distance=0.5724958777427673
|
||
2025-06-11 14:26:22,281 - DEBUG - 融合文本: 什么是知识抽取? 知识类型 part of KGE
|
||
2025-06-11 14:26:22,297 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,299 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6080607175827026
|
||
2025-06-11 14:26:22,299 - DEBUG - 召回: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.606679379940033
|
||
2025-06-11 14:26:22,299 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.589964747428894
|
||
2025-06-11 14:26:22,299 - DEBUG - 召回: text=来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能..., distance=0.5895588994026184
|
||
2025-06-11 14:26:22,299 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.5873573422431946
|
||
2025-06-11 14:26:22,299 - DEBUG - 融合文本: 什么是知识抽取? graphs studies knowledge
|
||
2025-06-11 14:26:22,316 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,318 - DEBUG - 召回: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.6198721528053284
|
||
2025-06-11 14:26:22,318 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6119018197059631
|
||
2025-06-11 14:26:22,318 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6016932129859924
|
||
2025-06-11 14:26:22,318 - DEBUG - 召回: text=Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B,..., distance=0.5992531776428223
|
||
2025-06-11 14:26:22,318 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.5978482961654663
|
||
2025-06-11 14:26:22,318 - DEBUG - 融合文本: 什么是知识抽取? graph completion part of knowledge
|
||
2025-06-11 14:26:22,334 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,337 - DEBUG - 召回: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.6126210689544678
|
||
2025-06-11 14:26:22,337 - DEBUG - 召回: text=[39]
|
||
Mikolov T, Sutskever I, Chen K, Corrado G, Dean J. Distributed representations of words and phr..., distance=0.6015218496322632
|
||
2025-06-11 14:26:22,337 - DEBUG - 召回: text=[46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational ma..., distance=0.5937269926071167
|
||
2025-06-11 14:26:22,337 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.5834683179855347
|
||
2025-06-11 14:26:22,337 - DEBUG - 召回: text=Machine Learning (ICML). Bellevue: Omnipress, 2011. 809–816.
|
||
[18]
|
||
Nickel M, Tresp V, Kriegel HP. Fac..., distance=0.582772433757782
|
||
2025-06-11 14:26:22,337 - DEBUG - 融合文本: 什么是知识抽取? Knowledge LinYG, HY Lin J.computer.de
|
||
2025-06-11 14:26:22,354 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:26:22,356 - DEBUG - 召回: text=In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on..., distance=0.5860868096351624
|
||
2025-06-11 14:26:22,356 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.5860285758972168
|
||
2025-06-11 14:26:22,356 - DEBUG - 召回: text=Machine Learning (ICML). Bellevue: Omnipress, 2011. 809–816.
|
||
[18]
|
||
Nickel M, Tresp V, Kriegel HP. Fac..., distance=0.5692107081413269
|
||
2025-06-11 14:26:22,356 - DEBUG - 召回: text=[162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoni..., distance=0.5576295256614685
|
||
2025-06-11 14:26:22,356 - DEBUG - 召回: text=Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B,..., distance=0.5514546036720276
|
||
2025-06-11 14:26:22,356 - DEBUG - 去重后结果数量: 30
|
||
2025-06-11 14:26:22,356 - DEBUG - 开始重排序
|
||
2025-06-11 14:26:23,396 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.465418, source=fused_triplet_(Sri)_subclass of_的知识
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., rerank_score=0.126246, source=fused_triplet_知识类型_part of_KGE
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P, LIN J. Strong baselines for simple
|
||
question answering over knowledge graphs with and without
|
||
neura..., rerank_score=0.062789, source=fused_triplet_YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S_knowledge of knowledge_knowledge
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.058777, source=fused_triplet_graph_part of technology that uses_Knowledge
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP). Seattle: Association for
|
||
Computational Linguistics (ACL), 2013. 1366–1371.
|
||
[140]
|
||
Han X, Liu ZY, Sun..., rerank_score=0.040999, source=fused_triplet_graph_part of technology that uses_Knowledge
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.037538, source=fused_triplet_graph_part of technology that uses_Knowledge
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.030968, source=fused_triplet_(Sri)_subclass of_的知识
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.029257, source=fused_triplet_Knowledge_instance of_natural язык question
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on Research and Development
|
||
in Information Retrieval. Paris: CEUR-WS, 2019.
|
||
[133]
|
||
张天成 等: 知识图谱嵌入技术研究综述 ..., rerank_score=0.015306, source=fused_triplet_Knowledge_LinYG, HY_Lin J.computer.de
|
||
2025-06-11 14:26:24,124 - DEBUG - 重排序结果: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., rerank_score=0.013956, source=fused_triplet_graph_part of KG_knowledge
|
||
2025-06-11 14:26:24,124 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 14:26:24,837 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.5588797926902771, rerank_score=0.4654178511875752
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 2: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.606679379940033, rerank_score=0.12624557801984876
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 3: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.6070694327354431, rerank_score=0.06278920859705135
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 4: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6089928150177002, rerank_score=0.05877655584806683
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 5: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.6067556142807007, rerank_score=0.04099902718739302
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 6: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.5940187573432922, rerank_score=0.03753800746527978
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 7: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5207943916320801, rerank_score=0.030967515262747533
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 8: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.5297415256500244, rerank_score=0.029256709498098055
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 9: text=In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on..., distance=0.5860868096351624, rerank_score=0.015306354560694806
|
||
2025-06-11 14:26:24,838 - DEBUG - 排序结果 10: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.5691097974777222, rerank_score=0.013955710398273338
|
||
2025-06-11 14:33:29,192 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 14:33:29,814 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 14:33:33,072 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 14:33:33,072 - INFO - 开始融合搜索: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 14:33:33,875 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 14:33:33,968 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 14:33:34,056 - DEBUG - NER 结果: []
|
||
2025-06-11 14:33:34,057 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 14:33:34,057 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 14:33:34,057 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 14:33:34,057 - DEBUG - 提取实体: ['知识', '是', '抽取']
|
||
2025-06-11 14:33:34,057 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 14:33:34,059 - DEBUG - 找到 document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41
|
||
2025-06-11 14:33:34,061 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 14:33:35,387 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 14:33:37,124 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 14:33:37,156 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 14:33:37,350 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 14:33:37,447 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 14:33:38,088 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 14:33:38,088 - DEBUG - 匹配三元组: [{'head': '(Sri)', 'head_type': 'eve', 'type': 'subclass of', 'tail': '的知识', 'tail_type': 'unk'}, {'head': '信息抽取', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '实体识别', 'head_type': 'concept', 'type': 'subclass of', 'tail': '信息抽取', 'tail_type': 'media'}, {'head': '属性抽取', 'head_type': 'concept', 'type': '<misc>', 'tail': '统计机器学习', 'tail_type': 'media'}, {'head': '拼图碎片', 'head_type': 'concept', 'type': '非结构化', 'tail': '信息抽取', 'tail_type': 'media'}]
|
||
2025-06-11 14:33:38,088 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取
|
||
2025-06-11 14:33:38,108 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:33:38,115 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.6537182331085205
|
||
2025-06-11 14:33:38,115 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6507815718650818
|
||
2025-06-11 14:33:38,115 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6018767356872559
|
||
2025-06-11 14:33:38,115 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5734187960624695
|
||
2025-06-11 14:33:38,115 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 14:33:38,116 - DEBUG - 找到 document_id: 842b6180-667a-4ac8-b051-5c225c859011
|
||
2025-06-11 14:33:38,119 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 14:33:38,456 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 14:33:38,490 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:33:38,715 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 14:33:39,609 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 14:33:45,834 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 14:33:46,635 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 14:33:48,148 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 14:33:48,564 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:34:09,704 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 14:34:09,704 - DEBUG - 匹配三元组: [{'head': 'Knowledge', 'head_type': 'misc', 'type': 'instance of', 'tail': 'natural язык question', 'tail_type': 'eve'}, {'head': 'graph', 'head_type': 'concept', 'type': 'part of KG', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': '限定领 域知识库', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知 识图谱', 'head_type': 'concept', 'type': '知識', 'tail': '知识', 'tail_type': 'media'}, {'head': '开放领域知识图谱问答', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': 'knowledgebase question', 'head_type': 'unk', 'type': 'mainland', 'tail': 'knowledge', 'tail_type': 'loc'}, {'head': 'YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S', 'head_type': 'concept', 'type': 'knowledge of knowledge', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}]
|
||
2025-06-11 14:34:09,704 - DEBUG - 融合文本: 什么是知识抽取? Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge
|
||
2025-06-11 14:34:09,723 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:34:09,727 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6718558669090271
|
||
2025-06-11 14:34:09,727 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6459053754806519
|
||
2025-06-11 14:34:09,727 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6419963240623474
|
||
2025-06-11 14:34:09,727 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6287973523139954
|
||
2025-06-11 14:34:09,727 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6190773248672485
|
||
2025-06-11 14:34:09,727 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 14:34:09,729 - DEBUG - 找到 document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5
|
||
2025-06-11 14:34:09,731 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 14:34:10,033 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 14:34:10,065 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 14:34:16,517 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 14:34:19,158 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 14:34:21,545 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:34:22,594 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 14:34:22,976 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 14:34:54,180 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 14:34:54,180 - DEBUG - 匹配三元组: [{'head': 'graph', 'head_type': 'concept', 'type': 'part of technology that uses', 'tail': 'Knowledge', 'tail_type': 'media'}, {'head': 'knowledge', 'head_type': 'per', 'type': '<dis>', 'tail': 'Knowledge models', 'tail_type': 'unk'}, {'head': '动态知识图谱嵌入', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知识类型', 'head_type': 'concept', 'type': 'part of', 'tail': 'KGE', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graph completion', 'head_type': 'concept', 'type': 'part of', 'tail': 'knowledge', 'tail_type': 'media'}, {'head': 'Knowledge', 'head_type': 'media', 'type': 'LinYG, HY', 'tail': 'Lin J.computer.de', 'tail_type': 'eve'}]
|
||
2025-06-11 14:34:54,180 - DEBUG - 融合文本: 什么是知识抽取? graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de
|
||
2025-06-11 14:34:54,199 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:34:54,202 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6823908090591431
|
||
2025-06-11 14:34:54,202 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6713353395462036
|
||
2025-06-11 14:34:54,202 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6633532643318176
|
||
2025-06-11 14:34:54,203 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6368440389633179
|
||
2025-06-11 14:34:54,203 - DEBUG - 召回: text=来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能..., distance=0.6136632561683655
|
||
2025-06-11 14:34:54,203 - DEBUG - 去重后结果数量: 14
|
||
2025-06-11 14:34:54,203 - DEBUG - 开始重排序
|
||
2025-06-11 14:34:55,153 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.464932, source=fused_triplets_5
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.058561, source=fused_triplets_7
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.037468, source=fused_triplets_7
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.030968, source=fused_triplets_5
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.029257, source=fused_triplets_8
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.011288, source=fused_triplets_7
|
||
2025-06-11 14:34:55,759 - DEBUG - 重排序结果: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., rerank_score=0.010052, source=fused_triplets_8
|
||
2025-06-11 14:34:55,760 - DEBUG - 重排序结果: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., rerank_score=0.006413, source=fused_triplets_8
|
||
2025-06-11 14:34:55,760 - DEBUG - 重排序结果: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., rerank_score=0.003608, source=fused_triplets_8
|
||
2025-06-11 14:34:55,760 - DEBUG - 重排序结果: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., rerank_score=0.003160, source=fused_triplets_5
|
||
2025-06-11 14:34:55,760 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 14:34:56,704 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6507815718650818, rerank_score=0.46493193870320343
|
||
2025-06-11 14:34:56,706 - DEBUG - 排序结果 2: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6633532643318176, rerank_score=0.058560826873748875
|
||
2025-06-11 14:34:56,708 - DEBUG - 排序结果 3: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6713353395462036, rerank_score=0.0374675068985736
|
||
2025-06-11 14:34:56,710 - DEBUG - 排序结果 4: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5734187960624695, rerank_score=0.030967515262747533
|
||
2025-06-11 14:34:56,711 - DEBUG - 排序结果 5: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6459053754806519, rerank_score=0.029256709498098055
|
||
2025-06-11 14:34:56,711 - DEBUG - 排序结果 6: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6823908090591431, rerank_score=0.011288073899230987
|
||
2025-06-11 14:34:56,711 - DEBUG - 排序结果 7: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6718558669090271, rerank_score=0.01005236865796813
|
||
2025-06-11 14:34:56,711 - DEBUG - 排序结果 8: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6190773248672485, rerank_score=0.006413163741325347
|
||
2025-06-11 14:34:56,711 - DEBUG - 排序结果 9: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6287973523139954, rerank_score=0.003607616803253527
|
||
2025-06-11 14:34:56,712 - DEBUG - 排序结果 10: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6018767356872559, rerank_score=0.003160352815071338
|
||
2025-06-11 14:54:24,342 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 14:54:25,019 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 14:54:28,114 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 14:54:28,114 - INFO - 开始融合搜索: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 14:54:28,958 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 14:54:29,062 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 14:54:29,136 - DEBUG - NER 结果: []
|
||
2025-06-11 14:54:29,137 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 14:54:29,137 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 14:54:29,137 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 14:54:29,137 - DEBUG - 提取实体: ['知识', '是', '抽取']
|
||
2025-06-11 14:54:29,137 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 14:54:29,140 - DEBUG - 找到 document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41
|
||
2025-06-11 14:54:29,142 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 14:54:30,468 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 14:54:32,206 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 14:54:32,238 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 14:54:32,433 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 14:54:32,529 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 14:54:33,176 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 14:54:33,176 - DEBUG - 匹配三元组: [{'head': '(Sri)', 'head_type': 'eve', 'type': 'subclass of', 'tail': '的知识', 'tail_type': 'unk'}, {'head': '信息抽取', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '实体识别', 'head_type': 'concept', 'type': 'subclass of', 'tail': '信息抽取', 'tail_type': 'media'}, {'head': '属性抽取', 'head_type': 'concept', 'type': '<misc>', 'tail': '统计机器学习', 'tail_type': 'media'}, {'head': '拼图碎片', 'head_type': 'concept', 'type': '非结构化', 'tail': '信息抽取', 'tail_type': 'media'}]
|
||
2025-06-11 14:54:33,177 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取
|
||
2025-06-11 14:54:33,196 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:54:33,203 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.6537182331085205
|
||
2025-06-11 14:54:33,203 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6507815718650818
|
||
2025-06-11 14:54:33,203 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6018767356872559
|
||
2025-06-11 14:54:33,203 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5734187960624695
|
||
2025-06-11 14:54:33,203 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 14:54:33,204 - DEBUG - 找到 document_id: 842b6180-667a-4ac8-b051-5c225c859011
|
||
2025-06-11 14:54:33,207 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 14:54:33,545 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 14:54:33,579 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:54:33,804 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 14:54:34,696 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 14:54:40,903 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 14:54:41,704 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 14:54:43,201 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 14:54:43,614 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:55:04,675 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 14:55:04,675 - DEBUG - 匹配三元组: [{'head': 'Knowledge', 'head_type': 'misc', 'type': 'instance of', 'tail': 'natural язык question', 'tail_type': 'eve'}, {'head': 'graph', 'head_type': 'concept', 'type': 'part of KG', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': '限定领 域知识库', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知 识图谱', 'head_type': 'concept', 'type': '知識', 'tail': '知识', 'tail_type': 'media'}, {'head': '开放领域知识图谱问答', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': 'knowledgebase question', 'head_type': 'unk', 'type': 'mainland', 'tail': 'knowledge', 'tail_type': 'loc'}, {'head': 'YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S', 'head_type': 'concept', 'type': 'knowledge of knowledge', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}]
|
||
2025-06-11 14:55:04,675 - DEBUG - 融合文本: 什么是知识抽取? Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge
|
||
2025-06-11 14:55:04,694 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:55:04,698 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6718558669090271
|
||
2025-06-11 14:55:04,698 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6459053754806519
|
||
2025-06-11 14:55:04,698 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6419963240623474
|
||
2025-06-11 14:55:04,698 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6287973523139954
|
||
2025-06-11 14:55:04,698 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6190773248672485
|
||
2025-06-11 14:55:04,698 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 14:55:04,700 - DEBUG - 找到 document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5
|
||
2025-06-11 14:55:04,702 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 14:55:05,010 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 14:55:05,042 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 14:55:11,540 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 14:55:14,185 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 14:55:16,583 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 14:55:17,633 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 14:55:18,017 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 14:55:49,313 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 14:55:49,314 - DEBUG - 匹配三元组: [{'head': 'graph', 'head_type': 'concept', 'type': 'part of technology that uses', 'tail': 'Knowledge', 'tail_type': 'media'}, {'head': 'knowledge', 'head_type': 'per', 'type': '<dis>', 'tail': 'Knowledge models', 'tail_type': 'unk'}, {'head': '动态知识图谱嵌入', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知识类型', 'head_type': 'concept', 'type': 'part of', 'tail': 'KGE', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graph completion', 'head_type': 'concept', 'type': 'part of', 'tail': 'knowledge', 'tail_type': 'media'}, {'head': 'Knowledge', 'head_type': 'media', 'type': 'LinYG, HY', 'tail': 'Lin J.computer.de', 'tail_type': 'eve'}]
|
||
2025-06-11 14:55:49,314 - DEBUG - 融合文本: 什么是知识抽取? graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de
|
||
2025-06-11 14:55:49,332 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 14:55:49,336 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6823908090591431
|
||
2025-06-11 14:55:49,336 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6713353395462036
|
||
2025-06-11 14:55:49,336 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6633532643318176
|
||
2025-06-11 14:55:49,336 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6368440389633179
|
||
2025-06-11 14:55:49,336 - DEBUG - 召回: text=来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能..., distance=0.6136632561683655
|
||
2025-06-11 14:55:49,336 - DEBUG - 去重后结果数量: 14
|
||
2025-06-11 14:55:49,336 - DEBUG - 开始重排序
|
||
2025-06-11 14:55:50,298 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.464932, source=fused_triplets_5
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.058561, source=fused_triplets_7
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.037468, source=fused_triplets_7
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.030968, source=fused_triplets_5
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.029257, source=fused_triplets_8
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.011288, source=fused_triplets_7
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., rerank_score=0.010052, source=fused_triplets_8
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., rerank_score=0.006413, source=fused_triplets_8
|
||
2025-06-11 14:55:50,938 - DEBUG - 重排序结果: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., rerank_score=0.003608, source=fused_triplets_8
|
||
2025-06-11 14:55:50,939 - DEBUG - 重排序结果: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., rerank_score=0.003160, source=fused_triplets_5
|
||
2025-06-11 14:55:50,939 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 14:55:51,625 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6507815718650818, rerank_score=0.46493193870320343
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 2: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6633532643318176, rerank_score=0.058560826873748875
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 3: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6713353395462036, rerank_score=0.0374675068985736
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 4: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5734187960624695, rerank_score=0.030967515262747533
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 5: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6459053754806519, rerank_score=0.029256709498098055
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 6: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6823908090591431, rerank_score=0.011288073899230987
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 7: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6718558669090271, rerank_score=0.01005236865796813
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 8: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6190773248672485, rerank_score=0.006413163741325347
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 9: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6287973523139954, rerank_score=0.003607616803253527
|
||
2025-06-11 14:55:51,626 - DEBUG - 排序结果 10: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6018767356872559, rerank_score=0.003160352815071338
|
||
2025-06-11 15:05:45,756 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:05:46,392 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 15:05:49,451 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:05:49,451 - INFO - 开始融合搜索: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 15:05:50,228 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 15:05:50,321 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 15:05:50,364 - DEBUG - NER 结果: []
|
||
2025-06-11 15:05:50,364 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 15:05:50,364 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 15:05:50,364 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 15:05:50,364 - DEBUG - 提取实体: ['知识', '是', '抽取']
|
||
2025-06-11 15:05:50,364 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 15:05:50,366 - DEBUG - 找到 document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41
|
||
2025-06-11 15:05:50,368 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 15:05:51,661 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 15:05:53,377 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 15:05:53,409 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 15:05:53,600 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 15:05:53,696 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 15:05:54,337 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 15:05:54,337 - DEBUG - 匹配三元组: [{'head': '(Sri)', 'head_type': 'eve', 'type': 'subclass of', 'tail': '的知识', 'tail_type': 'unk'}, {'head': '信息抽取', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '实体识别', 'head_type': 'concept', 'type': 'subclass of', 'tail': '信息抽取', 'tail_type': 'media'}, {'head': '属性抽取', 'head_type': 'concept', 'type': '<misc>', 'tail': '统计机器学习', 'tail_type': 'media'}, {'head': '拼图碎片', 'head_type': 'concept', 'type': '非结构化', 'tail': '信息抽取', 'tail_type': 'media'}]
|
||
2025-06-11 15:05:54,337 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取
|
||
2025-06-11 15:05:54,355 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 15:05:54,361 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.6537182331085205
|
||
2025-06-11 15:05:54,361 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6507815718650818
|
||
2025-06-11 15:05:54,361 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6018767356872559
|
||
2025-06-11 15:05:54,361 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5734187960624695
|
||
2025-06-11 15:05:54,361 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 15:05:54,363 - DEBUG - 找到 document_id: 842b6180-667a-4ac8-b051-5c225c859011
|
||
2025-06-11 15:05:54,365 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 15:05:54,701 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 15:05:54,734 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 15:05:54,958 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 15:05:55,848 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:06:02,079 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 15:06:02,878 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 15:06:04,378 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 15:06:04,793 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 15:06:25,935 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 15:06:25,935 - DEBUG - 匹配三元组: [{'head': 'Knowledge', 'head_type': 'misc', 'type': 'instance of', 'tail': 'natural язык question', 'tail_type': 'eve'}, {'head': 'graph', 'head_type': 'concept', 'type': 'part of KG', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': '限定领 域知识库', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知 识图谱', 'head_type': 'concept', 'type': '知識', 'tail': '知识', 'tail_type': 'media'}, {'head': '开放领域知识图谱问答', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': 'knowledgebase question', 'head_type': 'unk', 'type': 'mainland', 'tail': 'knowledge', 'tail_type': 'loc'}, {'head': 'YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S', 'head_type': 'concept', 'type': 'knowledge of knowledge', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}]
|
||
2025-06-11 15:06:25,935 - DEBUG - 融合文本: 什么是知识抽取? Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge
|
||
2025-06-11 15:06:25,954 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6718558669090271
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6459053754806519
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6419963240623474
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6287973523139954
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6190773248672485
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=[101] XIONG W H, YU M, CHANG S Y, et al. Improving
|
||
question answering over incomplete KBs with knowl..., distance=0.6180056929588318
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional s..., distance=0.6133151054382324
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-..., distance=0.609727680683136
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.5877428650856018
|
||
2025-06-11 15:06:25,959 - DEBUG - 召回: text=MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
..., distance=0.579315185546875
|
||
2025-06-11 15:06:25,959 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 15:06:25,961 - DEBUG - 找到 document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5
|
||
2025-06-11 15:06:25,963 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 15:06:26,267 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 15:06:26,299 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 15:06:32,783 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 15:06:35,430 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 15:06:37,826 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 15:06:38,882 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 15:06:39,265 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 15:07:10,585 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 15:07:10,586 - DEBUG - 匹配三元组: [{'head': 'graph', 'head_type': 'concept', 'type': 'part of technology that uses', 'tail': 'Knowledge', 'tail_type': 'media'}, {'head': 'knowledge', 'head_type': 'per', 'type': '<dis>', 'tail': 'Knowledge models', 'tail_type': 'unk'}, {'head': '动态知识图谱嵌入', 'head_type': 'media', 'type': 'subclass of', 'tail': '知识', 'tail_type': 'concept'}, {'head': '知识类型', 'head_type': 'concept', 'type': 'part of', 'tail': 'KGE', 'tail_type': 'misc'}, {'head': 'graphs', 'head_type': 'concept', 'type': 'studies', 'tail': 'knowledge', 'tail_type': 'misc'}, {'head': 'graph completion', 'head_type': 'concept', 'type': 'part of', 'tail': 'knowledge', 'tail_type': 'media'}, {'head': 'Knowledge', 'head_type': 'media', 'type': 'LinYG, HY', 'tail': 'Lin J.computer.de', 'tail_type': 'eve'}]
|
||
2025-06-11 15:07:10,586 - DEBUG - 融合文本: 什么是知识抽取? graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de
|
||
2025-06-11 15:07:10,604 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 15:07:10,608 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6823908090591431
|
||
2025-06-11 15:07:10,608 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6713353395462036
|
||
2025-06-11 15:07:10,608 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6633532643318176
|
||
2025-06-11 15:07:10,608 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6368440389633179
|
||
2025-06-11 15:07:10,608 - DEBUG - 召回: text=来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能..., distance=0.6136632561683655
|
||
2025-06-11 15:07:10,609 - DEBUG - 召回: text=的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低..., distance=0.605804443359375
|
||
2025-06-11 15:07:10,609 - DEBUG - 召回: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.5998020768165588
|
||
2025-06-11 15:07:10,609 - DEBUG - 召回: text=Machine Learning (ICML). Bellevue: Omnipress, 2011. 809–816.
|
||
[18]
|
||
Nickel M, Tresp V, Kriegel HP. Fac..., distance=0.5978930592536926
|
||
2025-06-11 15:07:10,609 - DEBUG - 召回: text=[39]
|
||
Mikolov T, Sutskever I, Chen K, Corrado G, Dean J. Distributed representations of words and phr..., distance=0.593865156173706
|
||
2025-06-11 15:07:10,609 - DEBUG - 召回: text=的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[28]、
|
||
ATEKE[101]等.
|
||
4.3 逻辑规则
|
||
∀x;y:HasWi f e(x;y)⇒..., distance=0.5886738896369934
|
||
2025-06-11 15:07:10,609 - DEBUG - 去重后结果数量: 24
|
||
2025-06-11 15:07:10,609 - DEBUG - 开始重排序
|
||
2025-06-11 15:07:11,542 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 15:07:12,252 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.465539, source=fused_triplets_5
|
||
2025-06-11 15:07:12,252 - DEBUG - 重排序结果: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., rerank_score=0.126030, source=fused_triplets_7
|
||
2025-06-11 15:07:12,252 - DEBUG - 重排序结果: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P, LIN J. Strong baselines for simple
|
||
question answering over knowledge graphs with and without
|
||
neura..., rerank_score=0.062674, source=fused_triplets_8
|
||
2025-06-11 15:07:12,252 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.058346, source=fused_triplets_7
|
||
2025-06-11 15:07:12,252 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.037468, source=fused_triplets_7
|
||
2025-06-11 15:07:12,253 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.030968, source=fused_triplets_5
|
||
2025-06-11 15:07:12,253 - DEBUG - 重排序结果: text=MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., rerank_score=0.029817, source=fused_triplets_8
|
||
2025-06-11 15:07:12,253 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.029368, source=fused_triplets_8
|
||
2025-06-11 15:07:12,253 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.011288, source=fused_triplets_7
|
||
2025-06-11 15:07:12,253 - DEBUG - 重排序结果: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., rerank_score=0.010052, source=fused_triplets_8
|
||
2025-06-11 15:07:12,253 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 15:07:13,113 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6507815718650818, rerank_score=0.4655393396013304
|
||
2025-06-11 15:07:13,113 - DEBUG - 排序结果 2: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.5998020768165588, rerank_score=0.12603029065187174
|
||
2025-06-11 15:07:13,113 - DEBUG - 排序结果 3: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.5877428650856018, rerank_score=0.0626743716883518
|
||
2025-06-11 15:07:13,113 - DEBUG - 排序结果 4: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.6633532643318176, rerank_score=0.05834584061168106
|
||
2025-06-11 15:07:13,113 - DEBUG - 排序结果 5: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6713353395462036, rerank_score=0.0374675068985736
|
||
2025-06-11 15:07:13,113 - DEBUG - 排序结果 6: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.5734187960624695, rerank_score=0.030967515262747533
|
||
2025-06-11 15:07:13,114 - DEBUG - 排序结果 7: text=MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
..., distance=0.579315185546875, rerank_score=0.029816541143800022
|
||
2025-06-11 15:07:13,114 - DEBUG - 排序结果 8: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6459053754806519, rerank_score=0.02936785418122852
|
||
2025-06-11 15:07:13,114 - DEBUG - 排序结果 9: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6823908090591431, rerank_score=0.011288073899230987
|
||
2025-06-11 15:07:13,114 - DEBUG - 排序结果 10: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.6718558669090271, rerank_score=0.01005236865796813
|
||
2025-06-11 15:10:39,478 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:10:40,096 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 15:10:43,398 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:10:43,398 - INFO - 开始融合搜索: query=知识图谱构建需要什么技术?, userid=testuser1, db_type=textdb
|
||
2025-06-11 15:10:44,214 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 15:10:44,304 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 15:10:44,389 - DEBUG - NER 结果: []
|
||
2025-06-11 15:10:44,389 - DEBUG - 合并连续名词: 知识图谱, 子词: ['知识', '图谱']
|
||
2025-06-11 15:10:44,389 - DEBUG - 合并连续名词: 技术, 子词: ['技术']
|
||
2025-06-11 15:10:44,389 - DEBUG - 连续名词子词集合: {'图谱', '技术', '知识'}
|
||
2025-06-11 15:10:44,389 - INFO - 从查询中提取到 4 个唯一实体: ['知识图谱', '技术', '构建', '需要']
|
||
2025-06-11 15:10:44,389 - DEBUG - 提取实体: ['知识图谱', '技术', '构建', '需要']
|
||
2025-06-11 15:10:44,389 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 15:10:44,392 - DEBUG - 找到 document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41
|
||
2025-06-11 15:10:44,394 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 15:10:44,536 - DEBUG - 匹配三元组: 知识图谱 - Web 3.0 - 万维网 (entity=知识图谱, head_sim=1.00, tail_sim=0.43)
|
||
2025-06-11 15:10:44,698 - DEBUG - 匹配三元组: 模式层 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.46, tail_sim=1.00)
|
||
2025-06-11 15:10:44,732 - DEBUG - 匹配三元组: 结构化知识库 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:10:44,830 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=知识图谱, head_sim=0.57, tail_sim=1.00)
|
||
2025-06-11 15:10:45,251 - DEBUG - 匹配三元组: 外部知识库 - 结构化数据 - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:10:45,444 - DEBUG - 匹配三元组: 上下位关系 - 阿里巴巴 - 图谱 (entity=知识图谱, head_sim=0.42, tail_sim=0.82)
|
||
2025-06-11 15:10:45,511 - DEBUG - 匹配三元组: 知识图谱 - location - 城市 (entity=知识图谱, head_sim=1.00, tail_sim=0.47)
|
||
2025-06-11 15:10:45,638 - DEBUG - 匹配三元组: 知识图谱 - part of - 数据层 (entity=知识图谱, head_sim=1.00, tail_sim=0.55)
|
||
2025-06-11 15:10:45,670 - DEBUG - 匹配三元组: 总结 - part of - 知识图谱 (entity=知识图谱, head_sim=0.48, tail_sim=1.00)
|
||
2025-06-11 15:10:45,705 - DEBUG - 匹配三元组: 知识图谱 - 移动个人助理(Siri - 智能语义搜索 (entity=知识图谱, head_sim=1.00, tail_sim=0.53)
|
||
2025-06-11 15:10:49,748 - INFO - 找到 10 个匹配的三元组
|
||
2025-06-11 15:10:49,749 - DEBUG - 匹配三元组: [{'head': '知识图谱', 'head_type': 'concept', 'type': 'Web 3.0', 'tail': '万维网', 'tail_type': 'media'}, {'head': '模式层', 'head_type': 'concept', 'type': 'subclass of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '结构化知识库', 'head_type': 'concept', 'type': 'subclass of', 'tail': '知识图谱', 'tail_type': 'misc'}, {'head': '信息抽取', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '外部知识库', 'head_type': 'concept', 'type': '结构化数据', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '上下位关系', 'head_type': 'concept', 'type': '阿里巴巴', 'tail': '图谱', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'location', 'tail': '城市', 'tail_type': 'loc'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'part of', 'tail': '数据层', 'tail_type': 'media'}, {'head': '总结', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': '移动个人助理(Siri', 'tail': '智能语义搜索', 'tail_type': 'media'}]
|
||
2025-06-11 15:10:49,749 - DEBUG - 融合文本: 知识图谱构建需要什么技术? 知识图谱 Web 3.0 万维网 模式层 subclass of 知识图谱 结构化知识库 subclass of 知识图谱 信息抽取 part of 知识图谱 外部知识库 结构化数据 知识图谱 上下位关系 阿里巴巴 图谱 知识图谱 location 城市 知识图谱 part of 数据层 总结 part of 知识图谱 知识图谱 移动个人助理(Siri 智能语义搜索
|
||
2025-06-11 15:10:49,768 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 15:10:49,775 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.7615541815757751
|
||
2025-06-11 15:10:49,775 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.7284857034683228
|
||
2025-06-11 15:10:49,775 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.7161188721656799
|
||
2025-06-11 15:10:49,775 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6004663109779358
|
||
2025-06-11 15:10:49,775 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 15:10:49,777 - DEBUG - 找到 document_id: 842b6180-667a-4ac8-b051-5c225c859011
|
||
2025-06-11 15:10:49,780 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 15:10:49,973 - DEBUG - 匹配三元组: 规则模板 - 问答方法 - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 15:10:50,420 - DEBUG - 匹配三元组: 语 言 - KG - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 15:10:50,485 - DEBUG - 匹配三元组: 知识图谱 - part of - 深度学习 (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 15:10:50,517 - DEBUG - 匹配三元组: 知识图谱 - graph question answering - 库问答 (entity=知识图谱, head_sim=1.00, tail_sim=0.50)
|
||
2025-06-11 15:10:50,549 - DEBUG - 匹配三元组: 知识图谱问答 - use - 搜索引擎 (entity=知识图谱, head_sim=0.87, tail_sim=0.50)
|
||
2025-06-11 15:10:50,613 - DEBUG - 匹配三元组: 子知识图谱 - standards body - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 15:10:50,677 - DEBUG - 匹配三元组: 知识图谱 - used by - KGQA (entity=知识图谱, head_sim=1.00, tail_sim=0.31)
|
||
2025-06-11 15:10:51,156 - DEBUG - 匹配三元组: 析、查询图和信息检索方法 - Fig.1 Framework of knowledge graph question - 知识图谱问答 (entity=知识图谱, head_sim=0.64, tail_sim=0.87)
|
||
2025-06-11 15:10:51,284 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识图谱, head_sim=0.87, tail_sim=0.74)
|
||
2025-06-11 15:10:51,380 - DEBUG - 匹配三元组: 知识图谱问答 - 通用领域 - 语义解析与信息检索细化 (entity=知识图谱, head_sim=0.87, tail_sim=0.55)
|
||
2025-06-11 15:10:51,444 - DEBUG - 匹配三元组: 信息检索 - part of - 知识图谱 G (entity=知识图谱, head_sim=0.63, tail_sim=0.82)
|
||
2025-06-11 15:10:52,536 - DEBUG - 匹配三元组: 匹配方法 - Web- Questions 基线的最高精确度指标 - 知识图谱问答 (entity=知识图谱, head_sim=0.45, tail_sim=0.87)
|
||
2025-06-11 15:10:53,754 - DEBUG - 匹配三元组: 知识图谱嵌入 - subclass of - 深度学习 (entity=知识图谱, head_sim=0.81, tail_sim=0.48)
|
||
2025-06-11 15:10:55,099 - DEBUG - 匹配三元组: 知识图谱 - <misc> - 神经网络的查询图 (entity=知识图谱, head_sim=1.00, tail_sim=0.62)
|
||
2025-06-11 15:10:55,131 - DEBUG - 匹配三元组: 知识图谱 - part of - 记忆网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.57)
|
||
2025-06-11 15:10:55,259 - DEBUG - 匹配三元组: 知识图谱 - <media> - 记忆组 件存储 KG (entity=知识图谱, head_sim=1.00, tail_sim=0.42)
|
||
2025-06-11 15:10:55,707 - DEBUG - 匹配三元组: 知识图谱 - part of - Wikidata (entity=知识图谱, head_sim=1.00, tail_sim=0.44)
|
||
2025-06-11 15:10:56,825 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 15:10:57,559 - DEBUG - 匹配三元组: 图谱 - subclass of - 问答 (entity=知识图谱, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 15:10:58,489 - DEBUG - 匹配三元组: 邹磊 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.28, tail_sim=1.00)
|
||
2025-06-11 15:10:58,715 - DEBUG - 匹配三元组: рика - 陈子睿 - 知识图谱问答研究综述 (entity=知识图谱, head_sim=0.29, tail_sim=0.81)
|
||
2025-06-11 15:11:31,851 - INFO - 找到 21 个匹配的三元组
|
||
2025-06-11 15:11:31,852 - DEBUG - 匹配三元组: [{'head': '规则模板', 'head_type': 'concept', 'type': '问答方法', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '语 言', 'head_type': 'concept', 'type': 'KG', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'part of', 'tail': '深度学习', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'graph question answering', 'tail': '库问答', 'tail_type': 'media'}, {'head': '知识图谱问答', 'head_type': 'media', 'type': 'use', 'tail': '搜索引擎', 'tail_type': 'concept'}, {'head': '子知识图谱', 'head_type': 'concept', 'type': 'standards body', 'tail': 'KGQA', 'tail_type': 'org'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'used by', 'tail': 'KGQA', 'tail_type': 'media'}, {'head': '析、查询图和信息检索方法', 'head_type': 'concept', 'type': 'Fig.1 Framework of knowledge graph question', 'tail': '知识图谱问答', 'tail_type': 'media'}, {'head': '知 识图谱', 'head_type': 'concept', 'type': '知識', 'tail': '知识', 'tail_type': 'media'}, {'head': '知识图谱问答', 'head_type': 'concept', 'type': '通用领域', 'tail': '语义解析与信息检索细化', 'tail_type': 'media'}, {'head': '信息检索', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱 G', 'tail_type': 'media'}, {'head': '匹配方法', 'head_type': 'concept', 'type': 'Web- Questions 基线的最高精确度指标', 'tail': '知识图谱问答', 'tail_type': 'media'}, {'head': '知识图谱嵌入', 'head_type': 'media', 'type': 'subclass of', 'tail': '深度学习', 'tail_type': 'concept'}, {'head': '知识图谱', 'head_type': 'concept', 'type': '<misc>', 'tail': '神经网络的查询图', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'part of', 'tail': '记忆网络', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': '<media>', 'tail': '记忆组 件存储 KG', 'tail_type': 'misc'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'part of', 'tail': 'Wikidata', 'tail_type': 'media'}, {'head': '知识图谱嵌入', 'head_type': 'concept', 'type': 'part of', 'tail': 'KGQA', 'tail_type': 'media'}, {'head': '图谱', 'head_type': 'concept', 'type': 'subclass of', 'tail': '问答', 'tail_type': 'media'}, {'head': '邹磊', 'head_type': 'per', 'type': 'field of work', 'tail': '知识图谱', 'tail_type': 'concept'}, {'head': 'рика', 'head_type': 'concept', 'type': '陈子睿', 'tail': '知识图谱问答研究综述', 'tail_type': 'media'}]
|
||
2025-06-11 15:11:31,852 - DEBUG - 融合文本: 知识图谱构建需要什么技术? 规则模板 问答方法 知识图谱 语 言 KG 知识图谱 知识图谱 part of 深度学习 知识图谱 graph question answering 库问答 知识图谱问答 use 搜索引擎 子知识图谱 standards body KGQA 知识图谱 used by KGQA 析、查询图和信息检索方法 Fig.1 Framework of knowledge graph question 知识图谱问答 知 识图谱 知識 知识 知识图谱问答 通用领域 语义解析与信息检索细化 信息检索 part of 知识图谱 G 匹配方法 Web- Questions 基线的最高精确度指标 知识图谱问答 知识图谱嵌入 subclass of 深度学习 知识图谱 <misc> 神经网络的查询图 知识图谱 part of 记忆网络 知识图谱 <media> 记忆组 件存储 KG 知识图谱 part of Wikidata 知识图谱嵌入 part of KGQA 图谱 subclass of 问答 邹磊 field of work 知识图谱 рика 陈子睿 知识图谱问答研究综述
|
||
2025-06-11 15:11:31,873 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 15:11:31,877 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.8070262670516968
|
||
2025-06-11 15:11:31,877 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.7937668561935425
|
||
2025-06-11 15:11:31,877 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.7836048603057861
|
||
2025-06-11 15:11:31,877 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.7835249900817871
|
||
2025-06-11 15:11:31,877 - DEBUG - 召回: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.7818303108215332
|
||
2025-06-11 15:11:31,877 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 15:11:31,878 - DEBUG - 找到 document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5
|
||
2025-06-11 15:11:31,882 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 15:11:32,010 - DEBUG - 匹配三元组: 知识图谱嵌入 - instance of - 图模型 (entity=知识图谱, head_sim=0.81, tail_sim=0.65)
|
||
2025-06-11 15:11:32,042 - DEBUG - 匹配三元组: 种被广泛采用的知识表示方法 - 结构 - 知识图谱 (entity=知识图谱, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 15:11:32,105 - DEBUG - 匹配三元组: 知识图谱嵌入 - 分类 - 中图法分类号: TP182 (entity=知识图谱, head_sim=0.81, tail_sim=0.47)
|
||
2025-06-11 15:11:32,490 - DEBUG - 匹配三元组: 知识图谱 - subclass of - 人工智能 (entity=知识图谱, head_sim=1.00, tail_sim=0.46)
|
||
2025-06-11 15:11:32,522 - DEBUG - 匹配三元组: 知识图谱 - part of - 三 (entity=知识图谱, head_sim=1.00, tail_sim=0.38)
|
||
2025-06-11 15:11:32,555 - DEBUG - 匹配三元组: 元组 - part of - 知识图谱 (entity=知识图谱, head_sim=0.36, tail_sim=1.00)
|
||
2025-06-11 15:11:32,587 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KG (entity=知识图谱, head_sim=0.81, tail_sim=0.32)
|
||
2025-06-11 15:11:32,812 - DEBUG - 匹配三元组: 统计关系学习 - studies - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 15:11:32,910 - DEBUG - 匹配三元组: 知识图谱嵌入 - G= (E;R;S) E={e1;e2;E|E - 定义几 (entity=知识图谱, head_sim=0.81, tail_sim=0.34)
|
||
2025-06-11 15:11:32,974 - DEBUG - 匹配三元组: 种基本符号 - 软件学报 2023年第 34卷第 1期 - 知识图谱 (entity=知识图谱, head_sim=0.47, tail_sim=1.00)
|
||
2025-06-11 15:11:33,039 - DEBUG - 匹配三元组: 嵌入三元组 - <media> - 知识图谱 S (entity=知识图谱, head_sim=0.39, tail_sim=0.85)
|
||
2025-06-11 15:11:34,991 - DEBUG - 匹配三元组: 知识图谱 - 生成模型 - TransG (entity=知识图谱, head_sim=1.00, tail_sim=0.34)
|
||
2025-06-11 15:11:39,311 - DEBUG - 匹配三元组: 静态知识图谱 - <media> - 形式的三元组 (entity=知识图谱, head_sim=0.81, tail_sim=0.43)
|
||
2025-06-11 15:11:39,694 - DEBUG - 匹配三元组: 知识图谱嵌入 - <misc> - 静态知识 (entity=知识图谱, head_sim=0.81, tail_sim=0.62)
|
||
2025-06-11 15:11:39,980 - DEBUG - 匹配三元组: 结构化信息 - part of - 知识图谱 (entity=知识图谱, head_sim=0.56, tail_sim=1.00)
|
||
2025-06-11 15:11:40,044 - DEBUG - 匹配三元组: 知识图谱 - TransE[15] - 的知识表示学习模型 (entity=知识图谱, head_sim=1.00, tail_sim=0.61)
|
||
2025-06-11 15:11:40,332 - DEBUG - 匹配三元组: 知识图谱 - part of - 学习模型RPJE (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 15:11:40,590 - DEBUG - 匹配三元组: 基于知识图谱的问答 - part of - QA-KG (entity=知识图谱, head_sim=0.84, tail_sim=0.35)
|
||
2025-06-11 15:11:41,329 - DEBUG - 匹配三元组: 张天成 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.18, tail_sim=1.00)
|
||
2025-06-11 15:11:41,521 - DEBUG - 匹配三元组: 类 - part of - 知识图 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 15:11:41,871 - DEBUG - 匹配三元组: 可扩展性 - 神经逻辑模型 - 大规模知识图谱中 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 15:11:41,935 - DEBUG - 匹配三元组: 认知智能 - aggregator - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 15:11:41,967 - DEBUG - 匹配三元组: 知识图谱 - instance of - 语义网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.58)
|
||
2025-06-11 15:11:42,030 - DEBUG - 匹配三元组: 知识图谱嵌入 - studies - KGE (entity=知识图谱, head_sim=0.81, tail_sim=0.29)
|
||
2025-06-11 15:12:31,573 - INFO - 找到 24 个匹配的三元组
|
||
2025-06-11 15:12:31,574 - DEBUG - 匹配三元组: [{'head': '知识图谱嵌入', 'head_type': 'media', 'type': 'instance of', 'tail': '图模型', 'tail_type': 'concept'}, {'head': '种被广泛采用的知识表示方法', 'head_type': 'concept', 'type': '结构', 'tail': '知识图谱', 'tail_type': 'misc'}, {'head': '知识图谱嵌入', 'head_type': 'concept', 'type': '分类', 'tail': '中图法分类号: TP182', 'tail_type': 'misc'}, {'head': '知识图谱', 'head_type': 'media', 'type': 'subclass of', 'tail': '人工智能', 'tail_type': 'concept'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'part of', 'tail': '三', 'tail_type': 'misc'}, {'head': '元组', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'misc'}, {'head': '知识图谱嵌入', 'head_type': 'concept', 'type': 'part of', 'tail': 'KG', 'tail_type': 'media'}, {'head': '统计关系学习', 'head_type': 'concept', 'type': 'studies', 'tail': '知识图谱', 'tail_type': 'misc'}, {'head': '知识图谱嵌入', 'head_type': 'concept', 'type': 'G= (E;R;S) E={e1;e2;E|E', 'tail': '定义几', 'tail_type': 'misc'}, {'head': '种基本符号', 'head_type': 'concept', 'type': '软件学报 2023年第 34卷第 1期', 'tail': '知识图谱', 'tail_type': 'misc'}, {'head': '嵌入三元组', 'head_type': 'concept', 'type': '<media>', 'tail': '知识图谱 S', 'tail_type': 'misc'}, {'head': '知识图谱', 'head_type': 'concept', 'type': '生成模型', 'tail': 'TransG', 'tail_type': 'media'}, {'head': '静态知识图谱', 'head_type': 'concept', 'type': '<media>', 'tail': '形式的三元组', 'tail_type': 'misc'}, {'head': '知识图谱嵌入', 'head_type': 'concept', 'type': '<misc>', 'tail': '静态知识', 'tail_type': 'media'}, {'head': '结构化信息', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'TransE[15]', 'tail': '的知识表示学习模型', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'part of', 'tail': '学习模型RPJE', 'tail_type': 'media'}, {'head': '基于知识图谱的问答', 'head_type': 'media', 'type': 'part of', 'tail': 'QA-KG', 'tail_type': 'misc'}, {'head': '张天成', 'head_type': 'per', 'type': 'field of work', 'tail': '知识图谱', 'tail_type': 'concept'}, {'head': '类', 'head_type': 'concept', 'type': 'part of', 'tail': '知识图', 'tail_type': 'misc'}, {'head': '可扩展性', 'head_type': 'concept', 'type': '神经逻辑模型', 'tail': '大规模知识图谱中', 'tail_type': 'media'}, {'head': '认知智能', 'head_type': 'concept', 'type': 'aggregator', 'tail': '知识图谱', 'tail_type': 'media'}, {'head': '知识图谱', 'head_type': 'concept', 'type': 'instance of', 'tail': '语义网络', 'tail_type': 'misc'}, {'head': '知识图谱嵌入', 'head_type': 'concept', 'type': 'studies', 'tail': 'KGE', 'tail_type': 'misc'}]
|
||
2025-06-11 15:12:31,574 - DEBUG - 融合文本: 知识图谱构建需要什么技术? 知识图谱嵌入 instance of 图模型 种被广泛采用的知识表示方法 结构 知识图谱 知识图谱嵌入 分类 中图法分类号: TP182 知识图谱 subclass of 人工智能 知识图谱 part of 三 元组 part of 知识图谱 知识图谱嵌入 part of KG 统计关系学习 studies 知识图谱 知识图谱嵌入 G= (E;R;S) E={e1;e2;E|E 定义几 种基本符号 软件学报 2023年第 34卷第 1期 知识图谱 嵌入三元组 <media> 知识图谱 S 知识图谱 生成模型 TransG 静态知识图谱 <media> 形式的三元组 知识图谱嵌入 <misc> 静态知识 结构化信息 part of 知识图谱 知识图谱 TransE[15] 的知识表示学习模型 知识图谱 part of 学习模型RPJE 基于知识图谱的问答 part of QA-KG 张天成 field of work 知识图谱 类 part of 知识图 可扩展性 神经逻辑模型 大规模知识图谱中 认知智能 aggregator 知识图谱 知识图谱 instance of 语义网络 知识图谱嵌入 studies KGE
|
||
2025-06-11 15:12:31,593 - DEBUG - 生成融合向量,维度: 1024
|
||
2025-06-11 15:12:31,597 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.7642273306846619
|
||
2025-06-11 15:12:31,597 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.7620716691017151
|
||
2025-06-11 15:12:31,597 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.7403979301452637
|
||
2025-06-11 15:12:31,597 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.7301129102706909
|
||
2025-06-11 15:12:31,597 - DEBUG - 召回: text=的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低..., distance=0.7132696509361267
|
||
2025-06-11 15:12:31,597 - DEBUG - 去重后结果数量: 14
|
||
2025-06-11 15:12:31,597 - DEBUG - 开始重排序
|
||
2025-06-11 15:12:32,540 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.978052, source=fused_triplets_24
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., rerank_score=0.971184, source=fused_triplets_10
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.949201, source=fused_triplets_10
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.860955, source=fused_triplets_24
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.858481, source=fused_triplets_24
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., rerank_score=0.752377, source=fused_triplets_10
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.667581, source=fused_triplets_21
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., rerank_score=0.530738, source=fused_triplets_21
|
||
2025-06-11 15:12:33,266 - DEBUG - 重排序结果: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., rerank_score=0.414899, source=fused_triplets_21
|
||
2025-06-11 15:12:33,267 - DEBUG - 重排序结果: text=的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., rerank_score=0.284775, source=fused_triplets_24
|
||
2025-06-11 15:12:33,267 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 15:12:34,316 - DEBUG - 排序结果 1: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.7301129102706909, rerank_score=0.9780517462851323
|
||
2025-06-11 15:12:34,318 - DEBUG - 排序结果 2: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.7161188721656799, rerank_score=0.9711838031967466
|
||
2025-06-11 15:12:34,321 - DEBUG - 排序结果 3: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.7284857034683228, rerank_score=0.9492005402963102
|
||
2025-06-11 15:12:34,323 - DEBUG - 排序结果 4: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.7642273306846619, rerank_score=0.8609547092195301
|
||
2025-06-11 15:12:34,324 - DEBUG - 排序结果 5: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.7403979301452637, rerank_score=0.8584814629082023
|
||
2025-06-11 15:12:34,324 - DEBUG - 排序结果 6: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.7615541815757751, rerank_score=0.7523766320725713
|
||
2025-06-11 15:12:34,324 - DEBUG - 排序结果 7: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.8070262670516968, rerank_score=0.6675812474744659
|
||
2025-06-11 15:12:34,324 - DEBUG - 排序结果 8: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.7836048603057861, rerank_score=0.5307381661709525
|
||
2025-06-11 15:12:34,324 - DEBUG - 排序结果 9: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.7835249900817871, rerank_score=0.4148988457967688
|
||
2025-06-11 15:12:34,324 - DEBUG - 排序结果 10: text=的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低..., distance=0.7132696509361267, rerank_score=0.2847748668392201
|
||
2025-06-11 15:13:49,155 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:13:49,781 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 15:13:50,741 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 15:13:53,757 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:13:53,773 - DEBUG - 查询向量维度: 1024
|
||
2025-06-11 15:13:53,773 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-11 15:13:53,873 - DEBUG - 加载集合: ragdb_textdb
|
||
2025-06-11 15:13:53,873 - DEBUG - 搜索参数: {'metric_type': 'COSINE', 'params': {'nprobe': 10}}, 表达式: userid == 'testuser1' and (filename == 'test.docx' or filename == 'zongshu.pdf' or filename == 'qianru.pdf'), limit: 5, offset: 0
|
||
2025-06-11 15:13:53,879 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.7479630708694458, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:13:53,879 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.7013792991638184, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:13:53,879 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6933318376541138, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:13:53,879 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.685930609703064, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:13:53,879 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6831154227256775, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:13:53,879 - DEBUG - 搜索完成,返回 5 条结果
|
||
2025-06-11 15:13:53,884 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 15:13:56,887 - INFO - RAG 检索返回 5 条结果
|
||
2025-06-11 15:13:56,893 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 15:13:56,901 - INFO - 找到 3 个文档: ['test.docx', 'zongshu.pdf', 'qianru.pdf']
|
||
2025-06-11 15:13:56,973 - DEBUG - NER 结果: []
|
||
2025-06-11 15:13:56,974 - DEBUG - 合并连续名词: 知识图谱, 子词: ['知识', '图谱']
|
||
2025-06-11 15:13:56,974 - DEBUG - 合并连续名词: 技术, 子词: ['技术']
|
||
2025-06-11 15:13:56,974 - DEBUG - 连续名词子词集合: {'图谱', '知识', '技术'}
|
||
2025-06-11 15:13:56,974 - INFO - 从查询中提取到 4 个唯一实体: ['知识图谱', '技术', '构建', '需要']
|
||
2025-06-11 15:13:56,974 - DEBUG - 处理文档: document_id=75e18e23-6f5a-4697-a1bb-ee53c6507a41, filename=test.docx
|
||
2025-06-11 15:13:56,976 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 15:13:57,116 - DEBUG - 匹配三元组: 知识图谱 - Web 3.0 - 万维网 (entity=知识图谱, head_sim=1.00, tail_sim=0.43)
|
||
2025-06-11 15:13:57,276 - DEBUG - 匹配三元组: 模式层 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.46, tail_sim=1.00)
|
||
2025-06-11 15:13:57,308 - DEBUG - 匹配三元组: 结构化知识库 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:13:57,404 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=知识图谱, head_sim=0.57, tail_sim=1.00)
|
||
2025-06-11 15:13:57,820 - DEBUG - 匹配三元组: 外部知识库 - 结构化数据 - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:13:58,013 - DEBUG - 匹配三元组: 上下位关系 - 阿里巴巴 - 图谱 (entity=知识图谱, head_sim=0.42, tail_sim=0.82)
|
||
2025-06-11 15:13:58,082 - DEBUG - 匹配三元组: 知识图谱 - location - 城市 (entity=知识图谱, head_sim=1.00, tail_sim=0.47)
|
||
2025-06-11 15:13:58,210 - DEBUG - 匹配三元组: 知识图谱 - part of - 数据层 (entity=知识图谱, head_sim=1.00, tail_sim=0.55)
|
||
2025-06-11 15:13:58,242 - DEBUG - 匹配三元组: 总结 - part of - 知识图谱 (entity=知识图谱, head_sim=0.48, tail_sim=1.00)
|
||
2025-06-11 15:13:58,274 - DEBUG - 匹配三元组: 知识图谱 - 移动个人助理(Siri - 智能语义搜索 (entity=知识图谱, head_sim=1.00, tail_sim=0.53)
|
||
2025-06-11 15:14:02,316 - INFO - 找到 10 个匹配的三元组
|
||
2025-06-11 15:14:02,316 - DEBUG - 搜索三元组: 知识图谱 Web 3.0 万维网 (文档: test.docx)
|
||
2025-06-11 15:14:02,332 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%万维网%'
|
||
2025-06-11 15:14:02,338 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.622643232345581, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,338 - DEBUG - 搜索三元组: 模式层 subclass of 知识图谱 (文档: test.docx)
|
||
2025-06-11 15:14:02,355 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%模式层%知识图谱%'
|
||
2025-06-11 15:14:02,358 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.567072868347168, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,358 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.5059496164321899, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,358 - DEBUG - 搜索三元组: 结构化知识库 subclass of 知识图谱 (文档: test.docx)
|
||
2025-06-11 15:14:02,375 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%结构化知识库%知识图谱%'
|
||
2025-06-11 15:14:02,378 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.6059292554855347, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,378 - DEBUG - 搜索三元组: 信息抽取 part of 知识图谱 (文档: test.docx)
|
||
2025-06-11 15:14:02,394 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%信息抽取%知识图谱%'
|
||
2025-06-11 15:14:02,397 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.6285881400108337, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,397 - DEBUG - 搜索三元组: 外部知识库 结构化数据 知识图谱 (文档: test.docx)
|
||
2025-06-11 15:14:02,413 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%外部知识库%知识图谱%'
|
||
2025-06-11 15:14:02,417 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6099985837936401, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,417 - DEBUG - 搜索三元组: 上下位关系 阿里巴巴 图谱 (文档: test.docx)
|
||
2025-06-11 15:14:02,433 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%上下位关系%图谱%'
|
||
2025-06-11 15:14:02,437 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.5227455496788025, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,437 - DEBUG - 搜索三元组: 知识图谱 location 城市 (文档: test.docx)
|
||
2025-06-11 15:14:02,453 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%城市%'
|
||
2025-06-11 15:14:02,460 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.5877416133880615, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,460 - DEBUG - 搜索三元组: 知识图谱 part of 数据层 (文档: test.docx)
|
||
2025-06-11 15:14:02,476 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%数据层%'
|
||
2025-06-11 15:14:02,482 - DEBUG - 命中: text: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., 距离: 0.677775502204895, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,482 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.6638458371162415, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,482 - DEBUG - 命中: text: 6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., 距离: 0.6140748262405396, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,482 - DEBUG - 搜索三元组: 总结 part of 知识图谱 (文档: test.docx)
|
||
2025-06-11 15:14:02,498 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%总结%知识图谱%'
|
||
2025-06-11 15:14:02,502 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.5805757641792297, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,502 - DEBUG - 搜索三元组: 知识图谱 移动个人助理(Siri 智能语义搜索 (文档: test.docx)
|
||
2025-06-11 15:14:02,519 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'test.docx' and text like '%知识图谱%智能语义搜索%'
|
||
2025-06-11 15:14:02,524 - DEBUG - 命中: text: 7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., 距离: 0.6165111064910889, 元数据: {'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:14:02,524 - DEBUG - 处理文档: document_id=842b6180-667a-4ac8-b051-5c225c859011, filename=zongshu.pdf
|
||
2025-06-11 15:14:02,527 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 15:14:02,719 - DEBUG - 匹配三元组: 规则模板 - 问答方法 - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 15:14:03,168 - DEBUG - 匹配三元组: 语 言 - KG - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 15:14:03,233 - DEBUG - 匹配三元组: 知识图谱 - part of - 深度学习 (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 15:14:03,265 - DEBUG - 匹配三元组: 知识图谱 - graph question answering - 库问答 (entity=知识图谱, head_sim=1.00, tail_sim=0.50)
|
||
2025-06-11 15:14:03,297 - DEBUG - 匹配三元组: 知识图谱问答 - use - 搜索引擎 (entity=知识图谱, head_sim=0.87, tail_sim=0.50)
|
||
2025-06-11 15:14:03,363 - DEBUG - 匹配三元组: 子知识图谱 - standards body - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 15:14:03,427 - DEBUG - 匹配三元组: 知识图谱 - used by - KGQA (entity=知识图谱, head_sim=1.00, tail_sim=0.31)
|
||
2025-06-11 15:14:03,908 - DEBUG - 匹配三元组: 析、查询图和信息检索方法 - Fig.1 Framework of knowledge graph question - 知识图谱问答 (entity=知识图谱, head_sim=0.64, tail_sim=0.87)
|
||
2025-06-11 15:14:04,037 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识图谱, head_sim=0.87, tail_sim=0.74)
|
||
2025-06-11 15:14:04,133 - DEBUG - 匹配三元组: 知识图谱问答 - 通用领域 - 语义解析与信息检索细化 (entity=知识图谱, head_sim=0.87, tail_sim=0.55)
|
||
2025-06-11 15:14:04,200 - DEBUG - 匹配三元组: 信息检索 - part of - 知识图谱 G (entity=知识图谱, head_sim=0.63, tail_sim=0.82)
|
||
2025-06-11 15:14:05,292 - DEBUG - 匹配三元组: 匹配方法 - Web- Questions 基线的最高精确度指标 - 知识图谱问答 (entity=知识图谱, head_sim=0.45, tail_sim=0.87)
|
||
2025-06-11 15:14:06,515 - DEBUG - 匹配三元组: 知识图谱嵌入 - subclass of - 深度学习 (entity=知识图谱, head_sim=0.81, tail_sim=0.48)
|
||
2025-06-11 15:14:07,862 - DEBUG - 匹配三元组: 知识图谱 - <misc> - 神经网络的查询图 (entity=知识图谱, head_sim=1.00, tail_sim=0.62)
|
||
2025-06-11 15:14:07,895 - DEBUG - 匹配三元组: 知识图谱 - part of - 记忆网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.57)
|
||
2025-06-11 15:14:08,023 - DEBUG - 匹配三元组: 知识图谱 - <media> - 记忆组 件存储 KG (entity=知识图谱, head_sim=1.00, tail_sim=0.42)
|
||
2025-06-11 15:14:08,472 - DEBUG - 匹配三元组: 知识图谱 - part of - Wikidata (entity=知识图谱, head_sim=1.00, tail_sim=0.44)
|
||
2025-06-11 15:14:09,600 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 15:14:10,339 - DEBUG - 匹配三元组: 图谱 - subclass of - 问答 (entity=知识图谱, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 15:14:11,274 - DEBUG - 匹配三元组: 邹磊 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.28, tail_sim=1.00)
|
||
2025-06-11 15:14:11,499 - DEBUG - 匹配三元组: рика - 陈子睿 - 知识图谱问答研究综述 (entity=知识图谱, head_sim=0.29, tail_sim=0.81)
|
||
2025-06-11 15:14:44,866 - INFO - 找到 21 个匹配的三元组
|
||
2025-06-11 15:14:44,867 - DEBUG - 搜索三元组: 规则模板 问答方法 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:44,883 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%规则模板%知识图谱%'
|
||
2025-06-11 15:14:44,888 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.7196816802024841, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,888 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.6338689923286438, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,888 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6320828199386597, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,888 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6310024857521057, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,888 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6165626049041748, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,888 - DEBUG - 搜索三元组: 语 言 KG 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:44,905 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%语 言%知识图谱%'
|
||
2025-06-11 15:14:44,908 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.5706815719604492, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,908 - DEBUG - 搜索三元组: 知识图谱 part of 深度学习 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:44,924 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%深度学习%'
|
||
2025-06-11 15:14:44,930 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.6626743674278259, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,930 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6333552002906799, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,930 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6285597681999207, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,930 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6233670115470886, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,930 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.6035276055335999, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,930 - DEBUG - 搜索三元组: 知识图谱 graph question answering 库问答 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:44,946 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%库问答%'
|
||
2025-06-11 15:14:44,953 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.662022054195404, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,953 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6436327695846558, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,953 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.5916442275047302, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,953 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5819114446640015, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,953 - DEBUG - 搜索三元组: 知识图谱问答 use 搜索引擎 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:44,969 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱问答%搜索引擎%'
|
||
2025-06-11 15:14:44,973 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.6104249954223633, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,973 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.6058603525161743, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,974 - DEBUG - 命中: text: YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接所得的三元组准确
|
||
率平均达 97%。这使得 YAGO 本体既从维基百科的
|
||
海量数据获益 ,又利用了 WordNet 清晰的概念分类 。
|
||
Wikidata
|
||
[103]
|
||
的目标是构建一个免费开放 、多语
|
||
..., 距离: 0.5500432848930359, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,974 - DEBUG - 搜索三元组: 子知识图谱 standards body KGQA (文档: zongshu.pdf)
|
||
2025-06-11 15:14:44,990 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%子知识图谱%KGQA%'
|
||
2025-06-11 15:14:44,993 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.635985255241394, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:44,993 - DEBUG - 搜索三元组: 知识图谱 used by KGQA (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,010 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%KGQA%'
|
||
2025-06-11 15:14:45,015 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.7099630236625671, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,015 - DEBUG - 命中: text: 同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , 用户可以直接得到答案
|
||
输出 。 而对于答案具体如何产生 , 系统应如何为用
|
||
户解释答案的来源也是 KGQA 要解决的重要问题 。
|
||
目前 , 已有大量开放领域知识图谱问答的方法
|
||
被提出 , 但尚无同时涵..., 距离: 0.7005059719085693, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,015 - DEBUG - 命中: text: summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional semantic
|
||
计算机科学与探索
|
||
Journal of Frontiers of Computer Science and Technology
|
||
1673-9418/2021/15(10)-1843-..., 距离: 0.6842584013938904, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,015 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6733513474464417, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,015 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6565587520599365, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,015 - DEBUG - 搜索三元组: 析、查询图和信息检索方法 Fig.1 Framework of knowledge graph question 知识图谱问答 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,032 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%析、查询图和信息检索方法%知识图谱问答%'
|
||
2025-06-11 15:14:45,035 - DEBUG - 搜索三元组: 知 识图谱 知識 知识 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,051 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知 识图谱%知识%'
|
||
2025-06-11 15:14:45,054 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6105901598930359, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,054 - DEBUG - 搜索三元组: 知识图谱问答 通用领域 语义解析与信息检索细化 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,070 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱问答%语义解析与信息检索细化%'
|
||
2025-06-11 15:14:45,074 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6384718418121338, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,074 - DEBUG - 搜索三元组: 信息检索 part of 知识图谱 G (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,090 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%信息检索%知识图谱 G%'
|
||
2025-06-11 15:14:45,094 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6183342933654785, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,094 - DEBUG - 命中: text: 答案部分 , 这也是两类方法的区别所在 。 开放领域
|
||
知识图谱问答 , 则是知识图谱 G 为通用领域知识图
|
||
谱 , 问题 q为开放领域问题的知识图谱问答情况 。
|
||
定义 2( 知识图谱问答 ) 给定知识图谱 G , 自然
|
||
语言问题 q, 返回正确答案集 A, 其中 A为 E 的子集 。
|
||
语义解析 ( semantic parsing, SP) : 得到查询语句
|
||
或查询语句的逻辑形式 , 在 KG 上..., 距离: 0.565437376499176, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,094 - DEBUG - 搜索三元组: 匹配方法 Web- Questions 基线的最高精确度指标 知识图谱问答 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,110 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%匹配方法%知识图谱问答%'
|
||
2025-06-11 15:14:45,114 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.5744408369064331, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,114 - DEBUG - 命中: text: PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空间模型作为复述模型对自然语言 -
|
||
逻辑形式元组 (c,z) 打分 , 使用得分最高元组的逻辑
|
||
形式 z 检索 KG 获得答案 。
|
||
OQA 系统
|
||
[54]
|
||
使用预先定义的操作符与模板 , 将
|
||
用户问题提..., 距离: 0.5386887788772583, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,114 - DEBUG - 搜索三元组: 知识图谱嵌入 subclass of 深度学习 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,130 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱嵌入%深度学习%'
|
||
2025-06-11 15:14:45,135 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.626388430595398, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,135 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.5887572765350342, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,135 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.562717616558075, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,135 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5601789355278015, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,135 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5475433468818665, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,135 - DEBUG - 搜索三元组: 知识图谱 <misc> 神经网络的查询图 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,151 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%神经网络的查询图%'
|
||
2025-06-11 15:14:45,157 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.6379419565200806, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,157 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.603220522403717, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,158 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5959279537200928, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,158 - DEBUG - 命中: text: 合位置编码的方法表示问题 q, 在 WebQuestions 数据
|
||
集上获得了更优的效果 ; Xu 等人
|
||
[39]
|
||
以 KV-MemNN 为
|
||
基础 , 通过引入 STOP 策略 , 设计一种新式查询更新
|
||
策略 , 屏蔽已寻址的内存信息 , 使得 KV-MemNN 能
|
||
够处理复杂问题 。
|
||
3.3 基于神经网络的语义解析
|
||
本节方法使用神经网络模块对传统语义解析 、
|
||
话语模板的查询图 、 传统信息检索方..., 距离: 0.57700115442276, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,158 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5637367963790894, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,158 - DEBUG - 搜索三元组: 知识图谱 part of 记忆网络 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,174 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%记忆网络%'
|
||
2025-06-11 15:14:45,180 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.6457532048225403, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,180 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.6223066449165344, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,180 - DEBUG - 命中: text: 机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名以关系名本身与组成关系的
|
||
单词两级表示 ,使用BiLSTM 进行编码并排序 。
|
||
本小节模型较为多样 ,模型呈现出复杂度递增
|
||
的趋势 。Mohammed 等人
|
||
[94]
|
||
评测深度学习与传统方
|
||
法的效果差..., 距离: 0.5924555659294128, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,180 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5907570123672485, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,180 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.589214563369751, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,180 - DEBUG - 搜索三元组: 知识图谱 <media> 记忆组 件存储 KG (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,196 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%记忆组 件存储 KG%'
|
||
2025-06-11 15:14:45,201 - DEBUG - 搜索三元组: 知识图谱 part of Wikidata (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,217 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱%Wikidata%'
|
||
2025-06-11 15:14:45,222 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.54942387342453, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,222 - DEBUG - 命中: text: YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接所得的三元组准确
|
||
率平均达 97%。这使得 YAGO 本体既从维基百科的
|
||
海量数据获益 ,又利用了 WordNet 清晰的概念分类 。
|
||
Wikidata
|
||
[103]
|
||
的目标是构建一个免费开放 、多语
|
||
..., 距离: 0.5443771481513977, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,222 - DEBUG - 搜索三元组: 知识图谱嵌入 part of KGQA (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,238 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%知识图谱嵌入%KGQA%'
|
||
2025-06-11 15:14:45,242 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.696393609046936, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,243 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.6650101542472839, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,243 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.6290625929832458, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,243 - DEBUG - 命中: text: 域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., 距离: 0.6236797571182251, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,243 - DEBUG - 命中: text: MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
陈子睿 等 : 开放领域知识图谱问答研究综述
|
||
取环节 , 将实体链接与关系抽取视为两个独立环节
|
||
的方法
|
||
[71]
|
||
普遍没有联合抽取方法
|
||
[98]
|
||
( 即同时考..., 距离: 0.5795214176177979, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,243 - DEBUG - 搜索三元组: 图谱 subclass of 问答 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,259 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%图谱%问答%'
|
||
2025-06-11 15:14:45,265 - DEBUG - 命中: text: 的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., 距离: 0.5989567041397095, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,265 - DEBUG - 命中: text: 谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., 距离: 0.5713517665863037, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,266 - DEBUG - 命中: text: ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., 距离: 0.5577582120895386, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,266 - DEBUG - 命中: text: KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., 距离: 0.5508726239204407, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,266 - DEBUG - 命中: text: 神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-79]
|
||
[21,30,80-81,96]
|
||
[82]
|
||
[83]
|
||
[84-87]
|
||
[31]
|
||
[27,88]
|
||
[36,40,89-91]
|
||
[43]
|
||
[92-93,97-99]
|
||
[29,35,94,100]
|
||
..., 距离: 0.5355452299118042, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,266 - DEBUG - 搜索三元组: 邹磊 field of work 知识图谱 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,282 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%邹磊%知识图谱%'
|
||
2025-06-11 15:14:45,284 - DEBUG - 命中: text: Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPATHI A, TALUKDAR P. Improving multi-
|
||
hop question answering over knowledge graphs using know-
|
||
ledge ba..., 距离: 0.4557343125343323, 元数据: {'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:14:45,285 - DEBUG - 搜索三元组: рика 陈子睿 知识图谱问答研究综述 (文档: zongshu.pdf)
|
||
2025-06-11 15:14:45,301 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'zongshu.pdf' and text like '%рика%知识图谱问答研究综述%'
|
||
2025-06-11 15:14:45,303 - DEBUG - 处理文档: document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, filename=qianru.pdf
|
||
2025-06-11 15:14:45,306 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 15:14:45,434 - DEBUG - 匹配三元组: 知识图谱嵌入 - instance of - 图模型 (entity=知识图谱, head_sim=0.81, tail_sim=0.65)
|
||
2025-06-11 15:14:45,466 - DEBUG - 匹配三元组: 种被广泛采用的知识表示方法 - 结构 - 知识图谱 (entity=知识图谱, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 15:14:45,531 - DEBUG - 匹配三元组: 知识图谱嵌入 - 分类 - 中图法分类号: TP182 (entity=知识图谱, head_sim=0.81, tail_sim=0.47)
|
||
2025-06-11 15:14:45,916 - DEBUG - 匹配三元组: 知识图谱 - subclass of - 人工智能 (entity=知识图谱, head_sim=1.00, tail_sim=0.46)
|
||
2025-06-11 15:14:45,948 - DEBUG - 匹配三元组: 知识图谱 - part of - 三 (entity=知识图谱, head_sim=1.00, tail_sim=0.38)
|
||
2025-06-11 15:14:45,981 - DEBUG - 匹配三元组: 元组 - part of - 知识图谱 (entity=知识图谱, head_sim=0.36, tail_sim=1.00)
|
||
2025-06-11 15:14:46,013 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KG (entity=知识图谱, head_sim=0.81, tail_sim=0.32)
|
||
2025-06-11 15:14:46,237 - DEBUG - 匹配三元组: 统计关系学习 - studies - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 15:14:46,333 - DEBUG - 匹配三元组: 知识图谱嵌入 - G= (E;R;S) E={e1;e2;E|E - 定义几 (entity=知识图谱, head_sim=0.81, tail_sim=0.34)
|
||
2025-06-11 15:14:46,398 - DEBUG - 匹配三元组: 种基本符号 - 软件学报 2023年第 34卷第 1期 - 知识图谱 (entity=知识图谱, head_sim=0.47, tail_sim=1.00)
|
||
2025-06-11 15:14:46,462 - DEBUG - 匹配三元组: 嵌入三元组 - <media> - 知识图谱 S (entity=知识图谱, head_sim=0.39, tail_sim=0.85)
|
||
2025-06-11 15:14:48,422 - DEBUG - 匹配三元组: 知识图谱 - 生成模型 - TransG (entity=知识图谱, head_sim=1.00, tail_sim=0.34)
|
||
2025-06-11 15:14:52,762 - DEBUG - 匹配三元组: 静态知识图谱 - <media> - 形式的三元组 (entity=知识图谱, head_sim=0.81, tail_sim=0.43)
|
||
2025-06-11 15:14:53,149 - DEBUG - 匹配三元组: 知识图谱嵌入 - <misc> - 静态知识 (entity=知识图谱, head_sim=0.81, tail_sim=0.62)
|
||
2025-06-11 15:14:53,439 - DEBUG - 匹配三元组: 结构化信息 - part of - 知识图谱 (entity=知识图谱, head_sim=0.56, tail_sim=1.00)
|
||
2025-06-11 15:14:53,503 - DEBUG - 匹配三元组: 知识图谱 - TransE[15] - 的知识表示学习模型 (entity=知识图谱, head_sim=1.00, tail_sim=0.61)
|
||
2025-06-11 15:14:53,793 - DEBUG - 匹配三元组: 知识图谱 - part of - 学习模型RPJE (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 15:14:54,050 - DEBUG - 匹配三元组: 基于知识图谱的问答 - part of - QA-KG (entity=知识图谱, head_sim=0.84, tail_sim=0.35)
|
||
2025-06-11 15:14:54,790 - DEBUG - 匹配三元组: 张天成 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.18, tail_sim=1.00)
|
||
2025-06-11 15:14:54,983 - DEBUG - 匹配三元组: 类 - part of - 知识图 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 15:14:55,335 - DEBUG - 匹配三元组: 可扩展性 - 神经逻辑模型 - 大规模知识图谱中 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 15:14:55,400 - DEBUG - 匹配三元组: 认知智能 - aggregator - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 15:14:55,432 - DEBUG - 匹配三元组: 知识图谱 - instance of - 语义网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.58)
|
||
2025-06-11 15:14:55,497 - DEBUG - 匹配三元组: 知识图谱嵌入 - studies - KGE (entity=知识图谱, head_sim=0.81, tail_sim=0.29)
|
||
2025-06-11 15:15:45,233 - INFO - 找到 24 个匹配的三元组
|
||
2025-06-11 15:15:45,233 - DEBUG - 搜索三元组: 知识图谱嵌入 instance of 图模型 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,249 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%图模型%'
|
||
2025-06-11 15:15:45,255 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.619387149810791, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,255 - DEBUG - 搜索三元组: 种被广泛采用的知识表示方法 结构 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,272 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%种被广泛采用的知识表示方法%知识图谱%'
|
||
2025-06-11 15:15:45,275 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5766963362693787, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,275 - DEBUG - 搜索三元组: 知识图谱嵌入 分类 中图法分类号: TP182 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,292 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%中图法分类号: TP182%'
|
||
2025-06-11 15:15:45,295 - DEBUG - 搜索三元组: 知识图谱 subclass of 人工智能 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,311 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%人工智能%'
|
||
2025-06-11 15:15:45,317 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.5648460984230042, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,317 - DEBUG - 搜索三元组: 知识图谱 part of 三 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,333 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%三%'
|
||
2025-06-11 15:15:45,340 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.5404534935951233, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,340 - DEBUG - 命中: text: 来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能而需要进一步探索的内部和外部信息.
|
||
● 知识类型: 不同的KGE方法在处理1-1, 1-N, N-1和N-N关系时具有不同的性能, 这表明针对不同类型的
|
||
知识或关系需要设计不同的KGE框架. 然而, ..., 距离: 0.5116069316864014, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,340 - DEBUG - 命中: text: (61)
|
||
|
||
N (h) = {t′|(h;t′ ∉ D)}∪{t}
|
||
h
|
||
其中, 是 的负例集.
|
||
M ¨obius
|
||
M ¨obius
|
||
实际上, 多关系知识图谱往往表现出多个层次结构, 为了解决这一问题, 提出了MuRP模型[89]. MuRP相对于
|
||
Poincare模型而言更加完善, 它是一种在双曲空间的Poincare ball模型中嵌入分层多关系数据的方法, 通过
|
||
矩阵-向量乘法..., 距离: 0.5078161358833313, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,340 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.505243718624115, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,340 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.4985816180706024, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,341 - DEBUG - 搜索三元组: 元组 part of 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,357 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%元组%知识图谱%'
|
||
2025-06-11 15:15:45,362 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.5568493604660034, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,363 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.534630537033081, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,363 - DEBUG - 命中: text: 的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[28]、
|
||
ATEKE[101]等.
|
||
4.3 逻辑规则
|
||
∀x;y:HasWi f e(x;y)⇒ HasSpouse(x;y)
|
||
逻辑规则(这里所说的逻辑规则主要指一阶Horn子句, 例如: , 表明任
|
||
何有两个HasWife关系相连的实体都有HasSpouse关系)包含丰富的背景信息. 目..., 距离: 0.5223005414009094, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,363 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5001960396766663, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,363 - DEBUG - 命中: text: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 距离: 0.4811737537384033, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,363 - DEBUG - 搜索三元组: 知识图谱嵌入 part of KG (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,379 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%KG%'
|
||
2025-06-11 15:15:45,384 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.7103158235549927, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,384 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.693242609500885, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,384 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.672911524772644, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,384 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.6270386576652527, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,384 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6173073053359985, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,384 - DEBUG - 搜索三元组: 统计关系学习 studies 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,400 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%统计关系学习%知识图谱%'
|
||
2025-06-11 15:15:45,404 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.5219854712486267, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,404 - DEBUG - 搜索三元组: 知识图谱嵌入 G= (E;R;S) E={e1;e2;E|E 定义几 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,420 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%定义几%'
|
||
2025-06-11 15:15:45,425 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.6373600363731384, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,425 - DEBUG - 搜索三元组: 种基本符号 软件学报 2023年第 34卷第 1期 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,441 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%种基本符号%知识图谱%'
|
||
2025-06-11 15:15:45,444 - DEBUG - 命中: text: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 距离: 0.4899718463420868, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,445 - DEBUG - 搜索三元组: 嵌入三元组 <media> 知识图谱 S (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,461 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%嵌入三元组%知识图谱 S%'
|
||
2025-06-11 15:15:45,464 - DEBUG - 搜索三元组: 知识图谱 生成模型 TransG (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,480 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%TransG%'
|
||
2025-06-11 15:15:45,485 - DEBUG - 命中: text: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 距离: 0.5846441388130188, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,485 - DEBUG - 搜索三元组: 静态知识图谱 <media> 形式的三元组 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,501 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%静态知识图谱%形式的三元组%'
|
||
2025-06-11 15:15:45,504 - DEBUG - 搜索三元组: 知识图谱嵌入 <misc> 静态知识 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,520 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%静态知识%'
|
||
2025-06-11 15:15:45,524 - DEBUG - 命中: text: 表 4 最新的知识图谱嵌入模型总结
|
||
类别 模型 实体嵌入 关系嵌入 评分函数 fr (h , t)
|
||
卷积神经网络
|
||
ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
Mr ∈ Rdw×dh
|
||
(vec(([Mh;Mr] ∗!))W)t
|
||
ConvKB [ 81 ]
|
||
h;t ∈ Rd
|
||
r ∈ Rd
|
||
concat(g([h;r;t] ∗!))w..., 距离: 0.5579541921615601, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,524 - DEBUG - 命中: text: wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. 将在时间 投影到时间特定的超平面 上, 分别得到投影向量 , , .
|
||
|
||
P (h)+ P (r)≈ P (t)
|
||
与transH类似, HyTE期望在时间 处有效的三..., 距离: 0.525954008102417, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,524 - DEBUG - 命中: text: TransR[43] 2015 优点: 不仅考虑关系的多样性, 而且考虑实体;
|
||
缺点: 计算复杂, 忽略头、尾实体不同的类型和属性
|
||
TransD[44] 2015 优点: 计算简单、参数少;
|
||
缺点: 并非所有新事实都可以从存在的情况中推论得出
|
||
STransE[45] 2016 优点: 对每个关系使用两个投影矩阵, 性能优于TransE;
|
||
缺点: 容易出现数据稀疏问题
|
||
TranSparse[46] ..., 距离: 0.4252125918865204, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,524 - DEBUG - 搜索三元组: 结构化信息 part of 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,540 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%结构化信息%知识图谱%'
|
||
2025-06-11 15:15:45,544 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.5296695232391357, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,544 - DEBUG - 搜索三元组: 知识图谱 TransE[15] 的知识表示学习模型 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,560 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%的知识表示学习模型%'
|
||
2025-06-11 15:15:45,566 - DEBUG - 命中: text: HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基于 GRU 的模型捕获动态 KG 中相邻
|
||
子 KG 的依赖关系 ; 引入辅助损失 , 利用先
|
||
前的结构信息监督后续超平面的学习过程
|
||
HyTE,
|
||
Flexible Translation,
|
||
t-..., 距离: 0.6241539716720581, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,566 - DEBUG - 搜索三元组: 知识图谱 part of 学习模型RPJE (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,582 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%学习模型RPJE%'
|
||
2025-06-11 15:15:45,588 - DEBUG - 搜索三元组: 基于知识图谱的问答 part of QA-KG (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,604 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%基于知识图谱的问答%QA-KG%'
|
||
2025-06-11 15:15:45,608 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.6780429482460022, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,608 - DEBUG - 搜索三元组: 张天成 field of work 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,624 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%张天成%知识图谱%'
|
||
2025-06-11 15:15:45,629 - DEBUG - 命中: text: [162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoning. In: Proc. of the 31st Int’l Conf. on
|
||
Neural Information Processing Systems (NIPS). Long Beach: C..., 距离: 0.6330105066299438, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,629 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5296636819839478, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,629 - DEBUG - 命中: text: [46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational mapping properties. In: Proc. of the
|
||
28th Pacific Asia Conf. on Language, Information and Computing (P..., 距离: 0.49077513813972473, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,629 - DEBUG - 命中: text: In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on Research and Development
|
||
in Information Retrieval. Paris: CEUR-WS, 2019.
|
||
[133]
|
||
张天成 等: 知识图谱嵌入技术研究综述 ..., 距离: 0.4850553274154663, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,629 - DEBUG - 命中: text: Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for Computing Machinery, 2019.
|
||
96–104. [doi: 10.1145/3289600.3291014]
|
||
[91]
|
||
Jiang TS, Liu TY, Ge T, Sha L,..., 距离: 0.4574166238307953, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,629 - DEBUG - 搜索三元组: 类 part of 知识图 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,646 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%类%知识图%'
|
||
2025-06-11 15:15:45,652 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.5143213868141174, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,652 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.5086515545845032, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,652 - DEBUG - 命中: text: [162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoning. In: Proc. of the 31st Int’l Conf. on
|
||
Neural Information Processing Systems (NIPS). Long Beach: C..., 距离: 0.5007524490356445, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,652 - DEBUG - 命中: text: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 距离: 0.46770092844963074, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,652 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.46138644218444824, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,652 - DEBUG - 搜索三元组: 可扩展性 神经逻辑模型 大规模知识图谱中 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,668 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%可扩展性%大规模知识图谱中%'
|
||
2025-06-11 15:15:45,672 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.674469530582428, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,672 - DEBUG - 搜索三元组: 认知智能 aggregator 知识图谱 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,688 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%认知智能%知识图谱%'
|
||
2025-06-11 15:15:45,691 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6310679912567139, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,691 - DEBUG - 搜索三元组: 知识图谱 instance of 语义网络 (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,707 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱%语义网络%'
|
||
2025-06-11 15:15:45,713 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.5649134516716003, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,713 - DEBUG - 搜索三元组: 知识图谱嵌入 studies KGE (文档: qianru.pdf)
|
||
2025-06-11 15:15:45,729 - DEBUG - 搜索表达式: userid == 'testuser1' and filename == 'qianru.pdf' and text like '%知识图谱嵌入%KGE%'
|
||
2025-06-11 15:15:45,733 - DEBUG - 命中: text: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 距离: 0.7633196115493774, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,733 - DEBUG - 命中: text: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 距离: 0.7493860125541687, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,733 - DEBUG - 命中: text: 需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., 距离: 0.7469873428344727, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,733 - DEBUG - 命中: text: 302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., 距离: 0.6985411047935486, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,733 - DEBUG - 命中: text: 最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., 距离: 0.6820932030677795, 元数据: {'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:45,734 - INFO - 返回 5 条唯一结果
|
||
2025-06-11 15:15:45,735 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-11 15:15:48,739 - INFO - 三元组检索返回 5 条结果
|
||
2025-06-11 15:15:48,739 - DEBUG - 三元组结果 1: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,739 - DEBUG - 三元组结果 2: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,739 - DEBUG - 三元组结果 3: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.7470, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,739 - DEBUG - 三元组结果 4: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 三元组结果 5: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 合并前结果:
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 1 (rag): text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., distance=0.7480, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 2 (rag): text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., distance=0.7014, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 3 (rag): text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., distance=0.6933, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 4 (rag): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.6859, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 5 (rag): text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., distance=0.6831, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 6 (triplet): text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 7 (triplet): text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 8 (triplet): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.7470, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 9 (triplet): text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:48,740 - DEBUG - 结果 10 (triplet): text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:49,731 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 15:15:50,348 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.978010, source=triplet
|
||
2025-06-11 15:15:50,348 - DEBUG - 重排序结果: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., rerank_score=0.971238, source=rag
|
||
2025-06-11 15:15:50,348 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.949201, source=rag
|
||
2025-06-11 15:15:50,348 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.860721, source=rag
|
||
2025-06-11 15:15:50,348 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.858244, source=triplet
|
||
2025-06-11 15:15:50,349 - DEBUG - 重排序结果: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., rerank_score=0.752559, source=rag
|
||
2025-06-11 15:15:50,349 - DEBUG - 重排序结果: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., rerank_score=0.415670, source=triplet
|
||
2025-06-11 15:15:50,349 - DEBUG - 重排序结果: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., rerank_score=0.359027, source=triplet
|
||
2025-06-11 15:15:50,349 - DEBUG - 重排序结果: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., rerank_score=0.220007, source=rag
|
||
2025-06-11 15:15:50,349 - DEBUG - 重排序结果: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., rerank_score=0.220007, source=triplet
|
||
2025-06-11 15:15:50,349 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 15:15:51,442 - DEBUG - 重排序后结果:
|
||
2025-06-11 15:15:51,443 - DEBUG - 排序结果 1 (triplet): text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, rerank_score=0.978010, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,443 - DEBUG - 排序结果 2 (rag): text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., distance=0.7014, rerank_score=0.971238, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:51,443 - DEBUG - 排序结果 3 (rag): text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., distance=0.6831, rerank_score=0.949201, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 4 (rag): text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., distance=0.6933, rerank_score=0.860721, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 5 (triplet): text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, rerank_score=0.858244, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 6 (rag): text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., distance=0.7480, rerank_score=0.752559, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 7 (triplet): text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, rerank_score=0.415670, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 8 (triplet): text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, rerank_score=0.359027, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 9 (rag): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.6859, rerank_score=0.220007, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 排序结果 10 (triplet): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.7470, rerank_score=0.220007, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重后结果:
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 1 (triplet): text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., distance=0.7494, rerank_score=0.978010, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 2 (rag): text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., distance=0.7014, rerank_score=0.971238, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 3 (rag): text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., distance=0.6831, rerank_score=0.949201, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 4 (rag): text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., distance=0.6933, rerank_score=0.860721, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 5 (triplet): text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., distance=0.7633, rerank_score=0.858244, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 6 (rag): text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., distance=0.7480, rerank_score=0.752559, metadata={'userid': 'testuser1', 'document_id': '75e18e23-6f5a-4697-a1bb-ee53c6507a41', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 7 (triplet): text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., distance=0.7100, rerank_score=0.415670, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 8 (triplet): text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., distance=0.7197, rerank_score=0.359027, metadata={'userid': 'testuser1', 'document_id': '842b6180-667a-4ac8-b051-5c225c859011', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - DEBUG - 去重结果 9 (rag): text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., distance=0.6859, rerank_score=0.220007, metadata={'userid': 'testuser1', 'document_id': '796af784-5a60-47f1-a4e2-3d73643fd4c5', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-11 15:15:51,444 - INFO - 合并后返回 9 条唯一结果
|
||
2025-06-11 15:51:22,535 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:51:23,125 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 15:51:26,417 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 15:51:26,418 - INFO - 开始融合搜索: query=知识图谱构建需要什么技术?, userid=testuser1, db_type=textdb
|
||
2025-06-11 15:51:27,297 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 15:51:27,426 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 15:51:27,522 - DEBUG - NER 结果: []
|
||
2025-06-11 15:51:27,522 - DEBUG - 合并连续名词: 知识图谱, 子词: ['知识', '图谱']
|
||
2025-06-11 15:51:27,522 - DEBUG - 合并连续名词: 技术, 子词: ['技术']
|
||
2025-06-11 15:51:27,522 - DEBUG - 连续名词子词集合: {'知识', '技术', '图谱'}
|
||
2025-06-11 15:51:27,523 - INFO - 从查询中提取到 4 个唯一实体: ['知识图谱', '技术', '构建', '需要']
|
||
2025-06-11 15:51:27,523 - DEBUG - 提取实体: ['知识图谱', '技术', '构建', '需要'], 耗时: 0.096s
|
||
2025-06-11 15:51:27,523 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 15:51:27,528 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt, 数量: 41
|
||
2025-06-11 15:51:27,529 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 15:51:27,674 - DEBUG - 匹配三元组: 知识图谱 - Web 3.0 - 万维网 (entity=知识图谱, head_sim=1.00, tail_sim=0.43)
|
||
2025-06-11 15:51:27,835 - DEBUG - 匹配三元组: 模式层 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.46, tail_sim=1.00)
|
||
2025-06-11 15:51:27,868 - DEBUG - 匹配三元组: 结构化知识库 - subclass of - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:51:27,965 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=知识图谱, head_sim=0.57, tail_sim=1.00)
|
||
2025-06-11 15:51:28,385 - DEBUG - 匹配三元组: 外部知识库 - 结构化数据 - 知识图谱 (entity=知识图谱, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 15:51:28,579 - DEBUG - 匹配三元组: 上下位关系 - 阿里巴巴 - 图谱 (entity=知识图谱, head_sim=0.42, tail_sim=0.82)
|
||
2025-06-11 15:51:28,644 - DEBUG - 匹配三元组: 知识图谱 - location - 城市 (entity=知识图谱, head_sim=1.00, tail_sim=0.47)
|
||
2025-06-11 15:51:28,773 - DEBUG - 匹配三元组: 知识图谱 - part of - 数据层 (entity=知识图谱, head_sim=1.00, tail_sim=0.55)
|
||
2025-06-11 15:51:28,805 - DEBUG - 匹配三元组: 总结 - part of - 知识图谱 (entity=知识图谱, head_sim=0.48, tail_sim=1.00)
|
||
2025-06-11 15:51:28,837 - DEBUG - 匹配三元组: 知识图谱 - 移动个人助理(Siri - 智能语义搜索 (entity=知识图谱, head_sim=1.00, tail_sim=0.53)
|
||
2025-06-11 15:51:32,901 - INFO - 找到 10 个匹配的三元组
|
||
2025-06-11 15:51:32,901 - DEBUG - 文件 test.docx 匹配三元组: 10 条, 耗时: 5.373s
|
||
2025-06-11 15:51:32,901 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 15:51:32,907 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt, 数量: 329
|
||
2025-06-11 15:51:32,909 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 15:51:33,102 - DEBUG - 匹配三元组: 规则模板 - 问答方法 - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 15:51:33,552 - DEBUG - 匹配三元组: 语 言 - KG - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 15:51:33,616 - DEBUG - 匹配三元组: 知识图谱 - part of - 深度学习 (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 15:51:33,648 - DEBUG - 匹配三元组: 知识图谱 - graph question answering - 库问答 (entity=知识图谱, head_sim=1.00, tail_sim=0.50)
|
||
2025-06-11 15:51:33,681 - DEBUG - 匹配三元组: 知识图谱问答 - use - 搜索引擎 (entity=知识图谱, head_sim=0.87, tail_sim=0.50)
|
||
2025-06-11 15:51:33,745 - DEBUG - 匹配三元组: 子知识图谱 - standards body - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 15:51:33,809 - DEBUG - 匹配三元组: 知识图谱 - used by - KGQA (entity=知识图谱, head_sim=1.00, tail_sim=0.31)
|
||
2025-06-11 15:51:34,290 - DEBUG - 匹配三元组: 析、查询图和信息检索方法 - Fig.1 Framework of knowledge graph question - 知识图谱问答 (entity=知识图谱, head_sim=0.64, tail_sim=0.87)
|
||
2025-06-11 15:51:34,420 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识图谱, head_sim=0.87, tail_sim=0.74)
|
||
2025-06-11 15:51:34,515 - DEBUG - 匹配三元组: 知识图谱问答 - 通用领域 - 语义解析与信息检索细化 (entity=知识图谱, head_sim=0.87, tail_sim=0.55)
|
||
2025-06-11 15:51:34,579 - DEBUG - 匹配三元组: 信息检索 - part of - 知识图谱 G (entity=知识图谱, head_sim=0.63, tail_sim=0.82)
|
||
2025-06-11 15:51:35,676 - DEBUG - 匹配三元组: 匹配方法 - Web- Questions 基线的最高精确度指标 - 知识图谱问答 (entity=知识图谱, head_sim=0.45, tail_sim=0.87)
|
||
2025-06-11 15:51:36,900 - DEBUG - 匹配三元组: 知识图谱嵌入 - subclass of - 深度学习 (entity=知识图谱, head_sim=0.81, tail_sim=0.48)
|
||
2025-06-11 15:51:38,249 - DEBUG - 匹配三元组: 知识图谱 - <misc> - 神经网络的查询图 (entity=知识图谱, head_sim=1.00, tail_sim=0.62)
|
||
2025-06-11 15:51:38,282 - DEBUG - 匹配三元组: 知识图谱 - part of - 记忆网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.57)
|
||
2025-06-11 15:51:38,410 - DEBUG - 匹配三元组: 知识图谱 - <media> - 记忆组 件存储 KG (entity=知识图谱, head_sim=1.00, tail_sim=0.42)
|
||
2025-06-11 15:51:38,860 - DEBUG - 匹配三元组: 知识图谱 - part of - Wikidata (entity=知识图谱, head_sim=1.00, tail_sim=0.44)
|
||
2025-06-11 15:51:39,987 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KGQA (entity=知识图谱, head_sim=0.81, tail_sim=0.31)
|
||
2025-06-11 15:51:40,729 - DEBUG - 匹配三元组: 图谱 - subclass of - 问答 (entity=知识图谱, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 15:51:41,664 - DEBUG - 匹配三元组: 邹磊 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.28, tail_sim=1.00)
|
||
2025-06-11 15:51:41,892 - DEBUG - 匹配三元组: рика - 陈子睿 - 知识图谱问答研究综述 (entity=知识图谱, head_sim=0.29, tail_sim=0.81)
|
||
2025-06-11 15:52:15,293 - INFO - 找到 21 个匹配的三元组
|
||
2025-06-11 15:52:15,294 - DEBUG - 文件 zongshu.pdf 匹配三元组: 21 条, 耗时: 42.386s
|
||
2025-06-11 15:52:15,294 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 15:52:15,300 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt, 数量: 466
|
||
2025-06-11 15:52:15,302 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 15:52:15,431 - DEBUG - 匹配三元组: 知识图谱嵌入 - instance of - 图模型 (entity=知识图谱, head_sim=0.81, tail_sim=0.65)
|
||
2025-06-11 15:52:15,464 - DEBUG - 匹配三元组: 种被广泛采用的知识表示方法 - 结构 - 知识图谱 (entity=知识图谱, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 15:52:15,528 - DEBUG - 匹配三元组: 知识图谱嵌入 - 分类 - 中图法分类号: TP182 (entity=知识图谱, head_sim=0.81, tail_sim=0.47)
|
||
2025-06-11 15:52:15,919 - DEBUG - 匹配三元组: 知识图谱 - subclass of - 人工智能 (entity=知识图谱, head_sim=1.00, tail_sim=0.46)
|
||
2025-06-11 15:52:15,952 - DEBUG - 匹配三元组: 知识图谱 - part of - 三 (entity=知识图谱, head_sim=1.00, tail_sim=0.38)
|
||
2025-06-11 15:52:15,984 - DEBUG - 匹配三元组: 元组 - part of - 知识图谱 (entity=知识图谱, head_sim=0.36, tail_sim=1.00)
|
||
2025-06-11 15:52:16,016 - DEBUG - 匹配三元组: 知识图谱嵌入 - part of - KG (entity=知识图谱, head_sim=0.81, tail_sim=0.32)
|
||
2025-06-11 15:52:16,242 - DEBUG - 匹配三元组: 统计关系学习 - studies - 知识图谱 (entity=知识图谱, head_sim=0.53, tail_sim=1.00)
|
||
2025-06-11 15:52:16,339 - DEBUG - 匹配三元组: 知识图谱嵌入 - G= (E;R;S) E={e1;e2;E|E - 定义几 (entity=知识图谱, head_sim=0.81, tail_sim=0.34)
|
||
2025-06-11 15:52:16,404 - DEBUG - 匹配三元组: 种基本符号 - 软件学报 2023年第 34卷第 1期 - 知识图谱 (entity=知识图谱, head_sim=0.47, tail_sim=1.00)
|
||
2025-06-11 15:52:16,469 - DEBUG - 匹配三元组: 嵌入三元组 - <media> - 知识图谱 S (entity=知识图谱, head_sim=0.39, tail_sim=0.85)
|
||
2025-06-11 15:52:18,438 - DEBUG - 匹配三元组: 知识图谱 - 生成模型 - TransG (entity=知识图谱, head_sim=1.00, tail_sim=0.34)
|
||
2025-06-11 15:52:22,790 - DEBUG - 匹配三元组: 静态知识图谱 - <media> - 形式的三元组 (entity=知识图谱, head_sim=0.81, tail_sim=0.43)
|
||
2025-06-11 15:52:23,176 - DEBUG - 匹配三元组: 知识图谱嵌入 - <misc> - 静态知识 (entity=知识图谱, head_sim=0.81, tail_sim=0.62)
|
||
2025-06-11 15:52:23,466 - DEBUG - 匹配三元组: 结构化信息 - part of - 知识图谱 (entity=知识图谱, head_sim=0.56, tail_sim=1.00)
|
||
2025-06-11 15:52:23,531 - DEBUG - 匹配三元组: 知识图谱 - TransE[15] - 的知识表示学习模型 (entity=知识图谱, head_sim=1.00, tail_sim=0.61)
|
||
2025-06-11 15:52:23,823 - DEBUG - 匹配三元组: 知识图谱 - part of - 学习模型RPJE (entity=知识图谱, head_sim=1.00, tail_sim=0.48)
|
||
2025-06-11 15:52:24,082 - DEBUG - 匹配三元组: 基于知识图谱的问答 - part of - QA-KG (entity=知识图谱, head_sim=0.84, tail_sim=0.35)
|
||
2025-06-11 15:52:24,824 - DEBUG - 匹配三元组: 张天成 - field of work - 知识图谱 (entity=知识图谱, head_sim=0.18, tail_sim=1.00)
|
||
2025-06-11 15:52:25,016 - DEBUG - 匹配三元组: 类 - part of - 知识图 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 15:52:25,370 - DEBUG - 匹配三元组: 可扩展性 - 神经逻辑模型 - 大规模知识图谱中 (entity=知识图谱, head_sim=0.46, tail_sim=0.81)
|
||
2025-06-11 15:52:25,434 - DEBUG - 匹配三元组: 认知智能 - aggregator - 知识图谱 (entity=知识图谱, head_sim=0.51, tail_sim=1.00)
|
||
2025-06-11 15:52:25,467 - DEBUG - 匹配三元组: 知识图谱 - instance of - 语义网络 (entity=知识图谱, head_sim=1.00, tail_sim=0.58)
|
||
2025-06-11 15:52:25,532 - DEBUG - 匹配三元组: 知识图谱嵌入 - studies - KGE (entity=知识图谱, head_sim=0.81, tail_sim=0.29)
|
||
2025-06-11 15:53:15,472 - INFO - 找到 24 个匹配的三元组
|
||
2025-06-11 15:53:15,473 - DEBUG - 文件 qianru.pdf 匹配三元组: 24 条, 耗时: 60.172s
|
||
2025-06-11 15:53:15,473 - DEBUG - 融合文本: 知识图谱构建需要什么技术? 知识图谱 Web 3.0 万维网 模式层 subclass of 知识图谱 结构化知识库 subclass of 知识图谱 信息抽取 part of 知识图谱 外部知识库 结构化数据 知识图谱 上下位关系 阿里巴巴 图谱 知识图谱 location 城市 知识图谱 part of 数据层 总结 part of 知识图谱 知识图谱 移动个人助理(Siri 智能语义搜索 规则模板 问答方法 知识图谱 语 言 KG 知识图谱 知识图谱 part of 深度学习 知识图谱 graph question answering 库问答 知识图谱问答 use 搜索引擎 子知识图谱 standards body KGQA 知识图谱 used by KGQA 析、查询图和信息检索方法 Fig.1 Framework of knowledge graph question 知识图谱问答 知 识图谱 知識 知识 知识图谱问答 通用领域 语义解析与信息检索细化 信息检索 part of 知识图谱 G 匹配方法 Web- Questions 基线的最高精确度指标 知识图谱问答 知识图谱嵌入 subclass of 深度学习 知识图谱 <misc> 神经网络的查询图 知识图谱 part of 记忆网络 知识图谱 <media> 记忆组 件存储 KG 知识图谱 part of Wikidata 知识图谱嵌入 part of KGQA 图谱 subclass of 问答 邹磊 field of work 知识图谱 рика 陈子睿 知识图谱问答研究综述 知识图谱嵌入 instance of 图模型 种被广泛采用的知识表示方法 结构 知识图谱 知识图谱嵌入 分类 中图法分类号: TP182 知识图谱 subclass of 人工智能 知识图谱 part of 三 元组 part of 知识图谱 知识图谱嵌入 part of KG 统计关系学习 studies 知识图谱 知识图谱嵌入 G= (E;R;S) E={e1;e2;E|E 定义几 种基本符号 软件学报 2023年第 34卷第 1期 知识图谱 嵌入三元组 <media> 知识图谱 S 知识图谱 生成模型 TransG 静态知识图谱 <media> 形式的三元组 知识图谱嵌入 <misc> 静态知识 结构化信息 part of 知识图谱 知识图谱 TransE[15] 的知识表示学习模型 知识图谱 part of 学习模型RPJE 基于知识图谱的问答 part of QA-KG 张天成 field of work 知识图谱 类 part of 知识图 可扩展性 神经逻辑模型 大规模知识图谱中 认知智能 aggregator 知识图谱 知识图谱 instance of 语义网络 知识图谱嵌入 studies KGE, 三元组数量: 55
|
||
2025-06-11 15:53:15,501 - DEBUG - 生成融合向量,维度: 1024, 耗时: 0.029s
|
||
2025-06-11 15:53:15,511 - DEBUG - Milvus 搜索耗时: 0.009s
|
||
2025-06-11 15:53:15,511 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.8084315061569214, filename=test.docx
|
||
2025-06-11 15:53:15,511 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.8077424764633179, filename=zongshu.pdf
|
||
2025-06-11 15:53:15,511 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.8062198162078857, filename=qianru.pdf
|
||
2025-06-11 15:53:15,511 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.7981106042861938, filename=qianru.pdf
|
||
2025-06-11 15:53:15,511 - DEBUG - 召回: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.7951054573059082, filename=zongshu.pdf
|
||
2025-06-11 15:53:15,511 - INFO - 去重后结果数量: 5 (原始数量: 5)
|
||
2025-06-11 15:53:15,511 - DEBUG - 开始重排序
|
||
2025-06-11 15:53:16,548 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 15:53:17,066 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.860838, source=fused_triplets_55
|
||
2025-06-11 15:53:17,066 - DEBUG - 重排序结果: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., rerank_score=0.752377, source=fused_triplets_55
|
||
2025-06-11 15:53:17,066 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.667798, source=fused_triplets_55
|
||
2025-06-11 15:53:17,066 - DEBUG - 重排序结果: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 , 对 KG
|
||
信息的利用率较高 , 主要通过监督和远程监督的方
|
||
式完成对 KG 的学习 。 知识图谱嵌入及记忆网络的
|
||
可解释性较差 , 基于神经网络的语义解析 、 查询图 、
|
||
信息检索方法可通过问答流程..., rerank_score=0.251464, source=fused_triplets_55
|
||
2025-06-11 15:53:17,066 - DEBUG - 重排序结果: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., rerank_score=0.219505, source=fused_triplets_55
|
||
2025-06-11 15:53:17,066 - INFO - 重排序返回 5 条结果
|
||
2025-06-11 15:53:17,963 - DEBUG - 重排序耗时: 2.451s
|
||
2025-06-11 15:53:17,965 - DEBUG - 排序结果 1: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.7981106042861938, rerank_score=0.8608377620505786
|
||
2025-06-11 15:53:17,967 - DEBUG - 排序结果 2: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.8084315061569214, rerank_score=0.7523766320725713
|
||
2025-06-11 15:53:17,969 - DEBUG - 排序结果 3: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.8077424764633179, rerank_score=0.6677979273537404
|
||
2025-06-11 15:53:17,970 - DEBUG - 排序结果 4: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.7951054573059082, rerank_score=0.2514638396760898
|
||
2025-06-11 15:53:17,970 - DEBUG - 排序结果 5: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.8062198162078857, rerank_score=0.21950476614240275
|
||
2025-06-11 15:53:17,970 - INFO - 总耗时: 111.552s
|
||
2025-06-11 16:10:12,334 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 16:10:12,956 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 16:10:16,219 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 16:10:16,220 - INFO - Starting search: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 16:10:16,975 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 16:10:17,059 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 16:10:17,118 - DEBUG - NER 结果: []
|
||
2025-06-11 16:10:17,118 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 16:10:17,118 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 16:10:17,118 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 16:10:17,118 - DEBUG - 提取实体: ['知识', '是', '抽取'], 耗时: 0.059s
|
||
2025-06-11 16:10:17,118 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 16:10:17,123 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt, size: 41
|
||
2025-06-11 16:10:17,124 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 16:10:18,442 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 16:10:20,184 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 16:10:20,216 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 16:10:20,410 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 16:10:20,507 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 16:10:21,152 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 16:10:21,152 - DEBUG - 文件 test.docx 匹配三元组: 5 条, 耗时: 4.029s
|
||
2025-06-11 16:10:21,152 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 16:10:21,157 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt, size: 329
|
||
2025-06-11 16:10:21,159 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 16:10:21,500 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 16:10:21,532 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 16:10:21,760 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 16:10:22,672 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 16:10:28,999 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 16:10:29,816 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 16:10:31,344 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 16:10:31,768 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 16:10:53,243 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 16:10:53,244 - DEBUG - 文件 zongshu.pdf 匹配三元组: 8 条, 耗时: 32.087s
|
||
2025-06-11 16:10:53,244 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 16:10:53,248 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt, size: 466
|
||
2025-06-11 16:10:53,250 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 16:10:53,557 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 16:10:53,589 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 16:11:00,151 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 16:11:02,834 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 16:11:05,260 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 16:11:06,330 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 16:11:06,718 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 16:11:38,484 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 16:11:38,484 - DEBUG - 文件 qianru.pdf 匹配三元组: 7 条, 耗时: 45.236s
|
||
2025-06-11 16:11:38,484 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取 Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de, 三元组数量: 20
|
||
2025-06-11 16:11:38,506 - DEBUG - 生成融合向量,维度: 1024, 耗时: 0.021s
|
||
2025-06-11 16:11:38,516 - DEBUG - Milvus 搜索耗时: 0.010s
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.7122770547866821, filename=test.docx
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.67530357837677, filename=zongshu.pdf
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6659342646598816, filename=test.docx
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6540310978889465, filename=qianru.pdf
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6520416736602783, filename=zongshu.pdf
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6494140028953552, filename=test.docx
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6453230381011963, filename=zongshu.pdf
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6408140659332275, filename=qianru.pdf
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6382900476455688, filename=qianru.pdf
|
||
2025-06-11 16:11:38,516 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6374435424804688, filename=zongshu.pdf
|
||
2025-06-11 16:11:38,516 - INFO - 去重后结果数量: 10 (原始数量: 10)
|
||
2025-06-11 16:11:38,516 - DEBUG - 开始重排序
|
||
2025-06-11 16:11:39,472 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 16:11:40,177 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.464082, source=fused_triplets_20
|
||
2025-06-11 16:11:40,177 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.037468, source=fused_triplets_20
|
||
2025-06-11 16:11:40,177 - DEBUG - 重排序结果: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统信息检索形成了以
|
||
查询图为中间结构的话语 ( utterance) 模板方法 。 在
|
||
此期间 , 三元组匹配方法和查询模板方法同样有所
|
||
发展 。 随着深度学习技术的不断发展 , 传统基于规
|
||
则模板的方..., rerank_score=0.029257, source=fused_triplets_20
|
||
2025-06-11 16:11:40,177 - DEBUG - 重排序结果: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., rerank_score=0.011332, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - DEBUG - 重排序结果: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重要的意义 。 本文对
|
||
开放领域知识图谱问答进行了研究综述 , 介绍了 5 种
|
||
基于规则模板的知识图谱问答方法 , 描述了 5 种基于
|
||
深度学习的知识图谱问答方法 , 对知识图谱问答常
|
||
用的 4 个知识..., rerank_score=0.010052, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - DEBUG - 重排序结果: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部 , 天津 300350
|
||
2. 天津市认知计算与应用重点实验室 , 天津 300350
|
||
3. 天津泰凡科技有限公司 , 天津 300457
|
||
+ 通信作者 E-mail: wangx@tju.edu.c..., rerank_score=0.003608, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - DEBUG - 重排序结果: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。
|
||
我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。
|
||
根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,..., rerank_score=0.003160, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - DEBUG - 重排序结果: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 KG 的内容通常是稀疏且不完整
|
||
的 , 导致系统无法从通用领域 KG 获得足够的信息以
|
||
回答问题 。 对此 , 人们试图引入外部文本语料库作
|
||
为开放领域知识库问答系统的另一信息源 ; 或根据
|
||
KG 目..., rerank_score=0.002834, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - DEBUG - 重排序结果: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现..., rerank_score=0.002314, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - DEBUG - 重排序结果: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 基于知识图谱嵌入的问答
|
||
随着大规模知识图谱的兴起, 基于知识图谱的问答(QA)成为重要的研究方向, 引起了人们的广泛关注. 现实
|
||
世界的领域中通常包含数百万到数十亿个事实, 其庞大的数据量和复杂的数据..., rerank_score=0.001817, source=fused_triplets_20
|
||
2025-06-11 16:11:40,178 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 16:11:41,220 - DEBUG - 重排序分数分布: [0.464, 0.037, 0.029, 0.011, 0.01, 0.004, 0.003, 0.003, 0.002, 0.002]
|
||
2025-06-11 16:11:41,221 - DEBUG - 重排序耗时: 2.705s
|
||
2025-06-11 16:11:41,224 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6494140028953552, rerank_score=0.46408175255976297
|
||
2025-06-11 16:11:41,226 - DEBUG - 排序结果 2: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6540310978889465, rerank_score=0.0374675068985736
|
||
2025-06-11 16:11:41,227 - DEBUG - 排序结果 3: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6520416736602783, rerank_score=0.029256709498098055
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 4: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6382900476455688, rerank_score=0.011331753531361455
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 5: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.67530357837677, rerank_score=0.01005236865796813
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 6: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6374435424804688, rerank_score=0.003607616803253527
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 7: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6659342646598816, rerank_score=0.003160352815071338
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 8: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6453230381011963, rerank_score=0.0028338498442466845
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 9: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.7122770547866821, rerank_score=0.0023141263296893675
|
||
2025-06-11 16:11:41,228 - DEBUG - 排序结果 10: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6408140659332275, rerank_score=0.001817283116449832
|
||
2025-06-11 16:11:41,228 - INFO - 总耗时: 85.008s
|
||
2025-06-11 16:50:44,042 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 16:50:44,682 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 16:50:48,063 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 16:50:48,063 - INFO - Starting search: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 16:50:48,987 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 16:50:49,080 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 16:50:49,174 - DEBUG - NER 结果: []
|
||
2025-06-11 16:50:49,174 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 16:50:49,174 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 16:50:49,174 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 16:50:49,174 - DEBUG - 提取实体: ['知识', '是', '抽取'], 耗时: 0.094s
|
||
2025-06-11 16:50:49,174 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 16:50:49,180 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt, size: 41
|
||
2025-06-11 16:50:49,181 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 16:50:50,517 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 16:50:52,257 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 16:50:52,289 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 16:50:52,483 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 16:50:52,579 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 16:50:53,225 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 16:50:53,225 - DEBUG - 文件 test.docx 匹配三元组: 5 条, 耗时: 4.045s
|
||
2025-06-11 16:50:53,225 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 16:50:53,230 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt, size: 329
|
||
2025-06-11 16:50:53,233 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 16:50:53,577 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 16:50:53,609 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 16:50:53,837 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 16:50:54,741 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 16:51:01,036 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 16:51:01,849 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 16:51:03,370 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 16:51:03,793 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 16:51:25,158 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 16:51:25,159 - DEBUG - 文件 zongshu.pdf 匹配三元组: 8 条, 耗时: 31.929s
|
||
2025-06-11 16:51:25,159 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 16:51:25,165 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt, size: 466
|
||
2025-06-11 16:51:25,167 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 16:51:25,472 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 16:51:25,504 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 16:51:32,034 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 16:51:34,705 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 16:51:37,119 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 16:51:38,184 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 16:51:38,569 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 16:52:10,148 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 16:52:10,149 - DEBUG - 文件 qianru.pdf 匹配三元组: 7 条, 耗时: 44.984s
|
||
2025-06-11 16:52:10,149 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取 Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de, 三元组数量: 20
|
||
2025-06-11 16:52:10,170 - DEBUG - 生成融合向量,维度: 1024, 耗时: 0.021s
|
||
2025-06-11 16:52:10,188 - DEBUG - Milvus 搜索耗时: 0.017s
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.7122770547866821, filename=test.docx
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.67530357837677, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6659342646598816, filename=test.docx
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6540310978889465, filename=qianru.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6520416736602783, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6494140028953552, filename=test.docx
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6453230381011963, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6408140659332275, filename=qianru.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6382900476455688, filename=qianru.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6374435424804688, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.632418155670166, filename=qianru.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-..., distance=0.6270214319229126, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6199074983596802, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,188 - DEBUG - 召回: text=MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
..., distance=0.6170055866241455, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能..., distance=0.6164808869361877, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.6164251565933228, filename=test.docx
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.6127768158912659, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名..., distance=0.6059378981590271, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional s..., distance=0.6026099920272827, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[39]
|
||
Mikolov T, Sutskever I, Chen K, Corrado G, Dean J. Distributed representations of words and phr..., distance=0.5964208245277405, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoni..., distance=0.5940210819244385, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[119]
|
||
Hao YC, Zhang YZ, Liu K, He SZ, Liu ZY, Wu H, Zhao J. An end-to-end model for question answeri..., distance=0.5936993956565857, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=Machine Learning (ICML). Bellevue: Omnipress, 2011. 809–816.
|
||
[18]
|
||
Nickel M, Tresp V, Kriegel HP. Fac..., distance=0.5936081409454346, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低..., distance=0.5933068990707397, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[10]
|
||
Daiber J, Jakob M, Hokamp C, Mendes PN. Improving efficiency and accuracy in multilingual entit..., distance=0.5929993391036987, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[101] XIONG W H, YU M, CHANG S Y, et al. Improving
|
||
question answering over incomplete KBs with knowl..., distance=0.5915719866752625, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.582183301448822, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=a survey[J]. IEEE Intelligent Systems & Their Applications,
|
||
2002, 14(4): 44-54.
|
||
[12] FAST E, CHEN B,..., distance=0.5821259617805481, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.5808187127113342, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B,..., distance=0.5788925886154175, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=答案部分 , 这也是两类方法的区别所在 。 开放领域
|
||
知识图谱问答 , 则是知识图谱 G 为通用领域知识图
|
||
谱 , 问题 q为开放领域问题的知识图谱问答情况 。
|
||
定义 2( 知识图谱问答 ) 给定知识..., distance=0.5785372853279114, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.5759531259536743, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[105]
|
||
Niu GL, Zhang YF, Li B, Cui P, Liu S, Li JY, Zhang XW. Rule-guided compositional representatio..., distance=0.5753666758537292, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[28]、
|
||
ATEKE[101]等.
|
||
4.3 逻辑规则
|
||
∀x;y:HasWi f e(x;y)⇒..., distance=0.5743425488471985, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=[46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational ma..., distance=0.5736039280891418, filename=qianru.pdf
|
||
2025-06-11 16:52:10,189 - DEBUG - 召回: text=In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on..., distance=0.5735967755317688, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=数据集不提供查询语句 。
|
||
WebQuestionsSP
|
||
[107]
|
||
重新审视语义解析逻辑形式
|
||
数据的价值 , 证明逻辑形式数据有助于 KGQA 性能
|
||
提升 , 并以 WebQuestions 数据集为..., distance=0.5696144700050354, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=3.4.1 神经网络+答案特征
|
||
针对无根据图到语义查询图的映射环节 , 最先
|
||
由 STAGG 系统
|
||
[27]
|
||
使用 CNN 模型完成关系映射 ; STF
|
||
系统
|
||
[88]
|
||
与 STAGG 系统的不同在于..., distance=0.5685309171676636, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=of the 10th ACM Conf. on Recommender Systems (RecSys). Boston: Association for Computing Machinery, ..., distance=0.5654684901237488, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=based question answering over RDF data[C]//Proceedings
|
||
of the 21st International Conference on World..., distance=0.5652495622634888, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=[80] HE X D, GOLUB D. Character- level question answering
|
||
with attention[C]//Proceedings of the 2016..., distance=0.5649557709693909, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基..., distance=0.5613418817520142, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=47(4): 77–83 (in Chinese with English abstract). [doi: 10.19678/j.issn.1000-3428.0057353]
|
||
[98]
|
||
Z..., distance=0.5586413145065308, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=合位置编码的方法表示问题 q, 在 WebQuestions 数据
|
||
集上获得了更优的效果 ; Xu 等人
|
||
[39]
|
||
以 KV-MemNN 为
|
||
基础 , 通过引入 STOP 策略 , 设计一种新式查询更..., distance=0.5573346614837646, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=for Computational Linguistics, Vancouver, Jul 30- Aug 4,
|
||
2017. Stroudsburg: ACL,2017: 571-581.
|
||
[36] ..., distance=0.5533172488212585, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPAT..., distance=0.5506022572517395, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=in Natural Language Processing (EMNLP). Doha: Association for Computational Linguistics (ACL), 2014...., distance=0.5500936508178711, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=据检索相似三元组得到答案 。 现经过转变 , 分别形
|
||
成以问题拆分和问题复述为首要环节的两类流水线
|
||
方法 , 并应用于开放领域知识图谱问答 。 但三元组
|
||
匹配方法在简单问题上的效果并不理想 , 在 W..., distance=0.5480425953865051, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=[70]
|
||
García-Durán A, Bordes A, Usunier N. Effective blending of two and three-way interactions for m..., distance=0.5441455245018005, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=Proc. of the 20th Int’l Conf. on Extending Database Technology (EDBT). Venice: OpenProceedings.org, ..., distance=0.5418552160263062, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=Fig.12 CYK translation process
|
||
˝…12 CYK •›Òº„ý‡Ì
|
||
Fig.13 Two forms of utterance-query template
|
||
˝…13 »..., distance=0.5386233329772949, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for C..., distance=0.5385698080062866, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=arXiv:1709.04264, 2017.
|
||
[147]
|
||
Huang HZ, Heck LP, Ji H. Leveraging deep neural networks and knowledge..., distance=0.5365546345710754, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=[76]
|
||
Socher R, Chen DQ, Manning CD, Ng AY. Reasoning with neural tensor networks for knowledge base ..., distance=0.5359963774681091, filename=qianru.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=集进一步提取字面匹配值 、 派生匹配值 、 同义词匹配
|
||
值和上下文匹配值 4 类模板特征值 , 结合环节 ( 1) 的
|
||
实体置信度等特征 , 一并输入随机森林 , 选出最优模
|
||
板进行检索 。
|
||
2.5...., distance=0.535879373550415, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=F1=2× precision×recall
|
||
precision+recall ( 4)
|
||
对于上述 3 种指标 , 有分别对应的 precision@K 、
|
||
recall@K 和 F1@K 指标 , ..., distance=0.5348227620124817, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=Freebase via relation extraction and textual evidence[C]//
|
||
Proceedings of the 54th Annual Meeting of..., distance=0.5344368815422058, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,190 - DEBUG - 召回: text=Trans. on Neural Networks and Learning Systems, 2022, 33(2): 494–514. [doi: 10.1109/TNNLS.2021.30708..., distance=0.5322403907775879, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=表 4 最新的知识图谱嵌入模型总结
|
||
类别 模型 实体嵌入 关系嵌入 评分函数 fr (h , t)
|
||
卷积神经网络
|
||
ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
..., distance=0.5320756435394287, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. ..., distance=0.5310471057891846, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=[112]
|
||
Blanco R, Ottaviano G, Meij E. Fast and space-efficient entity linking for queries. In: Proc. ..., distance=0.53049635887146, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=Banff: Association for Computing Machinery, 2007. 697–706. [doi: 10.1145/1242572.1242667]
|
||
[3]
|
||
Carlso..., distance=0.5289050936698914, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=[65] SHEKARPOUR S, MARX E, NGOMO A C, et al. SINA:
|
||
semantic interpretation of user queries for quest..., distance=0.5288459658622742, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=(h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r..., distance=0.5266366600990295, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接..., distance=0.5260889530181885, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=ANALOGY[68]
|
||
h;t ∈ Rd
|
||
Mr ∈ Rd×d
|
||
h⊤Mrt
|
||
SimplE[69]
|
||
h;t ∈ Rd
|
||
r;r′ ∈ Rd
|
||
1
|
||
2(h◦rt+t◦r′t) ..., distance=0.5260568857192993, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=rich question sets for QA evaluation[C]//Proceedings of
|
||
the 2016 Conference on Empirical Methods in ..., distance=0.5244188904762268, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=一个嵌入向量, 并为每个实体学习两个嵌入向量, 一个用于头实体嵌入, 另一个用于尾实体嵌入. 由于头、尾实体
|
||
嵌入的学习是独立的, 这导致了CP方法在知识图谱补全上性能较差. SimplE[70]是基..., distance=0.5237970352172852, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=2007, 5(2): 72-105.
|
||
[57] DAMLJANOVIC D, AGATONOVIC M, CUNNINGHAM H.
|
||
Natural language interfaces to o..., distance=0.5237061977386475, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=(61)
|
||
|
||
N (h) = {t′|(h;t′ ∉ D)}∪{t}
|
||
h
|
||
其中, 是 的负例集.
|
||
M ¨obius
|
||
M ¨obius
|
||
实际上, 多关系知识图谱往往表现出多个层次结构, 为了解..., distance=0.5232309699058533, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=of Web Semantics,2020, 65: 100612.
|
||
[88] HU S, ZOU L, ZHANG X B. A state-transition framework
|
||
to answ..., distance=0.5220537185668945, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空..., distance=0.5212742686271667, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=a corpus for complex question answering over knowledge
|
||
graphs[C]//LNCS 10588: Proceedings of the16th..., distance=0.5182384252548218, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=最初 , 直接映射的传统语义解析
|
||
[47-48]
|
||
作为 NLP 领
|
||
域的传统方法 , 用于将自然语言转换为某种逻辑语
|
||
言的表达形式 。 Berant 等人
|
||
[17]
|
||
将直接映射的传统语
|
||
义解析融入 K..., distance=0.5154937505722046, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=Conf. on Learning Representations (ICLR). New Orleans: OpenReview.net, 2019.
|
||
[84]
|
||
Zhang S, Tay Y, Ya..., distance=0.5145440101623535, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=与RotatE只有一个旋转平面不同, QuatE具有两个旋转平面. 而且, 与欧拉角相比, 四元数可以避免万向节锁问题,
|
||
同时, 四元数也比旋转矩阵更有效且数值稳定.
|
||
除了RotatE和QuatE利用..., distance=0.5064875483512878, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=h⊤diag(r)t = t⊤diag(r)h
|
||
该分数仅捕获沿相同维度h和t分量之间的成对交互作用, 减少了每个关系的参数数量. 对于任何h和t, 满
|
||
足 . 因此, 这种过度简化的模型只能处理对..., distance=0.5058000087738037, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=TransR[43] 2015 优点: 不仅考虑关系的多样性, 而且考虑实体;
|
||
缺点: 计算复杂, 忽略头、尾实体不同的类型和属性
|
||
TransD[44] 2015 优点: 计算简单、参数少;
|
||
缺点: ..., distance=0.5056704878807068, filename=qianru.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=Natural Language Processing and Computational Natural
|
||
Language Learning, Jeju Island, Jul12-14, 2012..., distance=0.5030069947242737, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,191 - DEBUG - 召回: text=系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体的数量, 表示
|
||
中的最大数. 投影矩阵的稀疏度为:
|
||
l
|
||
r = 1−(1− min)..., distance=0.5005106329917908, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=量, 得到 , 并将 作为输入馈送到一个由L个整流线性隐层组成的深度神经网络, 使得:
|
||
{ a(l) = W(l)z(l−1) +b(l); (l = 1;:::; L)
|
||
z(l) = ReL..., distance=0.4997248947620392, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=预测性能. 具有线性/双线性块的编码模型也可以使用神经网络进行建模, 例如: SME模型(具体介绍见第
|
||
3.2.1节). 代表性的神经网络模型有MLP[76], SLM[77], NTN[77], N..., distance=0.4985853433609009, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=22nd Int’l Conf. on Neural Information Processing Systems (NIPS). Vancouver: Curran Associates Inc.,..., distance=0.49670690298080444, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=Proceedings of the 52nd Annual Meeting of the Association
|
||
for Computational Linguistics, Baltimore, ..., distance=0.4945724606513977, filename=zongshu.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=2.1.4 模型总结
|
||
本节介绍了基于距离的评分函数的代表模型, 具体划分为基本距离模型, 翻译模型, 复杂关系建模3个小节进
|
||
行阐述. 在复杂关系建模小节中, 按照实体与关系的不同表示空间进行细..., distance=0.49309611320495605, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=t
|
||
■|||||■
|
||
|
||
|
||
张天成 等 : 知识图谱嵌入技术研究综述 285
|
||
2.2 语义匹配模型
|
||
(h⊤Mr≈ t⊤)
|
||
语义匹配模型利用基于相似性的评分函数, 即通过语义匹配来衡量事实的合理..., distance=0.490575909614563, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=Fr
|
||
Mr
|
||
de
|
||
t ∈ T
|
||
HypER的可视化如图11所示, 头实体嵌入h与由超网络H根据关系嵌入r创建的滤波器器 进行卷积, 将
|
||
获得的特征映射 通过权重矩阵W和非线性函数f映射到 维..., distance=0.4880823493003845, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更..., distance=0.48656076192855835, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=因此, 投影矩阵仅由关系决定是不合理的; ③ 与TransE和TransH相比, 矩阵-向量乘法使TransR模型参数急剧增
|
||
加, 因此, TransR难以应用于大规模知识图谱.
|
||
Mrh
|
||
Mrt
|
||
wh..., distance=0.4783179759979248, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接..., distance=0.47789376974105835, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - DEBUG - 召回: text=过程中除了学习嵌入之外还引入了学习关系相关候选对象与关系相关注意力两个任务. 而以往的模型(如TransH,
|
||
TransR, TranSparse)无法学习细粒度的注意力.
|
||
由此, Qian等人[52..., distance=0.4492214322090149, filename=qianru.pdf
|
||
2025-06-11 16:52:10,192 - INFO - 去重后结果数量: 91 (原始数量: 91)
|
||
2025-06-11 16:52:10,192 - DEBUG - 开始重排序
|
||
2025-06-11 16:52:11,271 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 16:52:12,358 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.464294, source=fused_triplets_20
|
||
2025-06-11 16:52:12,358 - DEBUG - 重排序结果: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., rerank_score=0.126030, source=fused_triplets_20
|
||
2025-06-11 16:52:12,358 - DEBUG - 重排序结果: text=Banff: Association for Computing Machinery, 2007. 697–706. [doi: 10.1145/1242572.1242667]
|
||
[3]
|
||
Carlson A, Betteridge J, Kisiel B, Settles B, Hruschka ER, Mitchell TM. Toward an architecture for never-e..., rerank_score=0.069668, source=fused_triplets_20
|
||
2025-06-11 16:52:12,358 - DEBUG - 重排序结果: text=PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空间模型作为复述模型对自然语言 -
|
||
逻辑形式元组 (c,z) 打分 , 使用得分最高元组的逻辑
|
||
形式 z 检索 KG 获得答案 。
|
||
OQA 系统
|
||
[54]
|
||
使用预先定义的操作符与模板 , 将
|
||
用户问题提..., rerank_score=0.067179, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - DEBUG - 重排序结果: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P, LIN J. Strong baselines for simple
|
||
question answering over knowledge graphs with and without
|
||
neura..., rerank_score=0.062789, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - DEBUG - 重排序结果: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., rerank_score=0.058561, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - DEBUG - 重排序结果: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP). Seattle: Association for
|
||
Computational Linguistics (ACL), 2013. 1366–1371.
|
||
[140]
|
||
Han X, Liu ZY, Sun..., rerank_score=0.040999, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.037468, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - DEBUG - 重排序结果: text=最初 , 直接映射的传统语义解析
|
||
[47-48]
|
||
作为 NLP 领
|
||
域的传统方法 , 用于将自然语言转换为某种逻辑语
|
||
言的表达形式 。 Berant 等人
|
||
[17]
|
||
将直接映射的传统语
|
||
义解析融入 KGQA 作为解决方法 , 解决了两个主要
|
||
问题 : 训练语义解析器需要人工标记的逻辑形式数
|
||
据作为监督和词汇表覆盖面窄的问题 , 并提出了著
|
||
名的 WebQuestions
|
||
[17]
|
||
数据集基线 。
|
||
..., rerank_score=0.034815, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - DEBUG - 重排序结果: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理两个层面的问题:
|
||
数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
|
||
通过模式层的融合,将新得到的本体融入已有的本体库中
|
||
然后是合并关..., rerank_score=0.031026, source=fused_triplets_20
|
||
2025-06-11 16:52:12,359 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 16:52:13,304 - DEBUG - 重排序分数分布: [0.464, 0.126, 0.07, 0.067, 0.063, 0.059, 0.041, 0.037, 0.035, 0.031]
|
||
2025-06-11 16:52:13,305 - DEBUG - 重排序耗时: 3.113s
|
||
2025-06-11 16:52:13,307 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6494140028953552, rerank_score=0.46429427971867326
|
||
2025-06-11 16:52:13,309 - DEBUG - 排序结果 2: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.5808187127113342, rerank_score=0.12603029065187174
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 3: text=Banff: Association for Computing Machinery, 2007. 697–706. [doi: 10.1145/1242572.1242667]
|
||
[3]
|
||
Carlso..., distance=0.5289050936698914, rerank_score=0.0696682291074515
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 4: text=PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空..., distance=0.5212742686271667, rerank_score=0.06717857728888728
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 5: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.582183301448822, rerank_score=0.06278920859705135
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 6: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.632418155670166, rerank_score=0.058560826873748875
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 7: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.5759531259536743, rerank_score=0.04099902718739302
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 8: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6540310978889465, rerank_score=0.0374675068985736
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 9: text=最初 , 直接映射的传统语义解析
|
||
[47-48]
|
||
作为 NLP 领
|
||
域的传统方法 , 用于将自然语言转换为某种逻辑语
|
||
言的表达形式 。 Berant 等人
|
||
[17]
|
||
将直接映射的传统语
|
||
义解析融入 K..., distance=0.5154937505722046, rerank_score=0.03481519622190517
|
||
2025-06-11 16:52:13,311 - DEBUG - 排序结果 10: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.6164251565933228, rerank_score=0.03102617939183979
|
||
2025-06-11 16:52:13,311 - INFO - 总耗时: 85.248s
|
||
2025-06-11 17:55:50,894 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 17:55:51,605 - DEBUG - LTP 模型加载成功
|
||
2025-06-11 17:55:54,658 - DEBUG - 嵌入模型加载成功
|
||
2025-06-11 17:55:54,658 - INFO - 开始融合搜索: query=什么是知识抽取?, userid=testuser1, db_type=textdb
|
||
2025-06-11 17:55:55,453 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-11 17:55:55,548 - DEBUG - 加载 Milvus 集合: ragdb_textdb
|
||
2025-06-11 17:55:55,592 - DEBUG - NER 结果: []
|
||
2025-06-11 17:55:55,592 - DEBUG - 合并连续名词: 知识, 子词: ['知识']
|
||
2025-06-11 17:55:55,592 - DEBUG - 连续名词子词集合: {'知识'}
|
||
2025-06-11 17:55:55,592 - INFO - 从查询中提取到 3 个唯一实体: ['知识', '是', '抽取']
|
||
2025-06-11 17:55:55,592 - DEBUG - 提取实体: ['知识', '是', '抽取'], 耗时: 0.044s
|
||
2025-06-11 17:55:55,592 - DEBUG - 处理文件: test.docx
|
||
2025-06-11 17:55:55,597 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt, 数量: 41
|
||
2025-06-11 17:55:55,598 - DEBUG - 从 /share/wangmeihua/rag/triples/75e18e23-6f5a-4697-a1bb-ee53c6507a41_testuser1.txt 加载 41 个三元组
|
||
2025-06-11 17:55:56,930 - DEBUG - 匹配三元组: (Sri) - subclass of - 的知识 (entity=知识, head_sim=0.39, tail_sim=0.94)
|
||
2025-06-11 17:55:58,679 - DEBUG - 匹配三元组: 信息抽取 - part of - 知识图谱 (entity=抽取, head_sim=0.86, tail_sim=0.48)
|
||
2025-06-11 17:55:58,712 - DEBUG - 匹配三元组: 实体识别 - subclass of - 信息抽取 (entity=抽取, head_sim=0.50, tail_sim=0.86)
|
||
2025-06-11 17:55:58,907 - DEBUG - 匹配三元组: 属性抽取 - <misc> - 统计机器学习 (entity=抽取, head_sim=0.81, tail_sim=0.55)
|
||
2025-06-11 17:55:59,006 - DEBUG - 匹配三元组: 拼图碎片 - 非结构化 - 信息抽取 (entity=抽取, head_sim=0.51, tail_sim=0.86)
|
||
2025-06-11 17:55:59,656 - INFO - 找到 5 个匹配的三元组
|
||
2025-06-11 17:55:59,656 - DEBUG - 文件 test.docx 匹配三元组: 5 条, 耗时: 4.059s
|
||
2025-06-11 17:55:59,656 - DEBUG - 处理文件: zongshu.pdf
|
||
2025-06-11 17:55:59,660 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt, 数量: 329
|
||
2025-06-11 17:55:59,663 - DEBUG - 从 /share/wangmeihua/rag/triples/842b6180-667a-4ac8-b051-5c225c859011_testuser1.txt 加载 329 个三元组
|
||
2025-06-11 17:56:00,007 - DEBUG - 匹配三元组: Knowledge - instance of - natural язык question (entity=知识, head_sim=0.82, tail_sim=0.52)
|
||
2025-06-11 17:56:00,040 - DEBUG - 匹配三元组: graph - part of KG - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 17:56:00,267 - DEBUG - 匹配三元组: 限定领 域知识库 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 17:56:01,179 - DEBUG - 匹配三元组: 知 识图谱 - 知識 - 知识 (entity=知识, head_sim=0.65, tail_sim=1.00)
|
||
2025-06-11 17:56:07,515 - DEBUG - 匹配三元组: 开放领域知识图谱问答 - subclass of - 知识 (entity=知识, head_sim=0.54, tail_sim=1.00)
|
||
2025-06-11 17:56:08,335 - DEBUG - 匹配三元组: knowledgebase question - mainland - knowledge (entity=知识, head_sim=0.58, tail_sim=0.83)
|
||
2025-06-11 17:56:09,867 - DEBUG - 匹配三元组: YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S - knowledge of knowledge - knowledge (entity=知识, head_sim=0.54, tail_sim=0.83)
|
||
2025-06-11 17:56:10,291 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 17:56:31,809 - INFO - 找到 8 个匹配的三元组
|
||
2025-06-11 17:56:31,809 - DEBUG - 文件 zongshu.pdf 匹配三元组: 8 条, 耗时: 32.149s
|
||
2025-06-11 17:56:31,809 - DEBUG - 处理文件: qianru.pdf
|
||
2025-06-11 17:56:31,815 - DEBUG - 加载三元组文件: /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt, 数量: 466
|
||
2025-06-11 17:56:31,817 - DEBUG - 从 /share/wangmeihua/rag/triples/796af784-5a60-47f1-a4e2-3d73643fd4c5_testuser1.txt 加载 466 个三元组
|
||
2025-06-11 17:56:32,125 - DEBUG - 匹配三元组: graph - part of technology that uses - Knowledge (entity=知识, head_sim=0.53, tail_sim=0.82)
|
||
2025-06-11 17:56:32,158 - DEBUG - 匹配三元组: knowledge - <dis> - Knowledge models (entity=知识, head_sim=0.83, tail_sim=0.60)
|
||
2025-06-11 17:56:38,772 - DEBUG - 匹配三元组: 动态知识图谱嵌入 - subclass of - 知识 (entity=知识, head_sim=0.58, tail_sim=1.00)
|
||
2025-06-11 17:56:41,473 - DEBUG - 匹配三元组: 知识类型 - part of - KGE (entity=知识, head_sim=0.81, tail_sim=0.30)
|
||
2025-06-11 17:56:43,917 - DEBUG - 匹配三元组: graphs - studies - knowledge (entity=知识, head_sim=0.53, tail_sim=0.83)
|
||
2025-06-11 17:56:44,994 - DEBUG - 匹配三元组: graph completion - part of - knowledge (entity=知识, head_sim=0.49, tail_sim=0.83)
|
||
2025-06-11 17:56:45,384 - DEBUG - 匹配三元组: Knowledge - LinYG, HY - Lin J.computer.de (entity=知识, head_sim=0.82, tail_sim=0.44)
|
||
2025-06-11 17:57:17,350 - INFO - 找到 7 个匹配的三元组
|
||
2025-06-11 17:57:17,351 - DEBUG - 文件 qianru.pdf 匹配三元组: 7 条, 耗时: 45.535s
|
||
2025-06-11 17:57:17,351 - DEBUG - 融合文本: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取 Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de, 三元组数量: 20
|
||
2025-06-11 17:57:17,372 - DEBUG - 生成融合向量,维度: 1024, 耗时: 0.021s
|
||
2025-06-11 17:57:17,389 - DEBUG - Milvus 搜索耗时: 0.017s
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识..., distance=0.7122770547866821, filename=test.docx
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=的信息检索方法在简单问题上的有效性 , 是未来的
|
||
一个研究方向 。
|
||
7 总结
|
||
问答系统能自动回答人类提出的自然语言问
|
||
题 , 开放领域知识图谱问答作为问答系统与通用领
|
||
域知识图谱的融合 , 具有十分重..., distance=0.67530357837677, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=7.2 知识推理
|
||
在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成..., distance=0.6659342646598816, filename=test.docx
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6540310978889465, filename=qianru.pdf
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=域知识图谱问答以人工因素占主导的规则模板方法
|
||
为主 。 最初通过词汇表 、 依存分析等方法构建查询
|
||
语句 , 进而检索 KG 获得问题答案的传统语义解析方
|
||
法 较 多 ; 基于语义 解析方法 , 传统..., distance=0.6520416736602783, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6494140028953552, filename=test.docx
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=谱问答已经取得一定进展 , 但现存的开放领域知识
|
||
图谱问答方法仍有许多局限性 , 面临许多挑战 。 本
|
||
章给出开放领域知识图谱问答的一些未来研究方向 。
|
||
6.1 解决知识图谱不完整问题
|
||
由于通用领域 ..., distance=0.6453230381011963, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,389 - DEBUG - 召回: text=需求, 并给出适当响应. 知识图谱嵌入方法的核心思想是将每个实体、关系表示为一个低维向量, 而学习到的实体、
|
||
关系嵌入可以受益于多种下游任务. 在本节中, 我们将介绍KGE的典型应用.
|
||
5.1 ..., distance=0.6408140659332275, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 11016..., distance=0.6382900476455688, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=ˁ ଊ ጊ
|
||
X X X D F B KP S H
|
||
开放领域知识图谱问答研究综述
|
||
陈子睿
|
||
1
|
||
, 王 鑫
|
||
1,2+
|
||
, 王 林
|
||
3
|
||
, 徐大为
|
||
3
|
||
, 贾勇哲
|
||
1,3
|
||
1. 天津大学 智能与计算学部..., distance=0.6374435424804688, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=existing knowledge graph embedding technologies are comprehensively reviewed, including not only tec..., distance=0.632418155670166, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=神经网络+问题
|
||
特征+图特征
|
||
剪枝+集束搜索
|
||
神经网络+候选
|
||
排序
|
||
神经网络+关系
|
||
匹配
|
||
神经网络+候选
|
||
排序+外部信息
|
||
文献
|
||
[19,33,41-42,75-77,95]
|
||
[24,32,39,78-..., distance=0.6270214319229126, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=同义实体 。 如何训练系统 , 使得系统对 KG 信息进行
|
||
充分的掌握与利用是 KGQA 面临的又一挑战 。
|
||
( 3) 答案可解释性 。 对于整个 KGQA 系统而言 ,
|
||
通过将自然语言作为输入 , ..., distance=0.6199074983596802, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=MCCNN
|
||
[28]
|
||
抽取特征的效果较好 ; 对于实体和 关系抽
|
||
Fig.23 Example of evaluation metric
|
||
˝…23 ˘À†âÖ‚–Œ˚¾Àý˝…
|
||
1860
|
||
ˁ ଊ ጊ
|
||
..., distance=0.6170055866241455, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=来研究方向.
|
||
6.1 面临的挑战
|
||
6.1.1 探索KG的内部和外部信息
|
||
KG中的实体和关系具有复杂的特性和丰富的信息, 而这些信息尚未得到充分考虑. 本小节将讨论为增强
|
||
KGE方法的性能..., distance=0.6164808869361877, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=6.2 知识合并
|
||
在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。
|
||
常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。
|
||
将外部知识库融合到本地知识库需要处理..., distance=0.6164251565933228, filename=test.docx
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=KGQA 方法逐渐被提出和发展 。 初期阶段 , 在排序
|
||
环节会采用基于规则或模板的方法进行实现 , 之后
|
||
则由深度学习方法所取代 。 基于深度学习的方法通
|
||
过神经网络模型抽取问题特征完成问答任务 ,..., distance=0.6127768158912659, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=机制表示问题与候选答案 。实验结果显示交叉注意
|
||
力机制的效果优于 MCCNN 。
|
||
3.5.2 神经网络 +关系匹配
|
||
神经网络模型同样可用于传统信息检索中的关
|
||
系匹配环节。
|
||
Yu等人
|
||
[35]
|
||
将关系名..., distance=0.6059378981590271, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=summarized. Firstly, five rule and template based KGQA methods are reviewed, including traditional s..., distance=0.6026099920272827, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=[39]
|
||
Mikolov T, Sutskever I, Chen K, Corrado G, Dean J. Distributed representations of words and phr..., distance=0.5964208245277405, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=[162]
|
||
Yang F, Yang ZL, Cohen WW. Differentiable learning of logical rules for knowledge base reasoni..., distance=0.5940210819244385, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=[119]
|
||
Hao YC, Zhang YZ, Liu K, He SZ, Liu ZY, Wu H, Zhao J. An end-to-end model for question answeri..., distance=0.5936993956565857, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=Machine Learning (ICML). Bellevue: Omnipress, 2011. 809–816.
|
||
[18]
|
||
Nickel M, Tresp V, Kriegel HP. Fac..., distance=0.5936081409454346, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低..., distance=0.5933068990707397, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=[10]
|
||
Daiber J, Jakob M, Hokamp C, Mendes PN. Improving efficiency and accuracy in multilingual entit..., distance=0.5929993391036987, filename=qianru.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=[101] XIONG W H, YU M, CHANG S Y, et al. Improving
|
||
question answering over incomplete KBs with knowl..., distance=0.5915719866752625, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=Linguistics, Vancouver, Jul 30- Aug 4, 2017. Stroudsburg:
|
||
ACL, 2017: 221-231.
|
||
[94] MOHAMMED S, SHI P..., distance=0.582183301448822, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=a survey[J]. IEEE Intelligent Systems & Their Applications,
|
||
2002, 14(4): 44-54.
|
||
[12] FAST E, CHEN B,..., distance=0.5821259617805481, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,390 - DEBUG - 召回: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.5808187127113342, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B,..., distance=0.5788925886154175, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=答案部分 , 这也是两类方法的区别所在 。 开放领域
|
||
知识图谱问答 , 则是知识图谱 G 为通用领域知识图
|
||
谱 , 问题 q为开放领域问题的知识图谱问答情况 。
|
||
定义 2( 知识图谱问答 ) 给定知识..., distance=0.5785372853279114, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.5759531259536743, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=[105]
|
||
Niu GL, Zhang YF, Li B, Cui P, Liu S, Li JY, Zhang XW. Rule-guided compositional representatio..., distance=0.5753666758537292, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=的两种表示, 与DKRL不同的是SSP采用主题模型建模实体的文本表示. 相关的其他模型还有TEKE[28]、
|
||
ATEKE[101]等.
|
||
4.3 逻辑规则
|
||
∀x;y:HasWi f e(x;y)⇒..., distance=0.5743425488471985, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=[46]
|
||
Fan M, Zhou Q, Chang E, Zheng TF. Transition-based knowledge graph embedding with relational ma..., distance=0.5736039280891418, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=In: Proc. of the SIGIR 2019 Workshop on eCommerce, Co-located with the 42nd Int’l ACM SIGIR Conf. on..., distance=0.5735967755317688, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=数据集不提供查询语句 。
|
||
WebQuestionsSP
|
||
[107]
|
||
重新审视语义解析逻辑形式
|
||
数据的价值 , 证明逻辑形式数据有助于 KGQA 性能
|
||
提升 , 并以 WebQuestions 数据集为..., distance=0.5696144700050354, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=3.4.1 神经网络+答案特征
|
||
针对无根据图到语义查询图的映射环节 , 最先
|
||
由 STAGG 系统
|
||
[27]
|
||
使用 CNN 模型完成关系映射 ; STF
|
||
系统
|
||
[88]
|
||
与 STAGG 系统的不同在于..., distance=0.5685309171676636, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=of the 10th ACM Conf. on Recommender Systems (RecSys). Boston: Association for Computing Machinery, ..., distance=0.5654684901237488, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=based question answering over RDF data[C]//Proceedings
|
||
of the 21st International Conference on World..., distance=0.5652495622634888, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=[80] HE X D, GOLUB D. Character- level question answering
|
||
with attention[C]//Proceedings of the 2016..., distance=0.5649557709693909, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=HyTE,
|
||
Flexible Translation
|
||
独立学习不同子 KG, 不能显
|
||
式建模动态 KG 演化过程
|
||
同时保留当前子 KG 的结构
|
||
信息与动态 KG 的时间演化
|
||
模式
|
||
利用基..., distance=0.5613418817520142, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=47(4): 77–83 (in Chinese with English abstract). [doi: 10.19678/j.issn.1000-3428.0057353]
|
||
[98]
|
||
Z..., distance=0.5586413145065308, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=合位置编码的方法表示问题 q, 在 WebQuestions 数据
|
||
集上获得了更优的效果 ; Xu 等人
|
||
[39]
|
||
以 KV-MemNN 为
|
||
基础 , 通过引入 STOP 策略 , 设计一种新式查询更..., distance=0.5573346614837646, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=for Computational Linguistics, Vancouver, Jul 30- Aug 4,
|
||
2017. Stroudsburg: ACL,2017: 571-581.
|
||
[36] ..., distance=0.5533172488212585, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=Processing, Hong Kong, China, Nov3-7, 2019. Stroudsburg:
|
||
ACL, 2019: 2380-2390.
|
||
[42] SAXENA A, TRIPAT..., distance=0.5506022572517395, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=in Natural Language Processing (EMNLP). Doha: Association for Computational Linguistics (ACL), 2014...., distance=0.5500936508178711, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=据检索相似三元组得到答案 。 现经过转变 , 分别形
|
||
成以问题拆分和问题复述为首要环节的两类流水线
|
||
方法 , 并应用于开放领域知识图谱问答 。 但三元组
|
||
匹配方法在简单问题上的效果并不理想 , 在 W..., distance=0.5480425953865051, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=[70]
|
||
García-Durán A, Bordes A, Usunier N. Effective blending of two and three-way interactions for m..., distance=0.5441455245018005, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=Proc. of the 20th Int’l Conf. on Extending Database Technology (EDBT). Venice: OpenProceedings.org, ..., distance=0.5418552160263062, filename=qianru.pdf
|
||
2025-06-11 17:57:17,391 - DEBUG - 召回: text=Fig.12 CYK translation process
|
||
˝…12 CYK •›Òº„ý‡Ì
|
||
Fig.13 Two forms of utterance-query template
|
||
˝…13 »..., distance=0.5386233329772949, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for C..., distance=0.5385698080062866, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=arXiv:1709.04264, 2017.
|
||
[147]
|
||
Huang HZ, Heck LP, Ji H. Leveraging deep neural networks and knowledge..., distance=0.5365546345710754, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=[76]
|
||
Socher R, Chen DQ, Manning CD, Ng AY. Reasoning with neural tensor networks for knowledge base ..., distance=0.5359963774681091, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=集进一步提取字面匹配值 、 派生匹配值 、 同义词匹配
|
||
值和上下文匹配值 4 类模板特征值 , 结合环节 ( 1) 的
|
||
实体置信度等特征 , 一并输入随机森林 , 选出最优模
|
||
板进行检索 。
|
||
2.5...., distance=0.535879373550415, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=F1=2× precision×recall
|
||
precision+recall ( 4)
|
||
对于上述 3 种指标 , 有分别对应的 precision@K 、
|
||
recall@K 和 F1@K 指标 , ..., distance=0.5348227620124817, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=Freebase via relation extraction and textual evidence[C]//
|
||
Proceedings of the 54th Annual Meeting of..., distance=0.5344368815422058, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=Trans. on Neural Networks and Learning Systems, 2022, 33(2): 494–514. [doi: 10.1109/TNNLS.2021.30708..., distance=0.5322403907775879, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=表 4 最新的知识图谱嵌入模型总结
|
||
类别 模型 实体嵌入 关系嵌入 评分函数 fr (h , t)
|
||
卷积神经网络
|
||
ConvE [ 79 ]
|
||
Mh ∈ Rdw×dh
|
||
t ∈ Rd
|
||
..., distance=0.5320756435394287, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=wt1;wt2;:::;
|
||
wtT
|
||
|
||
w
|
||
P (h)
|
||
P (t)
|
||
P (r)
|
||
HyTE将时间表示为超平面, 对于KG中的T个时间步, 可以得到T个不同的超平面, 分别由法向量
|
||
表示. ..., distance=0.5310471057891846, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=[112]
|
||
Blanco R, Ottaviano G, Meij E. Fast and space-efficient entity linking for queries. In: Proc. ..., distance=0.53049635887146, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=Banff: Association for Computing Machinery, 2007. 697–706. [doi: 10.1145/1242572.1242667]
|
||
[3]
|
||
Carlso..., distance=0.5289050936698914, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=[65] SHEKARPOUR S, MARX E, NGOMO A C, et al. SINA:
|
||
semantic interpretation of user queries for quest..., distance=0.5288459658622742, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=(h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r..., distance=0.5266366600990295, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=YAGO 是一个三元组质量高 、概念覆盖广的链接
|
||
数据库,其核心同为维基百科 ,却以较高的准确率将
|
||
维基百科与 WordNet
|
||
[102]
|
||
两个数据源进行连接 ,以三元
|
||
组的关系类型为单位 ,计算连接..., distance=0.5260889530181885, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=ANALOGY[68]
|
||
h;t ∈ Rd
|
||
Mr ∈ Rd×d
|
||
h⊤Mrt
|
||
SimplE[69]
|
||
h;t ∈ Rd
|
||
r;r′ ∈ Rd
|
||
1
|
||
2(h◦rt+t◦r′t) ..., distance=0.5260568857192993, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=rich question sets for QA evaluation[C]//Proceedings of
|
||
the 2016 Conference on Empirical Methods in ..., distance=0.5244188904762268, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=一个嵌入向量, 并为每个实体学习两个嵌入向量, 一个用于头实体嵌入, 另一个用于尾实体嵌入. 由于头、尾实体
|
||
嵌入的学习是独立的, 这导致了CP方法在知识图谱补全上性能较差. SimplE[70]是基..., distance=0.5237970352172852, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=2007, 5(2): 72-105.
|
||
[57] DAMLJANOVIC D, AGATONOVIC M, CUNNINGHAM H.
|
||
Natural language interfaces to o..., distance=0.5237061977386475, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=(61)
|
||
|
||
N (h) = {t′|(h;t′ ∉ D)}∪{t}
|
||
h
|
||
其中, 是 的负例集.
|
||
M ¨obius
|
||
M ¨obius
|
||
实际上, 多关系知识图谱往往表现出多个层次结构, 为了解..., distance=0.5232309699058533, filename=qianru.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=of Web Semantics,2020, 65: 100612.
|
||
[88] HU S, ZOU L, ZHANG X B. A state-transition framework
|
||
to answ..., distance=0.5220537185668945, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,392 - DEBUG - 召回: text=PARASEMPRE 系统
|
||
[23]
|
||
使用 5 个人工定义模板将问题
|
||
转换为逻辑形式 z , 后使 用预先定义好的规则和词汇
|
||
表将每个逻辑形式 z 转换为一组自然语言 c , 后使用
|
||
联合模型与向量空..., distance=0.5212742686271667, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=a corpus for complex question answering over knowledge
|
||
graphs[C]//LNCS 10588: Proceedings of the16th..., distance=0.5182384252548218, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=最初 , 直接映射的传统语义解析
|
||
[47-48]
|
||
作为 NLP 领
|
||
域的传统方法 , 用于将自然语言转换为某种逻辑语
|
||
言的表达形式 。 Berant 等人
|
||
[17]
|
||
将直接映射的传统语
|
||
义解析融入 K..., distance=0.5154937505722046, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=Conf. on Learning Representations (ICLR). New Orleans: OpenReview.net, 2019.
|
||
[84]
|
||
Zhang S, Tay Y, Ya..., distance=0.5145440101623535, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=与RotatE只有一个旋转平面不同, QuatE具有两个旋转平面. 而且, 与欧拉角相比, 四元数可以避免万向节锁问题,
|
||
同时, 四元数也比旋转矩阵更有效且数值稳定.
|
||
除了RotatE和QuatE利用..., distance=0.5064875483512878, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=h⊤diag(r)t = t⊤diag(r)h
|
||
该分数仅捕获沿相同维度h和t分量之间的成对交互作用, 减少了每个关系的参数数量. 对于任何h和t, 满
|
||
足 . 因此, 这种过度简化的模型只能处理对..., distance=0.5058000087738037, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=TransR[43] 2015 优点: 不仅考虑关系的多样性, 而且考虑实体;
|
||
缺点: 计算复杂, 忽略头、尾实体不同的类型和属性
|
||
TransD[44] 2015 优点: 计算简单、参数少;
|
||
缺点: ..., distance=0.5056704878807068, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=Natural Language Processing and Computational Natural
|
||
Language Learning, Jeju Island, Jul12-14, 2012..., distance=0.5030069947242737, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体的数量, 表示
|
||
中的最大数. 投影矩阵的稀疏度为:
|
||
l
|
||
r = 1−(1− min)..., distance=0.5005106329917908, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=量, 得到 , 并将 作为输入馈送到一个由L个整流线性隐层组成的深度神经网络, 使得:
|
||
{ a(l) = W(l)z(l−1) +b(l); (l = 1;:::; L)
|
||
z(l) = ReL..., distance=0.4997248947620392, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=预测性能. 具有线性/双线性块的编码模型也可以使用神经网络进行建模, 例如: SME模型(具体介绍见第
|
||
3.2.1节). 代表性的神经网络模型有MLP[76], SLM[77], NTN[77], N..., distance=0.4985853433609009, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=22nd Int’l Conf. on Neural Information Processing Systems (NIPS). Vancouver: Curran Associates Inc.,..., distance=0.49670690298080444, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=Proceedings of the 52nd Annual Meeting of the Association
|
||
for Computational Linguistics, Baltimore, ..., distance=0.4945724606513977, filename=zongshu.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=2.1.4 模型总结
|
||
本节介绍了基于距离的评分函数的代表模型, 具体划分为基本距离模型, 翻译模型, 复杂关系建模3个小节进
|
||
行阐述. 在复杂关系建模小节中, 按照实体与关系的不同表示空间进行细..., distance=0.49309611320495605, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=t
|
||
■|||||■
|
||
|
||
|
||
张天成 等 : 知识图谱嵌入技术研究综述 285
|
||
2.2 语义匹配模型
|
||
(h⊤Mr≈ t⊤)
|
||
语义匹配模型利用基于相似性的评分函数, 即通过语义匹配来衡量事实的合理..., distance=0.490575909614563, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=Fr
|
||
Mr
|
||
de
|
||
t ∈ T
|
||
HypER的可视化如图11所示, 头实体嵌入h与由超网络H根据关系嵌入r创建的滤波器器 进行卷积, 将
|
||
获得的特征映射 通过权重矩阵W和非线性函数f映射到 维..., distance=0.4880823493003845, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更..., distance=0.48656076192855835, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=因此, 投影矩阵仅由关系决定是不合理的; ③ 与TransE和TransH相比, 矩阵-向量乘法使TransR模型参数急剧增
|
||
加, 因此, TransR难以应用于大规模知识图谱.
|
||
Mrh
|
||
Mrt
|
||
wh..., distance=0.4783179759979248, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接..., distance=0.47789376974105835, filename=qianru.pdf
|
||
2025-06-11 17:57:17,393 - DEBUG - 召回: text=过程中除了学习嵌入之外还引入了学习关系相关候选对象与关系相关注意力两个任务. 而以往的模型(如TransH,
|
||
TransR, TranSparse)无法学习细粒度的注意力.
|
||
由此, Qian等人[52..., distance=0.4492214322090149, filename=qianru.pdf
|
||
2025-06-11 17:57:17,394 - INFO - 去重后结果数量: 91 (原始数量: 91)
|
||
2025-06-11 17:57:17,394 - DEBUG - 开始重排序
|
||
2025-06-11 17:57:17,394 - DEBUG - 重排序查询: 什么是知识抽取? (Sri) subclass of 的知识 信息抽取 part of 知识图谱 实体识别 subclass of 信息抽取 属性抽取 <misc> 统计机器学习 拼图碎片 非结构化 信息抽取 Knowledge instance of natural язык question graph part of KG knowledge 限定领 域知识库 subclass of 知识 知 识图谱 知識 知识 开放领域知识图谱问答 subclass of 知识 knowledgebase question mainland knowledge YU M, CHANG S Y, et al. Improving question answering over incomplete KBs with knowledge-M,CHang S knowledge of knowledge knowledge graphs studies knowledge graph part of technology that uses Knowledge knowledge <dis> Knowledge models 动态知识图谱嵌入 subclass of 知识 知识类型 part of KGE graphs studies knowledge graph completion part of knowledge Knowledge LinYG, HY Lin J.computer.de
|
||
2025-06-11 17:57:18,330 - DEBUG - BGE Reranker 初始化成功,模型路径: /share/models/BAAI/bge-reranker-v2-m3, 设备: cuda:0
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。
|
||
1.人工构造语法和语义规则(模式匹配)
|
||
2.统计机器学习方法
|
||
3.基于特征向量或核..., rerank_score=0.824321, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP). Seattle: Association for
|
||
Computational Linguistics (ACL), 2013. 1366–1371.
|
||
[140]
|
||
Han X, Liu ZY, Sun..., rerank_score=0.715424, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B, Guo L. Jointly embedding knowledge graphs and logical rules. In: Proc. of the 2016 Conf. on
|
||
Empiric..., rerank_score=0.573380, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=arXiv:1709.04264, 2017.
|
||
[147]
|
||
Huang HZ, Heck LP, Ji H. Leveraging deep neural networks and knowledge graphs for entity disambiguation. arXiv:1504.07678, 2015.[148]
|
||
Fang W, Zhang JW, Wang DL, Chen Z, L..., rerank_score=0.556580, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=[10]
|
||
Daiber J, Jakob M, Hokamp C, Mendes PN. Improving efficiency and accuracy in multilingual entity extraction. In: Proc. of the 9th Int’l
|
||
Conf. on Semantic Systems. Graz: Association for Computing ..., rerank_score=0.556400, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交互特定的方式充分利用了KG的语义和拓扑, 为推荐结果提
|
||
供了可解释性. 此外, Ni等人描述了一种用于Wikipedia的基于嵌入的实体推荐框架[135], 该框架将Wikipedia组织
|
||
成一系列彼..., rerank_score=0.547948, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=in Natural Language Processing (EMNLP). Doha: Association for Computational Linguistics (ACL), 2014. 1591–1601. [doi: 10.3115/
|
||
v1/D14-1167]
|
||
[25]
|
||
Zhong HP, Zhang JW, Wang Z, Wan H, Chen Z. Aligning kno..., rerank_score=0.538134, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的方法.
|
||
6.2.2 可解释性
|
||
知识表示的可解释性是知识获取和实际应用中的关键问题. 现有方法已为可解释性作出了初步努力.
|
||
ITransF[51]采用稀疏向量进行知识迁移, 通过注意力可视化进行..., rerank_score=0.537254, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for Computing Machinery, 2019.
|
||
96–104. [doi: 10.1145/3289600.3291014]
|
||
[91]
|
||
Jiang TS, Liu TY, Ge T, Sha L,..., rerank_score=0.521532, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - DEBUG - 重排序结果: text=based question answering over RDF data[C]//Proceedings
|
||
of the 21st International Conference on World Wide Web,
|
||
Lyon, Apr16-20, 2012. New York: ACM,2012: 639-648.
|
||
[73] ABUJABAL A, YAHYA M, RIEDEWALD M,..., rerank_score=0.515551, source=fused_triplets_20
|
||
2025-06-11 17:57:19,408 - INFO - 重排序返回 10 条结果
|
||
2025-06-11 17:57:20,370 - DEBUG - 重排序分数分布: [0.824, 0.715, 0.573, 0.557, 0.556, 0.548, 0.538, 0.537, 0.522, 0.516]
|
||
2025-06-11 17:57:20,371 - DEBUG - 重排序耗时: 2.977s
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 1: text=5.2 关系抽取(Relation Extraction)
|
||
文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念..., distance=0.6494140028953552, rerank_score=0.8243205491125412
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 2: text=extraction. In: Proc. of the 2013 Conf. on Empirical Methods in Natural Language Processing (EMNLP)...., distance=0.5759531259536743, rerank_score=0.7154239957834733
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 3: text=Linguistics (ACL), 2016. 1434–1444. [doi: 10.18653/v1/P16-1136]
|
||
[31]
|
||
Guo S, Wang Q, Wang LH, Wang B,..., distance=0.5788925886154175, rerank_score=0.5733798314509144
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 4: text=arXiv:1709.04264, 2017.
|
||
[147]
|
||
Huang HZ, Heck LP, Ji H. Leveraging deep neural networks and knowledge..., distance=0.5365546345710754, rerank_score=0.5565803475023842
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 5: text=[10]
|
||
Daiber J, Jakob M, Hokamp C, Mendes PN. Improving efficiency and accuracy in multilingual entit..., distance=0.5929993391036987, rerank_score=0.5563995792788694
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 6: text=最近, Sha等人提出了一种新颖的注意力知识图谱嵌入(attentive knowledge graph embedding, AKGE)框
|
||
架[134], 以更好地利用KG进行有效推荐. 该框架以交..., distance=0.5808187127113342, rerank_score=0.5479479103392403
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 7: text=in Natural Language Processing (EMNLP). Doha: Association for Computational Linguistics (ACL), 2014...., distance=0.5500936508178711, rerank_score=0.5381338104068217
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 8: text=302 软件学报 2023年第 34卷第 1期
|
||
解. 大多数工作使用不同的模型来描述知识获取和关系提取. 然而, 以类似于图网络统一框架的方式进行的统一研
|
||
究[157]是弥合研究差距的一种有价值的..., distance=0.6540310978889465, rerank_score=0.5372538306476956
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 9: text=Proc. of the 12th ACM Int’l Conf. on Web Search and Data Mining (WSDM). Melbourne: Association for C..., distance=0.5385698080062866, rerank_score=0.521532084745802
|
||
2025-06-11 17:57:20,371 - DEBUG - 排序结果 10: text=based question answering over RDF data[C]//Proceedings
|
||
of the 21st International Conference on World..., distance=0.5652495622634888, rerank_score=0.5155513178899652
|
||
2025-06-11 17:57:20,372 - INFO - 总耗时: 85.713s
|
||
2025-06-19 16:14:36,418 - INFO -
|
||
测试 2:列出所有 db_types 和文档映射
|
||
2025-06-19 16:14:37,333 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-19 16:14:37,334 - DEBUG - 处理集合: ragdb_textdb (db_type: textdb)
|
||
2025-06-19 16:14:37,430 - DEBUG - 集合 ragdb_textdb 中找到用户和文档映射: {'testuser1': ['75e18e23-6f5a-4697-a1bb-ee53c6507a41', '842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}
|
||
2025-06-19 16:14:37,431 - DEBUG - 可用 db_types 和数据: {'textdb': {'userids': {'testuser1': ['75e18e23-6f5a-4697-a1bb-ee53c6507a41', '842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-19 16:14:37,431 - INFO - 可用 db_types 和文档: {'textdb': {'userids': {'testuser1': ['75e18e23-6f5a-4697-a1bb-ee53c6507a41', '842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '29c93db6-c633-42cc-a9b0-1fa83a49d8bc']}}}
|
||
2025-06-19 16:14:37,431 - INFO -
|
||
测试 3:查看 userid testuser1 的所有集合
|
||
2025-06-19 16:14:37,431 - DEBUG - 正在查看 userid testuser1 的集合
|
||
2025-06-19 16:14:37,431 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-19 16:14:37,442 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的文档数: 92
|
||
2025-06-19 16:14:37,442 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的内容:
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 1: 内容: 开元云(北京)科技有限公司,是一家注册于2020年的高科技企业,在上海、南京、深圳、济南等地设有分支机构,创始团队核心成员来自一流的云计算公司及电信运营商,拥有云计算、超算、智算和网络运营专业经验,在企业市场均拥有超过十年以上行业经验,服务客户超过2万家。公司以自主研发的业务操作支撑系统(KBoss)为底座,打造开放算力应用服务平台(open-computing),将云计算、算力资源和算力应用进行..., 元数据: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 2: 内容: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 3: 内容: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 4: 内容: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 5: 内容: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 6: 内容: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,442 - DEBUG - 文档 7: 内容: 因此, 投影矩阵仅由关系决定是不合理的; ③ 与TransE和TransH相比, 矩阵-向量乘法使TransR模型参数急剧增
|
||
加, 因此, TransR难以应用于大规模知识图谱.
|
||
Mrh
|
||
Mrt
|
||
whi
|
||
wti
|
||
(i = 1;2;3)
|
||
wr
|
||
hi⊥
|
||
ti⊥
|
||
hi⊥ +r ≈ ti⊥
|
||
(i = 1;2;3)
|
||
(h;r;t)
|
||
wh
|
||
wt ∈ Rd
|
||
wr ∈ Rk
|
||
Mrh
|
||
Mrt ∈ Rk×d
|
||
为此, ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,443 - DEBUG - 文档 8: 内容: 系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体的数量, 表示
|
||
中的最大数. 投影矩阵的稀疏度为:
|
||
l
|
||
r = 1−(1− min)Nl
|
||
r=Nl∗
|
||
r∗ (12)
|
||
|
||
投影向量定义为:
|
||
h⊥ = Mh
|
||
r
|
||
(
|
||
h
|
||
r
|
||
)
|
||
h;t⊥ = Mt
|
||
r
|
||
( t
|
||
r
|
||
)t (13)
|
||
|
||
(h;r;t)
|
||
wr
|
||
● TransM: Tr..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,443 - DEBUG - 文档 9: 内容: 过程中除了学习嵌入之外还引入了学习关系相关候选对象与关系相关注意力两个任务. 而以往的模型(如TransH,
|
||
TransR, TranSparse)无法学习细粒度的注意力.
|
||
由此, Qian等人[52]提出TransAt模型来同时学习嵌入, 关系相关候选对象和关系相关注意力. TransAt的评分
|
||
函数定义如下:
|
||
fr (h;t)= Pr ( (rh)h)+r− Pr ( (rt)t) (18..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,443 - DEBUG - 文档 10: 内容: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,443 - INFO -
|
||
测试 5:获取 userid testuser1 在textdb数据库的文档映射
|
||
2025-06-19 16:14:37,443 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,457 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,458 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,459 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,460 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,461 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,462 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:14:37,463 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:14:37,464 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:14:37,464 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:14:37,464 - DEBUG - 找到 4 个文档的映射
|
||
2025-06-19 16:14:37,464 - INFO - 文档映射: {'29c93db6-c633-42cc-a9b0-1fa83a49d8bc': {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}, '796af784-5a60-47f1-a4e2-3d73643fd4c5': {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}, '842b6180-667a-4ac8-b051-5c225c859011': {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}, '75e18e23-6f5a-4697-a1bb-ee53c6507a41': {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}}
|
||
2025-06-19 16:52:49,271 - INFO -
|
||
测试 2:列出所有 db_types 和文档映射
|
||
2025-06-19 16:52:50,163 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-19 16:52:50,164 - DEBUG - 处理集合: ragdb_textdb (db_type: textdb)
|
||
2025-06-19 16:52:50,269 - DEBUG - 集合 ragdb_textdb 中找到用户和文档映射: {'testuser1': ['29c93db6-c633-42cc-a9b0-1fa83a49d8bc', '842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '75e18e23-6f5a-4697-a1bb-ee53c6507a41']}
|
||
2025-06-19 16:52:50,270 - DEBUG - 可用 db_types 和数据: {'textdb': {'userids': {'testuser1': ['29c93db6-c633-42cc-a9b0-1fa83a49d8bc', '842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '75e18e23-6f5a-4697-a1bb-ee53c6507a41']}}}
|
||
2025-06-19 16:52:50,270 - INFO - 可用 db_types 和文档: {'textdb': {'userids': {'testuser1': ['29c93db6-c633-42cc-a9b0-1fa83a49d8bc', '842b6180-667a-4ac8-b051-5c225c859011', '796af784-5a60-47f1-a4e2-3d73643fd4c5', '75e18e23-6f5a-4697-a1bb-ee53c6507a41']}}}
|
||
2025-06-19 16:52:50,270 - INFO -
|
||
测试 3:查看 userid testuser1 的所有集合
|
||
2025-06-19 16:52:50,270 - DEBUG - 正在查看 userid testuser1 的集合
|
||
2025-06-19 16:52:50,270 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-19 16:52:50,281 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的文档数: 92
|
||
2025-06-19 16:52:50,281 - DEBUG - 集合 ragdb_textdb 中 userid testuser1 的内容:
|
||
2025-06-19 16:52:50,281 - DEBUG - 文档 1: 内容: 开元云(北京)科技有限公司,是一家注册于2020年的高科技企业,在上海、南京、深圳、济南等地设有分支机构,创始团队核心成员来自一流的云计算公司及电信运营商,拥有云计算、超算、智算和网络运营专业经验,在企业市场均拥有超过十年以上行业经验,服务客户超过2万家。公司以自主研发的业务操作支撑系统(KBoss)为底座,打造开放算力应用服务平台(open-computing),将云计算、算力资源和算力应用进行..., 元数据: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 16:52:50,281 - DEBUG - 文档 2: 内容: 知识图谱嵌入技术研究综述*
|
||
张天成1, 田 雪1, 孙相会1, 于明鹤2, 孙艳红1, 于 戈1
|
||
1(东北大学 计算机科学与工程学院, 辽宁 沈阳 110169)
|
||
2(东北大学 软件学院, 辽宁 沈阳 110169)
|
||
通信作者: 田雪, E-mail: 1901787@stu.neu.edu.cn
|
||
|
||
摘 要: 知识图谱(KG)是一种用图模型来描述知识和建..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,281 - DEBUG - 文档 3: 内容: existing knowledge graph embedding technologies are comprehensively reviewed, including not only techniques using the facts observed in
|
||
KG for embedding, but also dynamic KG embedding methods ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,281 - DEBUG - 文档 4: 内容: 的向量空间中, 以在简化操作的同时保留KG的固有结构. 与传统的表示方法相比, KGE为KG中的实体和关系
|
||
提供了更加密集的表示, 降低了其应用中的计算复杂度. 此外, KGE可以通过度量实体和关系低维嵌入的相似性
|
||
来显式地捕获实体和关系之间的相似性.
|
||
尽管研究者已提出多种模型来学习KG中的实体和关系表示, 但是目前大多数可用的技术仍然仅根据知识图
|
||
谱中观察到的事实来执行嵌入任务. 具体地说, 给..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,281 - DEBUG - 文档 5: 内容: (h;r;t)
|
||
事实三元组
|
||
(h;r;t) 嵌入三元组
|
||
r ∈ R
|
||
e ∈ E
|
||
, 关系集合与实体集合
|
||
fr(h;t) 评分函数
|
||
(·);g(·)
|
||
非线性激活函数
|
||
M r 映射矩阵
|
||
L
|
||
损失函数
|
||
Rd d维实值空间
|
||
Cd
|
||
d维复数空间
|
||
Hd d维超复数空间
|
||
Td
|
||
d维环面空间
|
||
⊗ Hamilton乘积
|
||
◦
|
||
Hadamard乘积
|
||
Re(·..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,281 - DEBUG - 文档 6: 内容: 2.1.3 复杂关系建模
|
||
TransE模型在大规模知识图谱上效果明显, 但是由于其模型简单, 导致TransE无法对知识库中的复杂关系建
|
||
模, 这里的复杂关系定义如下. 按照知识库中关系两端连接实体的数目, 可以将关系划分为1-1, 1-N, N-1和N-N
|
||
这4种类型, 例如1-N类型关系指的是一个头实体会平均对应多个尾实体. 我们将1-N, N-1和N-N称为复杂关
|
||
系. 研究发现, 各..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,282 - DEBUG - 文档 7: 内容: 因此, 投影矩阵仅由关系决定是不合理的; ③ 与TransE和TransH相比, 矩阵-向量乘法使TransR模型参数急剧增
|
||
加, 因此, TransR难以应用于大规模知识图谱.
|
||
Mrh
|
||
Mrt
|
||
whi
|
||
wti
|
||
(i = 1;2;3)
|
||
wr
|
||
hi⊥
|
||
ti⊥
|
||
hi⊥ +r ≈ ti⊥
|
||
(i = 1;2;3)
|
||
(h;r;t)
|
||
wh
|
||
wt ∈ Rd
|
||
wr ∈ Rk
|
||
Mrh
|
||
Mrt ∈ Rk×d
|
||
为此, ..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,282 - DEBUG - 文档 8: 内容: 系的索引, h, t表示矩阵用于哪个实体(头或尾). ( )表示关系r在位置l处连接不同实体的数量, 表示
|
||
中的最大数. 投影矩阵的稀疏度为:
|
||
l
|
||
r = 1−(1− min)Nl
|
||
r=Nl∗
|
||
r∗ (12)
|
||
|
||
投影向量定义为:
|
||
h⊥ = Mh
|
||
r
|
||
(
|
||
h
|
||
r
|
||
)
|
||
h;t⊥ = Mt
|
||
r
|
||
( t
|
||
r
|
||
)t (13)
|
||
|
||
(h;r;t)
|
||
wr
|
||
● TransM: Tr..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,282 - DEBUG - 文档 9: 内容: 过程中除了学习嵌入之外还引入了学习关系相关候选对象与关系相关注意力两个任务. 而以往的模型(如TransH,
|
||
TransR, TranSparse)无法学习细粒度的注意力.
|
||
由此, Qian等人[52]提出TransAt模型来同时学习嵌入, 关系相关候选对象和关系相关注意力. TransAt的评分
|
||
函数定义如下:
|
||
fr (h;t)= Pr ( (rh)h)+r− Pr ( (rt)t) (18..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,282 - DEBUG - 文档 10: 内容: fL2 (h;r;t) = (2dL2 ([h] +[r];[t]))2
|
||
feL2 (h;r;t) = (deL2 ([h] +[r];[t])=2)2
|
||
(23)
|
||
|
||
TorusE具有比TransE更低的计算复杂度.
|
||
(3) 高斯空间
|
||
前面提出的部分模型(例如: TransE)通过优化全局损失函数来确保KG中正三元组分数高于负三元组. 然而,
|
||
这些模型忽略了实体和关系的(不)确定性. 实际上, 不..., 元数据: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,282 - INFO -
|
||
测试 5:获取 userid testuser1 在textdb数据库的文档映射
|
||
2025-06-19 16:52:50,282 - DEBUG - 已存在 Milvus 连接,跳过重复连接
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata: {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,294 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,295 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,296 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata: {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,297 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,298 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,299 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 842b6180-667a-4ac8-b051-5c225c859011, metadata: {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:52:50,300 - DEBUG - document_id: 75e18e23-6f5a-4697-a1bb-ee53c6507a41, metadata: {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}
|
||
2025-06-19 16:52:50,300 - DEBUG - 找到 4 个文档的映射
|
||
2025-06-19 16:52:50,300 - INFO - 文档映射: {'29c93db6-c633-42cc-a9b0-1fa83a49d8bc': {'userid': 'testuser1', 'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}, '796af784-5a60-47f1-a4e2-3d73643fd4c5': {'userid': 'testuser1', 'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}, '842b6180-667a-4ac8-b051-5c225c859011': {'userid': 'testuser1', 'filename': 'zongshu.pdf', 'file_path': '/share/wangmeihua/rag/data/zongshu.pdf', 'upload_time': '2025-06-11T11:05:18.207910', 'file_type': 'pdf'}, '75e18e23-6f5a-4697-a1bb-ee53c6507a41': {'userid': 'testuser1', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-11T11:18:55.085813', 'file_type': 'docx'}}
|
||
2025-06-19 16:54:58,921 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-19 16:54:58,921 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-19 16:54:59,049 - INFO - 生成 document_id: b8b28ba3-b1c7-4019-8ee0-6c5464303764 for file: /share/wangmeihua/rag/data/test.docx
|
||
2025-06-19 16:54:59,050 - INFO - 开始处理文件 /share/wangmeihua/rag/data/test.docx,userid: testuser1,db_type: textdb
|
||
2025-06-19 16:54:59,050 - DEBUG - 检查文件: /share/wangmeihua/rag/data/test.docx, 大小: 25158 字节
|
||
2025-06-19 16:54:59,050 - DEBUG - 文件扩展名: docx
|
||
2025-06-19 16:54:59,050 - DEBUG - 开始加载文件
|
||
2025-06-19 16:54:59,067 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-19 16:54:59,068 - DEBUG - 分割完成,生成 4 个文档块
|
||
2025-06-19 16:54:59,068 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:54:59,068 - DEBUG - 生成文档块 1: metadata={'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:54:59,068 - DEBUG - 生成文档块 2: metadata={'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:54:59,068 - DEBUG - 生成文档块 3: metadata={'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:54:59,068 - DEBUG - 文件 /share/wangmeihua/rag/data/test.docx 加载并分割为 4 个文档块,document_id: b8b28ba3-b1c7-4019-8ee0-6c5464303764
|
||
2025-06-19 16:54:59,068 - DEBUG - 处理文件 /share/wangmeihua/rag/data/test.docx,生成 4 个文档块
|
||
2025-06-19 16:54:59,068 - DEBUG - 第一个文档块: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现
|
||
2025-06-19 16:54:59,829 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-19 16:55:05,423 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-19 16:55:05,423 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-19 16:55:05,427 - DEBUG - 检查集合 ragdb_textdb 的 schema: 字段匹配=True, vector_field存在=True, dtype=101, dim=1024
|
||
2025-06-19 16:55:05,526 - DEBUG - 集合 ragdb_textdb 已存在并加载成功
|
||
2025-06-19 16:55:05,537 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-19 16:55:05,537 - DEBUG - 正在为 userid testuser1 插入 4 个文档到 ragdb_textdb
|
||
2025-06-19 16:55:05,537 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:55:05,537 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:55:05,537 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:55:05,537 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'b8b28ba3-b1c7-4019-8ee0-6c5464303764', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T16:54:59.068210', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 16:55:05,702 - DEBUG - 成功插入 4 个文档
|
||
2025-06-19 16:55:05,709 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104512, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104513, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104514, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104515, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104516, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104517, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104518, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104519, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 插入后查询结果: pk=458649953127104520, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 16:55:05,710 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-19 16:55:08,748 - INFO - 开始抽取文档 b8b28ba3-b1c7-4019-8ee0-6c5464303764 的三元组,userid: testuser1
|
||
2025-06-19 16:55:08,749 - DEBUG - 分割为 44 个文本块
|
||
2025-06-19 16:55:08,749 - DEBUG - 处理块 1/44: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教...
|
||
2025-06-19 16:55:09,336 - DEBUG - 块 1 生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-19 16:55:09,336 - DEBUG - 原始生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-19 16:55:09,336 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Google搜索', '<media>', 'part of', '<triplet>', 'Google', '<org>', '聊天机器人', '<misc>', 'industry']
|
||
2025-06-19 16:55:09,336 - DEBUG - 处理块 2/44: 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及...
|
||
2025-06-19 16:55:09,561 - DEBUG - 块 2 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 16:55:09,561 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 16:55:09,562 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-19 16:55:09,562 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-19 16:55:09,562 - DEBUG - 块 2 提取到 1 个三元组
|
||
2025-06-19 16:55:09,562 - DEBUG - 处理块 3/44: 目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析...
|
||
2025-06-19 16:55:09,907 - DEBUG - 块 3 生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-19 16:55:09,907 - DEBUG - 原始生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-19 16:55:09,907 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Web语义知识库', '<media>', 'part of']
|
||
2025-06-19 16:55:09,907 - DEBUG - 处理块 4/44: 知识图谱以其强大的语义处理能力与开放互联能力,可为万维网上的知识互联奠定扎实的基础,使Web 3.0...
|
||
2025-06-19 16:55:10,543 - DEBUG - 块 4 生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-19 16:55:10,543 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-19 16:55:10,543 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '万维网', '<media>', 'Web 3.0', '<eve>', '愿景', '<org>', '世界', '<misc>', 'part of', '<triplet>', 'Web', '<unk>', '网的', '<time>', 'is a list of']
|
||
2025-06-19 16:55:10,543 - DEBUG - 添加三元组: 知识图谱(concept) - Web 3.0 - 万维网(media)
|
||
2025-06-19 16:55:10,543 - DEBUG - 添加三元组: Web(unk) - is a list of - 网的(time)
|
||
2025-06-19 16:55:10,543 - DEBUG - 块 4 提取到 2 个三元组
|
||
2025-06-19 16:55:10,543 - DEBUG - 处理块 5/44: 知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”...
|
||
2025-06-19 16:55:11,026 - DEBUG - 块 5 生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-19 16:55:11,026 - DEBUG - 原始生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-19 16:55:11,026 - DEBUG - 处理后标记: ['<triplet>', '自顶向下', '<concept>', '结构化数据源', '<media>', '百科类网站', '<org>', '知识库', '<misc>', 'part of']
|
||
2025-06-19 16:55:11,026 - DEBUG - 添加三元组: 自顶向下(concept) - 百科类网站 - 结构化数据源(media)
|
||
2025-06-19 16:55:11,026 - DEBUG - 块 5 提取到 1 个三元组
|
||
2025-06-19 16:55:11,026 - DEBUG - 处理块 6/44: 所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模...
|
||
2025-06-19 16:55:11,617 - DEBUG - 块 6 生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-19 16:55:11,617 - DEBUG - 原始生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-19 16:55:11,617 - DEBUG - 处理后标记: ['<triplet>', '结构化数据', '<concept>', '关系数据库', '<media>', '<org>', '知识库', '<misc>', '数据类型和存储方式', '<unk>', '<loc>', '的数据类型']
|
||
2025-06-19 16:55:11,617 - DEBUG - 添加三元组: 结构化数据(concept) - <org> - 关系数据库(media)
|
||
2025-06-19 16:55:11,617 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-19 16:55:11,617 - DEBUG - 处理块 7/44: 半结构化数据(Semi-Structed Data):如XML、JSON、百科
|
||
非结构化数据(UnS...
|
||
2025-06-19 16:55:11,777 - DEBUG - 块 7 生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-19 16:55:11,777 - DEBUG - 原始生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-19 16:55:11,777 - DEBUG - 处理后标记: ['<triplet>', '非结构化数据', '<concept>', 'XML', '<org>', 'subclass of']
|
||
2025-06-19 16:55:11,777 - DEBUG - 添加三元组: 非结构化数据(concept) - subclass of - XML(org)
|
||
2025-06-19 16:55:11,777 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-19 16:55:11,777 - DEBUG - 处理块 8/44: 一般有两种选择,一个是通过RDF(资源描述框架)这样的规范存储格式来进行存储,还有一种方法,就是使用...
|
||
2025-06-19 16:55:12,069 - DEBUG - 块 8 生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-19 16:55:12,069 - DEBUG - 原始生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-19 16:55:12,069 - DEBUG - 处理后标记: ['<triplet>', '模式层', '<concept>', '知识图谱', '<media>', 'subclass of']
|
||
2025-06-19 16:55:12,069 - DEBUG - 添加三元组: 模式层(concept) - subclass of - 知识图谱(media)
|
||
2025-06-19 16:55:12,070 - DEBUG - 块 8 提取到 1 个三元组
|
||
2025-06-19 16:55:12,070 - DEBUG - 处理块 9/44: 模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的...
|
||
2025-06-19 16:55:12,444 - DEBUG - 块 9 生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-19 16:55:12,444 - DEBUG - 原始生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-19 16:55:12,444 - DEBUG - 处理后标记: ['<triplet>', '结构化知识库', '<concept>', '知识图谱', '<misc>', 'subclass of']
|
||
2025-06-19 16:55:12,444 - DEBUG - 添加三元组: 结构化知识库(concept) - subclass of - 知识图谱(misc)
|
||
2025-06-19 16:55:12,444 - DEBUG - 块 9 提取到 1 个三元组
|
||
2025-06-19 16:55:12,444 - DEBUG - 处理块 10/44: 如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储...
|
||
2025-06-19 16:55:12,871 - DEBUG - 块 10 生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-19 16:55:12,871 - DEBUG - 原始生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-19 16:55:12,871 - DEBUG - 处理后标记: ['<triplet>', '比尔盖茨', '<per>', '微软', '<org>', 'employer', '<triplet>', '5 信息抽取', '<media>', '数据层', '<concept>', 'facet of']
|
||
2025-06-19 16:55:12,871 - DEBUG - 添加三元组: 比尔盖茨(per) - employer - 微软(org)
|
||
2025-06-19 16:55:12,871 - DEBUG - 添加三元组: 5 信息抽取(media) - facet of - 数据层(concept)
|
||
2025-06-19 16:55:12,872 - DEBUG - 块 10 提取到 2 个三元组
|
||
2025-06-19 16:55:12,872 - DEBUG - 处理块 11/44: 信息抽取(infromation extraction)是知识图谱构建的第1步,其中的关键问题是:如...
|
||
2025-06-19 16:55:13,184 - DEBUG - 块 11 生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 16:55:13,184 - DEBUG - 原始生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 16:55:13,184 - DEBUG - 处理后标记: ['<triplet>', '信息抽取', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-19 16:55:13,184 - DEBUG - 添加三元组: 信息抽取(concept) - part of - 知识图谱(media)
|
||
2025-06-19 16:55:13,184 - DEBUG - 块 11 提取到 1 个三元组
|
||
2025-06-19 16:55:13,184 - DEBUG - 处理块 12/44: 5.1 实体抽取(Entity Extraction)
|
||
实体抽取又称为命名实体识别(named en...
|
||
2025-06-19 16:55:13,355 - DEBUG - 块 12 生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-19 16:55:13,356 - DEBUG - 原始生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-19 16:55:13,356 - DEBUG - 处理后标记: ['<triplet>', '实体识别', '<concept>', '信息抽取', '<media>', 'subclass of']
|
||
2025-06-19 16:55:13,356 - DEBUG - 添加三元组: 实体识别(concept) - subclass of - 信息抽取(media)
|
||
2025-06-19 16:55:13,356 - DEBUG - 块 12 提取到 1 个三元组
|
||
2025-06-19 16:55:13,356 - DEBUG - 处理块 13/44: 2012年Ling等人归纳出112种实体类别,并基于条件随机场CRF进行实体边界识别,最后采用自适应...
|
||
2025-06-19 16:55:13,711 - DEBUG - 块 13 生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-19 16:55:13,711 - DEBUG - 原始生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-19 16:55:13,711 - DEBUG - 处理后标记: ['<triplet>', '实体分类体系', '<concept>', '112种实体类别', '<misc>', 'part of']
|
||
2025-06-19 16:55:13,711 - DEBUG - 添加三元组: 实体分类体系(concept) - part of - 112种实体类别(misc)
|
||
2025-06-19 16:55:13,711 - DEBUG - 块 13 提取到 1 个三元组
|
||
2025-06-19 16:55:13,711 - DEBUG - 处理块 14/44: 在面向开放域的实体识别和分类研究中,不需要(也不可能)为每个领域或者每个实体类别建立单独的语料库作为...
|
||
2025-06-19 16:55:13,997 - DEBUG - 块 14 生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-19 16:55:13,997 - DEBUG - 原始生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-19 16:55:13,998 - DEBUG - 处理后标记: ['<triplet>', '分类研究', '<concept>', '面向开放域的实体识别', '<media>', '实体类别', '<misc>', 'studies']
|
||
2025-06-19 16:55:13,998 - DEBUG - 添加三元组: 分类研究(concept) - 实体类别 - 面向开放域的实体识别(media)
|
||
2025-06-19 16:55:13,998 - DEBUG - 块 14 提取到 1 个三元组
|
||
2025-06-19 16:55:13,998 - DEBUG - 处理块 15/44: 一种思路是根据已知的实体实例进行特征建模,利用该模型处理海量数据集得到新的命名实体列表,然后针对新实...
|
||
2025-06-19 16:55:14,469 - DEBUG - 块 15 生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-19 16:55:14,469 - DEBUG - 原始生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-19 16:55:14,469 - DEBUG - 处理后标记: ['<triplet>', '服务器日志', '<concept>', '搜索引擎', '<org>', '特征建模', '<media>', '<misc>', '算法', '<unk>', '<eve>', '<per>', '分类', '<loc>', '<time>', '<dis>', '<cel>', '语义特征']
|
||
2025-06-19 16:55:14,469 - DEBUG - 添加三元组: 服务器日志(concept) - 特征建模 - 搜索引擎(org)
|
||
2025-06-19 16:55:14,469 - DEBUG - 块 15 提取到 1 个三元组
|
||
2025-06-19 16:55:14,469 - DEBUG - 处理块 16/44: 5.2 关系抽取(Relation Extraction)
|
||
...
|
||
2025-06-19 16:55:14,640 - DEBUG - 块 16 生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-19 16:55:14,640 - DEBUG - 原始生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-19 16:55:14,640 - DEBUG - 处理后标记: ['<triplet>', '关系抽取', '<concept>', 'Relation Extraction', '<unk>', 'subclass of']
|
||
2025-06-19 16:55:14,640 - DEBUG - 添加三元组: 关系抽取(concept) - subclass of - Relation Extraction(unk)
|
||
2025-06-19 16:55:14,640 - DEBUG - 块 16 提取到 1 个三元组
|
||
2025-06-19 16:55:14,640 - DEBUG - 处理块 17/44: 文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体...
|
||
2025-06-19 16:55:14,876 - DEBUG - 块 17 生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-19 16:55:14,877 - DEBUG - 原始生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-19 16:55:14,877 - DEBUG - 处理后标记: ['<triplet>', '模式匹配', '<concept>', '语料', '<media>', '实体', '<misc>', 'subclass of']
|
||
2025-06-19 16:55:14,877 - DEBUG - 添加三元组: 模式匹配(concept) - 实体 - 语料(media)
|
||
2025-06-19 16:55:14,877 - DEBUG - 块 17 提取到 1 个三元组
|
||
2025-06-19 16:55:14,877 - DEBUG - 处理块 18/44: 2.统计机器学习方法
|
||
3.基于特征向量或核函数的有监督学习方法
|
||
4.研究重点转向半监督和无监督
|
||
5....
|
||
2025-06-19 16:55:15,456 - DEBUG - 块 18 生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-19 16:55:15,457 - DEBUG - 原始生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-19 16:55:15,457 - DEBUG - 处理后标记: ['<triplet>', '属性抽取', '<concept>', '统计机器学习', '<media>', '<misc>', '面向开放域的信息抽', '<unk>', '<eve>', '信息抽式', '<org>', '統計', '<time>', '<dis>', 'part of']
|
||
2025-06-19 16:55:15,457 - DEBUG - 添加三元组: 属性抽取(concept) - <misc> - 统计机器学习(media)
|
||
2025-06-19 16:55:15,457 - DEBUG - 块 18 提取到 1 个三元组
|
||
2025-06-19 16:55:15,457 - DEBUG - 处理块 19/44: 属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物,可以从网络公开信息中得到...
|
||
2025-06-19 16:55:15,627 - DEBUG - 块 19 生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-19 16:55:15,627 - DEBUG - 原始生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-19 16:55:15,627 - DEBUG - 处理后标记: ['<triplet>', '属性', '<concept>', '实体', '<misc>', 'subclass of']
|
||
2025-06-19 16:55:15,627 - DEBUG - 添加三元组: 属性(concept) - subclass of - 实体(misc)
|
||
2025-06-19 16:55:15,627 - DEBUG - 块 19 提取到 1 个三元组
|
||
2025-06-19 16:55:15,627 - DEBUG - 处理块 20/44: 基于规则和启发式算法,抽取结构化数据
|
||
基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训...
|
||
2025-06-19 16:55:15,820 - DEBUG - 块 20 生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-19 16:55:15,820 - DEBUG - 原始生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-19 16:55:15,820 - DEBUG - 处理后标记: ['<triplet>', '数据挖掘', '<concept>', '结构化数据', '<media>', 'subclass of']
|
||
2025-06-19 16:55:15,820 - DEBUG - 添加三元组: 数据挖掘(concept) - subclass of - 结构化数据(media)
|
||
2025-06-19 16:55:15,820 - DEBUG - 块 20 提取到 1 个三元组
|
||
2025-06-19 16:55:15,820 - DEBUG - 处理块 21/44: 通过信息抽取,我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。
|
||
如果我们...
|
||
2025-06-19 16:55:16,526 - DEBUG - 块 21 生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-19 16:55:16,526 - DEBUG - 原始生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-19 16:55:16,526 - DEBUG - 处理后标记: ['<triplet>', '拼图碎片', '<concept>', '信息抽取', '<media>', '非结构化', '<misc>', '数据', '<unk>', '<org>', '的数据', '<eve>', '<per>', '<loc>']
|
||
2025-06-19 16:55:16,526 - DEBUG - 添加三元组: 拼图碎片(concept) - 非结构化 - 信息抽取(media)
|
||
2025-06-19 16:55:16,526 - DEBUG - 块 21 提取到 1 个三元组
|
||
2025-06-19 16:55:16,526 - DEBUG - 处理块 22/44: 拼图(知识)中还存在大量冗杂和错误的拼图碎片(信息)
|
||
那么如何解决这一问题,就是在知识融合这一步里我...
|
||
2025-06-19 16:55:16,868 - DEBUG - 块 22 生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-19 16:55:16,868 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-19 16:55:16,868 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<unk>', '知识库', '<media>', 'part of']
|
||
2025-06-19 16:55:16,868 - DEBUG - 处理块 23/44:
|
||
其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链...
|
||
2025-06-19 16:55:17,359 - DEBUG - 块 23 生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-19 16:55:17,359 - DEBUG - 原始生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-19 16:55:17,359 - DEBUG - 处理后标记: ['<triplet>', '实体指称项', '<concept>', '<unk>', '知识库', '<media>', 'part of the series', '<loc>', '<org>', '<misc>', '库中', '<eve>', '<dis>', '<cel>', '<per>', '<time>', '<triplet>']
|
||
2025-06-19 16:55:17,359 - DEBUG - 处理块 24/44: 即集成实体链接(collective entity linking)
|
||
实体链接的流程:
|
||
1.从文本中...
|
||
2025-06-19 16:55:17,541 - DEBUG - 块 24 生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-19 16:55:17,541 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-19 16:55:17,541 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<org>', 'subclass of']
|
||
2025-06-19 16:55:17,541 - DEBUG - 处理块 25/44: 在确认知识库中对应的正确实体对象之后,将该实体指称项链接到知识库中对应实体。
|
||
实体消歧:专门用于解决...
|
||
2025-06-19 16:55:17,902 - DEBUG - 块 25 生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-19 16:55:17,902 - DEBUG - 原始生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-19 16:55:17,902 - DEBUG - 处理后标记: ['<triplet>', '歧义', '<concept>', '实体消歧', '<media>', 'used by', '<triplet>']
|
||
2025-06-19 16:55:17,902 - DEBUG - 添加三元组: 歧义(concept) - used by - 实体消歧(media)
|
||
2025-06-19 16:55:17,902 - DEBUG - 块 25 提取到 1 个三元组
|
||
2025-06-19 16:55:17,902 - DEBUG - 处理块 26/44: 共指消解:主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象...
|
||
2025-06-19 16:55:18,448 - DEBUG - 块 26 生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-19 16:55:18,449 - DEBUG - 原始生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-19 16:55:18,449 - DEBUG - 处理后标记: ['<triplet>', '共指消解', '<concept>', '信息检索', '<misc>', '自然语言处理', '<media>', '语言', '<org>', '指称对应同一实体', '<unk>', '实体对象', '<per>', 'subclass of']
|
||
2025-06-19 16:55:18,449 - DEBUG - 添加三元组: 共指消解(concept) - 自然语言处理 - 信息检索(misc)
|
||
2025-06-19 16:55:18,449 - DEBUG - 块 26 提取到 1 个三元组
|
||
2025-06-19 16:55:18,449 - DEBUG - 处理块 27/44: 共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。
|
||
|
||
6.2 知识合并
|
||
在构建知识图谱时...
|
||
2025-06-19 16:55:18,814 - DEBUG - 块 27 生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-19 16:55:18,814 - DEBUG - 原始生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-19 16:55:18,814 - DEBUG - 处理后标记: ['<triplet>', '外部知识库', '<concept>', '知识图谱', '<media>', '结构化数据', '<org>', '库产品', '<unk>', '合并', '<misc>', 'subclass of']
|
||
2025-06-19 16:55:18,814 - DEBUG - 添加三元组: 外部知识库(concept) - 结构化数据 - 知识图谱(media)
|
||
2025-06-19 16:55:18,814 - DEBUG - 块 27 提取到 1 个三元组
|
||
2025-06-19 16:55:18,814 - DEBUG - 处理块 28/44: 数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,...
|
||
2025-06-19 16:55:19,447 - DEBUG - 块 28 生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-19 16:55:19,447 - DEBUG - 原始生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-19 16:55:19,447 - DEBUG - 处理后标记: ['<triplet>', '数据层的融合', '<concept>', '关系数据库', '<media>', '模式层', '<org>', '本体库', '<misc>', '实体的指称', '<unk>', '<loc>', '<per>', '实例以及关系的冲突问题,造成不必要的冗余', '<eve>', '合并关系', '<time>', 'facet of']
|
||
2025-06-19 16:55:19,447 - DEBUG - 添加三元组: 数据层的融合(concept) - 模式层 - 关系数据库(media)
|
||
2025-06-19 16:55:19,447 - DEBUG - 块 28 提取到 1 个三元组
|
||
2025-06-19 16:55:19,447 - DEBUG - 处理块 29/44: 为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界...
|
||
2025-06-19 16:55:20,002 - DEBUG - 块 29 生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-19 16:55:20,002 - DEBUG - 原始生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-19 16:55:20,002 - DEBUG - 处理后标记: ['<triplet>', '资源描述框架', '<concept>', '本体构建本体', '<org>', '<media>', '<misc>', '<unk>', '<per>', '<loc>', '<eve>', '<time>', '<dis>', '<triplet>', 'DB2RDF', '<cel>', '结构化的历史数据', '<date>', 'subclass of']
|
||
2025-06-19 16:55:20,002 - DEBUG - 添加三元组: 资源描述框架(concept) - <media> - 本体构建本体(org)
|
||
2025-06-19 16:55:20,002 - DEBUG - 添加三元组: DB2RDF(cel) - subclass of - 结构化的历史数据(date)
|
||
2025-06-19 16:55:20,002 - DEBUG - 块 29 提取到 2 个三元组
|
||
2025-06-19 16:55:20,002 - DEBUG - 处理块 30/44: 本体可以采用人工编辑的方式手动构建(借助本体编辑软件),也可以以数据驱动的自动化方式构建本体。因为人...
|
||
2025-06-19 16:55:20,644 - DEBUG - 块 30 生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-19 16:55:20,644 - DEBUG - 原始生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-19 16:55:20,644 - DEBUG - 处理后标记: ['<triplet>', '自动化本体构建过程', '<concept>', '数据驱动的自动化方式', '<media>', '本体库', '<misc>', '全局', '<org>', '库产品', '<unk>', '软件', '<loc>', 'part of']
|
||
2025-06-19 16:55:20,644 - DEBUG - 添加三元组: 自动化本体构建过程(concept) - 本体库 - 数据驱动的自动化方式(media)
|
||
2025-06-19 16:55:20,644 - DEBUG - 块 30 提取到 1 个三元组
|
||
2025-06-19 16:55:20,645 - DEBUG - 处理块 31/44: 1.实体并列关系相似度计算
|
||
2.实体上下位关系抽取
|
||
3.本体的生成
|
||
比如对下面这个例子,当知识图谱刚...
|
||
2025-06-19 16:55:20,826 - DEBUG - 块 31 生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-19 16:55:20,826 - DEBUG - 原始生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-19 16:55:20,826 - DEBUG - 处理后标记: ['<triplet>', '阿里', '<org>', '阿里巴巴', '<media>', 'owned by']
|
||
2025-06-19 16:55:20,826 - DEBUG - 添加三元组: 阿里(org) - owned by - 阿里巴巴(media)
|
||
2025-06-19 16:55:20,826 - DEBUG - 块 31 提取到 1 个三元组
|
||
2025-06-19 16:55:20,826 - DEBUG - 处理块 32/44: 这就是第一步的作用,但这样下来,知识图谱实际上还是没有一个上下层的概念,它还是不知道,阿里巴巴和手机...
|
||
2025-06-19 16:55:21,220 - DEBUG - 块 32 生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-19 16:55:21,220 - DEBUG - 原始生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-19 16:55:21,220 - DEBUG - 处理后标记: ['<triplet>', '上下位关系', '<concept>', '图谱', '<media>', '阿里巴巴', '<org>', 'owned by']
|
||
2025-06-19 16:55:21,220 - DEBUG - 添加三元组: 上下位关系(concept) - 阿里巴巴 - 图谱(media)
|
||
2025-06-19 16:55:21,220 - DEBUG - 块 32 提取到 1 个三元组
|
||
2025-06-19 16:55:21,220 - DEBUG - 处理块 33/44: 当三步结束后,这个知识图谱可能就会明白,“阿里巴巴和腾讯,其实都是公司这样一个实体下的细分实体。它们...
|
||
2025-06-19 16:55:21,379 - DEBUG - 块 33 生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-19 16:55:21,379 - DEBUG - 原始生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-19 16:55:21,379 - DEBUG - 处理后标记: ['<triplet>', '腾讯', '<org>', '阿里巴巴', '<concept>', 'owned by']
|
||
2025-06-19 16:55:21,379 - DEBUG - 添加三元组: 腾讯(org) - owned by - 阿里巴巴(concept)
|
||
2025-06-19 16:55:21,379 - DEBUG - 块 33 提取到 1 个三元组
|
||
2025-06-19 16:55:21,379 - DEBUG - 处理块 34/44: 但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识...
|
||
2025-06-19 16:55:21,892 - DEBUG - 块 34 生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-19 16:55:21,892 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-19 16:55:21,892 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '城市', '<loc>', 'location']
|
||
2025-06-19 16:55:21,892 - DEBUG - 添加三元组: 知识图谱(concept) - location - 城市(loc)
|
||
2025-06-19 16:55:21,892 - DEBUG - 块 34 提取到 1 个三元组
|
||
2025-06-19 16:55:21,892 - DEBUG - 处理块 35/44: 根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,那么我们就可以将AD...
|
||
2025-06-19 16:55:22,479 - DEBUG - 块 35 生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-19 16:55:22,479 - DEBUG - 原始生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-19 16:55:22,479 - DEBUG - 处理后标记: ['<triplet>', '串联', '<concept>', '推理策略的一环', '<media>', '规则', '<misc>', '图里', '<org>', '<eve>', '<unk>', '<per>', 'C', '<loc>', 'part of']
|
||
2025-06-19 16:55:22,479 - DEBUG - 添加三元组: 串联(concept) - 规则 - 推理策略的一环(media)
|
||
2025-06-19 16:55:22,479 - DEBUG - 块 35 提取到 1 个三元组
|
||
2025-06-19 16:55:22,479 - DEBUG - 处理块 36/44: 当然知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。
|
||
推理属性值...
|
||
2025-06-19 16:55:22,809 - DEBUG - 块 36 生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-19 16:55:22,809 - DEBUG - 原始生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-19 16:55:22,810 - DEBUG - 处理后标记: ['<triplet>', '猫科', '<concept>', '老虎,科,目,食肉目']
|
||
2025-06-19 16:55:22,810 - DEBUG - 处理块 37/44: 这一块的算法主要可以分为3大类,基于逻辑的推理、基于图的推理和基于深度学习的推理。
|
||
7.3 质量评估...
|
||
2025-06-19 16:55:23,181 - DEBUG - 块 37 生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-19 16:55:23,182 - DEBUG - 原始生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-19 16:55:23,182 - DEBUG - 处理后标记: ['<triplet>', '算法', '<concept>', '知识库', '<media>', 'part of']
|
||
2025-06-19 16:55:23,182 - DEBUG - 添加三元组: 算法(concept) - part of - 知识库(media)
|
||
2025-06-19 16:55:23,182 - DEBUG - 块 37 提取到 1 个三元组
|
||
2025-06-19 16:55:23,182 - DEBUG - 处理块 38/44: 从逻辑上看,知识库的更新包括概念层的更新和数据层的更新。
|
||
概念层的更新是指新增数据后获得了新的概念,...
|
||
2025-06-19 16:55:23,510 - DEBUG - 块 38 生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-19 16:55:23,510 - DEBUG - 原始生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-19 16:55:23,510 - DEBUG - 处理后标记: ['<triplet>', '知识库的更新', '<concept>', '概念层', '<media>', 'subclass of']
|
||
2025-06-19 16:55:23,510 - DEBUG - 添加三元组: 知识库的更新(concept) - subclass of - 概念层(media)
|
||
2025-06-19 16:55:23,510 - DEBUG - 块 38 提取到 1 个三元组
|
||
2025-06-19 16:55:23,510 - DEBUG - 处理块 39/44: 数据层的更新主要是新增或更新实体、关系、属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性...
|
||
2025-06-19 16:55:23,937 - DEBUG - 块 39 生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-19 16:55:23,937 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-19 16:55:23,937 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '数据层', '<media>', 'part of']
|
||
2025-06-19 16:55:23,937 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 数据层(media)
|
||
2025-06-19 16:55:23,937 - DEBUG - 块 39 提取到 1 个三元组
|
||
2025-06-19 16:55:23,937 - DEBUG - 处理块 40/44: 这种方法比较简单,但资源消耗大,而且需要耗费大量人力资源进行系统维护;
|
||
增量更新:以当前新增数据为输...
|
||
2025-06-19 16:55:24,097 - DEBUG - 块 40 生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 16:55:24,097 - DEBUG - 原始生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 16:55:24,097 - DEBUG - 处理后标记: ['<triplet>', '总结', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-19 16:55:24,097 - DEBUG - 添加三元组: 总结(concept) - part of - 知识图谱(media)
|
||
2025-06-19 16:55:24,097 - DEBUG - 块 40 提取到 1 个三元组
|
||
2025-06-19 16:55:24,098 - DEBUG - 处理块 41/44: 通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和...
|
||
2025-06-19 16:55:24,749 - DEBUG - 块 41 生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-19 16:55:24,749 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-19 16:55:24,749 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '智能语义搜索', '<media>', '移动个人助理(Siri', '<misc>', '互联网信息', '<org>', 'owned by', '<triplet>', '(Sri)', '<eve>', '的知识', '<unk>', 'subclass of']
|
||
2025-06-19 16:55:24,750 - DEBUG - 添加三元组: 知识图谱(concept) - 移动个人助理(Siri - 智能语义搜索(media)
|
||
2025-06-19 16:55:24,750 - DEBUG - 添加三元组: (Sri)(eve) - subclass of - 的知识(unk)
|
||
2025-06-19 16:55:24,750 - DEBUG - 块 41 提取到 2 个三元组
|
||
2025-06-19 16:55:24,750 - DEBUG - 处理块 42/44: 在智能语义搜索中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键词进行解析和推理,进...
|
||
2025-06-19 16:55:24,910 - DEBUG - 块 42 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 16:55:24,910 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 16:55:24,910 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-19 16:55:24,910 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-19 16:55:24,910 - DEBUG - 块 42 提取到 1 个三元组
|
||
2025-06-19 16:55:24,910 - DEBUG - 处理块 43/44: 在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析...
|
||
2025-06-19 16:55:25,424 - DEBUG - 块 43 生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-19 16:55:25,424 - DEBUG - 原始生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-19 16:55:25,424 - DEBUG - 处理后标记: ['<triplet>', '病毒', '<concept>', '埃博拉病毒的症状有哪些', '<media>', '知识图谱', '<misc>', '深度问答应用中', '<org>', '<unk>', '系统', '<eve>', 'مية']
|
||
2025-06-19 16:55:25,424 - DEBUG - 添加三元组: 病毒(concept) - 知识图谱 - 埃博拉病毒的症状有哪些(media)
|
||
2025-06-19 16:55:25,424 - DEBUG - 块 43 提取到 1 个三元组
|
||
2025-06-19 16:55:25,424 - DEBUG - 处理块 44/44: 』,然后再进行推理变换,最终形成等价的三元组查询语句,如(埃博拉,症状,?)和(埃博拉,征兆,?)等...
|
||
2025-06-19 16:55:25,741 - DEBUG - 块 44 生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-19 16:55:25,741 - DEBUG - 原始生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-19 16:55:25,742 - DEBUG - 处理后标记: ['<triplet>', '症状', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-19 16:55:25,742 - DEBUG - 添加三元组: 症状(concept) - part of - 三元组(misc)
|
||
2025-06-19 16:55:25,742 - DEBUG - 块 44 提取到 1 个三元组
|
||
2025-06-19 16:55:25,747 - INFO - 文档 b8b28ba3-b1c7-4019-8ee0-6c5464303764 的 41 个三元组已保存到: /share/wangmeihua/rag/triples/b8b28ba3-b1c7-4019-8ee0-6c5464303764_testuser1.txt
|
||
2025-06-19 16:55:25,747 - INFO - 文档 b8b28ba3-b1c7-4019-8ee0-6c5464303764 三元组抽取完成,耗时: 17.00 秒
|
||
2025-06-19 16:55:25,747 - INFO - 文件 /share/wangmeihua/rag/data/test.docx 三元组保存到: True
|
||
2025-06-19 16:55:25,864 - INFO - Step 1: 导入图谱节点到 Neo4j,document_id: b8b28ba3-b1c7-4019-8ee0-6c5464303764
|
||
2025-06-19 17:01:08,927 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-19 17:01:08,927 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-19 17:01:09,057 - INFO - 生成 document_id: 521b2024-f3dc-47af-957d-0b725bf0855d for file: /share/wangmeihua/rag/data/test.docx
|
||
2025-06-19 17:01:09,057 - INFO - 开始处理文件 /share/wangmeihua/rag/data/test.docx,userid: testuser1,db_type: textdb
|
||
2025-06-19 17:01:09,057 - DEBUG - 检查文件: /share/wangmeihua/rag/data/test.docx, 大小: 25158 字节
|
||
2025-06-19 17:01:09,058 - DEBUG - 文件扩展名: docx
|
||
2025-06-19 17:01:09,058 - DEBUG - 开始加载文件
|
||
2025-06-19 17:01:09,075 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-19 17:01:09,075 - DEBUG - 分割完成,生成 4 个文档块
|
||
2025-06-19 17:01:09,075 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:09,076 - DEBUG - 生成文档块 1: metadata={'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:09,076 - DEBUG - 生成文档块 2: metadata={'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:09,076 - DEBUG - 生成文档块 3: metadata={'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:09,076 - DEBUG - 文件 /share/wangmeihua/rag/data/test.docx 加载并分割为 4 个文档块,document_id: 521b2024-f3dc-47af-957d-0b725bf0855d
|
||
2025-06-19 17:01:09,076 - DEBUG - 处理文件 /share/wangmeihua/rag/data/test.docx,生成 4 个文档块
|
||
2025-06-19 17:01:09,076 - DEBUG - 第一个文档块: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现
|
||
2025-06-19 17:01:09,916 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-19 17:01:15,674 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-19 17:01:15,675 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-19 17:01:15,679 - DEBUG - 检查集合 ragdb_textdb 的 schema: 字段匹配=True, vector_field存在=True, dtype=101, dim=1024
|
||
2025-06-19 17:01:15,795 - DEBUG - 集合 ragdb_textdb 已存在并加载成功
|
||
2025-06-19 17:01:15,809 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-19 17:01:15,809 - DEBUG - 正在为 userid testuser1 插入 4 个文档到 ragdb_textdb
|
||
2025-06-19 17:01:15,809 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:15,810 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:15,810 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:15,810 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': '521b2024-f3dc-47af-957d-0b725bf0855d', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:01:09.075944', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:01:15,977 - DEBUG - 成功插入 4 个文档
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104512, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104513, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104514, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104515, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104516, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104517, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104518, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,983 - DEBUG - 插入后查询结果: pk=458649953127104519, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,984 - DEBUG - 插入后查询结果: pk=458649953127104520, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:01:15,984 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-19 17:01:19,021 - INFO - 开始抽取文档 521b2024-f3dc-47af-957d-0b725bf0855d 的三元组,userid: testuser1
|
||
2025-06-19 17:01:19,022 - DEBUG - 分割为 44 个文本块
|
||
2025-06-19 17:01:19,022 - DEBUG - 处理块 1/44: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教...
|
||
2025-06-19 17:01:19,636 - DEBUG - 块 1 生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-19 17:01:19,636 - DEBUG - 原始生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-19 17:01:19,637 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Google搜索', '<media>', 'part of', '<triplet>', 'Google', '<org>', '聊天机器人', '<misc>', 'industry']
|
||
2025-06-19 17:01:19,637 - DEBUG - 处理块 2/44: 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及...
|
||
2025-06-19 17:01:19,866 - DEBUG - 块 2 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:01:19,866 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:01:19,866 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-19 17:01:19,866 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-19 17:01:19,866 - DEBUG - 块 2 提取到 1 个三元组
|
||
2025-06-19 17:01:19,866 - DEBUG - 处理块 3/44: 目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析...
|
||
2025-06-19 17:01:20,212 - DEBUG - 块 3 生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-19 17:01:20,212 - DEBUG - 原始生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-19 17:01:20,212 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Web语义知识库', '<media>', 'part of']
|
||
2025-06-19 17:01:20,212 - DEBUG - 处理块 4/44: 知识图谱以其强大的语义处理能力与开放互联能力,可为万维网上的知识互联奠定扎实的基础,使Web 3.0...
|
||
2025-06-19 17:01:20,850 - DEBUG - 块 4 生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-19 17:01:20,851 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-19 17:01:20,851 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '万维网', '<media>', 'Web 3.0', '<eve>', '愿景', '<org>', '世界', '<misc>', 'part of', '<triplet>', 'Web', '<unk>', '网的', '<time>', 'is a list of']
|
||
2025-06-19 17:01:20,851 - DEBUG - 添加三元组: 知识图谱(concept) - Web 3.0 - 万维网(media)
|
||
2025-06-19 17:01:20,851 - DEBUG - 添加三元组: Web(unk) - is a list of - 网的(time)
|
||
2025-06-19 17:01:20,851 - DEBUG - 块 4 提取到 2 个三元组
|
||
2025-06-19 17:01:20,851 - DEBUG - 处理块 5/44: 知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”...
|
||
2025-06-19 17:01:21,333 - DEBUG - 块 5 生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-19 17:01:21,333 - DEBUG - 原始生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-19 17:01:21,333 - DEBUG - 处理后标记: ['<triplet>', '自顶向下', '<concept>', '结构化数据源', '<media>', '百科类网站', '<org>', '知识库', '<misc>', 'part of']
|
||
2025-06-19 17:01:21,333 - DEBUG - 添加三元组: 自顶向下(concept) - 百科类网站 - 结构化数据源(media)
|
||
2025-06-19 17:01:21,333 - DEBUG - 块 5 提取到 1 个三元组
|
||
2025-06-19 17:01:21,333 - DEBUG - 处理块 6/44: 所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模...
|
||
2025-06-19 17:01:21,928 - DEBUG - 块 6 生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-19 17:01:21,928 - DEBUG - 原始生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-19 17:01:21,928 - DEBUG - 处理后标记: ['<triplet>', '结构化数据', '<concept>', '关系数据库', '<media>', '<org>', '知识库', '<misc>', '数据类型和存储方式', '<unk>', '<loc>', '的数据类型']
|
||
2025-06-19 17:01:21,928 - DEBUG - 添加三元组: 结构化数据(concept) - <org> - 关系数据库(media)
|
||
2025-06-19 17:01:21,928 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-19 17:01:21,928 - DEBUG - 处理块 7/44: 半结构化数据(Semi-Structed Data):如XML、JSON、百科
|
||
非结构化数据(UnS...
|
||
2025-06-19 17:01:22,088 - DEBUG - 块 7 生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-19 17:01:22,088 - DEBUG - 原始生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-19 17:01:22,088 - DEBUG - 处理后标记: ['<triplet>', '非结构化数据', '<concept>', 'XML', '<org>', 'subclass of']
|
||
2025-06-19 17:01:22,088 - DEBUG - 添加三元组: 非结构化数据(concept) - subclass of - XML(org)
|
||
2025-06-19 17:01:22,088 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-19 17:01:22,089 - DEBUG - 处理块 8/44: 一般有两种选择,一个是通过RDF(资源描述框架)这样的规范存储格式来进行存储,还有一种方法,就是使用...
|
||
2025-06-19 17:01:22,378 - DEBUG - 块 8 生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-19 17:01:22,378 - DEBUG - 原始生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-19 17:01:22,378 - DEBUG - 处理后标记: ['<triplet>', '模式层', '<concept>', '知识图谱', '<media>', 'subclass of']
|
||
2025-06-19 17:01:22,378 - DEBUG - 添加三元组: 模式层(concept) - subclass of - 知识图谱(media)
|
||
2025-06-19 17:01:22,378 - DEBUG - 块 8 提取到 1 个三元组
|
||
2025-06-19 17:01:22,378 - DEBUG - 处理块 9/44: 模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的...
|
||
2025-06-19 17:01:22,753 - DEBUG - 块 9 生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-19 17:01:22,754 - DEBUG - 原始生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-19 17:01:22,754 - DEBUG - 处理后标记: ['<triplet>', '结构化知识库', '<concept>', '知识图谱', '<misc>', 'subclass of']
|
||
2025-06-19 17:01:22,754 - DEBUG - 添加三元组: 结构化知识库(concept) - subclass of - 知识图谱(misc)
|
||
2025-06-19 17:01:22,754 - DEBUG - 块 9 提取到 1 个三元组
|
||
2025-06-19 17:01:22,754 - DEBUG - 处理块 10/44: 如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储...
|
||
2025-06-19 17:01:23,182 - DEBUG - 块 10 生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-19 17:01:23,182 - DEBUG - 原始生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-19 17:01:23,182 - DEBUG - 处理后标记: ['<triplet>', '比尔盖茨', '<per>', '微软', '<org>', 'employer', '<triplet>', '5 信息抽取', '<media>', '数据层', '<concept>', 'facet of']
|
||
2025-06-19 17:01:23,182 - DEBUG - 添加三元组: 比尔盖茨(per) - employer - 微软(org)
|
||
2025-06-19 17:01:23,182 - DEBUG - 添加三元组: 5 信息抽取(media) - facet of - 数据层(concept)
|
||
2025-06-19 17:01:23,182 - DEBUG - 块 10 提取到 2 个三元组
|
||
2025-06-19 17:01:23,182 - DEBUG - 处理块 11/44: 信息抽取(infromation extraction)是知识图谱构建的第1步,其中的关键问题是:如...
|
||
2025-06-19 17:01:23,492 - DEBUG - 块 11 生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:01:23,493 - DEBUG - 原始生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:01:23,493 - DEBUG - 处理后标记: ['<triplet>', '信息抽取', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-19 17:01:23,493 - DEBUG - 添加三元组: 信息抽取(concept) - part of - 知识图谱(media)
|
||
2025-06-19 17:01:23,493 - DEBUG - 块 11 提取到 1 个三元组
|
||
2025-06-19 17:01:23,493 - DEBUG - 处理块 12/44: 5.1 实体抽取(Entity Extraction)
|
||
实体抽取又称为命名实体识别(named en...
|
||
2025-06-19 17:01:23,665 - DEBUG - 块 12 生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-19 17:01:23,666 - DEBUG - 原始生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-19 17:01:23,666 - DEBUG - 处理后标记: ['<triplet>', '实体识别', '<concept>', '信息抽取', '<media>', 'subclass of']
|
||
2025-06-19 17:01:23,666 - DEBUG - 添加三元组: 实体识别(concept) - subclass of - 信息抽取(media)
|
||
2025-06-19 17:01:23,666 - DEBUG - 块 12 提取到 1 个三元组
|
||
2025-06-19 17:01:23,666 - DEBUG - 处理块 13/44: 2012年Ling等人归纳出112种实体类别,并基于条件随机场CRF进行实体边界识别,最后采用自适应...
|
||
2025-06-19 17:01:24,019 - DEBUG - 块 13 生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-19 17:01:24,019 - DEBUG - 原始生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-19 17:01:24,019 - DEBUG - 处理后标记: ['<triplet>', '实体分类体系', '<concept>', '112种实体类别', '<misc>', 'part of']
|
||
2025-06-19 17:01:24,019 - DEBUG - 添加三元组: 实体分类体系(concept) - part of - 112种实体类别(misc)
|
||
2025-06-19 17:01:24,019 - DEBUG - 块 13 提取到 1 个三元组
|
||
2025-06-19 17:01:24,019 - DEBUG - 处理块 14/44: 在面向开放域的实体识别和分类研究中,不需要(也不可能)为每个领域或者每个实体类别建立单独的语料库作为...
|
||
2025-06-19 17:01:24,309 - DEBUG - 块 14 生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-19 17:01:24,309 - DEBUG - 原始生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-19 17:01:24,309 - DEBUG - 处理后标记: ['<triplet>', '分类研究', '<concept>', '面向开放域的实体识别', '<media>', '实体类别', '<misc>', 'studies']
|
||
2025-06-19 17:01:24,309 - DEBUG - 添加三元组: 分类研究(concept) - 实体类别 - 面向开放域的实体识别(media)
|
||
2025-06-19 17:01:24,309 - DEBUG - 块 14 提取到 1 个三元组
|
||
2025-06-19 17:01:24,309 - DEBUG - 处理块 15/44: 一种思路是根据已知的实体实例进行特征建模,利用该模型处理海量数据集得到新的命名实体列表,然后针对新实...
|
||
2025-06-19 17:01:24,783 - DEBUG - 块 15 生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-19 17:01:24,783 - DEBUG - 原始生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-19 17:01:24,783 - DEBUG - 处理后标记: ['<triplet>', '服务器日志', '<concept>', '搜索引擎', '<org>', '特征建模', '<media>', '<misc>', '算法', '<unk>', '<eve>', '<per>', '分类', '<loc>', '<time>', '<dis>', '<cel>', '语义特征']
|
||
2025-06-19 17:01:24,783 - DEBUG - 添加三元组: 服务器日志(concept) - 特征建模 - 搜索引擎(org)
|
||
2025-06-19 17:01:24,783 - DEBUG - 块 15 提取到 1 个三元组
|
||
2025-06-19 17:01:24,783 - DEBUG - 处理块 16/44: 5.2 关系抽取(Relation Extraction)
|
||
...
|
||
2025-06-19 17:01:24,954 - DEBUG - 块 16 生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-19 17:01:24,954 - DEBUG - 原始生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-19 17:01:24,954 - DEBUG - 处理后标记: ['<triplet>', '关系抽取', '<concept>', 'Relation Extraction', '<unk>', 'subclass of']
|
||
2025-06-19 17:01:24,954 - DEBUG - 添加三元组: 关系抽取(concept) - subclass of - Relation Extraction(unk)
|
||
2025-06-19 17:01:24,954 - DEBUG - 块 16 提取到 1 个三元组
|
||
2025-06-19 17:01:24,954 - DEBUG - 处理块 17/44: 文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体...
|
||
2025-06-19 17:01:25,189 - DEBUG - 块 17 生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:01:25,189 - DEBUG - 原始生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:01:25,189 - DEBUG - 处理后标记: ['<triplet>', '模式匹配', '<concept>', '语料', '<media>', '实体', '<misc>', 'subclass of']
|
||
2025-06-19 17:01:25,189 - DEBUG - 添加三元组: 模式匹配(concept) - 实体 - 语料(media)
|
||
2025-06-19 17:01:25,189 - DEBUG - 块 17 提取到 1 个三元组
|
||
2025-06-19 17:01:25,189 - DEBUG - 处理块 18/44: 2.统计机器学习方法
|
||
3.基于特征向量或核函数的有监督学习方法
|
||
4.研究重点转向半监督和无监督
|
||
5....
|
||
2025-06-19 17:01:25,770 - DEBUG - 块 18 生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-19 17:01:25,770 - DEBUG - 原始生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-19 17:01:25,770 - DEBUG - 处理后标记: ['<triplet>', '属性抽取', '<concept>', '统计机器学习', '<media>', '<misc>', '面向开放域的信息抽', '<unk>', '<eve>', '信息抽式', '<org>', '統計', '<time>', '<dis>', 'part of']
|
||
2025-06-19 17:01:25,770 - DEBUG - 添加三元组: 属性抽取(concept) - <misc> - 统计机器学习(media)
|
||
2025-06-19 17:01:25,770 - DEBUG - 块 18 提取到 1 个三元组
|
||
2025-06-19 17:01:25,770 - DEBUG - 处理块 19/44: 属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物,可以从网络公开信息中得到...
|
||
2025-06-19 17:01:25,942 - DEBUG - 块 19 生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:01:25,942 - DEBUG - 原始生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:01:25,942 - DEBUG - 处理后标记: ['<triplet>', '属性', '<concept>', '实体', '<misc>', 'subclass of']
|
||
2025-06-19 17:01:25,942 - DEBUG - 添加三元组: 属性(concept) - subclass of - 实体(misc)
|
||
2025-06-19 17:01:25,942 - DEBUG - 块 19 提取到 1 个三元组
|
||
2025-06-19 17:01:25,942 - DEBUG - 处理块 20/44: 基于规则和启发式算法,抽取结构化数据
|
||
基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训...
|
||
2025-06-19 17:01:26,134 - DEBUG - 块 20 生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-19 17:01:26,135 - DEBUG - 原始生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-19 17:01:26,135 - DEBUG - 处理后标记: ['<triplet>', '数据挖掘', '<concept>', '结构化数据', '<media>', 'subclass of']
|
||
2025-06-19 17:01:26,135 - DEBUG - 添加三元组: 数据挖掘(concept) - subclass of - 结构化数据(media)
|
||
2025-06-19 17:01:26,135 - DEBUG - 块 20 提取到 1 个三元组
|
||
2025-06-19 17:01:26,135 - DEBUG - 处理块 21/44: 通过信息抽取,我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。
|
||
如果我们...
|
||
2025-06-19 17:01:26,841 - DEBUG - 块 21 生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-19 17:01:26,842 - DEBUG - 原始生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-19 17:01:26,842 - DEBUG - 处理后标记: ['<triplet>', '拼图碎片', '<concept>', '信息抽取', '<media>', '非结构化', '<misc>', '数据', '<unk>', '<org>', '的数据', '<eve>', '<per>', '<loc>']
|
||
2025-06-19 17:01:26,842 - DEBUG - 添加三元组: 拼图碎片(concept) - 非结构化 - 信息抽取(media)
|
||
2025-06-19 17:01:26,842 - DEBUG - 块 21 提取到 1 个三元组
|
||
2025-06-19 17:01:26,842 - DEBUG - 处理块 22/44: 拼图(知识)中还存在大量冗杂和错误的拼图碎片(信息)
|
||
那么如何解决这一问题,就是在知识融合这一步里我...
|
||
2025-06-19 17:01:27,184 - DEBUG - 块 22 生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-19 17:01:27,184 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-19 17:01:27,184 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<unk>', '知识库', '<media>', 'part of']
|
||
2025-06-19 17:01:27,184 - DEBUG - 处理块 23/44:
|
||
其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链...
|
||
2025-06-19 17:01:27,676 - DEBUG - 块 23 生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-19 17:01:27,677 - DEBUG - 原始生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-19 17:01:27,677 - DEBUG - 处理后标记: ['<triplet>', '实体指称项', '<concept>', '<unk>', '知识库', '<media>', 'part of the series', '<loc>', '<org>', '<misc>', '库中', '<eve>', '<dis>', '<cel>', '<per>', '<time>', '<triplet>']
|
||
2025-06-19 17:01:27,677 - DEBUG - 处理块 24/44: 即集成实体链接(collective entity linking)
|
||
实体链接的流程:
|
||
1.从文本中...
|
||
2025-06-19 17:01:27,858 - DEBUG - 块 24 生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-19 17:01:27,858 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-19 17:01:27,858 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<org>', 'subclass of']
|
||
2025-06-19 17:01:27,858 - DEBUG - 处理块 25/44: 在确认知识库中对应的正确实体对象之后,将该实体指称项链接到知识库中对应实体。
|
||
实体消歧:专门用于解决...
|
||
2025-06-19 17:01:28,222 - DEBUG - 块 25 生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-19 17:01:28,222 - DEBUG - 原始生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-19 17:01:28,222 - DEBUG - 处理后标记: ['<triplet>', '歧义', '<concept>', '实体消歧', '<media>', 'used by', '<triplet>']
|
||
2025-06-19 17:01:28,222 - DEBUG - 添加三元组: 歧义(concept) - used by - 实体消歧(media)
|
||
2025-06-19 17:01:28,222 - DEBUG - 块 25 提取到 1 个三元组
|
||
2025-06-19 17:01:28,222 - DEBUG - 处理块 26/44: 共指消解:主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象...
|
||
2025-06-19 17:01:28,770 - DEBUG - 块 26 生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-19 17:01:28,770 - DEBUG - 原始生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-19 17:01:28,770 - DEBUG - 处理后标记: ['<triplet>', '共指消解', '<concept>', '信息检索', '<misc>', '自然语言处理', '<media>', '语言', '<org>', '指称对应同一实体', '<unk>', '实体对象', '<per>', 'subclass of']
|
||
2025-06-19 17:01:28,770 - DEBUG - 添加三元组: 共指消解(concept) - 自然语言处理 - 信息检索(misc)
|
||
2025-06-19 17:01:28,770 - DEBUG - 块 26 提取到 1 个三元组
|
||
2025-06-19 17:01:28,770 - DEBUG - 处理块 27/44: 共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。
|
||
|
||
6.2 知识合并
|
||
在构建知识图谱时...
|
||
2025-06-19 17:01:29,134 - DEBUG - 块 27 生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-19 17:01:29,134 - DEBUG - 原始生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-19 17:01:29,134 - DEBUG - 处理后标记: ['<triplet>', '外部知识库', '<concept>', '知识图谱', '<media>', '结构化数据', '<org>', '库产品', '<unk>', '合并', '<misc>', 'subclass of']
|
||
2025-06-19 17:01:29,134 - DEBUG - 添加三元组: 外部知识库(concept) - 结构化数据 - 知识图谱(media)
|
||
2025-06-19 17:01:29,134 - DEBUG - 块 27 提取到 1 个三元组
|
||
2025-06-19 17:01:29,134 - DEBUG - 处理块 28/44: 数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,...
|
||
2025-06-19 17:01:29,769 - DEBUG - 块 28 生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-19 17:01:29,769 - DEBUG - 原始生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-19 17:01:29,769 - DEBUG - 处理后标记: ['<triplet>', '数据层的融合', '<concept>', '关系数据库', '<media>', '模式层', '<org>', '本体库', '<misc>', '实体的指称', '<unk>', '<loc>', '<per>', '实例以及关系的冲突问题,造成不必要的冗余', '<eve>', '合并关系', '<time>', 'facet of']
|
||
2025-06-19 17:01:29,769 - DEBUG - 添加三元组: 数据层的融合(concept) - 模式层 - 关系数据库(media)
|
||
2025-06-19 17:01:29,769 - DEBUG - 块 28 提取到 1 个三元组
|
||
2025-06-19 17:01:29,769 - DEBUG - 处理块 29/44: 为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界...
|
||
2025-06-19 17:01:30,328 - DEBUG - 块 29 生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-19 17:01:30,328 - DEBUG - 原始生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-19 17:01:30,328 - DEBUG - 处理后标记: ['<triplet>', '资源描述框架', '<concept>', '本体构建本体', '<org>', '<media>', '<misc>', '<unk>', '<per>', '<loc>', '<eve>', '<time>', '<dis>', '<triplet>', 'DB2RDF', '<cel>', '结构化的历史数据', '<date>', 'subclass of']
|
||
2025-06-19 17:01:30,328 - DEBUG - 添加三元组: 资源描述框架(concept) - <media> - 本体构建本体(org)
|
||
2025-06-19 17:01:30,328 - DEBUG - 添加三元组: DB2RDF(cel) - subclass of - 结构化的历史数据(date)
|
||
2025-06-19 17:01:30,328 - DEBUG - 块 29 提取到 2 个三元组
|
||
2025-06-19 17:01:30,328 - DEBUG - 处理块 30/44: 本体可以采用人工编辑的方式手动构建(借助本体编辑软件),也可以以数据驱动的自动化方式构建本体。因为人...
|
||
2025-06-19 17:01:30,974 - DEBUG - 块 30 生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-19 17:01:30,974 - DEBUG - 原始生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-19 17:01:30,974 - DEBUG - 处理后标记: ['<triplet>', '自动化本体构建过程', '<concept>', '数据驱动的自动化方式', '<media>', '本体库', '<misc>', '全局', '<org>', '库产品', '<unk>', '软件', '<loc>', 'part of']
|
||
2025-06-19 17:01:30,974 - DEBUG - 添加三元组: 自动化本体构建过程(concept) - 本体库 - 数据驱动的自动化方式(media)
|
||
2025-06-19 17:01:30,974 - DEBUG - 块 30 提取到 1 个三元组
|
||
2025-06-19 17:01:30,974 - DEBUG - 处理块 31/44: 1.实体并列关系相似度计算
|
||
2.实体上下位关系抽取
|
||
3.本体的生成
|
||
比如对下面这个例子,当知识图谱刚...
|
||
2025-06-19 17:01:31,156 - DEBUG - 块 31 生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-19 17:01:31,156 - DEBUG - 原始生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-19 17:01:31,156 - DEBUG - 处理后标记: ['<triplet>', '阿里', '<org>', '阿里巴巴', '<media>', 'owned by']
|
||
2025-06-19 17:01:31,156 - DEBUG - 添加三元组: 阿里(org) - owned by - 阿里巴巴(media)
|
||
2025-06-19 17:01:31,156 - DEBUG - 块 31 提取到 1 个三元组
|
||
2025-06-19 17:01:31,156 - DEBUG - 处理块 32/44: 这就是第一步的作用,但这样下来,知识图谱实际上还是没有一个上下层的概念,它还是不知道,阿里巴巴和手机...
|
||
2025-06-19 17:01:31,552 - DEBUG - 块 32 生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-19 17:01:31,552 - DEBUG - 原始生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-19 17:01:31,552 - DEBUG - 处理后标记: ['<triplet>', '上下位关系', '<concept>', '图谱', '<media>', '阿里巴巴', '<org>', 'owned by']
|
||
2025-06-19 17:01:31,552 - DEBUG - 添加三元组: 上下位关系(concept) - 阿里巴巴 - 图谱(media)
|
||
2025-06-19 17:01:31,552 - DEBUG - 块 32 提取到 1 个三元组
|
||
2025-06-19 17:01:31,552 - DEBUG - 处理块 33/44: 当三步结束后,这个知识图谱可能就会明白,“阿里巴巴和腾讯,其实都是公司这样一个实体下的细分实体。它们...
|
||
2025-06-19 17:01:31,712 - DEBUG - 块 33 生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-19 17:01:31,712 - DEBUG - 原始生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-19 17:01:31,712 - DEBUG - 处理后标记: ['<triplet>', '腾讯', '<org>', '阿里巴巴', '<concept>', 'owned by']
|
||
2025-06-19 17:01:31,712 - DEBUG - 添加三元组: 腾讯(org) - owned by - 阿里巴巴(concept)
|
||
2025-06-19 17:01:31,712 - DEBUG - 块 33 提取到 1 个三元组
|
||
2025-06-19 17:01:31,712 - DEBUG - 处理块 34/44: 但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识...
|
||
2025-06-19 17:01:32,225 - DEBUG - 块 34 生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-19 17:01:32,225 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-19 17:01:32,225 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '城市', '<loc>', 'location']
|
||
2025-06-19 17:01:32,225 - DEBUG - 添加三元组: 知识图谱(concept) - location - 城市(loc)
|
||
2025-06-19 17:01:32,225 - DEBUG - 块 34 提取到 1 个三元组
|
||
2025-06-19 17:01:32,225 - DEBUG - 处理块 35/44: 根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,那么我们就可以将AD...
|
||
2025-06-19 17:01:32,814 - DEBUG - 块 35 生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-19 17:01:32,814 - DEBUG - 原始生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-19 17:01:32,815 - DEBUG - 处理后标记: ['<triplet>', '串联', '<concept>', '推理策略的一环', '<media>', '规则', '<misc>', '图里', '<org>', '<eve>', '<unk>', '<per>', 'C', '<loc>', 'part of']
|
||
2025-06-19 17:01:32,815 - DEBUG - 添加三元组: 串联(concept) - 规则 - 推理策略的一环(media)
|
||
2025-06-19 17:01:32,815 - DEBUG - 块 35 提取到 1 个三元组
|
||
2025-06-19 17:01:32,815 - DEBUG - 处理块 36/44: 当然知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。
|
||
推理属性值...
|
||
2025-06-19 17:01:33,145 - DEBUG - 块 36 生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-19 17:01:33,145 - DEBUG - 原始生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-19 17:01:33,145 - DEBUG - 处理后标记: ['<triplet>', '猫科', '<concept>', '老虎,科,目,食肉目']
|
||
2025-06-19 17:01:33,145 - DEBUG - 处理块 37/44: 这一块的算法主要可以分为3大类,基于逻辑的推理、基于图的推理和基于深度学习的推理。
|
||
7.3 质量评估...
|
||
2025-06-19 17:01:33,519 - DEBUG - 块 37 生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-19 17:01:33,519 - DEBUG - 原始生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-19 17:01:33,520 - DEBUG - 处理后标记: ['<triplet>', '算法', '<concept>', '知识库', '<media>', 'part of']
|
||
2025-06-19 17:01:33,520 - DEBUG - 添加三元组: 算法(concept) - part of - 知识库(media)
|
||
2025-06-19 17:01:33,520 - DEBUG - 块 37 提取到 1 个三元组
|
||
2025-06-19 17:01:33,520 - DEBUG - 处理块 38/44: 从逻辑上看,知识库的更新包括概念层的更新和数据层的更新。
|
||
概念层的更新是指新增数据后获得了新的概念,...
|
||
2025-06-19 17:01:33,850 - DEBUG - 块 38 生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-19 17:01:33,850 - DEBUG - 原始生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-19 17:01:33,850 - DEBUG - 处理后标记: ['<triplet>', '知识库的更新', '<concept>', '概念层', '<media>', 'subclass of']
|
||
2025-06-19 17:01:33,850 - DEBUG - 添加三元组: 知识库的更新(concept) - subclass of - 概念层(media)
|
||
2025-06-19 17:01:33,850 - DEBUG - 块 38 提取到 1 个三元组
|
||
2025-06-19 17:01:33,850 - DEBUG - 处理块 39/44: 数据层的更新主要是新增或更新实体、关系、属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性...
|
||
2025-06-19 17:01:34,278 - DEBUG - 块 39 生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-19 17:01:34,278 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-19 17:01:34,278 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '数据层', '<media>', 'part of']
|
||
2025-06-19 17:01:34,278 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 数据层(media)
|
||
2025-06-19 17:01:34,278 - DEBUG - 块 39 提取到 1 个三元组
|
||
2025-06-19 17:01:34,278 - DEBUG - 处理块 40/44: 这种方法比较简单,但资源消耗大,而且需要耗费大量人力资源进行系统维护;
|
||
增量更新:以当前新增数据为输...
|
||
2025-06-19 17:01:34,438 - DEBUG - 块 40 生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:01:34,438 - DEBUG - 原始生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:01:34,438 - DEBUG - 处理后标记: ['<triplet>', '总结', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-19 17:01:34,438 - DEBUG - 添加三元组: 总结(concept) - part of - 知识图谱(media)
|
||
2025-06-19 17:01:34,438 - DEBUG - 块 40 提取到 1 个三元组
|
||
2025-06-19 17:01:34,438 - DEBUG - 处理块 41/44: 通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和...
|
||
2025-06-19 17:01:35,090 - DEBUG - 块 41 生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-19 17:01:35,090 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-19 17:01:35,091 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '智能语义搜索', '<media>', '移动个人助理(Siri', '<misc>', '互联网信息', '<org>', 'owned by', '<triplet>', '(Sri)', '<eve>', '的知识', '<unk>', 'subclass of']
|
||
2025-06-19 17:01:35,091 - DEBUG - 添加三元组: 知识图谱(concept) - 移动个人助理(Siri - 智能语义搜索(media)
|
||
2025-06-19 17:01:35,091 - DEBUG - 添加三元组: (Sri)(eve) - subclass of - 的知识(unk)
|
||
2025-06-19 17:01:35,091 - DEBUG - 块 41 提取到 2 个三元组
|
||
2025-06-19 17:01:35,091 - DEBUG - 处理块 42/44: 在智能语义搜索中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键词进行解析和推理,进...
|
||
2025-06-19 17:01:35,251 - DEBUG - 块 42 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:01:35,251 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:01:35,251 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-19 17:01:35,251 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-19 17:01:35,251 - DEBUG - 块 42 提取到 1 个三元组
|
||
2025-06-19 17:01:35,251 - DEBUG - 处理块 43/44: 在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析...
|
||
2025-06-19 17:01:35,765 - DEBUG - 块 43 生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-19 17:01:35,765 - DEBUG - 原始生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-19 17:01:35,765 - DEBUG - 处理后标记: ['<triplet>', '病毒', '<concept>', '埃博拉病毒的症状有哪些', '<media>', '知识图谱', '<misc>', '深度问答应用中', '<org>', '<unk>', '系统', '<eve>', 'مية']
|
||
2025-06-19 17:01:35,765 - DEBUG - 添加三元组: 病毒(concept) - 知识图谱 - 埃博拉病毒的症状有哪些(media)
|
||
2025-06-19 17:01:35,766 - DEBUG - 块 43 提取到 1 个三元组
|
||
2025-06-19 17:01:35,766 - DEBUG - 处理块 44/44: 』,然后再进行推理变换,最终形成等价的三元组查询语句,如(埃博拉,症状,?)和(埃博拉,征兆,?)等...
|
||
2025-06-19 17:01:36,085 - DEBUG - 块 44 生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-19 17:01:36,085 - DEBUG - 原始生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-19 17:01:36,085 - DEBUG - 处理后标记: ['<triplet>', '症状', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-19 17:01:36,085 - DEBUG - 添加三元组: 症状(concept) - part of - 三元组(misc)
|
||
2025-06-19 17:01:36,085 - DEBUG - 块 44 提取到 1 个三元组
|
||
2025-06-19 17:01:36,092 - INFO - 文档 521b2024-f3dc-47af-957d-0b725bf0855d 的 41 个三元组已保存到: /share/wangmeihua/rag/triples/521b2024-f3dc-47af-957d-0b725bf0855d_testuser1.txt
|
||
2025-06-19 17:01:36,092 - INFO - 文档 521b2024-f3dc-47af-957d-0b725bf0855d 三元组抽取完成,耗时: 17.07 秒
|
||
2025-06-19 17:01:36,092 - INFO - 文件 /share/wangmeihua/rag/data/test.docx 三元组保存到: True
|
||
2025-06-19 17:01:36,194 - INFO - Step 1: 导入图谱节点到 Neo4j,document_id: 521b2024-f3dc-47af-957d-0b725bf0855d
|
||
2025-06-19 17:47:59,277 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-19 17:47:59,277 - DEBUG - 成功加载 mREBEL 模型,分词器 triplet_id: 250054
|
||
2025-06-19 17:47:59,426 - INFO - 生成 document_id: c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac for file: /share/wangmeihua/rag/data/test.docx
|
||
2025-06-19 17:47:59,426 - INFO - 开始处理文件 /share/wangmeihua/rag/data/test.docx,userid: testuser1,db_type: textdb
|
||
2025-06-19 17:47:59,426 - DEBUG - 检查文件: /share/wangmeihua/rag/data/test.docx, 大小: 25158 字节
|
||
2025-06-19 17:47:59,426 - DEBUG - 文件扩展名: docx
|
||
2025-06-19 17:47:59,426 - DEBUG - 开始加载文件
|
||
2025-06-19 17:47:59,442 - DEBUG - 加载完成,生成 1 个文档
|
||
2025-06-19 17:47:59,442 - DEBUG - 分割完成,生成 4 个文档块
|
||
2025-06-19 17:47:59,442 - DEBUG - 生成文档块 0: metadata={'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:47:59,442 - DEBUG - 生成文档块 1: metadata={'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:47:59,442 - DEBUG - 生成文档块 2: metadata={'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:47:59,442 - DEBUG - 生成文档块 3: metadata={'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:47:59,442 - DEBUG - 文件 /share/wangmeihua/rag/data/test.docx 加载并分割为 4 个文档块,document_id: c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac
|
||
2025-06-19 17:47:59,442 - DEBUG - 处理文件 /share/wangmeihua/rag/data/test.docx,生成 4 个文档块
|
||
2025-06-19 17:47:59,442 - DEBUG - 第一个文档块: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
|
||
知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现
|
||
2025-06-19 17:48:00,364 - DEBUG - 已连接到 Milvus Lite,路径: /share/wangmeihua/rag/conf/Milvus/milvus.db
|
||
2025-06-19 17:48:06,645 - DEBUG - 嵌入模型加载成功,输出维度: 1024
|
||
2025-06-19 17:48:06,645 - DEBUG - 集合名称: ragdb_textdb
|
||
2025-06-19 17:48:06,649 - DEBUG - 检查集合 ragdb_textdb 的 schema: 字段匹配=True, vector_field存在=True, dtype=101, dim=1024
|
||
2025-06-19 17:48:06,764 - DEBUG - 集合 ragdb_textdb 已存在并加载成功
|
||
2025-06-19 17:48:06,774 - DEBUG - 成功初始化 Milvus 向量存储: ragdb_textdb
|
||
2025-06-19 17:48:06,774 - DEBUG - 正在为 userid testuser1 插入 4 个文档到 ragdb_textdb
|
||
2025-06-19 17:48:06,774 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 0, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:48:06,774 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 1, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:48:06,774 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 2, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:48:06,774 - DEBUG - 插入文档元数据: {'userid': 'testuser1', 'document_id': 'c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac', 'filename': 'test.docx', 'file_path': '/share/wangmeihua/rag/data/test.docx', 'upload_time': '2025-06-19T17:47:59.442690', 'file_type': 'docx', 'chunk_index': 3, 'source': '/share/wangmeihua/rag/data/test.docx'}
|
||
2025-06-19 17:48:06,936 - DEBUG - 成功插入 4 个文档
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649670833930240, document_id=29c93db6-c633-42cc-a9b0-1fa83a49d8bc, metadata={'filename': 'test.txt', 'file_path': '/share/wangmeihua/rag/data/test.txt', 'upload_time': '2025-06-11T10:40:35.641220', 'file_type': 'txt'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104512, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104513, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104514, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104515, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104516, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104517, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104518, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104519, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 插入后查询结果: pk=458649953127104520, document_id=796af784-5a60-47f1-a4e2-3d73643fd4c5, metadata={'filename': 'qianru.pdf', 'file_path': '/share/wangmeihua/rag/data/qianru.pdf', 'upload_time': '2025-06-11T10:58:34.018018', 'file_type': 'pdf'}
|
||
2025-06-19 17:48:06,943 - DEBUG - 已断开 Milvus 连接
|
||
2025-06-19 17:48:09,980 - INFO - 开始抽取文档 c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac 的三元组,userid: testuser1
|
||
2025-06-19 17:48:09,982 - DEBUG - 分割为 44 个文本块
|
||
2025-06-19 17:48:09,982 - DEBUG - 处理块 1/44: 1. 前言
|
||
从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教...
|
||
2025-06-19 17:48:10,589 - DEBUG - 块 1 生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-19 17:48:10,589 - DEBUG - 原始生成文本: <triplet> <concept> Google搜索 <media> part of <triplet> Google <org> 聊天机器人 <misc> industry</s>
|
||
2025-06-19 17:48:10,589 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Google搜索', '<media>', 'part of', '<triplet>', 'Google', '<org>', '聊天机器人', '<misc>', 'industry']
|
||
2025-06-19 17:48:10,589 - DEBUG - 处理块 2/44: 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及...
|
||
2025-06-19 17:48:10,813 - DEBUG - 块 2 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:48:10,813 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:48:10,813 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-19 17:48:10,813 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-19 17:48:10,814 - DEBUG - 块 2 提取到 1 个三元组
|
||
2025-06-19 17:48:10,814 - DEBUG - 处理块 3/44: 目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析...
|
||
2025-06-19 17:48:11,155 - DEBUG - 块 3 生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-19 17:48:11,156 - DEBUG - 原始生成文本: <triplet> <concept> Web语义知识库 <media> part of</s>
|
||
2025-06-19 17:48:11,156 - DEBUG - 处理后标记: ['<triplet>', '<concept>', 'Web语义知识库', '<media>', 'part of']
|
||
2025-06-19 17:48:11,156 - DEBUG - 处理块 4/44: 知识图谱以其强大的语义处理能力与开放互联能力,可为万维网上的知识互联奠定扎实的基础,使Web 3.0...
|
||
2025-06-19 17:48:11,794 - DEBUG - 块 4 生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-19 17:48:11,794 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 万维网 <media> Web 3.0 <eve> 愿景 <org> 世界 <misc> part of <triplet> Web <unk> 网的 <time> is a list of</s>
|
||
2025-06-19 17:48:11,794 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '万维网', '<media>', 'Web 3.0', '<eve>', '愿景', '<org>', '世界', '<misc>', 'part of', '<triplet>', 'Web', '<unk>', '网的', '<time>', 'is a list of']
|
||
2025-06-19 17:48:11,794 - DEBUG - 添加三元组: 知识图谱(concept) - Web 3.0 - 万维网(media)
|
||
2025-06-19 17:48:11,794 - DEBUG - 添加三元组: Web(unk) - is a list of - 网的(time)
|
||
2025-06-19 17:48:11,794 - DEBUG - 块 4 提取到 2 个三元组
|
||
2025-06-19 17:48:11,794 - DEBUG - 处理块 5/44: 知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”...
|
||
2025-06-19 17:48:12,275 - DEBUG - 块 5 生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-19 17:48:12,275 - DEBUG - 原始生成文本: <triplet> 自顶向下 <concept> 结构化数据源 <media> 百科类网站 <org> 知识库 <misc> part of</s>
|
||
2025-06-19 17:48:12,275 - DEBUG - 处理后标记: ['<triplet>', '自顶向下', '<concept>', '结构化数据源', '<media>', '百科类网站', '<org>', '知识库', '<misc>', 'part of']
|
||
2025-06-19 17:48:12,275 - DEBUG - 添加三元组: 自顶向下(concept) - 百科类网站 - 结构化数据源(media)
|
||
2025-06-19 17:48:12,275 - DEBUG - 块 5 提取到 1 个三元组
|
||
2025-06-19 17:48:12,275 - DEBUG - 处理块 6/44: 所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模...
|
||
2025-06-19 17:48:12,865 - DEBUG - 块 6 生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-19 17:48:12,865 - DEBUG - 原始生成文本: <triplet> 结构化数据 <concept> 关系数据库 <media> <org> 知识库 <misc> 数据类型和存储方式 <unk> <loc> 的数据类型</s>
|
||
2025-06-19 17:48:12,865 - DEBUG - 处理后标记: ['<triplet>', '结构化数据', '<concept>', '关系数据库', '<media>', '<org>', '知识库', '<misc>', '数据类型和存储方式', '<unk>', '<loc>', '的数据类型']
|
||
2025-06-19 17:48:12,865 - DEBUG - 添加三元组: 结构化数据(concept) - <org> - 关系数据库(media)
|
||
2025-06-19 17:48:12,865 - DEBUG - 块 6 提取到 1 个三元组
|
||
2025-06-19 17:48:12,865 - DEBUG - 处理块 7/44: 半结构化数据(Semi-Structed Data):如XML、JSON、百科
|
||
非结构化数据(UnS...
|
||
2025-06-19 17:48:13,025 - DEBUG - 块 7 生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-19 17:48:13,025 - DEBUG - 原始生成文本: <triplet> 非结构化数据 <concept> XML <org> subclass of</s>
|
||
2025-06-19 17:48:13,025 - DEBUG - 处理后标记: ['<triplet>', '非结构化数据', '<concept>', 'XML', '<org>', 'subclass of']
|
||
2025-06-19 17:48:13,025 - DEBUG - 添加三元组: 非结构化数据(concept) - subclass of - XML(org)
|
||
2025-06-19 17:48:13,025 - DEBUG - 块 7 提取到 1 个三元组
|
||
2025-06-19 17:48:13,025 - DEBUG - 处理块 8/44: 一般有两种选择,一个是通过RDF(资源描述框架)这样的规范存储格式来进行存储,还有一种方法,就是使用...
|
||
2025-06-19 17:48:13,315 - DEBUG - 块 8 生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-19 17:48:13,316 - DEBUG - 原始生成文本: <triplet> 模式层 <concept> 知识图谱 <media> subclass of</s>
|
||
2025-06-19 17:48:13,316 - DEBUG - 处理后标记: ['<triplet>', '模式层', '<concept>', '知识图谱', '<media>', 'subclass of']
|
||
2025-06-19 17:48:13,316 - DEBUG - 添加三元组: 模式层(concept) - subclass of - 知识图谱(media)
|
||
2025-06-19 17:48:13,316 - DEBUG - 块 8 提取到 1 个三元组
|
||
2025-06-19 17:48:13,316 - DEBUG - 处理块 9/44: 模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的...
|
||
2025-06-19 17:48:13,692 - DEBUG - 块 9 生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-19 17:48:13,692 - DEBUG - 原始生成文本: <triplet> 结构化知识库 <concept> 知识图谱 <misc> subclass of</s>
|
||
2025-06-19 17:48:13,692 - DEBUG - 处理后标记: ['<triplet>', '结构化知识库', '<concept>', '知识图谱', '<misc>', 'subclass of']
|
||
2025-06-19 17:48:13,692 - DEBUG - 添加三元组: 结构化知识库(concept) - subclass of - 知识图谱(misc)
|
||
2025-06-19 17:48:13,692 - DEBUG - 块 9 提取到 1 个三元组
|
||
2025-06-19 17:48:13,692 - DEBUG - 处理块 10/44: 如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储...
|
||
2025-06-19 17:48:14,118 - DEBUG - 块 10 生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-19 17:48:14,118 - DEBUG - 原始生成文本: <triplet> 比尔盖茨 <per> 微软 <org> employer <triplet> 5 信息抽取 <media> 数据层 <concept> facet of</s>
|
||
2025-06-19 17:48:14,119 - DEBUG - 处理后标记: ['<triplet>', '比尔盖茨', '<per>', '微软', '<org>', 'employer', '<triplet>', '5 信息抽取', '<media>', '数据层', '<concept>', 'facet of']
|
||
2025-06-19 17:48:14,119 - DEBUG - 添加三元组: 比尔盖茨(per) - employer - 微软(org)
|
||
2025-06-19 17:48:14,119 - DEBUG - 添加三元组: 5 信息抽取(media) - facet of - 数据层(concept)
|
||
2025-06-19 17:48:14,119 - DEBUG - 块 10 提取到 2 个三元组
|
||
2025-06-19 17:48:14,119 - DEBUG - 处理块 11/44: 信息抽取(infromation extraction)是知识图谱构建的第1步,其中的关键问题是:如...
|
||
2025-06-19 17:48:14,429 - DEBUG - 块 11 生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:48:14,429 - DEBUG - 原始生成文本: <triplet> 信息抽取 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:48:14,429 - DEBUG - 处理后标记: ['<triplet>', '信息抽取', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-19 17:48:14,429 - DEBUG - 添加三元组: 信息抽取(concept) - part of - 知识图谱(media)
|
||
2025-06-19 17:48:14,429 - DEBUG - 块 11 提取到 1 个三元组
|
||
2025-06-19 17:48:14,429 - DEBUG - 处理块 12/44: 5.1 实体抽取(Entity Extraction)
|
||
实体抽取又称为命名实体识别(named en...
|
||
2025-06-19 17:48:14,600 - DEBUG - 块 12 生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-19 17:48:14,600 - DEBUG - 原始生成文本: <triplet> 实体识别 <concept> 信息抽取 <media> subclass of</s>
|
||
2025-06-19 17:48:14,600 - DEBUG - 处理后标记: ['<triplet>', '实体识别', '<concept>', '信息抽取', '<media>', 'subclass of']
|
||
2025-06-19 17:48:14,600 - DEBUG - 添加三元组: 实体识别(concept) - subclass of - 信息抽取(media)
|
||
2025-06-19 17:48:14,600 - DEBUG - 块 12 提取到 1 个三元组
|
||
2025-06-19 17:48:14,600 - DEBUG - 处理块 13/44: 2012年Ling等人归纳出112种实体类别,并基于条件随机场CRF进行实体边界识别,最后采用自适应...
|
||
2025-06-19 17:48:14,953 - DEBUG - 块 13 生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-19 17:48:14,953 - DEBUG - 原始生成文本: <triplet> 实体分类体系 <concept> 112种实体类别 <misc> part of</s>
|
||
2025-06-19 17:48:14,953 - DEBUG - 处理后标记: ['<triplet>', '实体分类体系', '<concept>', '112种实体类别', '<misc>', 'part of']
|
||
2025-06-19 17:48:14,953 - DEBUG - 添加三元组: 实体分类体系(concept) - part of - 112种实体类别(misc)
|
||
2025-06-19 17:48:14,953 - DEBUG - 块 13 提取到 1 个三元组
|
||
2025-06-19 17:48:14,953 - DEBUG - 处理块 14/44: 在面向开放域的实体识别和分类研究中,不需要(也不可能)为每个领域或者每个实体类别建立单独的语料库作为...
|
||
2025-06-19 17:48:15,241 - DEBUG - 块 14 生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-19 17:48:15,241 - DEBUG - 原始生成文本: <triplet> 分类研究 <concept> 面向开放域的实体识别 <media> 实体类别 <misc> studies</s>
|
||
2025-06-19 17:48:15,241 - DEBUG - 处理后标记: ['<triplet>', '分类研究', '<concept>', '面向开放域的实体识别', '<media>', '实体类别', '<misc>', 'studies']
|
||
2025-06-19 17:48:15,241 - DEBUG - 添加三元组: 分类研究(concept) - 实体类别 - 面向开放域的实体识别(media)
|
||
2025-06-19 17:48:15,241 - DEBUG - 块 14 提取到 1 个三元组
|
||
2025-06-19 17:48:15,241 - DEBUG - 处理块 15/44: 一种思路是根据已知的实体实例进行特征建模,利用该模型处理海量数据集得到新的命名实体列表,然后针对新实...
|
||
2025-06-19 17:48:15,711 - DEBUG - 块 15 生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-19 17:48:15,711 - DEBUG - 原始生成文本: <triplet> 服务器日志 <concept> 搜索引擎 <org> 特征建模 <media> <misc> 算法 <unk> <eve> <per> 分类 <loc> <time> <dis> <cel> 语义特征</s>
|
||
2025-06-19 17:48:15,711 - DEBUG - 处理后标记: ['<triplet>', '服务器日志', '<concept>', '搜索引擎', '<org>', '特征建模', '<media>', '<misc>', '算法', '<unk>', '<eve>', '<per>', '分类', '<loc>', '<time>', '<dis>', '<cel>', '语义特征']
|
||
2025-06-19 17:48:15,712 - DEBUG - 添加三元组: 服务器日志(concept) - 特征建模 - 搜索引擎(org)
|
||
2025-06-19 17:48:15,712 - DEBUG - 块 15 提取到 1 个三元组
|
||
2025-06-19 17:48:15,712 - DEBUG - 处理块 16/44: 5.2 关系抽取(Relation Extraction)
|
||
...
|
||
2025-06-19 17:48:15,882 - DEBUG - 块 16 生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-19 17:48:15,882 - DEBUG - 原始生成文本: <triplet> 关系抽取 <concept> Relation Extraction <unk> subclass of</s>
|
||
2025-06-19 17:48:15,882 - DEBUG - 处理后标记: ['<triplet>', '关系抽取', '<concept>', 'Relation Extraction', '<unk>', 'subclass of']
|
||
2025-06-19 17:48:15,882 - DEBUG - 添加三元组: 关系抽取(concept) - subclass of - Relation Extraction(unk)
|
||
2025-06-19 17:48:15,882 - DEBUG - 块 16 提取到 1 个三元组
|
||
2025-06-19 17:48:15,882 - DEBUG - 处理块 17/44: 文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体...
|
||
2025-06-19 17:48:16,116 - DEBUG - 块 17 生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:48:16,116 - DEBUG - 原始生成文本: <triplet> 模式匹配 <concept> 语料 <media> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:48:16,116 - DEBUG - 处理后标记: ['<triplet>', '模式匹配', '<concept>', '语料', '<media>', '实体', '<misc>', 'subclass of']
|
||
2025-06-19 17:48:16,116 - DEBUG - 添加三元组: 模式匹配(concept) - 实体 - 语料(media)
|
||
2025-06-19 17:48:16,116 - DEBUG - 块 17 提取到 1 个三元组
|
||
2025-06-19 17:48:16,116 - DEBUG - 处理块 18/44: 2.统计机器学习方法
|
||
3.基于特征向量或核函数的有监督学习方法
|
||
4.研究重点转向半监督和无监督
|
||
5....
|
||
2025-06-19 17:48:16,692 - DEBUG - 块 18 生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-19 17:48:16,692 - DEBUG - 原始生成文本: <triplet> 属性抽取 <concept> 统计机器学习 <media> <misc> 面向开放域的信息抽 <unk> <eve> 信息抽式 <org> 統計 <time> <dis> part of</s>
|
||
2025-06-19 17:48:16,692 - DEBUG - 处理后标记: ['<triplet>', '属性抽取', '<concept>', '统计机器学习', '<media>', '<misc>', '面向开放域的信息抽', '<unk>', '<eve>', '信息抽式', '<org>', '統計', '<time>', '<dis>', 'part of']
|
||
2025-06-19 17:48:16,692 - DEBUG - 添加三元组: 属性抽取(concept) - <misc> - 统计机器学习(media)
|
||
2025-06-19 17:48:16,692 - DEBUG - 块 18 提取到 1 个三元组
|
||
2025-06-19 17:48:16,692 - DEBUG - 处理块 19/44: 属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物,可以从网络公开信息中得到...
|
||
2025-06-19 17:48:16,862 - DEBUG - 块 19 生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:48:16,862 - DEBUG - 原始生成文本: <triplet> 属性 <concept> 实体 <misc> subclass of</s>
|
||
2025-06-19 17:48:16,862 - DEBUG - 处理后标记: ['<triplet>', '属性', '<concept>', '实体', '<misc>', 'subclass of']
|
||
2025-06-19 17:48:16,862 - DEBUG - 添加三元组: 属性(concept) - subclass of - 实体(misc)
|
||
2025-06-19 17:48:16,862 - DEBUG - 块 19 提取到 1 个三元组
|
||
2025-06-19 17:48:16,862 - DEBUG - 处理块 20/44: 基于规则和启发式算法,抽取结构化数据
|
||
基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训...
|
||
2025-06-19 17:48:17,053 - DEBUG - 块 20 生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-19 17:48:17,053 - DEBUG - 原始生成文本: <triplet> 数据挖掘 <concept> 结构化数据 <media> subclass of</s>
|
||
2025-06-19 17:48:17,053 - DEBUG - 处理后标记: ['<triplet>', '数据挖掘', '<concept>', '结构化数据', '<media>', 'subclass of']
|
||
2025-06-19 17:48:17,053 - DEBUG - 添加三元组: 数据挖掘(concept) - subclass of - 结构化数据(media)
|
||
2025-06-19 17:48:17,053 - DEBUG - 块 20 提取到 1 个三元组
|
||
2025-06-19 17:48:17,053 - DEBUG - 处理块 21/44: 通过信息抽取,我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。
|
||
如果我们...
|
||
2025-06-19 17:48:17,758 - DEBUG - 块 21 生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-19 17:48:17,758 - DEBUG - 原始生成文本: <triplet> 拼图碎片 <concept> 信息抽取 <media> 非结构化 <misc> 数据 <unk> <org> 的数据 <eve> <per> <loc></s>
|
||
2025-06-19 17:48:17,758 - DEBUG - 处理后标记: ['<triplet>', '拼图碎片', '<concept>', '信息抽取', '<media>', '非结构化', '<misc>', '数据', '<unk>', '<org>', '的数据', '<eve>', '<per>', '<loc>']
|
||
2025-06-19 17:48:17,758 - DEBUG - 添加三元组: 拼图碎片(concept) - 非结构化 - 信息抽取(media)
|
||
2025-06-19 17:48:17,758 - DEBUG - 块 21 提取到 1 个三元组
|
||
2025-06-19 17:48:17,758 - DEBUG - 处理块 22/44: 拼图(知识)中还存在大量冗杂和错误的拼图碎片(信息)
|
||
那么如何解决这一问题,就是在知识融合这一步里我...
|
||
2025-06-19 17:48:18,098 - DEBUG - 块 22 生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-19 17:48:18,098 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <unk> 知识库 <media> part of</s>
|
||
2025-06-19 17:48:18,099 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<unk>', '知识库', '<media>', 'part of']
|
||
2025-06-19 17:48:18,099 - DEBUG - 处理块 23/44:
|
||
其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链...
|
||
2025-06-19 17:48:18,590 - DEBUG - 块 23 生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-19 17:48:18,590 - DEBUG - 原始生成文本: <triplet> 实体指称项 <concept> <unk> 知识库 <media> part of the series <loc> <org> <misc> 库中 <eve> <dis> <cel> <per> <time> <triplet></s>
|
||
2025-06-19 17:48:18,590 - DEBUG - 处理后标记: ['<triplet>', '实体指称项', '<concept>', '<unk>', '知识库', '<media>', 'part of the series', '<loc>', '<org>', '<misc>', '库中', '<eve>', '<dis>', '<cel>', '<per>', '<time>', '<triplet>']
|
||
2025-06-19 17:48:18,590 - DEBUG - 处理块 24/44: 即集成实体链接(collective entity linking)
|
||
实体链接的流程:
|
||
1.从文本中...
|
||
2025-06-19 17:48:18,772 - DEBUG - 块 24 生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-19 17:48:18,773 - DEBUG - 原始生成文本: <triplet> 实体链接 <concept> <org> subclass of</s>
|
||
2025-06-19 17:48:18,773 - DEBUG - 处理后标记: ['<triplet>', '实体链接', '<concept>', '<org>', 'subclass of']
|
||
2025-06-19 17:48:18,773 - DEBUG - 处理块 25/44: 在确认知识库中对应的正确实体对象之后,将该实体指称项链接到知识库中对应实体。
|
||
实体消歧:专门用于解决...
|
||
2025-06-19 17:48:19,134 - DEBUG - 块 25 生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-19 17:48:19,134 - DEBUG - 原始生成文本: <triplet> 歧义 <concept> 实体消歧 <media> used by <triplet></s>
|
||
2025-06-19 17:48:19,134 - DEBUG - 处理后标记: ['<triplet>', '歧义', '<concept>', '实体消歧', '<media>', 'used by', '<triplet>']
|
||
2025-06-19 17:48:19,134 - DEBUG - 添加三元组: 歧义(concept) - used by - 实体消歧(media)
|
||
2025-06-19 17:48:19,134 - DEBUG - 块 25 提取到 1 个三元组
|
||
2025-06-19 17:48:19,134 - DEBUG - 处理块 26/44: 共指消解:主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象...
|
||
2025-06-19 17:48:19,680 - DEBUG - 块 26 生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-19 17:48:19,680 - DEBUG - 原始生成文本: <triplet> 共指消解 <concept> 信息检索 <misc> 自然语言处理 <media> 语言 <org> 指称对应同一实体 <unk> 实体对象 <per> subclass of</s>
|
||
2025-06-19 17:48:19,680 - DEBUG - 处理后标记: ['<triplet>', '共指消解', '<concept>', '信息检索', '<misc>', '自然语言处理', '<media>', '语言', '<org>', '指称对应同一实体', '<unk>', '实体对象', '<per>', 'subclass of']
|
||
2025-06-19 17:48:19,680 - DEBUG - 添加三元组: 共指消解(concept) - 自然语言处理 - 信息检索(misc)
|
||
2025-06-19 17:48:19,680 - DEBUG - 块 26 提取到 1 个三元组
|
||
2025-06-19 17:48:19,680 - DEBUG - 处理块 27/44: 共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。
|
||
|
||
6.2 知识合并
|
||
在构建知识图谱时...
|
||
2025-06-19 17:48:20,042 - DEBUG - 块 27 生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-19 17:48:20,042 - DEBUG - 原始生成文本: <triplet> 外部知识库 <concept> 知识图谱 <media> 结构化数据 <org> 库产品 <unk> 合并 <misc> subclass of</s>
|
||
2025-06-19 17:48:20,042 - DEBUG - 处理后标记: ['<triplet>', '外部知识库', '<concept>', '知识图谱', '<media>', '结构化数据', '<org>', '库产品', '<unk>', '合并', '<misc>', 'subclass of']
|
||
2025-06-19 17:48:20,042 - DEBUG - 添加三元组: 外部知识库(concept) - 结构化数据 - 知识图谱(media)
|
||
2025-06-19 17:48:20,042 - DEBUG - 块 27 提取到 1 个三元组
|
||
2025-06-19 17:48:20,042 - DEBUG - 处理块 28/44: 数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,...
|
||
2025-06-19 17:48:20,674 - DEBUG - 块 28 生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-19 17:48:20,674 - DEBUG - 原始生成文本: <triplet> 数据层的融合 <concept> 关系数据库 <media> 模式层 <org> 本体库 <misc> 实体的指称 <unk> <loc> <per> 实例以及关系的冲突问题,造成不必要的冗余 <eve> 合并关系 <time> facet of</s>
|
||
2025-06-19 17:48:20,674 - DEBUG - 处理后标记: ['<triplet>', '数据层的融合', '<concept>', '关系数据库', '<media>', '模式层', '<org>', '本体库', '<misc>', '实体的指称', '<unk>', '<loc>', '<per>', '实例以及关系的冲突问题,造成不必要的冗余', '<eve>', '合并关系', '<time>', 'facet of']
|
||
2025-06-19 17:48:20,674 - DEBUG - 添加三元组: 数据层的融合(concept) - 模式层 - 关系数据库(media)
|
||
2025-06-19 17:48:20,674 - DEBUG - 块 28 提取到 1 个三元组
|
||
2025-06-19 17:48:20,674 - DEBUG - 处理块 29/44: 为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界...
|
||
2025-06-19 17:48:21,229 - DEBUG - 块 29 生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-19 17:48:21,229 - DEBUG - 原始生成文本: <triplet> 资源描述框架 <concept> 本体构建本体 <org> <media> <misc> <unk> <per> <loc> <eve> <time> <dis> <triplet> DB2RDF <cel> 结构化的历史数据 <date> subclass of</s>
|
||
2025-06-19 17:48:21,229 - DEBUG - 处理后标记: ['<triplet>', '资源描述框架', '<concept>', '本体构建本体', '<org>', '<media>', '<misc>', '<unk>', '<per>', '<loc>', '<eve>', '<time>', '<dis>', '<triplet>', 'DB2RDF', '<cel>', '结构化的历史数据', '<date>', 'subclass of']
|
||
2025-06-19 17:48:21,229 - DEBUG - 添加三元组: 资源描述框架(concept) - <media> - 本体构建本体(org)
|
||
2025-06-19 17:48:21,229 - DEBUG - 添加三元组: DB2RDF(cel) - subclass of - 结构化的历史数据(date)
|
||
2025-06-19 17:48:21,229 - DEBUG - 块 29 提取到 2 个三元组
|
||
2025-06-19 17:48:21,229 - DEBUG - 处理块 30/44: 本体可以采用人工编辑的方式手动构建(借助本体编辑软件),也可以以数据驱动的自动化方式构建本体。因为人...
|
||
2025-06-19 17:48:21,870 - DEBUG - 块 30 生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-19 17:48:21,870 - DEBUG - 原始生成文本: <triplet> 自动化本体构建过程 <concept> 数据驱动的自动化方式 <media> 本体库 <misc> 全局 <org> 库产品 <unk> 软件 <loc> part of</s>
|
||
2025-06-19 17:48:21,870 - DEBUG - 处理后标记: ['<triplet>', '自动化本体构建过程', '<concept>', '数据驱动的自动化方式', '<media>', '本体库', '<misc>', '全局', '<org>', '库产品', '<unk>', '软件', '<loc>', 'part of']
|
||
2025-06-19 17:48:21,870 - DEBUG - 添加三元组: 自动化本体构建过程(concept) - 本体库 - 数据驱动的自动化方式(media)
|
||
2025-06-19 17:48:21,870 - DEBUG - 块 30 提取到 1 个三元组
|
||
2025-06-19 17:48:21,870 - DEBUG - 处理块 31/44: 1.实体并列关系相似度计算
|
||
2.实体上下位关系抽取
|
||
3.本体的生成
|
||
比如对下面这个例子,当知识图谱刚...
|
||
2025-06-19 17:48:22,051 - DEBUG - 块 31 生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-19 17:48:22,051 - DEBUG - 原始生成文本: <triplet> 阿里 <org> 阿里巴巴 <media> owned by</s>
|
||
2025-06-19 17:48:22,051 - DEBUG - 处理后标记: ['<triplet>', '阿里', '<org>', '阿里巴巴', '<media>', 'owned by']
|
||
2025-06-19 17:48:22,051 - DEBUG - 添加三元组: 阿里(org) - owned by - 阿里巴巴(media)
|
||
2025-06-19 17:48:22,051 - DEBUG - 块 31 提取到 1 个三元组
|
||
2025-06-19 17:48:22,051 - DEBUG - 处理块 32/44: 这就是第一步的作用,但这样下来,知识图谱实际上还是没有一个上下层的概念,它还是不知道,阿里巴巴和手机...
|
||
2025-06-19 17:48:22,444 - DEBUG - 块 32 生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-19 17:48:22,445 - DEBUG - 原始生成文本: <triplet> 上下位关系 <concept> 图谱 <media> 阿里巴巴 <org> owned by</s>
|
||
2025-06-19 17:48:22,445 - DEBUG - 处理后标记: ['<triplet>', '上下位关系', '<concept>', '图谱', '<media>', '阿里巴巴', '<org>', 'owned by']
|
||
2025-06-19 17:48:22,445 - DEBUG - 添加三元组: 上下位关系(concept) - 阿里巴巴 - 图谱(media)
|
||
2025-06-19 17:48:22,445 - DEBUG - 块 32 提取到 1 个三元组
|
||
2025-06-19 17:48:22,445 - DEBUG - 处理块 33/44: 当三步结束后,这个知识图谱可能就会明白,“阿里巴巴和腾讯,其实都是公司这样一个实体下的细分实体。它们...
|
||
2025-06-19 17:48:22,603 - DEBUG - 块 33 生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-19 17:48:22,604 - DEBUG - 原始生成文本: <triplet> 腾讯 <org> 阿里巴巴 <concept> owned by</s>
|
||
2025-06-19 17:48:22,604 - DEBUG - 处理后标记: ['<triplet>', '腾讯', '<org>', '阿里巴巴', '<concept>', 'owned by']
|
||
2025-06-19 17:48:22,604 - DEBUG - 添加三元组: 腾讯(org) - owned by - 阿里巴巴(concept)
|
||
2025-06-19 17:48:22,604 - DEBUG - 块 33 提取到 1 个三元组
|
||
2025-06-19 17:48:22,604 - DEBUG - 处理块 34/44: 但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识...
|
||
2025-06-19 17:48:23,114 - DEBUG - 块 34 生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-19 17:48:23,114 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 城市 <loc> location</s>
|
||
2025-06-19 17:48:23,114 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '城市', '<loc>', 'location']
|
||
2025-06-19 17:48:23,114 - DEBUG - 添加三元组: 知识图谱(concept) - location - 城市(loc)
|
||
2025-06-19 17:48:23,114 - DEBUG - 块 34 提取到 1 个三元组
|
||
2025-06-19 17:48:23,114 - DEBUG - 处理块 35/44: 根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,那么我们就可以将AD...
|
||
2025-06-19 17:48:23,698 - DEBUG - 块 35 生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-19 17:48:23,698 - DEBUG - 原始生成文本: <triplet> 串联 <concept> 推理策略的一环 <media> 规则 <misc> 图里 <org> <eve> <unk> <per> C <loc> part of</s>
|
||
2025-06-19 17:48:23,698 - DEBUG - 处理后标记: ['<triplet>', '串联', '<concept>', '推理策略的一环', '<media>', '规则', '<misc>', '图里', '<org>', '<eve>', '<unk>', '<per>', 'C', '<loc>', 'part of']
|
||
2025-06-19 17:48:23,698 - DEBUG - 添加三元组: 串联(concept) - 规则 - 推理策略的一环(media)
|
||
2025-06-19 17:48:23,698 - DEBUG - 块 35 提取到 1 个三元组
|
||
2025-06-19 17:48:23,698 - DEBUG - 处理块 36/44: 当然知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。
|
||
推理属性值...
|
||
2025-06-19 17:48:24,027 - DEBUG - 块 36 生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-19 17:48:24,027 - DEBUG - 原始生成文本: <triplet> 猫科 <concept> 老虎,科,目,食肉目</s>
|
||
2025-06-19 17:48:24,027 - DEBUG - 处理后标记: ['<triplet>', '猫科', '<concept>', '老虎,科,目,食肉目']
|
||
2025-06-19 17:48:24,027 - DEBUG - 处理块 37/44: 这一块的算法主要可以分为3大类,基于逻辑的推理、基于图的推理和基于深度学习的推理。
|
||
7.3 质量评估...
|
||
2025-06-19 17:48:24,399 - DEBUG - 块 37 生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-19 17:48:24,399 - DEBUG - 原始生成文本: <triplet> 算法 <concept> 知识库 <media> part of</s>
|
||
2025-06-19 17:48:24,400 - DEBUG - 处理后标记: ['<triplet>', '算法', '<concept>', '知识库', '<media>', 'part of']
|
||
2025-06-19 17:48:24,400 - DEBUG - 添加三元组: 算法(concept) - part of - 知识库(media)
|
||
2025-06-19 17:48:24,400 - DEBUG - 块 37 提取到 1 个三元组
|
||
2025-06-19 17:48:24,400 - DEBUG - 处理块 38/44: 从逻辑上看,知识库的更新包括概念层的更新和数据层的更新。
|
||
概念层的更新是指新增数据后获得了新的概念,...
|
||
2025-06-19 17:48:24,729 - DEBUG - 块 38 生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-19 17:48:24,729 - DEBUG - 原始生成文本: <triplet> 知识库的更新 <concept> 概念层 <media> subclass of</s>
|
||
2025-06-19 17:48:24,729 - DEBUG - 处理后标记: ['<triplet>', '知识库的更新', '<concept>', '概念层', '<media>', 'subclass of']
|
||
2025-06-19 17:48:24,729 - DEBUG - 添加三元组: 知识库的更新(concept) - subclass of - 概念层(media)
|
||
2025-06-19 17:48:24,729 - DEBUG - 块 38 提取到 1 个三元组
|
||
2025-06-19 17:48:24,729 - DEBUG - 处理块 39/44: 数据层的更新主要是新增或更新实体、关系、属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性...
|
||
2025-06-19 17:48:25,154 - DEBUG - 块 39 生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-19 17:48:25,154 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 数据层 <media> part of</s>
|
||
2025-06-19 17:48:25,154 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '数据层', '<media>', 'part of']
|
||
2025-06-19 17:48:25,154 - DEBUG - 添加三元组: 知识图谱(concept) - part of - 数据层(media)
|
||
2025-06-19 17:48:25,155 - DEBUG - 块 39 提取到 1 个三元组
|
||
2025-06-19 17:48:25,155 - DEBUG - 处理块 40/44: 这种方法比较简单,但资源消耗大,而且需要耗费大量人力资源进行系统维护;
|
||
增量更新:以当前新增数据为输...
|
||
2025-06-19 17:48:25,315 - DEBUG - 块 40 生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:48:25,315 - DEBUG - 原始生成文本: <triplet> 总结 <concept> 知识图谱 <media> part of</s>
|
||
2025-06-19 17:48:25,315 - DEBUG - 处理后标记: ['<triplet>', '总结', '<concept>', '知识图谱', '<media>', 'part of']
|
||
2025-06-19 17:48:25,315 - DEBUG - 添加三元组: 总结(concept) - part of - 知识图谱(media)
|
||
2025-06-19 17:48:25,315 - DEBUG - 块 40 提取到 1 个三元组
|
||
2025-06-19 17:48:25,315 - DEBUG - 处理块 41/44: 通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和...
|
||
2025-06-19 17:48:25,968 - DEBUG - 块 41 生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-19 17:48:25,968 - DEBUG - 原始生成文本: <triplet> 知识图谱 <concept> 智能语义搜索 <media> 移动个人助理(Siri <misc> 互联网信息 <org> owned by <triplet> (Sri) <eve> 的知识 <unk> subclass of</s>
|
||
2025-06-19 17:48:25,968 - DEBUG - 处理后标记: ['<triplet>', '知识图谱', '<concept>', '智能语义搜索', '<media>', '移动个人助理(Siri', '<misc>', '互联网信息', '<org>', 'owned by', '<triplet>', '(Sri)', '<eve>', '的知识', '<unk>', 'subclass of']
|
||
2025-06-19 17:48:25,968 - DEBUG - 添加三元组: 知识图谱(concept) - 移动个人助理(Siri - 智能语义搜索(media)
|
||
2025-06-19 17:48:25,968 - DEBUG - 添加三元组: (Sri)(eve) - subclass of - 的知识(unk)
|
||
2025-06-19 17:48:25,968 - DEBUG - 块 41 提取到 2 个三元组
|
||
2025-06-19 17:48:25,968 - DEBUG - 处理块 42/44: 在智能语义搜索中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键词进行解析和推理,进...
|
||
2025-06-19 17:48:26,129 - DEBUG - 块 42 生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:48:26,129 - DEBUG - 原始生成文本: <triplet> 谷歌 <org> 搜索引擎 <concept> industry</s>
|
||
2025-06-19 17:48:26,129 - DEBUG - 处理后标记: ['<triplet>', '谷歌', '<org>', '搜索引擎', '<concept>', 'industry']
|
||
2025-06-19 17:48:26,129 - DEBUG - 添加三元组: 谷歌(org) - industry - 搜索引擎(concept)
|
||
2025-06-19 17:48:26,129 - DEBUG - 块 42 提取到 1 个三元组
|
||
2025-06-19 17:48:26,129 - DEBUG - 处理块 43/44: 在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析...
|
||
2025-06-19 17:48:26,639 - DEBUG - 块 43 生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-19 17:48:26,639 - DEBUG - 原始生成文本: <triplet> 病毒 <concept> 埃博拉病毒的症状有哪些 <media> 知识图谱 <misc> 深度问答应用中 <org> <unk> 系统 <eve> مية</s>
|
||
2025-06-19 17:48:26,639 - DEBUG - 处理后标记: ['<triplet>', '病毒', '<concept>', '埃博拉病毒的症状有哪些', '<media>', '知识图谱', '<misc>', '深度问答应用中', '<org>', '<unk>', '系统', '<eve>', 'مية']
|
||
2025-06-19 17:48:26,639 - DEBUG - 添加三元组: 病毒(concept) - 知识图谱 - 埃博拉病毒的症状有哪些(media)
|
||
2025-06-19 17:48:26,639 - DEBUG - 块 43 提取到 1 个三元组
|
||
2025-06-19 17:48:26,639 - DEBUG - 处理块 44/44: 』,然后再进行推理变换,最终形成等价的三元组查询语句,如(埃博拉,症状,?)和(埃博拉,征兆,?)等...
|
||
2025-06-19 17:48:26,959 - DEBUG - 块 44 生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-19 17:48:26,960 - DEBUG - 原始生成文本: <triplet> 症状 <concept> 三元组 <misc> part of</s>
|
||
2025-06-19 17:48:26,960 - DEBUG - 处理后标记: ['<triplet>', '症状', '<concept>', '三元组', '<misc>', 'part of']
|
||
2025-06-19 17:48:26,960 - DEBUG - 添加三元组: 症状(concept) - part of - 三元组(misc)
|
||
2025-06-19 17:48:26,960 - DEBUG - 块 44 提取到 1 个三元组
|
||
2025-06-19 17:48:26,966 - INFO - 文档 c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac 的 41 个三元组已保存到: /share/wangmeihua/rag/triples/c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac_testuser1.txt
|
||
2025-06-19 17:48:26,966 - INFO - 文档 c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac 三元组抽取完成,耗时: 16.99 秒
|
||
2025-06-19 17:48:26,966 - INFO - 文件 /share/wangmeihua/rag/data/test.docx 三元组保存到: /share/wangmeihua/rag/triples/c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac_testuser1.txt
|
||
2025-06-19 17:48:27,081 - INFO - Step 1: 导入图谱节点到 Neo4j,document_id: c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac
|
||
2025-06-19 17:48:28,262 - INFO - Step 2: 导入图谱边到 Neo4j,document_id: c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac
|
||
2025-06-19 17:48:29,326 - INFO - Step 3: 导出 Neo4j 节点数据,document_id: c0f603f3-1bbe-45dc-bb4a-1005e26bf1ac
|
||
2025-06-19 17:48:29,383 - INFO - 文件 /share/wangmeihua/rag/data/test.docx 三元组成功插入 Neo4j
|
||
2025-06-19 17:48:29,383 - INFO - 文件 /share/wangmeihua/rag/data/test.docx 成功嵌入到数据库 ragdb_textdb
|