突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率
最新 1 月 31 日消息,百度于 2025 年 1 月 23 日公布最新研究成果 EICopilot,利用大型语言模型(LLM)简化了从数据库中提取信息的流程,为企业知识图谱探索提供了高效解决方案。
项目背景
知识图谱近来在企业领域得到了广泛应用,涵盖法人、注册资本、股东信息等多维度数据。尽管图谱具有很高的实用性,但由于复杂的文本查询和手动探索限制,阻碍有效提取信息。
EICopilot 简介
EICopilot 由百度研究院开发,是一个基于 AI 智能体的解决方案,可简化存储在知识图谱数据库中的企业数据的搜索、探索和摘要,从而有效地获得有关企业的宝贵见解。
EICopilot 处理的数据集包含数亿节点、数百亿边(edges)、数千亿属性以及数百万子图,涵盖国家注册企业、组织和公司等信息。
研究人员收集真实企业相关查询,构建种子数据集,并使用 Gremlin 语言编写搜索脚本,通过系统标注和增强,形成向量数据库,提高搜索精度。
EICopilot 是一个基于 LLM 的聊天机器人,采用创新的数据预处理流程优化数据库查询,利用向量数据库实时生成搜索空间,实现高效的图谱检索和探索。
EICopilot 还具备强大的推理能力,采用思维链(CoT)和上下文学习(ICL)等技术,提供更精准的查询响应。
EICopilot 性能
研究人员使用百度内部数据平台的数据,构建了包含查询和图数据库查询对的数据集,根据查询的遍历长度,将查询分为简单、中等和复杂三类,并采用语法错误率(SyntaxErrorRate)和执行正确率(Execution Correctness)评估 EICopilot 的性能。
实证结果表明,EICopilot 的性能优于基线方法,尤其在速度和准确性方面。Full Mask 版本的 EICopilot 语法错误率低至 10.00%,执行正确率高达 82.14%。
最新附上参考地址
Baidu Research Introduces EICopilot: An Intelligent Agent-based Chatbot to Retrieve and Interpret Enterprise Information from Massive Graph Databases
EICopilot: Search and Explore Enterprise Information over Large-scale Knowledge Graphs with LLM-driven Agents
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱