从被动存储到主动决策:AI如何驱动数据库与大数据智能进化
基于统一语义层的数据分析智能体WeData Unity Semantics打破智能分析的“巴别塔困境”虎兴龙主讲人业务挑战01关键思路02Unity Semantics解决方案03业务价值04业务挑战01定义优秀的Data Agent信任感持续进化可控专业共鸣如何建立用户信任?可迭代进化自主可控专业可靠共鸣认同挑战关键思路02人与Agent 信任的基础是什么?不信任Data Agent的根源“你知道我知道你是知道的”人和机器没有共同的Context新的协作模式,需要新的信任基础全域数据资产分散在不同系统的技术性数据结构,难以直接应⽤于业务决策数据语义层连接底层数据与业务⽤⼾的桥梁,将技术数据转化为易于理解的业务概念Data Agent基于多智能体协作的超级智能体,具备数据开发、数据治理、数据分析等专家能力现在过去全域数据资产分散在不同系统的技术性数据结构,难以直接应⽤于业务决策多维数据分析基于SQL、可视化拖拽的多维自助数据分析人与人的协作人与机器的协作数据语义层为Data Agent提供可靠的知识基础和操作接⼝Data Agent赋予数据语义层更强的交互能⼒和智能分析能⼒Context可解释性正确性LLMSemantic Layer数据分析的语义(Context)是什么?We Know More Than We Can Tell--Michael Polanyi技术目录技术代码业务目录业务报表技术人员业务人员数据工程师算法工程师数据科学家开发工程师销售产品运营市场概念(主题、目录、定义)关系(数据关联、数据血缘)指标(数据口径)维度(观测角度)数据语义层连接底层数据与业务⽤⼾的桥梁,将技术数据转化为易于理解的业务概念Data Agent可靠的数据和知识持续的反馈进化数据工程师用户基于多智能体协作的超级智能体,具备数据开发、数据治理、数据分析等专家能力信任感,用户对可优化的期望WeData Unity Semantics解决方案03多模态湖仓一体引擎数据工程:Data Engineering语义工程:Data Context EngineeringData Agent:Data Agent Engineering统一语义层(Unity Semantics)数据智能新底座WeData Unity SemanticsDatabase自然语言Query数据查询SQLWeData Unity Semantics:构建人与机器都能理解的数据资产WeData Unity Semantics 架构TablesFilesFunctionsTC-Catalog(统一技术元数据)Data ModelingMetric DefinitionMeta ExtractionAuto AccelerationSDKSemQLBI插件文档插件MCPREST APIIntegrateMeta RetrieverWeData Unity SemanticsWeData Data Discovery(数据发现)Models算法精排混合召回混合索引构建向量化处理元数据整合Join关系逻辑视图缓存加速查询路由SQL优化血缘关系 指标&维度表信息文本信息维度窗口原子指标派生指标多源异构数据可信语义层智能应用新生态Unity SemanticsWeDataMySQLDorisStarrocksLakehouseClickhousePostgresTc-HouseAgent & ChatBIBI 工具智能检索文档、office嵌入式分析核心能力:1.Integrate: API、JDBC、语义层MCP、插件等提供丰富的下游生态对接能力2.Meta Retriever :基于结构化元数据知识索引、多路召回、混合排序能力3.Semantic Model:强大的语义建模表达能力,支持复杂指标、维度定义,基于图论的复杂指标SQL生成4.Auto Acceleration:多级缓存,自适应CTE提取合并IO、谓词下推、自动物化视图推荐和合并WeData Unity Semantics 核心能力业务、主题 ⊕( )数据模型⊕描述_1⊕指标_1_ 𝑖 ⊕维度_1_ 𝑖𝑛1𝑖 = 1业务、主题 ⊕数据模型⊕描述_q⊕指标_q_ 𝑖 ⊕维度_q_ 𝑖𝑛𝑞𝑖 = 1业务、主题⊕数据模型⊕描述_2⊕指标_2_ 𝑖 ⊕维度_2_ 𝑖𝑛2𝑖 = 1……语义模型库Query意图识别Query改写Query分解用户关键词Query元数据序列+……元数据序列化混合检索序列表示元数据原始序列ES候选指标维度重排向量检索聚类语义特征聚类中心ES语义特征聚类检索元数据固定模版LLM模版QueryESFlattenedRAG重排后Top_k个表目标簇指标、维度的集合构造模版使用的指标、维度重排(BGE、Qwen-Ranker等)去重低分过滤定位目标指标、维度WeData Unity Semantics 指标语义知识召回能力select * from query(metric=[订单金额],where=[Dimension(订单状态) = '已取消' ],order_by=[TimeOutput(day) desc],group_by=[Dimension(性别别),Dimension(订单状态),TimeOutput(day),TimeOutput(month)],limit=10,time_start='2025-12-01T00:00:00',time_end='2025-12-30T00:00:00’)client = MultiServerMCPClient( { “WeData_Unity_Semantics”: { “desc”: “wedata统一语义层MCP”, “url”: “https://wedata-api-fusion-dev.cloud.tencent.com/mcp/sse”, “headers”: { “TENCENTCLOUD_SECRET_ID”: ”腾讯云accesskey“, ”TENCENTCLOUD_SECRET_KEY“: ”腾讯云secretkey “, ”TENCENTCLOUD_REGION“: ”腾讯云可用区" }, "timeout": "60", "sse_read_timeout": "300", "transport": "sse", } })tools = await client.get_tools()agent = create_react_agent( model=llm, tools=tools, debug=True)response = await agent.ainvoke({"messages": "帮我统计一下近7日订单总金额的变化趋势"})SemQL(Semantic Query Language)Semantic MCPUnity Semantics SemQL&MCP业务价值03价值1:
从被动存储到主动决策:AI如何驱动数据库与大数据智能进化,点击即可下载。报告格式为PDF,大小19M,页数61页,欢迎下载。