阿里云实时计算Flink AI能力解读

阿里云实时计算FlinkAI能力解读黄鹏程阿里云智能集团高级产品专家阿里云实时计算Flink版产品负责人Contents目录01AI实时化浪潮02产品能力解读03应用场景与落地案例01 AI实时化浪潮• 当今企业面临的数据处理挑战不断升级,实时数据分析需求持续增长。与此同时,生成式AI技术正迅速改变各行各业的应用场景与可能性。• 行业正快速向融合AI与大数据实时处理的方向演化,企业寻求在数据产生的第一时间获取智能洞察并采取行动。72%企业增长采用实时数据分析的企业收入增长率2.5倍效率提升实时AI决策相比传统分析方法的效率提升35%成本降低企业通过实时智能分析降低运营成本AI开辟实时化分析新纪元02 产品能力解读基于大语言模型的实时数据分析情感分析智能推荐实时RAG• 强大的AI Funcion函数支持在SQL流处理中直接调用大语言模型服务• 支持Chat Model实时调用,实现文本理解• 完全兼容OpenAI API,各种模型可无缝接入,全面支持阿里云百炼、PAI等大模型服务。• 毫秒级流数据相似性搜索• 与Apache Flink SQL生态系统无缝集成,让非结构化与结构化数据综合分析成为可能• 丰富的上游生态,对数据库实时变化、对象存储文件变化实时捕捉• 内置提供多种数据、文本函数方便数据切分• 支持Embedding Model调用,实现文本向量化,• 内置Milvus连接器,支持高性能写入向量数据能力覆盖实时情感分析 、智能推荐、异常检测、语义搜索、智能客服等多样化AI场景事件驱动型AI多智能体框架Flink AgentsAI 编程Chat BIDeep Research购买评论点击指标用户触发系统触发会话型AI 智能体事件驱动型AI 智能体https://github.com/apache/flink-agents03 应用场景与落地案例向量数据库向量数据库大语言模型Chatting/Reasoning Model大语言模型Embedding Model向量数据近似检索 大语言模型Chatting/Reasoning ModelAI 问答应用AI问答应用的实时数据向量化构建基于向量索引的实时数据增强实时数据向量检索 消息队列交易数据库需要向量化的数据源消息队列交易数据库需要根据向量数据增强的源数据Flink SQL/Pyflink数据仓库引擎能力场景介绍结构化数据非结构化数据具体应用场景: 直播评论实时智能情感分析流式写入实时CDC数据摄取ServerServerServer远程存储 ( S3 / OSS / HDFS )数据湖存储 ( Paimon / Iceberg)数据分层服务Flink SQLAI 大模型调用外部大语言模型服务Fluss 湖流一体存储情感分析话题变化风险追踪潜在商机挖掘….Flink SQL结构化数据增强向量数据库INSERT INTO rds_sentiments SELECT comment_id, live_id, user_id, comment_text,UPPER(content) AS predict_label, content AS predict_raw, CURRENT_TIMESTAMP AS predict_timeFROM ML_PREDICT( TABLE fluss_comments, MODEL ai_live_sentiment,DESCRIPTOR(comment_text));落地案例:某头部车企客户之声实时市场舆情分析架构方案&架构图项目简介项目需求与痛点方案价值与成果VOC(Voice of Customer)应用场景,涵盖高层战略、产品介绍、试乘试驾、售后维修、召回、APP使用、论坛、车友会、会员体系、线上线下活动、权益使用等各种场景下,使用大模型进行语音和文字数据的结构化打标和处理工作,提供情感分析、信息提取、VOC标注、标签挖掘能力,用于舆情监控、活动介绍、售后维修等场景。•高吞吐: 依托Flink+百炼+Kafka的流式推理架构,在Kafka分区数1200个、Flink并发度100时,可实现240万条数据/小时的处理效率,远超客户百万条每小时的预期。•低成本: 整条链路未大幅增加Kafka分区或Flink并发度,仅优化超时参数与异步吞吐•高精确度:借助Flink AI Function调用大模型能力,调用百炼做到高质量标签生成,提升后续标签挖掘、舆情分析等场景的准确度•效率:传统的方式依靠靠人工抽检或者针对每个场景训练NLP小模型来应对,并发和吞吐较低,客户要求达到百万条推理/小时•效果:常见NLP小模型应对多数据源、多目标场景的泛化能力不足,无法满足所有需求•成本:要求在控制成本、不依靠堆积资源的前提下,满足生成效率的需求•多种源端数据(评价文本)清洗后以Json格式推送至消息通道Kafka•Flink流式消费Kafka中数据,使用AI Function异步http call形式调用百炼大模型服务,结果返回异步队列,将生成的三级标签数据回写至Kafka•Kafka中数据推送给下游业务消费,做进一步分析数据采集垂直社区超级APP头部网站大数据平台消息通道Kafka流计算Flink大模型平台大模型推理百炼下游业务车主APP公关部4S店推送消费异步调用异步返回推送写入*以上为客户业务实现实际统计数据THANKS阿里云实时计算Flink安全架构 & 权限体系李昊哲阿里云智能集团实时计算Flink版产品经理Contents目录01020304场景化权限管理方案企业上云安全驱动及挑战企业级产品安全能力阿里云账号权限体系01 企业上云安全驱动及挑战大数据安全建设的三大驱动力n国家法律Ø《网络安全法》Ø《数据安全法》Ø《个人信息保护法》Ø《密码法》n监管规范Ø《《促进和规范数据跨境流动规定》》Ø《烟草行业数据安全管理办法》Ø《汽车数据安全若干若干规定》Ø……合规监管业务刚需n外部数据窃取n内部数据泄漏n个人数据滥用安全事件被动主动n企业核心资产保护n数据分级治理n数据安全成熟度认证企业上云面临的安全挑战随着⼈员、⽹络、⾝份、应⽤的多样化,⾝份权限管理难以统⼀AD/LDAP钉钉账号密码身份人员自研应用商业应用应用开源应用供应商产研运维员工普通员工外包员工⽆统⼀认证 —— “账号⿊洞”• 使用默认 JobManager WebUI,无登录鉴权• 通过 Nginx 做简单 Basic Auth,账号密码明文存储• 存在未授权访问风险,易被扫描器发现并攻击操作⽆审计 —— “⿊盒操作,⽆法追溯”• 无操作日志记录,难以进行和人追踪• 审计合规无法满足(如等保、GDPR)权限粗放 —— “全有或全⽆”• 多租户场景下,团队间资源互相可见、可操作• 所有用户拥有相同权限:可提交、修改、停止任意作业• 无“只读”、“开发”、“运维”角色区分02 阿里云账号权限体系阿里云身份权限体系RAM鉴权体系03 企业级安全能力云上大数据服务如何保障企业数据和服务安全数据泄露权限控制不足安全攻击业务中断Flink平台系统安全Flink基础设施安全独立大规模集群及网络隔离环境全链路数据集服务高可用设计多层次的服务安全部署设计同城容灾与恢复

立即下载
综合
2025-09-29
57页
13.8M
收藏
分享

阿里云实时计算Flink AI能力解读,点击即可下载。报告格式为PDF,大小13.8M,页数57页,欢迎下载。

本报告共57页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共57页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图 3.6 甘肃省发债城投企业筹资活动现金净
综合
2025-09-29
来源:地方政府与城投企业债务风险研究报告-甘肃篇
查看原文
表 2.3 2023-2024 年甘肃省各地级市(州)政府性基金收入情况(单位:亿元)
综合
2025-09-29
来源:地方政府与城投企业债务风险研究报告-甘肃篇
查看原文
表 2.2 2024 年甘肃省各地级市(州)GDP 及增速情况
综合
2025-09-29
来源:地方政府与城投企业债务风险研究报告-甘肃篇
查看原文
表 2.1 甘肃省各地级市(州)产业分布情况
综合
2025-09-29
来源:地方政府与城投企业债务风险研究报告-甘肃篇
查看原文
表 1.4 2022-2024 年及 2025 年 1-6 月甘肃省主要财政数据
综合
2025-09-29
来源:地方政府与城投企业债务风险研究报告-甘肃篇
查看原文
表 1.2 2022-2024 年及 2025 年 1-6 月甘肃省主要经济数据
综合
2025-09-29
来源:地方政府与城投企业债务风险研究报告-甘肃篇
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起