语言解码双生花:人类经验与AI算法的镜像之旅
人类经验与AI算法的镜像之旅浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江报告提纲语言的奥秘:人类如何解码世界DeepSeek-R1:推理模型的诞生与突破从符号到智能:AI的语言理解之路智能体时代:AI如何重塑教育未来DeepSeek-V3:大语言模型的构建与进化浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江维克多-D.O.-桑托斯语言对我们有多重要语言造就了人类,人和动物的根本区别就是人具有创造性地运用语言的能力•语言赋予人类秩序•语言是思维的工具•语言是合作的纽带如果想要实现通用的人工智能,理解人类使用的不太精确、可能有歧义、混乱的语言是一个有效途径。语言对我们有多重要,《光明日报》,刘松青,2019-06-01 维克多-D.O.-桑托斯的《是什么让我们成为人类》浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江维克多-D.O.-桑托斯人类是如何理解语言的?下雨了我要赶紧回家...“下雨”/“家” /“收衣服”这些词语,基于我们的经验,在我们大脑中已经建立了固定的神经连接。浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江维克多-D.O.-桑托斯人类是如何理解语言的?下雨了我要赶紧回家收衣服。人类大脑通过理解每个词语的意思、进行词语组装,从而得到句子的意思,甚至推断出句子背后的含义。因此,理解语言的基础是理解词语及词语间的关联关系。浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江人类是如何理解语言的?人类语言的精准解译与语义歧义的消解具有显著的语境依赖性,需通过系统性整合上下文信息构建语义解析模型。这个苹果品质真高 ,已通过欧盟有机认证,每颗果实都带有 NFC 溯源标签。浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江报告提纲语言的奥秘:人类如何解码世界DeepSeek-R1:推理模型的诞生与突破从符号到智能:AI的语言理解之路智能体时代:AI如何重塑教育未来DeepSeek-V3:大语言模型的构建与进化浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江计算机的数字化世界Towards Seamless Communication for Sign Language Support: Architecture, Algorithms, and Optimization计算机理解一切信息的基础是将信息进行数字化。在处理图像时,计算机会将图像的每一个像素转换为数字信号,通常使用颜色的RGB值来表示每个像素。浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江语言的数字化计算机无法直接理解离散的人类语言词向量(word embedding)和词与词之间的位置关系浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江词向量及单词之间的相似度 欧式距离:两个点(或向量)在空间中的“直线距离”。它反映了两个向量的绝对差异。欧氏距离值越小,说明两个向量越接近;值越大,说明差异越大。 余弦相似度:两个向量之间夹角的余弦值来衡量它们的相似度。它反映了两个向量的方向是否相似,而不关心向量的大小。更适用于比较两者相似性(如文本相似度)。dogcatman浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江词向量模型的缺陷• 在序列数据中,同一个元素处在不同的上下文中意思是不同的。如:•(1) The animal didn’t cross the street because it was too tired. (那只动物没有过马路,因为它太累了。)•(2) The animal didn’t cross the street because it was too wide.(那只动物没有过马路,因为马路太宽了。)• 然而,传统的词向量模型中同一个词只有一个向量,这对于一些词语会造成歧义问题,如何解决这个问题呢?https://jalammar.github.io/illustrated-transformer/浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江注意力机制与上下文建模• 大语言模型通过使用Transformer架构,可以为每个词生成一个上下文相关的词向量,这解决了传统词向量无法处理多义词和上下文依赖的问题。• 一个单词的真实含义,不仅仅取决于它自身,还取决于句子中的其它上下文信息(来自其它单词的信息)。• 一个单词的向量值,需要融合从句子上下文中的其他单词中的信息,在数学上可以表达为所有单词的向量值的加权平均。这些权重值,我们可以称之为注意力权重 (attention weights)。it与其他单词之间的注意力权重。蓝色的深浅表达了权重的相对大小。https://jalammar.github.io/illustrated-transformer/浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究
[浙江大学]:语言解码双生花:人类经验与AI算法的镜像之旅,点击即可下载。报告格式为PDF,大小9.1M,页数42页,欢迎下载。
