暂无个人介绍
大语言模型(LLMs)和知识管理(KM)之间存在紧密的关系,这种关系可以从多个角度进行理解,包括它们的目标、应用、以及相互影响等方面。
RAG中,答案是大模型产生的,还是向量检索产生的?RAG是一种结合了大模型生成和向量检索的自然语言处理技术。它通过大模型生成答案的主体部分,并利用向量检索从知识库中获取相关的参考文本片段。这种结合使得RAG能够生成更丰富、更准确的答案。然而,随着技术的发展和应用场景的不断扩大,我们还需要进一步研究和解决RAG面临的一些挑战和问题。
大语言模型在多个领域都发挥着重要作用,从新闻报道到金融分析,从智能家居到在线教育、自然语言处理、智能客服、情感分析,它们都在推动技术进步并改善人们的生活质量。
强化学习在大模型中的应用具有广泛的潜力和机会。通过使用强化学习算法,如DQN、PPO和TRPO,可以训练具有复杂决策能力的智能体,在自动驾驶、机器人控制和游戏玩家等领域取得显著成果。然而,仍然存在一些挑战,如样本效率、探索与利用平衡以及可解释性问题。未来的研究方向包括提高样本效率、改进探索策略和探索可解释的强化学习算法,以进一步推动强化学习在大模型中的应用。
大语言模型在假新闻检测应用中发挥重要作用。通过学习大量语言数据和模式,模型可以理解文本的语义和上下文信息,判断其真实性。模型通过监督学习训练,提取特征并预测新闻真实性。结合其他技术手段和人工审核,可以提高准确性和可信度。假新闻检测的过程包括数据准备、特征提取、模型训练和实际应用。模型在谣言检测中也有类似应用。
零样本学习是一种机器学习的方法,它的目标是在没有任何标记样本的情况下,通过学习从未见过的类别或任务。这意味着模型需要在没有任何先验知识的情况下进行学习和推理。
知识图谱和向量数据库在处理不同类型的数据和任务中具有各自的优势。它们可以在大语言模型中相互结合,以处理复杂的需求,提供更全面和准确的信息检索和推理能力。这种结合为我们在自然语言处理和机器学习领域中解决实际问题提供了有力的工具和方法。
经各研究生培养单位推荐申报、研究生院形式审核、组织专家评审,最终共有包括阿里在内的8个实践基地入选复旦大学第二届示范性专业学位研究生专业实践基地。研究生院已向每个示范性基地给予奖励支持,并将召开表彰大会为每个示范性基地授予荣誉铭牌。
知识蒸馏(Knowledge Distillation)是一种模型压缩方法,在人工智能领域有广泛应用。目前深度学习模型在训练过程中对硬件资源要求较高,例如采用GPU、TPU等硬件进行训练加速。但在模型部署阶段,对于复杂的深度学习模型,要想达到较快的推理速度,部署的硬件成本很高,在边缘终端上特别明显。而知识蒸馏利用较复杂的预训练教师模型,指导轻量级的学生模型训练,将教师模型的知识传递给学生网络,实现模型压缩,减少对部署平台的硬件要求,可提高模型的推理速度。
近年来互联网信息量呈几何级增长,用户很容易迷失在海量信息中。虽然可使用层次分类(分类目录)或搜索引擎等方法解决这类信息过载问题,但是层次分类需要手动对信息进行分类,并且随着数据量增加层级逐渐增多,不便于用户浏览;而搜索引擎需要用户自己输入关键词,自行选择结果,这要求用户已明确知道要查找的内容,并且具有核心词的抽象能力,如果对结果不满意需要调整关键词重新搜索。推荐系统根据用户的浏览记录、社交网络等信息进行个性化的计算,发现用户的兴趣,并应用推荐算法最终达到“千人千面”“个性化”推荐的效果。
复旦大学与阿里巴巴集团宣布双方达成全面战略合作,未来将在科研融合创新、科研合作、人才培养等领域展开深入合作,共同促进AI for Science从原始创新到应用落地的全链路发展。
《深度学习及其应用》是一门理论和实践并重的课程,强调课程内容的深度和应用性,重视领域问题(项目沉浸)驱动式教学、配套实验案例和实验平台的建设、课程资源配套的建设以及与学生的交流。课程结合20多家企业的30多个实战合作项目实践,深入浅出地帮助学生钻研深度学习的算法以及应用;借助阿里等公司的人工智能开源平台,分享最新的算法、更多领域应用的相关实验。课程配套资料齐全,其中,利用主流的机器学习开源框架,开发了50多个机器学习案例,并在此基础上出版了多本实用案例丰富的教材,有效地支撑了课程实践教学的开展。课程在中国大学MOOC(爱课程)运行,已经有8万多名高校学生和社会学习者选修该课程,具有一定的影响力
2023年4月12日,复旦大学-阿里云计算有限公司研究生专业实践基地合作交流会在复旦大学江湾校区二号交叉学科楼A1010会议室举行。学校研究生院副院长王昕莅临指导;阿里集团全球人才储备总监曹彬,阿里云高校合作部总经理李贝,阿里云资深技术专家施兴,资深安全专家路放,高级技术专家周磊、王晨、杨晔辉、林帆、薛盛可、林俊旸,阿里云学术与高校合作部刘林岩、沈龙睿、胡锐、李卓君等参会;学院副院长彭鑫,院长助理钱振兴,学院导师代表黄萱菁、熊贇、孙未未、徐扬、王智慧、池明旻、赵进、赵卫东等参会。会议由学院研究生办公室廖炳华主持。
近日,2022年度教育部产学合作协同育人项目优秀项目案例重磅发布。赵卫东老师与阿里云公司合作的项目荣获“教学内容和课程体系改革”优秀项目!https://mp.weixin.qq.com/s/bSuisNg-avFvvfRK2J7-4g
强化学习(Reinforcement Learning)是智能体与环境之间进行交互,并将状态映射到动作以获得奖励,实现最优策略的学习机制。与监督学习相比,强化学习不需要样本集,也不需要进行人工标注,而是通过不断尝试来发现不同动作产生的正向或负向的反馈,来指导策略的学习。与无监督式学习相比,强化学习不只是探索事物的特征进行模式识别,而且通过与环境交互建立输入与输出之间的映射关系,目标是得到最优策略。
近年来,大规模的标注数据被用于深度学习的模型训练中,极大地提高了模型的鲁棒性和 泛化能力。然而,在现实应用中,有些深度学习训练的样本数或者标注样本数很少,若直接用 于训练会产生过拟合问题。小样本学习(Few-shot Learning)实现了在原始样本有限的情况下, 依然能够训练出具有较高泛化能力的模型。
数据挖掘和机器学习的关系越来越密切。那么,它们之间存在什么样的关系?这是一个不是很明确的问题,可以从机器学习和数据挖掘的发展历史和现状分析。
机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书基于Python语言,实现了12个典型的实战案例,其内容涵盖了机器学习的基础算法,主要包括统计学习基础、可视化、常用的分类算法、文本分析、卷积神经网络、循环神经网络、注意力机制、生成对抗网络、电子推荐系统等理论。本书深入浅出,以实际应用的项目作为案例,实践性强,注重提升读者的动手操作能力,适合作为高等院校本科生、研究生机器学习、深度学习、数据挖掘等课程的实验教材,也可作为对机器学习和深度学习感兴趣的研究人员和工程技术人员的参考资料。 感谢阿里云计算有限公司在案例写作过程中的支持!
针对新工科项目式教学中存在的问题, 提出基于阿里天池AI平台,面向课程群建设统一的递进式教学项目案例库,重点介绍支撑课程群的递进式教学项目案例库设计的方法,并分析面向课程群的项目教学案例库设计的具体过程。 此文已经被《计算机教育》录用
阿里云天池AI实训平台人工智能师资培训班诚挚邀请您来参加啦! 农业、气象、机器学习、图像识别四大经典赛题实验首次解读 阿里云专家和名校教师在线直播讲解,搭配AI实训平台实时演练 培训全程免费,完成任务即可获得阿里云官方颁发的师资培训证书
2022年6月17日,复旦-阿里电子信息专业学位研究生专业实践基地第一次合作对接会通过钉钉会议在线举行。此前,复旦大学与阿里集团针对计算机领域的电子信息专业学位研究生专业实践基地签署了共建协议,同时聘请了29位阿里技术专家担任复旦大学专业学位研究生行业导师。此次会议为双方共建专业学位研究生专业实践基地的协议签署后的首次对接活动,其主要目的是通过学院研究生导师与企业研究生行业导师的直接交流探索研究生实践化培养的具体技术领域。
今年互联网+大赛企业赛道发布了很多题目,这些题目都是阿里等大公司出题,很多题目非常适合我们组织研究生参赛。因为我们研究生和校企合作体量都很大。这方面的成绩也是支撑我们学院研究生培养质量特别是专业学位培养成果的重要体现。请各位老师抽空看看赛题,积极发动学生组队参加。
简要介绍数据湖的特点和功能,与数据仓库的区别。此外,还介绍了数据中台的作用和功能。
按照复旦大学对全日制专业学位研究生实践化培养的要求,近期计算机科学技术学院(以下简称学院)与阿里云计算有限公司(以下简称阿里云)签订了专业学位研究生实践化培养基地合作协议,同时阿里云推荐的一批行业导师也已通过学校审核被正式聘用。
这是2020年阿里云计算有限公司-教育部产学合作协同育人项目的成果。 实训课程内容涵盖了主要内容涵盖了图像分割的基础知识,主要包括图像分割的概论、基础、分类、神经网络实现等经典的机器学习理论知识,也包括卷积神经网络、残差网络、U-Net算法、多模态等深度学习内容。此外,还介绍天池AI等平台的应用,在此基础上通过实验的方式,详细地介绍机器视觉在农业大数据分析领域的过程,以及遥感图像处理相关技术的原理与实践。结合阿里云的产品和技术资源,进行应用实验,让学生在充分理解掌握基础知识的同时,也能接触到业界最前沿的发展方向和成果。本课程通过实验大作业的方式,实现典型的机器视觉应用,训练学生模型设计与应用。
从认知论的角度而言,人类获得新知识的过程往往是从大量的个案和具体的问题入手,通过抽取其共性,形成了相关的概念和认识,然后在应用到个案中。在机器学习建设过程中,通过课前引入具体的应用领域背景,揭示其中要解决的问题,增加在线课程的趣味性和吸引力。在此基础上,从现实领域问题的视野,突出其中关键的步骤,然后再介绍相关的概念和算法等理论知识,并给出具体的解题过程。之后还要通过自建案例库的实验探讨其中的关键问题,从而能使学生的认知达到一定的深度。这个从应用中学习的过程也是深度学习的要求。
由电网有限责任公司主办,电力信息科技有限公司、天池大数据平台承办的“电网智慧现场作业挑战赛”正式落下帷幕。据悉,此次大赛共吸引到来自全国知名高校及企业的近3000支参赛队伍,分别在识别佩戴绝缘手套,识别规范穿戴工作服,识别高空作业及安全带佩戴三个赛道同台竞技。大赛旨在围绕电网实际业务的技术难题,推动将人工智能技术应用于电力现场作业,提升安全生产水平。
阿里云天池众智平台与广东电网有限责任公司共同组织的“广东电网智慧现场作业挑战赛”已进入了线上竞赛的收尾阶段。本次挑战赛的目标是通过人工智能中的计算机视觉技术,提高在电力生产作业过程中工作人员的安全防护功能,提升现场安全作业水平。例如,电网工作人员在日常巡检和维修过程中会接触高压电力设备,如操作不当或未正确佩戴防护装备,容易出现安全事故,对作业人员的人身安全和电力生产的安全运行均造成威胁。运用计算机视觉中的的目标识别、检测、跟踪等技术能够有效地防范这些隐患的发生。
5月29日,应复旦大学计算机学院赵卫东老师的邀请,阿里巴巴达摩院资深算法专家李永彬老师为复旦学子开展了一场深入精彩的“对话智能的前沿研究和大规模应用”云讲座,复旦软件学院近百名研究生聆听了讲座。
面向高校人才培养的飞天加速计划2.0,将提供30亿小时免费CPU/GPU资源,并资助师资培训、教辅资料、实践平台、协同育人项目基金,解决困扰高校实验和实训教学的一些问题。
为了能让更多的老师能了解天池Ai实训平台的使用方法,更好地建设机器学习课程,尤其是实验和实训课程的开展, 6月8-11日,来自全国高校的50多名老师齐聚杭州阿里云飞天园区,通过多个实际案例学习阿里云天池实训平台的使用方法。