达摩院

首页 标签 达摩院
# 达摩院 #
关注
1634内容
2022云栖内容精选—AI助力新型电力系统建设
摘要:本文整理自达摩院决策智能实验室负责人印卧涛,在云栖大会的分享。本篇内容主要分为三个部分: 1. “双碳”目标下的新型电力系统与挑战 2. 在电力预测、调度决策、虚拟电厂决策方向的创新与积累 3. 关于未来的产品展望
MindOpt--C++语言-对一个简单的混合整数规划问题建模求解
MindOpt是达摩院决策智能实验室研究的一款优化求解器,目前在优化求解线性规划问题这一功能上取得不错的成绩,希望大家能够帮我们多多打磨其他功能(混合整数线性规划、二次规划、半定规划目前都在公测),让我们的MindOpt在优化求解器这板块成为国产之光。
万能抠图——你值得拥有!!!
大家好这里是失踪人口三岁,最近较为繁忙,今天给大家来一个万能抠图系统,当然是“万能”抠图
再获殊荣!达摩院数据库与存储实验室荣登「InfoQ年度十大高价值技术团队」榜单
日前,由全球知名中文技术媒体InfoQ 发起,以“深入数字经济·洞见技术价值”为主题的“InfoQ 2022 中国技术力量年终榜单”结果正式揭晓。凭借突破性的技术创新、优秀的技术实践和落地案例,达摩院数据库与存储实验室荣获【2022 年度十大高价值技术团队】称号。
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
随着自媒体与短视频的兴起,人们有了越来越多的拍摄视频的需求。然而由于手持拍摄、硬件限制等原因,利用手机等普通摄影设备拍摄的视频难免存在视频抖动问题。尤其是开启较高倍数的变焦后,手持拍摄很难拍摄到稳定的视频,极易产生抖动的现象。使用云台、斯坦尼康等外设可以缓解这样的抖动,但是很多时候多带一个外设降低了拍摄视频的便利程度,会使得随时随地的拍摄体验大打折扣。
INTERSPEECH 2022论文解读|针对多方会议场景下说话人相关语音识别的对比研究
INTERSPEECH是由国际语音通讯协会 (International Speech Communication Association, ISCA) 创办的语音信号处理领域顶级旗舰国际会议。历届INTERSPEECH会议都备受全球各地语音语言领域人士的广泛关注。 ‍本文主要对比研究三种SA-ASR的方法,通过对说话人日志、语音分离和语音识别模块的耦合,在M2MeT竞赛上发布的真实会议场景语料库AliMeeting上进行了相关实验,有效地降低了说话人相关字错误率(SD-CER)。论文已被INTERSPEECH 2022接收。
魔搭语音更新|七大模型最新开源,推理速度升级,几行代码可实现微调
自ModelScope魔搭社区发布以来,众开发者在ModelScope上传与下载模型,并集成到自己的语音识别服务中。为了方便用户更好地利用ModelScope进行语音识别服务,我们推出了语音识别基础框架FunASR,希望在语音识别的学术研究和工业应用之间架起一座桥梁。FunASR已经集成到ModelScope中,提供的工业级的语音识别模型的推理与微调定制,使得研究人员和开发者可以更加便捷的进行语音识别模型的研究和生产,促进语音识别生态的发展。
免费试用