AI年味之关于春节你有什么想分享的故事?

简介: 本文介绍了一项名为「AI年味系列活动」的创新春节庆祝方式。活动通过阿里云云原生应用开发平台CAP和百炼模型服务,利用AI技术为用户带来别具一格的春节体验。参与者可以用一周时间创作如春联、藏头诗、创意贺卡等作品,优秀作品将署名展示。文中还详细描述了如何部署和使用该平台,包括创建项目、配置参数、访问示例应用及生成视频的具体步骤。通过简化操作流程、提高制作效率、个性化内容定制和降低制作成本,AI有声绘本读物为春节增添了独特的“年味”。

一、引言

提到春节,我们想到的是什么?

是印象最深刻的儿时趣事?

还是新颖的春节小知识?

可以写副别具一格的春联?

为家人朋友创作一首迎新春藏头诗?

还可以设计一张充满创意的祝福贺卡?

自定义一个红包封面?

来画一幅蛇年中国画,甚至AI语音助手拜年。

接下来,我们将用一周的时间带你体验「AI年味系列活动」,用新的庆祝方式为春节增添独特的“年味”。我们会筛选出最具新意,最有乐趣的作品,署上作者名字,将成品展示出来,敬请期待!

接下来,我们将用一周的时间带你体验「AI年味系列活动」,用新的庆祝方式为春节增添独特的“年味”。我们会筛选出最具新意,最有乐趣的作品,署上作者名字,将成品展示出来,敬请期待!


“小福回老家过年,他帮家人贴春联、挂灯笼、学习辞旧迎新的传统。”

“年夜饭吃鱼,寓意年年有鱼;吃饺子寻找硬币,寓意带来好运”

“守岁时放烟花,听爷爷讲年兽的故事...”

这些传统小习俗和简单小故事,不如考虑做成视频?或者有声读物的形式会不会更加别出心裁呢?

image.png

image.png

现在,通过阿里云云原生应用开发平台 CAP 和百炼模型服务,就可以实现有声绘本读物的自动化创作,让你的春节故事自己说话。


此外,对于希望利用 AI 制作高质量视频以吸引观众的内容创作者、需要快速制作大量图文内容满足市场需求的营销团队、期望通过 AI 生成内容提升品牌影响力的企业,也都可以实现有声绘本读物的制作流程简化,解决了传统制作中步骤繁琐、周期长和高技术门槛的问题,显著提高了创作效率。


AI 有声绘本核心优势:


  • 简化操作流程:提供可视化工作流搭建界面,用户无需复杂编程,即可轻松配置和管理视频制作流程,降低技术门槛,提高易用性。
  • 提高制作效率:AI 工作流自动处理视频制作各环节,如内容生成、声音合成、字幕提取等,同时利用云资源实例的弹性能力,实现对视频渲染任务进行并发切片处理,大幅缩短视频的合成周期,快速输出高质量图文视频。
  • 个性化内容定制:根据用户需求和偏好生成定制化图文视频内容、文案、图像、声音、字幕和视频模板,满足不同场景和目标受众需求,提高内容针对性和吸引力。
  • 降低制作成本:减少对专业人员和昂贵设备的依赖,自动化处理大量素材,降低人力和制作费用,使企业或个人创作者以更低成本制作高质量视频。


本文将介绍如何使用云原生应用开发平台 CAP 构建 Web 服务,利用其提供函数计算资源以及工作流能力,结合百炼模型服务,从而实现从文案、声音、字幕、图像生成到视频合成的一站式自动化流程。


点击文末“阅读原文”,了解方案详情,完成场景体验,在本文评论区分享你的绘本截图,真实有效即可获得公众号专属新春小礼物~


二、部署流程

整体架构

本方案的技术架构图如下:

image.png

包括以下基础设施和云服务:


  • 1个云原生应用开发平台 CAP 项目:用于部署有声读物 Web 服务和任务处理工作流。
  • 1个对象存储 OSS Bucket:存储图片、音频、视频等。
  • 百炼模型服务:调用 API 完成内容生成、语音合成和字幕相关信息生成。


云原生应用开发平台 CAP 是 Serverless + AI 应用开发平台,开发者可由业务需求驱动应用开发,通过项目(Project)进行组织和管理(开发态、运维态),再通过一个或多个服务(Service)独立运行(运行态)或协同通信实现特定业务逻辑。项目(Project)通过管理这些服务(Service)及其运行环境,实现完整的应用开发、管理和部署流程。


使用函数计算应用模板完成资源的创建和配置

  1. 开通百炼模型服务并创建对象存储OSS
  2. 点击云原生应用开发平台 CAP 项目模板链接:

https://cap.console.aliyun.com/create-project?template=ai-audiobook-flow,参考下表进行参数配置:


说明:首次使用云原生应用开放平台 CAP 会自动跳转到访问控制快速授权页面,滚动到浏览器底部单击确认授权,等待授权结束后单击返回控制台。

项目

描述

示例值

项目名称

自动生成。

默认

地域

FC部署地域。

默认 华东1(杭州)

百炼 API-KEY

百炼 API-KEY。

部署资源中获取的百炼 API-KEY

对象存储存储桶名

下拉选择 Bucket 名称。

ai-audiobook

函数访问OSS需要的角色及权限

函数计算访问对象存储OSS服务时使用的函数角色。

如果提示您当前选择的应用还需要额外一些权限,请单击前往授权。

命名空间

自动生成,通过命名空间来区分不同的应用地址

默认

工作流访问函数需要的角色

流程运行时需要使用的服务角色,流程会使用此角色调度您的函数。

如果提示您当前选择的应用还需要额外一些权限,请单击前往授权。

函数调用工作流需要的角色及权限

函数中需要基于此角色访问 CloudFlow,并调用 StartSyncExecution 和在线查询流程。

如果提示您当前选择的应用还需要额外一些权限,请单击前往授权。

  1. 单击部署项目,最后在弹出面板中单击确认部署,应用部署成功后如下图所示。

image.png

三、应用体验

访问示例应用

  1. 应用部署完成之后按照下图找到访问地址。

image.png

  1. 点击访问地址,即可打开示例应用。

image.png


参考使用官方示例,进行视频生成

  1. 在视频生成时,使用默认填写的文本提示词进行视频生成。
  1. 鼠标移动到示例1,然后单击使用该示例。

image.png

  1. 单击生成视频,预计等待 2~5 分钟即可查看生成结果。

image.png

image.png


自定义文本提示词,生成春节绘本

在视频生成时,自定义文本提示词进行视频生成。

image.png





来源  |  阿里云开发者公众号



相关文章
|
17天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
阿里云与企业共筑容器供应链安全
171341 14
|
20天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。
150297 32
|
28天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
201965 15
对话 | ECS如何构筑企业上云的第一道安全防线
|
5天前
|
机器学习/深度学习 自然语言处理 PyTorch
深入剖析Transformer架构中的多头注意力机制
多头注意力机制(Multi-Head Attention)是Transformer模型中的核心组件,通过并行运行多个独立的注意力机制,捕捉输入序列中不同子空间的语义关联。每个“头”独立处理Query、Key和Value矩阵,经过缩放点积注意力运算后,所有头的输出被拼接并通过线性层融合,最终生成更全面的表示。多头注意力不仅增强了模型对复杂依赖关系的理解,还在自然语言处理任务如机器翻译和阅读理解中表现出色。通过多头自注意力机制,模型在同一序列内部进行多角度的注意力计算,进一步提升了表达能力和泛化性能。
|
10天前
|
存储 人工智能 安全
对话|无影如何助力企业构建办公安全防护体系
阿里云无影助力企业构建办公安全防护体系
1256 11
|
12天前
|
机器学习/深度学习 自然语言处理 搜索推荐
自注意力机制全解析:从原理到计算细节,一文尽览!
自注意力机制(Self-Attention)最早可追溯至20世纪70年代的神经网络研究,但直到2017年Google Brain团队提出Transformer架构后才广泛应用于深度学习。它通过计算序列内部元素间的相关性,捕捉复杂依赖关系,并支持并行化训练,显著提升了处理长文本和序列数据的能力。相比传统的RNN、LSTM和GRU,自注意力机制在自然语言处理(NLP)、计算机视觉、语音识别及推荐系统等领域展现出卓越性能。其核心步骤包括生成查询(Q)、键(K)和值(V)向量,计算缩放点积注意力得分,应用Softmax归一化,以及加权求和生成输出。自注意力机制提高了模型的表达能力,带来了更精准的服务。
|
10天前
|
人工智能 自然语言处理 程序员
通义灵码2.0全新升级,AI程序员全面开放使用
通义灵码2.0来了,成为全球首个同时上线JetBrains和VSCode的AI 程序员产品!立即下载更新最新插件使用。
1411 25
|
10天前
|
消息中间件 人工智能 运维
1月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
804 38
1月更文特别场——寻找用云高手,分享云&AI实践
|
1天前
|
存储 人工智能 分布式计算
湖仓实时化升级 :Uniflow 构建流批一体实时湖仓
本文整理自阿里云产品经理李昊哲在Flink Forward Asia 2024流批一体专场的分享,涵盖实时湖仓发展趋势、基于Flink搭建流批一体实时湖仓及Materialized Table优化三方面。首先探讨了实时湖仓的发展趋势和背景,特别是阿里云在该领域的领导地位。接着介绍了Uniflow解决方案,通过Flink CDC、Paimon存储等技术实现低成本、高性能的流批一体处理。最后,重点讲解了Materialized Table如何简化用户操作,提升数据查询和补数体验,助力企业高效应对不同业务需求。
315 17
湖仓实时化升级 :Uniflow 构建流批一体实时湖仓
|
16天前
|
人工智能 自然语言处理 API
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。