|
机器学习/深度学习 人工智能 缓存
|

人工智能平台PAI使用问题之如何配置学习任务

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

336 0
来自: 人工智能平台PAI  版块
|
存储 安全 区块链
|

云上数字资产管理:解锁数字经济新蓝海,护航企业价值增长

生态化建设:数字资产管理将不再局限于企业内部,而是逐步向生态化方向发展。企业将与产业链上下游伙伴、第三方服务机构等共同构建数字资产管理生态体系,实现资源的共享和价值的共创。 结语 云上数字资产管理作为数字经济时代的重要产物,正以其独特的优势和价值引领着企业资产管理的变革和发展。面对未来的机遇和挑战,企业需要不断加强技术创新和人才培养

873 0
|
SQL 存储 安全
|

SQL数据库:核心原理、应用实践与未来展望

在电子商务领域,SQL数据库用于存储商品信息、用户信息、订单信息等。通过SQL数据库,电商平台可以实现商品的快速检索、用户行为的跟踪分析、订单状态的实时更新等功能,提升用户体验和运营效率。

628 2
|
机器学习/深度学习 人工智能 供应链
|

智能制造:AI驱动的生产革命——探索生产线优化、质量控制与供应链管理的新纪元

【7月更文第19天】随着第四次工业革命的浪潮席卷全球,人工智能(AI)正逐步成为推动制造业转型升级的核心力量。从生产线的智能化改造到质量控制的精密化管理,再到供应链的全局优化,AI技术以其强大的数据处理能力和深度学习算法,为企业开启了全新的生产效率和质量标准。本文将深入探讨AI在智能制造中的三大关键领域——生产线优化、质量控制、供应链管理中的应用与影响,并通过具体案例和代码示例加以阐述。

1705 3
|
C++
|

C++一分钟之-文件系统库(fs)的使用

【7月更文挑战第18天】C++17的`<filesystem>`库简化了文件系统操作,包括`path`类和`directory_iterator`。`path`用于表示路径,`directory_iterator`用于遍历目录。常用功能有路径拼接、分解,创建/删除目录,以及遍历。错误处理、跨平台兼容性和性能是使用时需考虑的关键点。示例代码展示了如何初始化`path`、创建目录、删除目录以及处理异常。

406 1
|
机器学习/深度学习 算法 数据挖掘
|

基于改进K-means的网络数据聚类算法matlab仿真

**摘要:** K-means聚类算法分析,利用MATLAB2022a进行实现。算法基于最小化误差平方和,优点在于简单快速,适合大数据集,但易受初始值影响。文中探讨了该依赖性并通过实验展示了随机初始值对结果的敏感性。针对传统算法的局限,提出改进版解决孤点影响和K值选择问题。代码中遍历不同K值,计算距离代价,寻找最优聚类数。最终应用改进后的K-means进行聚类分析。

346 10
|
算法 Java C++
|

《经典图论算法》迪杰斯特拉算法(Dijkstra)

这个是求最短路径的迪杰斯特拉算法,另外我还写了50多种《经典图论算法》,每种都使用C++和Java两种语言实现,熟练掌握之后无论是参加蓝桥杯,信奥赛,还是其他比赛,或者是面试,都能轻松应对。

739 0
|
机器学习/深度学习 算法 开发工具
|

大语言模型的直接偏好优化(DPO)对齐在PAI-QuickStart实践

阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对DPO算法提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现大语言模型的DPO对齐微调。本文以阿里云最近推出的开源大型语言模型Qwen2(通义千问2)系列为例,介绍如何在PAI-QuickStart实现Qwen2的DPO算法对齐微调。

35798 2
来自: 人工智能平台PAI  版块
|
IDE PHP 开发工具
|

「Python入门」python环境搭建及VScode使用python运行方式

**Python 概述与环境搭建摘要** Python是一种解释型、面向对象、交互式的脚本语言,以其简单易学和丰富库著称。安装Python时,推荐在Windows上选择.exe安装程序,记得勾选“Add Python to PATH”。安装完成后,通过环境变量配置确保Python可被系统识别。验证安装成功,可在CMD中输入`python --version`。Visual Studio Code (VScode)是流行的Python IDE,安装Python插件并选择解释器后,可直接在VScode内编写和运行Python代码。

893 0
|
机器学习/深度学习 API Docker
|

使用Python实现深度学习模型:模型部署与生产环境应用

【7月更文挑战第7天】 使用Python实现深度学习模型:模型部署与生产环境应用

597 0
|
机器学习/深度学习 编解码 数据可视化
|

图神经网络版本的Kolmogorov Arnold(KAN)代码实现和效果对比

目前我们看到有很多使用KAN替代MLP的实验,但是目前来说对于图神经网络来说还没有类似的实验,今天我们就来使用KAN创建一个图神经网络Graph Kolmogorov Arnold(GKAN),来测试下KAN是否可以在图神经网络方面有所作为。

612 1
|
数据采集 API 开发者
|

爬虫:闲鱼商品详情数据接口(goodfish.item_get)

闲鱼的`goodfish.item_get`非官方API,其数据接口多为私有,适用于授权合作伙伴。获取商品详情数据可考虑官方合作、网络爬虫(需遵守反爬政策)、第三方API服务或直接联系闲鱼官方。合法合规使用数据至关重要。

1494 0
|
存储 安全 固态存储
|

回收站的照片删除了怎么找回?

当回收站的照片被删除,数据恢复软件如DiskGenius能帮助找回丢失的文件。文件删除后并未立即消失,只是标记为可复用,直到新数据覆盖。停止写入操作,尽快使用恢复软件扫描未覆盖的区域。如果文件未备份,数据恢复的成功率取决于多种因素,包括是否使用了TRIM(针对SSD)以及删除后的时间长短。在尝试恢复前,可先检查是否有系统备份。

530 0
|
分布式计算 DataWorks 调度
|

DataWorks操作报错合集之DataX访问MaxCompute(原ODPS)突然无法读取到字段数据,是什么导致的

DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

414 0
|
消息中间件 SQL 存储
|

ClickHouse(21)ClickHouse集成Kafka表引擎详细解析

ClickHouse的Kafka表引擎允许直接从Apache Kafka流中消费数据,支持多种数据格式如JSONEachRow。创建Kafka表时需指定参数如brokers、topics、group和format。关键参数包括`kafka_broker_list`、`kafka_topic_list`、`kafka_group_name`和`kafka_format`。Kafka特性包括发布/订阅、容错存储和流处理。通过设置`kafka_num_consumers`可以调整并行消费者数量。Kafka引擎还支持Kerberos认证。虚拟列如`_topic`、`_offset`等提供元数据信息。

890 0

妙笔生词智能作词软件能为作词续写一首未完成的歌词吗?

使用妙笔生词软件,作词人可轻松解决创作瓶颈。只需输入未完成的歌词,点击生成,软件便会自动生成下半部分,多次迭代提供不同选项,助力作词人丰富创意,高效完成歌词创作,是音乐创新领域的实用工具。

462 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

深度揭秘:深度学习框架下的神经网络架构进化

从感知机到深度学习的革命,神经网络经历了从简单到复杂的演变。反向传播使多层网络实用化,深度信念网络(DBN)和卷积神经网络(CNN)的兴起,尤其是AlexNet在ImageNet竞赛中的胜利,开启了深度学习黄金时代。ResNet的残差学习解决了深度梯度消失问题。循环神经网络(RNN)、LSTM和GRU改进了序列处理,Transformer模型(如BERT和GPT)引领了自然语言处理的变革。超大规模模型如GPT-3和通义千问展示惊人能力,影响医疗、自动驾驶等多个领域。未来,平衡模型复杂度、计算成本与应用需求将是关键。

896 2
|
SQL 关系型数据库 数据库
|

python使用DBUtil连接池封装psycopg2/hologres

这段代码是一个Python类`PsycopgConn`,用于管理PostgreSQL数据库连接池。类使用了`dbutils.pooled_db.PooledDB`来创建连接池,支持多线程,并提供了获取连接、关闭连接池、执行查询(`SelectSql`)、插入(`InsertSql`)和更新(`UpdateSql`)SQL的方法。类实现单例模式以确保只有一个实例存在。连接配置包括主机、端口等

774 4
|
数据采集 分布式计算 大数据
|

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系,通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台,保障数据生产稳定性与数据质量,减少ETL链路及计算时间,每年数仓整体费用从300多万降到180万。

2555 11
来自: 实时数仓 Hologres  版块
|
人工智能 监控 并行计算
|

Stable Diffusion火影数据集训练:SwanLab可视化训练

**使用Stable Diffusion 1.5模型训练火影忍者风格的文生图模型。在22GB显存的GPU上,通过Huggingface的`lambdalabs/naruto-blip-captions`数据集进行训练,利用SwanLab进行监控。所需库包括`swanlab`, `diffusers`, `datasets`, `accelerate`, `torchvision`, `transformers`。代码、日志和更多资源可在GitHub和SwanLab找到。训练涉及数据下载、模型配置、训练过程可视化及结果评估。**

1490 6
|
搜索推荐 程序员 开发工具
|

Emacs Verilog mode 简单使用指南

【6月更文挑战第17天】Emacs Verilog mode 提升Verilog编程体验,提供语法高亮、代码补全、自动缩进等功能。安装可通过`M-x package-install RET verilog-mode`。常见问题包括补全不生效、高亮不准确,可通过调整配置解决。支持模板插入、代码折叠、错误高亮、代码跳转。通过个性化配置、整合Git、集成其他工具和社区资源,实现高效Verilog开发。Emacs学习曲线虽陡,但效能提升显著。

658 4
|
机器学习/深度学习 Python
|

ReLU

本文探讨了高等数学中ReLU(修正线性单元)在神经网络的应用。ReLU函数定义为$f(x) = \max(0, x)$,其导数为$1$($x \geq 0$)或$0$($x < 0$)。适用于除二分类问题外的其他问题。Python代码展示了ReLU及其导数的图形绘制。

473 1
|
SQL 关系型数据库 MySQL
|

SQLAlchemy使用指南

**SQLAlchemy 指南**:Python SQL 工具包,提供数据库高级抽象。安装:`pip install sqlalchemy`,加上数据库驱动(如 MySQL: `pip install mysql-connector-python`)。基础使用包括:创建数据库连接、定义模型、创建表、添加/查询/更新/删除数据。高级功能涉及关系映射、原生 SQL 语句及 SQLAlchemy Core。推荐阅读官方文档以深入了解。

1255 1
|
算法 物联网 数据库
|

阿里云 OpenSearch RAG 应用实践

本文介绍了阿里云OpenSearch在过去一年中在RAG方面的应用和探索。

28833 4
来自: 智能搜索推荐  版块
|
数据处理 Apache 流计算
|

活动预告|6月13日Apache Flink Meetup·香港站

Apache Flink 香港 Meetup 来啦!

1026 1
来自: 实时计算 Flink  版块
|
存储 自然语言处理 算法
|

OpenIM Bot: 用LLM构建企业专属的智能客服

OpenIM Bot 通过结合LLM和RAG技术,构建企业专属的智能客服系统。该系统通过优化向量存储、混合检索和查询分析,解决了LLM的幻觉、新鲜度、token长度和数据安全问题,提升了用户体验。向量存储和预处理步骤确保文档高质量,而混合检索结合文本和语义搜索,增强了检索结果的准确性。通过迭代优化,OpenIM Bot 提供了高效、智能的支持服务,减轻了支持团队的负担,提升了问题解决效率。

1536 3
来自: 智能搜索推荐  版块
|
存储 SQL 数据可视化
|

阿里云 EMR Serverless StarRocks3.x,极速统一的湖仓新范式

EMR StarRocks 线上公开课第1期 ,直播主题:EMR Serverless StarRocks3.x,极速统一的湖仓新范式。

1535 1
|
机器学习/深度学习 数据采集 分布式计算
|

【机器学习】Spark ML 对数据进行规范化预处理 StandardScaler 与向量拆分

标准化Scaler是数据预处理技术,用于将特征值映射到均值0、方差1的标准正态分布,以消除不同尺度特征的影响,提升模型稳定性和精度。Spark ML中的StandardScaler实现此功能,通过`.setInputCol`、`.setOutputCol`等方法配置并应用到DataFrame数据。示例展示了如何在Spark中使用StandardScaler进行数据规范化,包括创建SparkSession,构建DataFrame,使用VectorAssembler和StandardScaler,以及将向量拆分为列。规范化有助于降低特征重要性,提高模型训练速度和计算效率。

768 6
|
存储
|

NameNode 故障无法重新启动解决方法

当NameNode进程挂掉时,若无数据丢失,可直接使用`hdfs --daemon start namenode`重启。但若数据丢失,需从SecondaryNameNode恢复。首先查看启动日志,确认因数据丢失导致的未启动成功问题。接着,将SecondaryNameNode的备份数据拷贝至NameNode的数据存储目录,目录路径在`core-site.xml`中设定。进入NameNode节点,使用`scp`命令从SecondaryNameNode复制数据后,重启NameNode进程,故障即可修复。

1847 0
|
SQL 分布式计算 资源调度
|

一文看懂 Hive 优化大全(参数配置、语法优化)

以下是对提供的内容的摘要,总长度为240个字符: 在Hadoop集群中,服务器环境包括3台机器,分别运行不同的服务,如NodeManager、DataNode、NameNode等。集群组件版本包括jdk 1.8、mysql 5.7、hadoop 3.1.3和hive 3.1.2。文章讨论了YARN的配置优化,如`yarn.nodemanager.resource.memory-mb`、`yarn.nodemanager.vmem-check-enabled`和`hive.map.aggr`等参数,以及Map-Side聚合优化、Map Join和Bucket Map Join。

1170 0
|
SQL 分布式计算 Java
|

IDEA 打包 Spark 项目 POM 文件依赖

这是一个 Maven POM 示例,用于构建一个使用 Spark 与 Hive 的项目,目标是将数据从 Hive 导入 ClickHouse。POM 文件设置了 Scala 和 Spark 的依赖,包括 `spark-core_2.12`, `spark-sql_2.12`, 和 `spark-hive_2.12`。`maven-assembly-plugin` 插件用于打包,生成包含依赖的和不含依赖的两种 JAR 包。`scope` 说明了依赖的使用范围,如 `compile`(默认),`provided`,`runtime`,`test` 和 `system`。

501 0
|
存储 数据可视化 前端开发
|

数仓常用分层与维度建模

本文介绍了数据仓库的分层结构和维度建模。数仓通常分为ODS、DIM、DWD、DWS和ADS五层,各层负责不同的数据处理阶段。维度建模是数据组织方法,包括星型和雪花模型。星型模型简单直观,查询性能高,适合简单查询;雪花模型则通过规范化减少冗余,提高数据一致性和结构复杂性,但可能影响查询效率。选择模型需根据业务需求和数据复杂性来定。

3270 0
|
SQL 存储 数据处理
|

实时计算 Flink版产品使用合集之idea本地调试,在哪里查看执行结果

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

558 1
来自: 实时计算 Flink  版块
|
Go
|

使用go组合卦象并解读运势

【5月更文挑战第3天】该文介绍了通过编程方式模拟每日运势占卜,使用Go语言定义了64卦的数据结构,并提供了解卦、比较列表和显示卦象的函数。最后,鼓励读者尝试并提出问题。

265 0
|
机器学习/深度学习 算法
|

LSTM时间序列预测中的一个常见错误以及如何修正

在使用LSTM进行时间序列预测时,常见错误是混淆回归和预测问题。LSTM需将时间序列转化为回归问题,通常使用窗口或多步方法。然而,窗口方法中,模型在预测未来值时依赖已知的未来值,导致误差累积。为解决此问题,应采用迭代预测和替换输入值的方法,或者在多步骤方法中选择合适的样本数量和训练大小以保持时间结构。编码器/解码器模型能更好地处理时间数据。

1022 1
|
分布式计算 DataWorks 大数据
|

MaxCompute产品使用合集之可以在什么地方学习大数据计算MaxCompute?

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

198 0
来自: 大数据计算 MaxCompute  版块
|
存储 分布式计算 Apache
|

官宣|Apache Paimon 毕业成为顶级项目,数据湖步入实时新篇章!

Apache Paimon 在构建实时数据湖与流批处理技术领域取得了重大突破,数据湖步入实时新篇章!

4392 6
来自: 实时计算 Flink  版块
|
人工智能 并行计算 PyTorch
|

Stable Diffusion 本地部署教程:详细步骤与常见问题解析

【4月更文挑战第12天】本教程详细介绍了如何在本地部署Stable Diffusion模型,包括安装Python 3.8+、CUDA 11.3+、cuDNN、PyTorch和torchvision,克隆仓库,下载预训练模型。配置运行参数后,通过运行`scripts/run_diffusion.py`生成图像。常见问题包括CUDA/CuDNN版本不匹配、显存不足、API密钥问题、模型加载失败和生成质量不佳,可按教程提供的解决办法处理。进阶操作包括使用自定义提示词和批量生成图像。完成这些步骤后,即可开始Stable Diffusion的AI艺术创作。

2859 2
|
数据采集 Java Python
|

python并发编程:Python在FastAPI服务中使用多进程池加速程序运行

python并发编程:Python在FastAPI服务中使用多进程池加速程序运行

2471 0
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里通义千问大语言模型在人工智能教育领域的应用探索

阿里通义千问,阿里集团的大型预训练语言模型,应用于AI教育,实现个性化教学、自适应学习系统和智能答疑。通过AIGC,它生成个性化内容,适应不同学生需求,优化教育资源配置,推动教育创新。在教育场景中,模型提供实时反馈,定制学习路径,促进教学质量提升。随着技术进步,AI在教育领域的应用将更加深入,但也需关注伦理与安全。

3895 1
|
人工智能 编解码 对象存储
|

一键生成视频,用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源,并且带领大家在 ComfyUI 环境下使用 SVD的模型,根据任何图片生成一个小短视频。

145853 185
来自: 人工智能平台PAI  版块
|
自然语言处理 API Python
|

使用Tokeniser估算GPT和LLM服务的查询成本

将LLM集成到项目所花费的成本主要是我们通过API获取LLM返回结果的成本,而这些成本通常是根据处理的令牌数量计算的。我们如何预估我们的令牌数量呢?Tokeniser包可以有效地计算文本输入中的令牌来估算这些成本。本文将介绍如何使用Tokeniser有效地预测和管理费用。

396 3
|
人工智能 DataWorks 数据可视化
|

心动基于阿里云DataWorks构建游戏行业通用大数据模型

心动游戏在阿里云上构建云原生大数据平台,基于DataWorks构建行业通用大数据模型,如玩家、产品、SDK、事件、发行等,满足各种不同的分析型应用的要求,如AI场景、风控场景、数据分析场景等。

1162 2
|
算法 数据可视化 API
|

使用PyOD进行异常值检测

异常值检测各个领域的关键任务之一。PyOD是Python Outlier Detection的缩写,可以简化多变量数据集中识别异常值的过程。在本文中,我们将介绍PyOD包,并通过实际给出详细的代码示例

443 0
|
消息中间件 安全 Kafka
|

如何为Kafka加上账号密码(二)

本小节我们就为Kafka添加最简单的认证方式,也就是SASL_PLAINTEXT(即SASL/PLAIN+ 非加密通道)。

2459 5
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 搜索推荐
|

Python进行AI声音克隆的端到端指南

人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。

890 0
|
存储 分布式计算 Apache
|

构建 Streaming Lakehouse:使用 Paimon 和 Hudi 的性能对比

Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文将在阿里云EMR 上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,然后分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

60697 9
来自: 实时计算 Flink  版块
|
人工智能 决策智能 数据安全/隐私保护
|

新加坡AI监管政策

【1月更文挑战第19天】新加坡AI监管政策

864 1
|
人工智能 算法 开发工具
|

Mixtral 8X7B MoE模型在阿里云PAI平台的微调部署实践

Mixtral 8x7B 是Mixtral AI最新发布的大语言模型,是当前最为先进的开源大语言模型之一。阿里云人工智能平台PAI,提供了对于 Mixtral 8x7B 模型的全面支持,开发者和企业用户可以基于 PAI-快速开始轻松完成Mixtral 8x7B 模型的微调和部署。

134914 6
来自: 人工智能平台PAI  版块
|
人工智能 程序员 云栖大会
|

盘点2023年我用过的AI大模型,国内也能免费用

盘点2023年我用过的AI大模型,国内也能免费用

974 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69094
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务