|
机器学习/深度学习 数据采集 数据挖掘
|

特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计

因果推断方法为特征工程提供了一个更深层次的框架,使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要,如经济学、医学和市场营销。

617 1
ly~
|
消息中间件 存储 数据库连接
|

RocketMQ 消息的重试机制是怎样的?

RocketMQ的消息重试机制确保消息消费失败时能自动重试,直至成功。默认重试16次,时间间隔逐次翻倍,从10秒至数分钟不等。重试在同组内不同消费者间进行,由异常抛出或特定状态返回触发。支持自定义重试次数与时间间隔,建议合理配置避免无限重试,保障系统稳定性和性能。

4129 2
|
IDE Java 编译器
|

Java“找不到符号” 错误怎么查找解决

“找不到符号”是Java编程中常见的编译错误,通常表明代码试图访问未声明或不可见的符号(如类、方法或变量)。解决此问题需检查拼写、导入包是否正确及作用域是否合适。确保使用正确的类路径和库,可有效避免此类错误。若问题依旧,查阅官方文档或使用调试工具定位错误亦为良策。

7302 10
|
Web App开发 缓存 安全
|

Chrome浏览器启动参数大全

这是一组用于定制浏览器行为的命令行参数,包括但不限于:不停用过期插件、放行非安全内容、允许应用中心脚本、停用GPU加速视频、禁用桌面通知、禁用拓展及各类API、调整缓存设置、启用打印预览、隐身模式启动、设定语言、使用代理服务器、无头模式运行等。通过这些参数,用户可以根据需求灵活调整浏览器功能与性能。

2389 0
|
存储 人工智能 编解码
|

在Data-Driven时代下,如何打造下一代智能数据体系?

本文源自2024外滩大会“Data+AI”论坛,由蚂蚁集团数据平台与服务部负责人骆骥演讲整理。文章回顾了数据技术发展历程,指出生成式AI正推动数据技术从成本效率中心向价值中心转变。

723 2
|
移动开发 JavaScript 前端开发
|

HTML5 Audio(音频)详解

HTML5 通过 `<audio>` 标签简化了网页音频嵌入。本文详细介绍其基本语法与常用属性(如 `controls`、`autoplay`),并通过示例代码展示如何使用 JavaScript 控制音频播放及处理音频事件。此外,还提供了关于浏览器兼容性、自适应设计及无障碍访问的注意事项,助您优化音频体验。

1378 3
|
机器学习/深度学习 人工智能 分布式计算
|

使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人

本次教程介绍了如何使用 PAI ×LLaMA Factory 框架,基于全参方法微调 Qwen2-VL 模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。

3495 1
来自: 人工智能平台PAI  版块
|
数据可视化 图形学 UED
|

只需四步,轻松开发三维模型Web应用

为了让用户更方便地应用三维模型,阿里云DataV提供了一套完整的三维模型Web模型开发方案,包括三维模型托管、应用开发、交互开发、应用分发等完整功能。只需69.3元/年,就能体验三维模型Web应用开发功能!

1071 9
来自: 数据可视化DataV  版块
|
jenkins Java 测试技术
|

CI/CD 流水线的设计与实施

【8月更文第30天】持续集成(Continuous Integration, CI)和持续交付(Continuous Delivery, CD)是现代软件开发中的重要组成部分。CI/CD 不仅可以加速产品的发布周期,还能提高软件的质量并减少部署过程中的风险。本文将详细介绍 CI/CD 流水线的设计与实施,并提供一些实用的工具和最佳实践。

1653 2
|
机器学习/深度学习 安全 数据挖掘
|

安全地运行 Jupyter 服务

【8月更文第29天】Jupyter Notebook 是一种流行的交互式计算环境,广泛应用于数据分析、机器学习等领域。然而,随着 Jupyter 服务越来越多地被部署在网络环境中,安全问题变得日益重要。本文将介绍一些最佳实践,帮助您保护 Jupyter 服务器免受攻击和数据泄露的风险。

865 0
|
机器学习/深度学习 自然语言处理 PyTorch
|

PyTorch 中的动态图与静态图:理解它们的区别及其应用场景

【8月更文第29天】深度学习框架中的计算图是构建和训练神经网络的基础。PyTorch 支持两种类型的计算图:动态图和静态图。本文旨在阐述这两种计算图的区别、各自的优缺点以及它们在不同场景下的应用。

3688 0
|
机器学习/深度学习 并行计算 算法
|

深度学习驱动的声音生成:FunAudioLLM的创新架构

【8月更文第28天】随着深度学习技术的发展,声音合成的质量得到了显著提升。本文将介绍 FunAudioLLM —— 一种基于深度学习的声音生成框架,旨在创造高质量、自然流畅的声音内容。我们将探讨 FunAudioLLM 的核心技术、训练流程及其实现细节,并提供一些示例代码。

462 0
|
Rust Apache 对象存储
|

Apache Paimon V0.9最新进展

Apache Paimon V0.9 版本即将发布,此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长,已成为Apache顶级项目,并广泛应用于阿里集团内外的多家企业。

18174 13
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

卷积神经网络(CNN):视觉识别的革命先锋

卷积神经网络(CNN)作为人工智能领域的一颗璀璨明珠,在计算机视觉中发挥着核心作用。CNN的发展历程展现了从生物学灵感到技术创新的转变,历经LeNet-5至AlexNet、VGGNet、ResNet等里程碑式的进步。其独特结构包括卷积层、池化层及全连接层,能够层层递进地提取特征并作出决策。CNN不仅在图像分类、目标检测等领域表现卓越,还在人脸识别、医学影像分析等方面展现出巨大潜力。尽管存在局限性,如对序列数据处理能力有限及解释性问题,但通过引入注意力机制、自监督学习等方法,CNN将持续演进,引领人工智能技术走向更加精彩的未来。

1075 2
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

AI基础科普:揭开人工智能的神秘面纱

人工智能(Artificial Intelligence, AI)已经成为现代科技的热门话题,影响着我们的生活方方面面。从语音助手到自动驾驶汽车,AI正在以惊人的速度改变着世界。然而,对于许多人来说,AI仍然是一个模糊的概念。本文将通过通俗易懂的语言和丰富的图文,全面介绍AI的基础知识,帮助读者更好地理解这个激动人心的领域。

1522 0
|
存储 人工智能 自然语言处理
|

阿里云Elasticsearch AI场景语义搜索最佳实践

本文介绍了如何使用阿里云Elasticsearch结合搜索开发工作台搭建AI语义搜索。

18087 68
|
存储 SQL OLAP
|

分析性能提升40%,阿里云Hologres流量场景最佳实践

分析性能提升40%,阿里云Hologres流量场景最佳实践

25487 22
来自: 实时数仓 Hologres  版块
|
存储 人工智能 自然语言处理
|

多模态RAG:三步构建图文并茂的智能问答、电商导购助手

本文介绍了如何使用OpenSearch LLM智能问答版,三步搭建一站式多模态RAG系统。

2221 9
来自: 智能搜索推荐  版块
|
供应链 Python
|

供需匹配(Demand-Supply Matching)的详细解释与Python代码示例

供需匹配(Demand-Supply Matching)的详细解释与Python代码示例

2923 2
|
机器学习/深度学习 数据采集 算法
|

Python实现GBDT(梯度提升树)分类模型(GradientBoostingClassifier算法)并应用网格搜索算法寻找最优参数项目实战

Python实现GBDT(梯度提升树)分类模型(GradientBoostingClassifier算法)并应用网格搜索算法寻找最优参数项目实战

1008 3
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 自然语言处理 数据挖掘
|

RouteLLM:高效LLM路由框架,可以动态选择优化成本与响应质量的平衡

新框架提出智能路由选择在强弱语言模型间,利用用户偏好的学习来预测强模型胜率,基于成本阈值做决策。在大规模LLMs部署中,该方法显著降低成本而不牺牲响应质量。研究显示,经过矩阵分解和BERT等技术训练的路由器在多个基准上提升性能,降低强模型调用,提高APGR。通过数据增强,如MMLU和GPT-4评审数据,路由器在GSM8K、MMLU等测试中展现出色的性能提升和成本效率。未来将测试更多模型组合以验证迁移学习能力。该框架为LLMs部署提供了成本-性能优化的解决方案。

813 2
|
存储 SQL 消息中间件
|

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

103479 30
来自: 实时数仓 Hologres  版块
|
JSON 分布式计算 大数据
|

MaxCompute产品使用问题之pyODPS3如何引用udf资源的函数

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

184 2
来自: 大数据计算 MaxCompute  版块
|
人工智能 监控 并行计算
|

Stable Diffusion火影数据集训练:SwanLab可视化训练

**使用Stable Diffusion 1.5模型训练火影忍者风格的文生图模型。在22GB显存的GPU上,通过Huggingface的`lambdalabs/naruto-blip-captions`数据集进行训练,利用SwanLab进行监控。所需库包括`swanlab`, `diffusers`, `datasets`, `accelerate`, `torchvision`, `transformers`。代码、日志和更多资源可在GitHub和SwanLab找到。训练涉及数据下载、模型配置、训练过程可视化及结果评估。**

1492 6
|
数据可视化 SDN Python
|

复动力系统 | 混沌 | Lozi 映射吸引子的可视化与交互式探索

该文介绍了一篇关于Lozi映射吸引子可视化和交互式探索的文章。Lozi映射是混沌理论中的一个模型,展示非线性动力系统的复杂性。通过Python和matplotlib,作者实现了Lozi映射的可视化,并添加交互功能,允许用户缩放以详细观察混沌吸引子。文中还给出了Lozi映射的数学定义,并提供了Python代码示例,演示如何绘制和动态调整吸引子的显示。

700 2
|
分布式计算 大数据 Java
|

MaxCompute产品使用合集之在datawoks的datastudio和odpscmd里执行时间没有问题,但是用jdbc连接大数据计算MaxCompute获取getdate()时间就不对,该怎么办

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

248 2
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 Python
|

ReLU

本文探讨了高等数学中ReLU(修正线性单元)在神经网络的应用。ReLU函数定义为$f(x) = \max(0, x)$,其导数为$1$($x \geq 0$)或$0$($x < 0$)。适用于除二分类问题外的其他问题。Python代码展示了ReLU及其导数的图形绘制。

475 1
|
机器学习/深度学习 Python
|

leaky ReLU

本文探讨了高等数学中的leaky ReLU激活函数,其在神经网络中的应用。函数定义为:当$x\geq0$时,$f(x)=x$;当$x<0$时,$f(x)=\lambda x$,其中$\lambda\in(0,1)$是泄露率。导数为:$x\geq0$时,$f'(x)=1$;$x<0$时,$f'(x)=\lambda$。文中还提供了leaky ReLU的Python实现和图像展示。

422 2
|
存储 JSON API
|

批量采集抖音商品详情数据:推荐你使用API(通过商品id取商品详情商品主图sku属性)

批量采集抖音商品详情,建议使用API接口。步骤包括:注册抖音开放平台获取App Key和Secret,调用商品详情API接口传入商品ID及相关参数,解析返回的JSON获取商品信息(如名称、价格、主图和SKU)。此外,接口列表提供商品搜索、销售量查询、历史价格、订单管理等多种功能。已封装的API接口地址:c0b.cc/R4rbK2,可测试并联系获取SDK文件。

1744 1
|
消息中间件 Kafka 分布式数据库
|

实时计算 Flink版产品使用合集之如何批量读取Kafka数据

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

1598 1
来自: 实时计算 Flink  版块
|
SQL 数据采集 存储
|

Hive实战 —— 电商数据分析(全流程详解 真实数据)

关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。

3051 1
|
存储 缓存 安全
|

Golang深入浅出之-Go语言中的并发安全容器:sync.Map与sync.Pool

Go语言中的`sync.Map`和`sync.Pool`是并发安全的容器。`sync.Map`提供并发安全的键值对存储,适合快速读取和少写入的情况。注意不要直接遍历Map,应使用`Range`方法。`sync.Pool`是对象池,用于缓存可重用对象,减少内存分配。使用时需注意对象生命周期管理和容量控制。在多goroutine环境下,这两个容器能提高性能和稳定性,但需根据场景谨慎使用,避免不当操作导致的问题。

717 7
|
存储 机器学习/深度学习 算法
|

如何准确的估计llm推理和微调的内存消耗

最近发布的三个大型语言模型——Command-R+ (104B参数), Mixtral-8x22b (141B参数的MoE模型), 和 Llama 3 70b (70.6B参数)——需要巨大的内存资源。推理时,Command-R+需193.72GB GPU RAM,Mixtral-8x22B需262.63GB,Llama 370b需131.5GB。激活的内存消耗根据序列长度、批大小等因素变化。文章详细介绍了计算这些模型内存需求的方法,并探讨了如何通过量化、优化器优化和梯度检查点减少内存使用,以适应微调和推理。

2506 0
|
API 异构计算 Docker
|

5种搭建LLM服务的方法和代码示例

本文介绍了5种搭建开源大型语言模型服务的方法,包括使用Anaconda+CPU、Anaconda+GPU、Docker+GPU、Modal和AnyScale。CPU方法适合本地低门槛测试,但速度较慢;GPU方法显著提升速度,Docker简化环境配置,适合大规模部署;Modal提供按需付费的GPU服务,适合试验和部署;而AnyScale则以低门槛和低成本访问开源模型。每种方法都有其优缺点,选择取决于具体需求和资源。

832 0
|
人工智能 并行计算 PyTorch
|

Stable Diffusion 本地部署教程:详细步骤与常见问题解析

【4月更文挑战第12天】本教程详细介绍了如何在本地部署Stable Diffusion模型,包括安装Python 3.8+、CUDA 11.3+、cuDNN、PyTorch和torchvision,克隆仓库,下载预训练模型。配置运行参数后,通过运行`scripts/run_diffusion.py`生成图像。常见问题包括CUDA/CuDNN版本不匹配、显存不足、API密钥问题、模型加载失败和生成质量不佳,可按教程提供的解决办法处理。进阶操作包括使用自定义提示词和批量生成图像。完成这些步骤后,即可开始Stable Diffusion的AI艺术创作。

2861 2
|
数据处理 Python
|

使用Pandas解决问题:对比两列数据取最大值的五种方法

​在数据处理和分析中,经常需要比较两个或多个列的值,并取其中的最大值。Pandas库作为Python中数据处理和分析的强大工具,提供了多种灵活的方法来实现这一需求。本文将详细介绍五种使用Pandas对比两列数据并取最大值的方法,通过代码示例和案例分析,帮助新手更好地理解并掌握这些技巧。

1003 0
|
消息中间件 API 数据处理
|

Flink常见面试问题(附答案)

Apache Flink是开源的流批处理框架,提供低延迟、高吞吐的数据处理。与Hadoop不同,Flink专注于实时数据流。其核心特性包括事件时间和处理时间的概念,事件时间通过水印处理乱序事件。Flink通过检查点实现容错,支持滚动、滑动和会话窗口进行流数据处理。状态后端用于管理应用程序状态,水印用于处理延迟数据。Flink与Kafka集成能保证事件顺序,支持多种连接器如Kafka、JDBC等。其处理延迟数据、乱序事件的能力,以及Exactly-Once语义,使其在大规模数据处理中具有优势。Flink还支持表格API和DataStream API,以及多种容错和性能优化策略。

1378 2
|
资源调度 供应链 监控
|

深入探究:ERP系统的核心模块解析

深入探究:ERP系统的核心模块解析

915 0
|
数据采集 JavaScript 前端开发
|

使用Go和JavaScript爬取股吧动态信息的完整指南

本文介绍了如何使用Go和JavaScript构建网络爬虫,从股吧网站抓取实时股市信息。通过设置代理服务器以应对反爬策略,利用`got`库执行JavaScript提取动态数据,如用户讨论和市场分析。示例代码展示了爬虫的实现过程,包括浏览器实例创建、代理配置、JavaScript执行及数据打印。此方法有助于投资者及时获取市场资讯,为决策提供支持。

635 4
|
人工智能 算法 开发工具
|

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen1.5系列模型的微调和快速部署。

179318 9
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 JSON
|

人工智能平台PAI问题之推断报错如何解决

人工智能平台PAI是指阿里云提供的机器学习平台服务,支持建模、训练和部署机器学习模型;本合集将介绍机器学习PAI的功能和操作流程,以及在使用过程中遇到的问题和解决方案。

229 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 算法 Python
|

LightGBM中的特征选择与重要性评估

LightGBM中的特征选择与重要性评估【2月更文挑战第1天】

2795 0
|
人工智能 自然语言处理 大数据
|

大模型+知识图谱双驱架构:新一代《知识语义框架SPG》白皮书

白皮书展望了SPG与LLM双向驱动的技术架构。通过基于SPG构建统一的图谱技术框架,可以屏蔽复杂的技术细节以支持新业务的快速部署,真正实现知识图谱技术的框架化、平民化、普惠化。

3523 2
|
自然语言处理 算法 OLAP
|

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。

118548 207
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 资源调度 数据可视化
|

Mamba详细介绍和RNN、Transformer的架构可视化对比

Transformer体系结构已经成为大型语言模型(llm)成功的主要组成部分。为了进一步改进llm,人们正在研发可能优于Transformer体系结构的新体系结构。其中一种方法是Mamba(一种状态空间模型)。

1528 2
|
机器学习/深度学习 算法 API
|

XGBoost模型部署与在线预测的完整指南

XGBoost模型部署与在线预测的完整指南

1940 6
|
数据采集 存储 前端开发
|

pdd 商品详情数据接口Python

pdd 商品详情数据接口Python

1773 0
|
人工智能 自然语言处理 搜索推荐
|

基于阿里云向量检索服务搭建AI智能问答机器人

基于阿里云向量检索服务搭建AI智能问答机器人

123980 38
来自: 智能搜索推荐  版块
|
Linux Shell 调度
|

linux服务器定时执行python程序

linux服务器定时执行python程序

2034 0
|
机器学习/深度学习 算法
|

【MATLAB】 多元变分模态分解MVMD信号分解算法

【MATLAB】 多元变分模态分解MVMD信号分解算法

1731 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务