大数据与机器学习-博文-第34页-阿里云开发者社区

hju6meadphitw

|

4月前

|

存储监控数据挖掘

|

博文

云上大数据分析平台：赋能企业决策，挖掘数据金矿

5.3 场景化针对不同行业和领域的需求特点，云上大数据分析平台将推出更多场景化的解决方案。这些解决方案将结合行业特点和业务场景进行

127 7 7

软件算法开发

|

4月前

|

算法

|

博文

基于kalman滤波的UAV三维轨迹跟踪算法matlab仿真

本文介绍了一种使用卡尔曼滤波(Kalman Filter)对无人飞行器(UAV)在三维空间中的运动轨迹进行预测和估计的方法。该方法通过状态预测和观测更新两个关键步骤，实时估计UAV的位置和速度，进而生成三维轨迹。在MATLAB 2022a环境下验证了算法的有效性（参见附图）。核心程序实现了状态估计和误差协方差矩阵的更新，并通过调整参数优化滤波效果。该算法有助于提高轨迹跟踪精度和稳定性，适用于多种应用场景，例如航拍和物流运输等领域。

206 12 13

Echo_Wish

|

4月前

|

监控供应链数据安全/隐私保护

|

博文

ERP系统中的库存周转率优化与管理解析

【7月更文挑战第25天】 ERP系统中的库存周转率优化与管理解析

200 0 0

Echo_Wish

|

4月前

|

供应链监控数据安全/隐私保护

|

博文

ERP系统中的供应链风险管理与应对策略解析

【7月更文挑战第25天】 ERP系统中的供应链风险管理与应对策略解析

417 0 0

Echo_Wish

|

4月前

|

监控算法数据可视化

|

博文

ERP系统中的生产调度与计划排程解析

【7月更文挑战第25天】 ERP系统中的生产调度与计划排程解析

257 1 1

灵杰开发者

|

4月前

|

存储人工智能自然语言处理

|

博文

多模态RAG：三步构建图文并茂的智能问答、电商导购助手

本文介绍了如何使用OpenSearch LLM智能问答版，三步搭建一站式多模态RAG系统。

995 9 9

来自：智能搜索推荐版块

奔跑的数据

|

4月前

|

Web App开发数据采集开发者

|

博文

如何解决ChromeDriver 126找不到chromedriver.exe问题

当使用Selenium与ChromeDriver 126时，遇到`chromedriver.exe`找不到的错误，可能是因为版本不匹配、文件路径错误或系统设置不当。解决方法包括：匹配Chrome浏览器版本下载ChromeDriver，确保文件在正确路径且有执行权限，以及调整系统设置允许执行。示例代码展示了如何设置代理IP、user-agent和cookie来运行Selenium爬虫。通过这些步骤，可以确保爬虫程序顺利运行。

291 2 2

三分钟热度的鱼

|

4月前

|

SQL 关系型数据库 MySQL

|

博文

实时计算 Flink版产品使用问题之如何使用Flink SQL连接带有Kerberos认证的Hive

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

155 0 0

来自：实时计算 Flink 版块

winx_19970108018

|

4月前

|

XML 数据挖掘 API

|

博文

数据为王！深度挖掘天猫商品详情接口，赋能电商运营新策略

**天猫商品详情接口摘要** - 开放平台API，获取商品标题、价格、描述、销量等信息。 - 支持多语言，用于生成详情页、数据分析、营销策略、竞品分析和购物决策。 - 注册授权，获取AppKey和AppSecret，参照文档构建请求。 - 发送GET/POST请求，处理JSON或XML响应数据。 - 助力自动化运营、提升效率和竞争力，对商家和消费者都有价值。

136 1 1

胖哥真不错

|

4月前

|

机器学习/深度学习数据采集算法

|

博文

Python实现支持向量机SVM回归模型(SVR算法)项目实战

298 4 4

来自：人工智能平台PAI 版块

游客etoojqwjsu3q2

|

4月前

|

弹性计算人工智能运维

|

博文

60分钟深度测评阿里云基于大模型构建的操作系统智能助手

OS Copilot 概要 OS Copilot 是阿里巴巴云针对Linux操作系统开发的智能助手，集成在Alibaba Cloud Linux中，利用大模型技术提供自然语言问答、命令行辅助、阿里云CLI调用和系统运维功能。它尤其适合新手，直观的交互方式提升效率。此外，OS Copilot支持在操作系统内直接管理阿里云资源，简化运维任务。目前，该助手仅在特定版本的Alibaba Cloud Linux上可用。体验者可以通过提供的链接和指南进行实操，体验其功能，如命令行的自然语言交互和环境变量配置。OS Copilot在提高用户体验和工作流集成方面的创新，预示着未来AI在操作系统中的广泛应用。

135 1 1

来自：人工智能平台PAI 版块

AIGC小王子

|

4月前

|

数据采集自然语言处理大数据

|

博文

「Python大数据」LDA主题分析模型

使用Python进行文本聚类，流程包括读取VOC数据、jieba分词、去除停用词，应用LDA模型（n_components=5）进行主题分析，并通过pyLDAvis生成可视化HTML。关键代码涉及数据预处理、CountVectorizer、LatentDirichletAllocation以及HTML文件的本地化处理。停用词和业务术语列表用于优化分词效果。

210 0 0

AIGC小王子

|

4月前

|

JSON JavaScript API

|

博文

「AIGC」NodeJs使用openai流式请求与非流式请求

本文档是关于使用Node.js与OpenAI API交互的教程，涵盖了非流式和流式请求。非流式请求示例展示了如何一次性返回所有数据，适用于兼容性但可能需要较长时间。流式请求则演示了如何即时响应数据，提高交互体验，但可能不适用于所有系统。代码示例使用了axios库和http模块，展示了如何处理数据流。

299 0 0

软件求生

|

4月前

|

消息中间件 Kafka 程序员

|

博文

彻底搞懂Kafka生产消费流程，这篇文章就够了！

```markdown 🚀 Kafka 生产消费流程揭秘：Producer 创建守护线程Sender，消息经拦截器→序列化器→分区器→缓冲区。批量发送基于batch.size或linger.ms条件。acks参数控制可靠性，从0（最快但不可靠）到all（最可靠）。消息重试和元数据返回确保不丢失。关注“软件求生”公众号，探索更多技术！ ```

143 1 1

wusp1994

|

5月前

|

存储数据可视化

|

博文

豆瓣电影Top250的可视化分析

本文旨在实现豆瓣电影TOP250的可视化，通过确定柱状图、折线图和饼图等图表设计，展示评价人数最多、年份分布及类型占比。模拟数据用于演示，例如评价最多的电影、年份最多的电影数量及每年高分电影趋势。完整代码可下载，包含ECharts实现的四种图表。

206 0 0

花开富贵111

|

5月前

|

机器学习/深度学习分布式计算大数据

|

博文

MaxCompute产品使用问题之如何对现有的非分区表数据进行分区处理

MaxCompute作为一款全面的大数据处理平台，广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践，可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集，涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

65 0 0

来自：大数据计算 MaxCompute 版块

郑小健

|

5月前

|

机器学习/深度学习 TensorFlow API

|

博文

TensorFlow与Keras实战：构建深度学习模型

本文探讨了TensorFlow和其高级API Keras在深度学习中的应用。TensorFlow是Google开发的高性能开源框架，支持分布式计算，而Keras以其用户友好和模块化设计简化了神经网络构建。通过一个手写数字识别的实战案例，展示了如何使用Keras加载MNIST数据集、构建CNN模型、训练及评估模型，并进行预测。案例详述了数据预处理、模型构建、训练过程和预测新图像的步骤，为读者提供TensorFlow和Keras的基础实践指导。

397 59 61

长梦

|

5月前

|

安全 Oracle Java

|

博文

Java一分钟之-GraalVM：高性能运行时与编译器

【6月更文挑战第12天】GraalVM是Oracle实验室的高性能运行时和编译器，支持Java、JavaScript等多语言，提供即时编译和提前编译技术，提升应用性能和跨语言互操作性。其核心亮点包括多语言支持、高性能、Native Image（AOT编译）和安全沙箱。常见问题涉及Native Image构建失败、反射与动态加载处理及资源消耗误解。解决这些问题需要详细阅读官方文档、利用GraalVM工具链和参考社区资源。通过Native Image，开发者可以构建接近零启动时间的原生应用。GraalVM是打破语言壁垒、提升应用效率的有力工具，随着生态发展，将在技术领域发挥更大作用。

131 1 1

长梦

|

5月前

|

缓存 NoSQL Java

|

博文

Java一分钟之-Spring Data Redis：使用Redis做缓存

【6月更文挑战第10天】Spring Data Redis是Spring框架的一部分，简化了Java应用与Redis的集成，支持多种数据结构操作。本文介绍了其基本使用，包括添加依赖、配置Redis连接及使用RedisTemplate。还讨论了常见问题，如序列化、缓存穿透和雪崩，并提供解决方案。通过实战示例展示了缓存与数据库读写分离的实现，强调了Spring Data Redis在提升系统性能中的作用。

205 0 0

郑小健

|

5月前

|

缓存监控 NoSQL

|

博文

Redis在减轻数据库压力中的关键角色

**摘要：** 本文介绍了Redis如何减轻数据库压力。Redis作为高性能内存数据库，利用其缓存热点数据、异步处理、分布式锁和数据聚合功能降低数据库负载。实践中，应合理设置缓存策略，优化数据结构和查询，监控告警并进行扩容容灾，以确保系统性能和稳定性。

188 4 4

李麒麟

|

5月前

|

机器学习/深度学习 Python

|

博文

tanh函数

本文探讨了高等数学中的tanh函数，即双曲正切函数，其定义为 $\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$，导数为 $1 - \tanh^2(x)$。tanh函数广泛适用于各类场景，并在神经网络中有重要应用。提供的Python代码绘制了tanh函数及其导数的图像。

134 1 1

李麒麟

|

5月前

|

数据库连接数据库数据安全/隐私保护

|

博文

FlaskMigrate使用指南

**Flask-Migrate** 是一个整合 Flask、SQLAlchemy 和 Alembic 的扩展，用于管理数据库迁移。安装所需库：`pip install Flask mysql-connector-python Flask-SQLAlchemy Flask-Migrate`。

161 0 0

张飞的猪

|

5月前

|

存储 SQL 消息中间件

|

博文

ClickHouse(12)ClickHouse合并树MergeTree家族表引擎之AggregatingMergeTree详细解析

AggregatingMergeTree是ClickHouse的一种表引擎，它优化了MergeTree的合并逻辑，通过将相同主键（排序键）的行聚合为一行并存储聚合函数状态来减少行数。适用于增量数据聚合和物化视图。建表语法中涉及AggregateFunction和SimpleAggregateFunction类型。插入数据需使用带-State-的聚合函数，查询时使用GROUP BY和-Merge-。处理逻辑包括按排序键聚合、在合并分区时计算、以分区为单位聚合等。常用于物化视图配合普通MergeTree使用。查阅更多资料可访问相关链接。

263 4 4

长梦

|

6月前

|

JSON 安全 JavaScript

|

博文

Java一分钟之-JSON处理：Gson与Jackson库

本文对比介绍了Java中常用的两个JSON库Gson和Jackson。Gson以其简洁易用和自动序列化/反序列化功能受到青睐，而Jackson则以优异性能和丰富功能（如字段忽略、日期格式化）著称。文中通过代码示例展示了两者的基本用法，并讨论了常见问题及解决策略，包括时间格式处理、循环引用和类型匹配。在实际应用中，应根据性能需求、安全性和版本兼容性选择合适的库，并遵循最佳实践。

182 0 0

blmdxiao

|

6月前

|

存储自然语言处理算法

|

博文

OpenIM Bot: 用LLM构建企业专属的智能客服

OpenIM Bot 通过结合LLM和RAG技术，构建企业专属的智能客服系统。该系统通过优化向量存储、混合检索和查询分析，解决了LLM的幻觉、新鲜度、token长度和数据安全问题，提升了用户体验。向量存储和预处理步骤确保文档高质量，而混合检索结合文本和语义搜索，增强了检索结果的准确性。通过迭代优化，OpenIM Bot 提供了高效、智能的支持服务，减轻了支持团队的负担，提升了问题解决效率。

793 3 3

来自：智能搜索推荐版块

CiiLii西里网

|

6月前

|

域名解析缓存安全

|

博文

cdn服务器连接异常怎么办

当遇到CDN服务器连接异常时，可采取以下步骤排查：检查CDN配置，包括域名解析和防火墙设置；清空CDN缓存；测试网络连接；确认源服务器状态；更换CDN服务器；等待恢复；联系服务商；检查本地电脑安全；检查程序代码；保持更新和维护。具体解决步骤需根据实际情况调整。

538 0 0

kng32f3vbngrm

|

6月前

|

存储传感器网络协议

|

博文

ClickHouse 数据类型、表引擎与TTL

ClickHouse数据类型包括UInt8、Int64等，对应Java的Short、Long等，支持数字、字符串、日期时间、数组、枚举、UUID和IP地址等多种类型。建表时需确定好数据类型，避免后期转换影响效率。不要使用Nullable类型，因其低效。合理设置分区和索引，避免轻量删除和修改操作。表引擎如TinyLog适合小规模数据，MergeTree适用于有序时间序列，ReplacingMergeTree用于替换更新数据，AggregatingMergeTree和SummingMergeTree做聚合计算，CollapsingMergeTree保留最新状态。

212 1 1

kng32f3vbngrm

|

6月前

|

SQL BI HIVE

|

博文

【5月更文挑战第13天】Java 8的`Optional`类旨在减少`NullPointerException`，提供优雅的空值处理。本文介绍`Optional`的基本用法、创建、常见操作，以及如何避免错误，如直接调用`get()`、误用`if (optional != null)`检查和过度使用`Optional`。正确使用`Optional`能提高代码可读性和健壮性，建议结合实际场景灵活应用。

243 3 3

长梦

|

6月前

|

安全 Java 开发者

|

博文

Java一分钟之-文件与目录操作：Path与Files类

【5月更文挑战第13天】Java 7 引入`java.nio.file`包，`Path`和`Files`类提供文件和目录操作。`Path`表示路径，不可变。`Files`包含静态方法，支持创建、删除、读写文件和目录。常见问题包括：忽略异常处理、路径解析错误和权限问题。在使用时，注意异常处理、正确格式化路径和考虑权限，以保证代码稳定和安全。结合具体需求，这些方法将使文件操作更高效。

163 2 2

灵杰开发者

|

6月前

|

存储分布式计算 Apache

|

博文

官宣｜Apache Paimon 毕业成为顶级项目，数据湖步入实时新篇章！

Apache Paimon 在构建实时数据湖与流批处理技术领域取得了重大突破，数据湖步入实时新篇章！

3114 6 6

来自：实时计算 Flink 版块

长梦

|

6月前

|

SQL 存储 NoSQL

|

博文

SQL vs. NoSQL：如何根据大数据需求选择合适数据库

【4月更文挑战第8天】本文对比分析了SQL与NoSQL数据库在大数据项目中的应用。SQL数据库适合结构化数据、强一致性和复杂事务处理，如金融系统，而NoSQL则适用于半结构化和非结构化数据、高并发及大数据场景，如社交网络。选择时应考虑业务需求、技术栈、团队经验和成本效益，以找到最佳解决方案。随着技术发展，NewSQL和Multi-model数据库也提供了更多选择。

384 0 0

长梦

|

6月前

|

SQL 分布式计算数据可视化

|

博文

Tableau与大数据：可视化工具在大数据分析中的应用

【4月更文挑战第8天】Tableau是一款领先的数据可视化工具，擅长于大数据分析，提供广泛的数据连接器，支持多源整合。它与Hadoop、Spark等深度集成，实现高效大数据处理。Tableau的拖拽式界面和交互式分析功能使得非技术人员也能轻松探索数据。在实战中，Tableau用于业务监控、数据storytelling和自助式分析，推动数据民主化，提升决策效率。未来，Tableau将持续创新，扩展生态系统，并保障数据安全与合规性，助力企业最大化数据价值。

330 0 0

Echo_Wish

|

6月前

|

Python

|

博文

使用Python实现基本的线性回归模型

224 8 9

长梦

|

6月前

|

缓存 JavaScript 前端开发

|

博文

JavaScript中DOM操作：新手常犯错误与避免策略

【4月更文挑战第1天】本文介绍了JavaScript中DOM操作的基础和新手常犯错误，包括频繁查询DOM、不恰当的遍历、滥用innerHTML、忽视异步与DOM状态以及过度同步更新。建议包括缓存DOM引用、注意文本节点、慎用innerHTML以防止XSS、正确处理异步和批量更新。遵循最佳实践，开发者能提升代码质量和应用性能。

167 2 2

嘟嘟嘟嘟嘟嘟

|

6月前

|

消息中间件关系型数据库 Kafka

|

博文

flink cdc 数据问题之数据丢失如何解决

Flink CDC（Change Data Capture）是一个基于Apache Flink的实时数据变更捕获库，用于实现数据库的实时同步和变更流的处理；在本汇总中，我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答，目的是辅助用户更好地理解和应用这一技术，优化实时数据处理流程。

549 0 0

来自：实时计算 Flink 版块

Echo_Wish

|

6月前

|

机器学习/深度学习算法 Python

|

博文

CatBoost中级教程：自动分类特征处理

CatBoost中级教程：自动分类特征处理【2月更文挑战第9天】

354 1 1

三分钟热度的鱼

|

6月前

|

SQL Prometheus Cloud Native

|

博文

Flink启动问题之job启动失败如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

448 1 1

来自：实时计算 Flink 版块

实时数仓Hologres团队

|

6月前

|

存储运维监控

|

博文

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

通过对各个业务线实时需求的调研了解到，当前实时数据处理场景是各个业务线基于Java服务独自处理的。各个业务线实时能力不能复用且存在计算资源的扩展性问题，而且实时处理的时效已不能满足业务需求。鉴于当前大数据团队数据架构主要解决离线场景，无法承接更多实时业务，因此我们需要重新设计整合，从架构合理性，复用性以及开发运维成本出发，建设一套通用的大数据实时数仓链路。本次实时数仓建设将以游戏运营业务为典型场景进行方案设计，综合业务时效性、资源成本和数仓开发运维成本等考虑，我们最终决定基于Flink + Hudi + Hologres来构建阿里云云原生实时湖仓，并在此文中探讨实时数据架构的具体落地实践。

132459 94 97

来自：实时数仓 Hologres 版块

长梦

|

6月前

|

安全前端开发中间件

|

博文

Python面试题：Django Web框架基础与进阶

【4月更文挑战第17天】本文详细梳理了Django面试中常考的基础和进阶问题，包括MTV架构、ORM、数据库迁移、视图模板、中间件、信号、表单验证、用户认证授权等，并指出易错点及规避策略。提供代码示例展示模型和视图的实现，助力开发者在面试中脱颖而出。

223 12 12

Deephub

|

6月前

|

机器学习/深度学习算法数据挖掘

|

博文

使用MICE进行缺失值的填充处理

在我们进行机器学习时，处理缺失数据是非常重要的，因为缺失数据可能会导致分析结果不准确，严重时甚至可能产生偏差。处理缺失数据是保证数据分析准确性和可靠性的重要步骤，有助于确保分析结果的可信度和可解释性。

248 2 2

Echo_Wish

|

6月前

|

机器学习/深度学习算法测试技术

|

博文

OpenAI Gym 中级教程——环境定制与创建

227 0 0

疯狂的猿

|

6月前

|

分布式计算资源调度 Hadoop

|

博文

在Linux系统上安装Hadoop的详细步骤

【1月更文挑战第4天】在Linux系统上安装Hadoop的详细步骤

784 0 0

Lwcah

|

6月前

|

机器学习/深度学习算法

|

博文

【MATLAB】MVMD_LSTM神经网络时序预测算法

102 1 1

灵杰开发者

|

6月前

|

Cloud Native Apache 流计算

|

博文

福利「Flink Forward Asia 2023 」PPT 阅读合集！

3075 1 3

来自：实时计算 Flink 版块

Echo_Wish

|

6月前

|

存储数据库索引

|

博文

Python高级数据结构——B树和B+树

170 1 2

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

云上大数据分析平台：赋能企业决策，挖掘数据金矿

基于kalman滤波的UAV三维轨迹跟踪算法matlab仿真

ERP系统中的库存周转率优化与管理解析

ERP系统中的供应链风险管理与应对策略解析

ERP系统中的生产调度与计划排程解析

多模态RAG：三步构建图文并茂的智能问答、电商导购助手

如何解决ChromeDriver 126找不到chromedriver.exe问题

实时计算 Flink版产品使用问题之如何使用Flink SQL连接带有Kerberos认证的Hive

数据为王！深度挖掘天猫商品详情接口，赋能电商运营新策略

Python实现支持向量机SVM回归模型(SVR算法)项目实战

60分钟深度测评阿里云基于大模型构建的操作系统智能助手

​「Python大数据」LDA主题分析模型

「AIGC」NodeJs使用openai流式请求与非流式请求

彻底搞懂Kafka生产消费流程，这篇文章就够了！

豆瓣电影Top250的可视化分析

MaxCompute产品使用问题之如何对现有的非分区表数据进行分区处理

TensorFlow与Keras实战：构建深度学习模型

Java一分钟之-GraalVM：高性能运行时与编译器

Java一分钟之-Spring Data Redis：使用Redis做缓存

Redis在减轻数据库压力中的关键角色

tanh函数

FlaskMigrate使用指南

ClickHouse(12)ClickHouse合并树MergeTree家族表引擎之AggregatingMergeTree详细解析

Java一分钟之-JSON处理：Gson与Jackson库

OpenIM Bot: 用LLM构建企业专属的智能客服

cdn服务器连接异常怎么办

ClickHouse 数据类型、表引擎与TTL

【Hive SQL 每日一题】统计用户留存率

实时计算 Flink版操作报错之抽取Oracle11g时，报错： "Retrieve schema history failed, the schema records for engine ... has been removed"，怎么处理

实时计算 Flink版产品使用合集之如何确保从Kafka读取的数据有序

实时计算 Flink版操作报错合集之报错：WARN (org.apache.kafka.clients.consumer.ConsumerConfig:logUnused)这个错误如何解决

实时计算 Flink版操作报错合集之Flink sql-client 针对kafka的protobuf格式数据建表，报错：java.lang.ClassNotFoundException 如何解决

Java一分钟之-Optional类：优雅处理null值

Java一分钟之-文件与目录操作：Path与Files类

官宣｜Apache Paimon 毕业成为顶级项目，数据湖步入实时新篇章！

SQL vs. NoSQL：如何根据大数据需求选择合适数据库

Tableau与大数据：可视化工具在大数据分析中的应用

使用Python实现基本的线性回归模型

JavaScript中DOM操作：新手常犯错误与避免策略

flink cdc 数据问题之数据丢失如何解决

CatBoost中级教程：自动分类特征处理

Flink启动问题之job启动失败如何解决

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

Python面试题：Django Web框架基础与进阶

使用MICE进行缺失值的填充处理

OpenAI Gym 中级教程——环境定制与创建

在Linux系统上安装Hadoop的详细步骤

【MATLAB】MVMD_LSTM神经网络时序预测算法

福利「Flink Forward Asia 2023 」PPT 阅读合集！

Python高级数据结构——B树和B+树

大数据与机器学习

活跃用户

相关产品

「Python大数据」LDA主题分析模型