大数据与机器学习-博文-第25页-阿里云开发者社区

啦啦啦191

|

10月前

|

消息中间件监控 Java

|

博文

借助最新技术构建 Java 邮件发送功能的详细流程与核心要点分享 Java 邮件发送功能

本文介绍了如何使用Spring Boot 3、Jakarta Mail、MailHog及响应式编程技术构建高效的Java邮件发送系统，涵盖环境搭建、异步发送、模板渲染、测试与生产配置，以及性能优化方案，助你实现现代化邮件功能。

705 0 0

灵杰开发者

|

10月前

|

人工智能运维自然语言处理

|

博文

如何在 Elasticsearch 中构建你的智能 AI 助手？

本文将带你探索一种全新的思路：如何基于 Elasticsearch 快速构建一个具备自然语言理解能力、异常检测和安全威胁识别能力的智能运维 AI 助手。文章会围绕实际部署流程、关键技术点和典型应用场景展开，帮助你把 Elasticsearch 从“日志仓库”升级为“智能决策中枢”。

532 30 30

来自：检索分析服务 Elasticsearch版版块

Deephub

|

10月前

|

存储缓存 API

|

博文

信息检索重排序技术深度解析：Cross-Encoders、ColBERT与大语言模型方法的实践对比

本文将深入分析三种主流的重排序技术：Cross-Encoders（交叉编码器）、ColBERT以及基于大语言模型的重排序器，并详细阐述各方案在实际应用中的性能表现、成本考量以及适用场景。

863 3 3

小白学大数据

|

11月前

|

数据采集存储 API

|

博文

Python爬虫结合API接口批量获取PDF文件

914 0 0

Aron_NeAr

|

11月前

|

SQL 分布式计算 API

|

博文

Apache Spark 是一个开源、分布式计算引擎，专为大规模数据处理设计。它以高速、易用和通用为核心目标。通过内存计算、DAG 执行引擎和惰性求值等特性，大幅提升数据处理效率。其核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLlib 和 GraphX，支持批处理、实时流处理、机器学习和图计算。Spark 提供统一编程模型，支持多语言（Scala/Java/Python/R），并拥有强大的 Catalyst 优化器和类型安全的 Dataset API，广泛应用于大数据分析和处理场景。

1417 8 8

djy3xngakhsl4

|

12月前

|

人工智能 JSON 安全

|

博文

VIN码查询_标准版API:帮助解锁车辆的“身份证”详细信息的实战指南

VIN码（车辆识别号码）是由17位字母和数字组成的全球唯一编码，相当于汽车的“身份证”。通过解析VIN码，可获取品牌、车系、生产年份等关键信息。探数API平台的VIN码查询API（标准版），只需输入VIN码即可返回完整车辆配置信息。该API适用于多种场景：电商平台可自动填充商品详情，提升准确性；维修行业能精准匹配零件与诊断需求；二手车市场则增强交易透明度与安全性。其调用流程简单，包括准备VIN码、构造请求、处理响应及异常处理。 VIN码不仅是查询工具，更是连接制造、销售、维修、保险等环节的纽带。

1089 6 6

小白学大数据

|

Web App开发数据采集 JavaScript

|

博文

动态网页爬取：Python如何获取JS加载的数据？

1774 58 58

Deephub

|

数据采集安全数据挖掘

|

博文

Pandas数据合并：10种高效连接技巧与常见问题

在数据分析中，数据合并是常见且关键的步骤。本文针对合并来自多个来源的数据集时可能遇到的问题，如列丢失、重复记录等，提供系统解决方案。基于对超1000个复杂数据集的分析经验，总结了10种关键技术，涵盖Pandas库中`merge`和`join`函数的使用方法。内容包括基本合并、左连接、右连接、外连接、基于索引连接、多键合并、数据拼接、交叉连接、后缀管理和合并验证等场景。通过实际案例与技术原理解析，帮助用户高效准确地完成数据整合任务，提升数据分析效率。

1079 13 13

DataWorks@佳里

|

存储人工智能监控

|

博文

通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统

阿里云向量检索服务Milvus版是一款全托管向量检索引擎，并确保与开源Milvus的完全兼容性，支持无缝迁移。它在开源版本的基础上增强了可扩展性，能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警，Milvus云服务成为多样化AI应用场景的理想选择，包括多模态搜索、检索增强生成（RAG）、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作，进一步促进应用的快速开发和部署。

1446 4 4

来自：向量检索服务 Milvus 版版块

CiiLii西里网

|

Ubuntu Linux Windows

|

博文

Ventoy 是一款开源的多系统启动U盘工具

Ventoy是一款开源多系统启动U盘工具，支持Legacy BIOS和UEFI模式，可直接启动多个ISO文件（无需解压），兼容Windows、Linux等系统。只需下载安装Ventoy到U盘，拷贝ISO文件即可实现多系统启动。官网：https://www.ventoy.net，GitHub：https://github.com/ventoy/Ventoy。制作需8GB以上U盘及Win7以上系统。

2315 154 154

来自：检索分析服务 Elasticsearch版版块

Deephub

|

人工智能编解码自然语言处理

|

博文

VideoMind：Chain-of-LoRA突破时间盲区让AI真正看懂长视频

VideoMind是一种新型视频语言代理，专为解决长视频时间定位理解挑战设计。它通过“Chain-of-LoRA”技术结合四个专业角色（Planner、Grounder、Verifier、Answerer）实现高效推理。Planner分析查询并制定计划；Grounder精确定位视频时刻；Verifier验证候选时刻准确性；Answerer生成最终答案。此架构在14个公共基准上表现出色，尤其在长视频定位任务中超越了现有模型，同时保持高内存效率。VideoMind推动了多模态AI的发展，提供了解决复杂视频理解问题的新方法。

10819 5 6

Echo_Wish

|

数据采集机器学习/深度学习存储

|

博文

可穿戴设备如何重塑医疗健康：技术解析与应用实战

742 4 4

软件算法开发

|

算法数据安全/隐私保护

|

博文

泵浦光与斯托克斯光相遇耦合效应的matlab模拟与仿真

本程序使用MATLAB2022A模拟泵浦光与斯托克斯光在非线性光学材料中的耦合效应，基于拉曼散射原理。通过非线性薛定谔方程描述两者相互作用，实现能量转换与放大。核心代码展示了时间与距离上的光强变化，最终生成动态图像展示耦合过程。完整程序无水印，运行结果如附图所示。该仿真有助于理解非线性光学现象及其应用。

518 14 14

winx_19970108018

|

算法 API 数据安全/隐私保护

|

博文

淘宝商品详情 API 接口（淘宝 API 系列）

淘宝商品详情API接口为电商从业者、数据分析师及开发者提供获取淘宝商品详细信息的便捷途径。该接口涵盖商品名称、价格、图片、描述、用户评价等多维度数据，助力市场分析与应用开发。严格的权限管理和灵活的请求方式确保数据安全和高效获取。Python示例代码展示了如何通过API获取特定商品的详情信息，包括构建请求参数、生成签名及处理响应结果。供稿：Taobaoapi2014 接口特点： - **丰富的数据内容**：提供商品基础信息、价格、图片、描述及用户评价。 - **多种请求方式**：支持GET和POST请求，灵活设置参数满足不同需求。

420 0 0

winx_19970108018

|

JSON API 数据格式

|

博文

携程网获取景点列表 API 接口（携程 API 系列）

携程作为国内知名的在线旅游服务提供商，其景点列表API对接口功能、参数和返回格式进行了详细定义。该接口可获取景点基本信息（名称、地区、开放时间等），支持条件筛选查询（如按地区、评分、价格区间等）。接口返回JSON或XML格式数据，并设有调用限制以确保系统稳定性和数据安全。虽然携程未公开免费API，开发者可通过商务合作申请权限。以下为模拟Python请求示例，展示了如何使用该接口获取景点信息。代码示例中，通过`requests.get()`发送GET请求，设置请求参数（如地区、门票价格等）和请求头（模拟浏览器访问），并处理响应数据。实际应用需替换为真实的接口URL，并遵循携程官方文档要求。

3058 0 0

邂逅惊鸿

|

UED

|

博文

产品经理-用户体验五要素 - AxureMost

《用户体验五要素》介绍了构建成功用户体验设计的五个层面：战略层、范围层、结构层、框架层和表现层。战略层明确产品目标与用户需求；范围层定义功能和内容需求；结构层规划交互与信息架构；框架层设计界面、导航和信息布局；表现层则通过视觉设计创造感知体验。每一层都依赖于其下一层，形成自下而上的连锁效应，确保各要素相互作用，共同实现用户体验目标。

1628 13 13

winx_19970108018

|

JSON 监控 API

|

博文

虾皮（shopee）商品列表接口（虾皮API 系列）

虾皮（Shopee）是东南亚及台湾地区的知名电商平台，提供丰富的商品数据。通过其API接口，开发者可合法获取商品列表信息，包括商品ID、名称、价格等，支持按分类、关键词、价格范围等条件筛选。Python示例代码展示了如何使用API进行请求，并解析返回的JSON数据。应用场景涵盖市场调研、竞品分析、选品决策、价格监控及数据可视化，帮助电商从业者和分析师更好地理解市场动态，优化运营策略。

1069 6 6

wiker24

|

数据采集存储安全

|

博文

【大数据】数据治理浅析

数据治理是数字化时代企业管理和利用数据的核心手段，确保数据的准确性、一致性和安全性。从基本概念、应用场景、必要性、需求分析等方面深入探讨其功能架构、技术架构、应用架构和数据架构，涵盖金融、医疗、应急管理等多个领域典型案例。随着政策法规推动、技术创新助力及市场需求增长，数据治理正朝着自动化、智能化方向发展，市场规模不断扩大，但人才短缺问题仍需解决。

1893 11 12

申某某

|

数据处理数据安全/隐私保护流计算

|

博文

Flink 三种时间窗口、窗口处理函数使用及案例

Flink 是处理无界数据流的强大工具，提供了丰富的窗口机制。本文介绍了三种时间窗口（滚动窗口、滑动窗口和会话窗口）及其使用方法，包括时间窗口的概念、窗口处理函数的使用和实际案例。通过这些机制，可以灵活地对数据流进行分析和计算，满足不同的业务需求。

1909 27 28

来自：实时计算 Flink 版块

申某某

|

SQL 存储缓存

|

博文

Flink SQL Deduplication 去重以及如何获取最新状态操作

Flink SQL Deduplication 是一种高效的数据去重功能，支持多种数据类型和灵活的配置选项。它通过哈希表、时间窗口和状态管理等技术实现去重，适用于流处理和批处理场景。本文介绍了其特性、原理、实际案例及源码分析，帮助读者更好地理解和应用这一功能。

1370 14 14

来自：实时计算 Flink 版块

API小知识

|

JSON API 数据格式

|

博文

如何使用Python开发1688商品详情API接口？

本文介绍了如何使用Python开发1688商品详情API接口，获取商品的标题、价格、销量和评价等详细信息。主要内容包括注册1688开放平台账号、安装必要Python模块、了解API接口、生成签名、编写Python代码、解析返回数据以及错误处理和日志记录。通过这些步骤，开发者可以轻松地集成1688商品数据到自己的应用中。

505 1 1

Deephub

|

存储人工智能自然语言处理

|

博文

Github上的十大RAG(信息检索增强生成)框架

信息检索增强生成（RAG）是一种结合了检索系统和生成模型优势的技术，能够显著提升大型语言模型的性能。RAG通过从外部知识库中检索相关信息，增强模型的输入，从而生成更加准确、符合上下文、实时更新的响应。GitHub上涌现出多个开源RAG框架，如Haystack、RAGFlow、txtai等，每个框架都有独特的功能和特性，适用于不同的应用场景。这些框架不仅提高了模型的准确性和可靠性，还增强了过程的透明度和可解释性。

2385 2 2

想飞的雪糕

|

机器学习/深度学习弹性计算人工智能

|

博文

大模型进阶微调篇（三）：微调GPT2大模型实战

本文详细介绍了如何在普通个人电脑上微调GPT2大模型，包括环境配置、代码实现和技术要点。通过合理设置训练参数和优化代码，即使在无独显的设备上也能完成微调，耗时约14小时。文章还涵盖了GPT-2的简介、数据集处理、自定义进度条回调等内容，适合初学者参考。

3104 6 7

来自：人工智能平台PAI 版块

Deephub

|

机器学习/深度学习自然语言处理算法

|

博文

数据准备指南：10种基础特征工程方法的实战教程

在数据分析和机器学习中，从原始数据中提取有价值的信息至关重要。本文详细介绍了十种基础特征工程技术，包括数据插补、数据分箱、对数变换、数据缩放、One-Hot编码、目标编码、主成分分析（PCA）、特征聚合、TF-IDF 和文本嵌入。每种技术都有具体应用场景和实现示例，帮助读者更好地理解和应用这些方法。通过合理的特征工程，可以显著提升模型的性能和预测能力。

1146 3 4

郑小健

|

安全网络安全 Android开发

|

博文

深度解析：利用Universal Links与Android App Links实现无缝网页至应用跳转的安全考量

【10月更文挑战第2天】在移动互联网时代，用户经常需要从网页无缝跳转到移动应用中。这种跳转不仅需要提供流畅的用户体验，还要确保安全性。本文将深入探讨如何利用Universal Links（仅限于iOS）和Android App Links技术实现这一目标，并分析其安全性。

2598 0 0

阿里云大数据Al技术

|

人工智能分布式计算大数据

|

博文

AI Native平台，跨越AI应用从创新到生产的鸿沟

2024年是AI应用的元年，以大模型为中心的 AI Native 应用大爆发正在从理想变成现实。云计算带来的应用创新潮，经历了虚拟机时代和云原生时代，正在全面拥抱以大模型为核心的 AI Native 阶段，推动大数据与AI的工作流前所未有地紧密结合。领先大模型、高效的AI计算平台和统一的大数据平台是 AI Native 应用广泛落地背后不可获缺的要素。 9月20日，2024云栖大会上，阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布大数据AI平台全面升级，为 AI Native 应用大爆发提供坚实的平台支撑。

2287 4 5

来自：人工智能平台PAI 版块

郑小健

|

机器学习/深度学习 PyTorch 算法框架/工具

|

博文

数据平衡与采样：使用 DataLoader 解决类别不平衡问题

【8月更文第29天】在机器学习项目中，类别不平衡问题非常常见，特别是在二分类或多分类任务中。当数据集中某个类别的样本远少于其他类别时，模型可能会偏向于预测样本数较多的类别，导致少数类别的预测性能较差。为了解决这个问题，可以采用不同的策略来平衡数据集，包括过采样（oversampling）、欠采样（undersampling）以及合成样本生成等方法。本文将介绍如何利用 PyTorch 的 `DataLoader` 来处理类别不平衡问题，并给出具体的代码示例。

3334 2 2

郑小健

|

机器学习/深度学习边缘计算 PyTorch

|

博文

PyTorch 与边缘计算：将深度学习模型部署到嵌入式设备

【8月更文第29天】随着物联网技术的发展，越来越多的数据处理任务开始在边缘设备上执行，以减少网络延迟、降低带宽成本并提高隐私保护水平。PyTorch 是一个广泛使用的深度学习框架，它不仅支持高效的模型训练，还提供了多种工具帮助开发者将模型部署到边缘设备。本文将探讨如何将PyTorch模型高效地部署到嵌入式设备上，并通过一个具体的示例来展示整个流程。

4112 1 1

阿里云大数据Al技术

|

人工智能分布式计算数据处理

|

博文

Big Data for AI实践：面向AI大模型开发和应用的大规模数据处理套件

文叙述的 Big Data for AI 最佳实践，基于阿里云人工智能平台PAI、MaxCompute自研分布式计算框架MaxFrame、Data-Juicer等产品和工具，实现了大模型数据采集、清洗、增强及合成大模型数据的全链路，解决企业级大模型开发应用场景的数据处理难题。

2487 7 8

来自：人工智能平台PAI 版块

mwlwop5lh2fhq

|

机器学习/深度学习人工智能自动驾驶

|

博文

AI的奇思妙想之旅：探索未来的无限可能

人工智能（AI）正迅速变革世界，从自动驾驶到智能助手，乃至艺术创作领域。AI不仅能生成多样风格的艺术品，还能创造新艺术形式。例如，利用Python和深度学习库可将普通照片转化为梵高风格的画作。此外，AI还助力建筑设计，通过生成对抗网络（GAN）快速生成建筑草图。在医疗领域，AI支持个性化医疗决策，如通过随机森林算法预测心脏病风险。AI不仅象征技术飞跃，更预示着未来生活的无限可能。

559 2 2

nsu_xxy

|

机器学习/深度学习人工智能算法

|

博文

解决方案评测：通义万相 AI 绘画创作

通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色，为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处，但随着技术的不断发展和优化，相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说，通义万相都是一款值得尝试和探索的 AI 绘画工具。

1563 4 5

winx_19970108018

|

数据采集 API 开发者

|

博文

爬虫：闲鱼商品详情数据接口（goodfish.item_get）

闲鱼的`goodfish.item_get`非官方API，其数据接口多为私有，适用于授权合作伙伴。获取商品详情数据可考虑官方合作、网络爬虫（需遵守反爬政策）、第三方API服务或直接联系闲鱼官方。合法合规使用数据至关重要。

1825 0 0

阿里云大数据Al技术

|

人工智能自然语言处理算法

|

博文

阿里云PAI大模型评测最佳实践

在大模型时代，模型评测是衡量性能、精选和优化模型的关键环节，对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景，如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型，如何实现更全面准确且具有针对性的模型评测，从而在AI领域可以更好地取得成就。

43241 15 19

来自：人工智能平台PAI 版块

Deephub

|

机器学习/深度学习自然语言处理索引

|

博文

Moirai：Salesforce的时间序列预测基础模型

过去几个月，时间序列基础模型发展迅速，包括TimeGPT、Lag-Llama、Google的TimesFM、Amazon的Chronos和Salesforce的Moirai。本文聚焦于Moirai，这是一个用于时间序列预测的通用模型，尤其强调零样本推理能力。Moirai处理各种数据频率、适应未知协变量并生成概率预测。文章介绍了Moirai的三个关键特性：多尺寸补丁投影层、任意变量注意力和混合分布。此外，还对比了Moirai与Chronos和TimeGPT，发现Moirai在性能上未超越Chronos，后者在数据效率上更优，但不支持多变量预测。

1379 2 2

winx_19970108018

|

API 开发者

|

博文

1688API接口推荐：1688口令转换真实链接接口

1688平台的item_password接口用于将淘口令短链接转为商品链接。开发者需注册获取API key和secret，通过POST或GET请求接口，输入淘口令代码和参数，返回结果包含商品ID和详细链接。商品详情可进一步通过商品详情接口获取。注意遵守1688平台的规定和条款，确保合法使用API。

1089 0 0

来自：开源大数据平台 E-MapReduce 版块

楠竹11

|

人工智能搜索推荐算法

|

博文

以ChatGPT为代表的AIGC发展现状

【1月更文挑战第17天】以ChatGPT为代表的AIGC发展现状

594 1 1

Deephub

|

存储自然语言处理算法

|

博文

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

在2022年11月OpenAI的ChatGPT发布之后，大型语言模型(llm)变得非常受欢迎。从那时起，这些语言模型的使用得到了爆炸式的发展，这在一定程度上得益于HuggingFace的Transformer库和PyTorch等库。

702 3 3

机器智能社区

|

机器学习/深度学习人工智能 API

|

博文

OpenSPG 新版发布：新增大模型知识抽取，3 步快速搭建专属知识图谱

OpenSPG 新版发布，支持大模型增强的图谱构建，仅需 3 个步骤快速搭建专属知识图谱。

1723 1 1

Lwcah

|

机器学习/深度学习算法数据挖掘

|

博文

【MATLAB 】RBF径向基神经网络回归预测

934 0 0

theMilkyWay`

|

机器学习/深度学习移动开发自然语言处理

|

博文

循环神经网络(RNN)、门控循环单元（GRU）、长短期记忆(LSTM)

1990 0 0

奔跑的数据

|

数据采集存储安全

|

博文

利用爬虫技术自动化采集汽车之家的车型参数数据

汽车之家是一个专业的汽车网站，提供了丰富的汽车信息，包括车型参数、图片、视频、评测、报价等。如果我们想要获取这些信息，我们可以通过浏览器手动访问网站，或者利用爬虫技术自动化采集数据。本文将介绍如何使用Python编写一个简单的爬虫程序，实现对汽车之家的车型参数数据的自动化采集，并使用亿牛云爬虫代理服务来提高爬虫的稳定性和效率。

1307 0 0

aliyun8832924060

|

分布式计算 Hadoop 大数据

|

博文

大数据技术解析：Hadoop、Spark、Flink和数据湖的对比

Hadoop、Spark、Flink 和数据湖都在大数据处理领域有着重要的地位，但它们各自的优势和劣势也需考虑实际应用场景。Hadoop 适用于批处理任务，Spark 更适合实时分析，而 Flink 则强调低延迟的流式处理。数据湖则是存储和管理大规模多样性数据的选择。

2787 1 1

北村南

|

小程序定位技术 vr&ar

|

博文

【微信小程序AR】基于Kivicube零代码实现微信小程序AR

话不多说，先看实现效果作者之前尝试过Apple公司的ARkit、Google公司的ARCore以及国产的EasyAR和SenseAR。Apple公司和Google公司的AR产品是市面上的主流，功能非常的完善，基本可以满足所有的程序载体，但是开发门槛非常的高。国内这两款AR产品还不错，但是主要针对的是WebAR，在微信小程序上功能不是很完善，作者在网上查找资源后发现国内弥知科技公司的Kivicube产品完美的适配于微信小程序，而且几乎上是零代码。非常适合小白新手。

1944 0 0

北村南

|

索引

|

博文

【Pytorch--代码技巧】各种论文代码常见技巧

博主在阅读论文原代码的时候常常看见一些没有见过的代码技巧，特此将这些内容进行汇总

725 0 0

阿里云大数据Al技术

|

存储机器学习/深度学习人工智能

|

博文

【DSW Gallery】DSW基础使用介绍

PAI-DSW是一款云端机器学习开发IDE，为您提供交互式编程环境，适用于不同水平的开发者。本文为您介绍PAI-DSW的功能特点以及界面的基础使用。

3014 0 0

来自：人工智能平台PAI 版块

阿里云大数据Al技术

|

存储机器学习/深度学习分布式计算

|

博文

【DSW Gallery】COMMON_IO使用指南

COMMON_IO模块提供了TableReader和TableWriter两个接口，使用TableReader可以读取ODPS Table中的数据，使用TableWriter可以将数据写入ODPS Table。

5526 0 0

来自：人工智能平台PAI 版块

dataworks_demo21

|

存储数据采集人工智能

|

博文

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

从2016年诞生起，“中台”概念就一路火热至今，对互联网与金融行业数字化转型产生了极为深远的影响。作为“中台”概念的提出者和先行者，阿里巴巴用12年的实践探索了中台能力建设和数据应用。在不断升级和重构的过程中，阿里巴巴的中台建设经历了从分散的数据分析到数据中台化能力整合，再到全局数据智能化的时代。

11938 8 15

来自：大数据开发治理DataWorks 版块

May-Hologres

|

存储分布式计算 Cloud Native

|

博文

Hologres揭秘：高性能原生加速MaxCompute核心原理

Hologres技术揭秘系列持续更新中，本期我们将带来Hologres高性能原生加速查询MaxCompute的技术原理解析。

8314 2 6

来自：实时数仓 Hologres 版块

孟硕(千澍)

|

存储机器学习/深度学习分布式计算

|

博文

持续定义Saas模式云数据仓库+实时搜索

本文由阿里云计算平台事业部 MaxCompute 产品经理孟硕为大家带来《持续定义Saas模式云数据仓库+实时搜索》的相关分享。以下是视频内容精华整理，主要包括以下三个部分：1.Why：概述与价值；2.What：应用场景；3.How：最佳实践。

20922 0 0

来自：大数据计算 MaxCompute 版块

大数据史记

|

存储容灾大数据

|

博文

分布式存储系统

本次分享内容主要包括三部分：（一）分布式存储系统应该具备的能力；（二）阿里云分布式存储系统盘古的介绍；（三）分布式系统技术展望。

12981 0 1

来自：大数据计算 MaxCompute 版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

借助最新技术构建 Java 邮件发送功能的详细流程与核心要点分享 Java 邮件发送功能

如何在 Elasticsearch 中构建你的智能 AI 助手？

信息检索重排序技术深度解析：Cross-Encoders、ColBERT与大语言模型方法的实践对比

Python爬虫结合API接口批量获取PDF文件

Apache Spark详解

VIN码查询_标准版API:帮助解锁车辆的“身份证”详细信息的实战指南

动态网页爬取：Python如何获取JS加载的数据？

Pandas数据合并：10种高效连接技巧与常见问题

通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统

Ventoy 是一款开源的多系统启动U盘工具

VideoMind：Chain-of-LoRA突破时间盲区让AI真正看懂长视频

可穿戴设备如何重塑医疗健康：技术解析与应用实战

泵浦光与斯托克斯光相遇耦合效应的matlab模拟与仿真

淘宝商品详情 API 接口（淘宝 API 系列）

携程网获取景点列表 API 接口（携程 API 系列）

产品经理-用户体验五要素 - AxureMost

虾皮（shopee）商品列表接口（虾皮API 系列）

【大数据】数据治理浅析

Flink 三种时间窗口、窗口处理函数使用及案例

Flink SQL Deduplication 去重以及如何获取最新状态操作

如何使用Python开发1688商品详情API接口？

Github上的十大RAG(信息检索增强生成)框架

大模型进阶微调篇（三）：微调GPT2大模型实战

数据准备指南：10种基础特征工程方法的实战教程

深度解析：利用Universal Links与Android App Links实现无缝网页至应用跳转的安全考量

AI Native平台，跨越AI应用从创新到生产的鸿沟

数据平衡与采样：使用 DataLoader 解决类别不平衡问题

PyTorch 与边缘计算：将深度学习模型部署到嵌入式设备

Big Data for AI实践：面向AI大模型开发和应用的大规模数据处理套件

AI的奇思妙想之旅：探索未来的无限可能

解决方案评测：通义万相 AI 绘画创作

爬虫：闲鱼商品详情数据接口（goodfish.item_get）

阿里云PAI大模型评测最佳实践

Moirai：Salesforce的时间序列预测基础模型

1688API接口推荐：1688口令转换真实链接接口

以ChatGPT为代表的AIGC发展现状

Tokenization 指南：字节对编码，WordPiece等方法Python代码详解

OpenSPG 新版发布：新增大模型知识抽取，3 步快速搭建专属知识图谱

【MATLAB 】RBF径向基神经网络回归预测

循环神经网络(RNN)、门控循环单元（GRU）、长短期记忆(LSTM)

利用爬虫技术自动化采集汽车之家的车型参数数据

大数据技术解析：Hadoop、Spark、Flink和数据湖的对比

【微信小程序AR】基于Kivicube零代码实现微信小程序AR

【Pytorch--代码技巧】各种论文代码常见技巧

【DSW Gallery】DSW基础使用介绍

【DSW Gallery】COMMON_IO使用指南

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

Hologres揭秘：高性能原生加速MaxCompute核心原理

持续定义Saas模式云数据仓库+实时搜索

分布式存储系统

大数据与机器学习

活跃用户

相关产品