分布式计算的搜索结果_第3页-阿里云开发者社区

阿里云大数据

|

5天前

|

博文

|

来自：大数据与机器学习

阿里云大数据AI产品月刊-2025年11月

大数据& AI 产品技术月刊【2025年 11 月】，涵盖 11 月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

# SQL # 人工智能 # 分布式计算 # 大数据 # MaxCompute

renqun_gw_fufei

|

5天前

|

博文

MaxCompute SQL AI 实战案例征集令：用SQL玩转人工智能，赢取丰厚奖励！

阿里云MaxCompute发起「SQL AI实战案例」征集，聚焦SQL与AI深度融合，征集电商、金融、医疗、工业等领域的创新实践。要求案例具备技术融合性、业务落地性与行业代表性，展现SQL驱动AI的创新应用。

# SQL # 机器学习/深度学习 # 人工智能 # 分布式计算 # MaxCompute

江佳豪

|

5天前

|

博文

如何做好SQL质量监控

SLS推出SQL质量监控功能，集成于CloudLens for SLS，从健康分、服务指标、运行明细、SQL Pattern及优化建议五大维度，助力用户全面掌握SQL使用情况，提升查询效率与资源管理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

霖玉

|

5天前

|

博文

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据场景，如搜索引擎需处理万亿级网页，倒排索引远超内存容量。本文介绍通过分治思想将文档集拆分为小块，在内存中构建局部倒排索引，再写入磁盘生成有序临时文件，最后利用多路归并技术合并为全局倒排索引。该过程可迁移至MapReduce框架实现分布式加速。检索时，优先将词典加载至内存（如哈希表或FST），结合B+树或跳表等结构高效访问磁盘中的posting list，辅以缓存优化IO。核心理念是“数据尽量入内存”与“分而治之”，兼顾效率与扩展性。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

阿里云大数据

|

6天前

|

博文

|

来自：大数据与机器学习

活动报名 | Apache Spark Meetup · 上海站，助力企业构建高效数据平台

2025年12月20日，上海 · 阿里巴巴徐汇滨江园区，Apache Spark Meetup 助力企业构建高效数据平台，欢迎报名！

# 开源大数据平台 E-MapReduce # 分布式计算 # Serverless # 数据处理 # Apache # Spark

Echo_Wish