自然语言处理的搜索结果_文章_第14页-阿里云开发者社区

32ea2c6h24f0eeLvbTg

|

6天前

|

博文

|

阿里云百炼是什么？阿里云百炼是阿里云推出的一站式大模型开发与应用平台，于 2023 年 10 月发布，后续历经多次升级，成为承载阿里云云 + AI 能力的核心平台，面向企业、开发者及 ISV 技术人员，提供从模型调用到应用构建的全链路服务。阿里云百炼提供两个核心登录入口，分别对应平台介绍与后台管理功能，开发者可通过对应链接访问相关服务，完成大模型体验与 API 调用操作。

# 大模型服务平台百炼 # 人工智能 # 运维 # 自然语言处理 # API # 开发者

modelscope

|

6天前

|

博文

|

来自： ModelScope模型即服务

智谱开源GLM-ASR：动动嘴，活就干了

智谱发布并开源GLM-ASR系列语音识别模型，推出桌面端AI输入法。包含云端旗舰模型GLM-ASR-2512与端侧轻量版GLM-ASR-Nano-2512（仅1.5B参数），实现高精度、低延迟、强隐私保护的语音转写。输入法集成大模型能力，支持语音指令、翻译、改写、人设切换、Vibe Coding等功能，让用户“动嘴干活”，提升办公效率。现已免费开放体验。

# 人工智能 # 自然语言处理 # 语音技术 # 数据安全/隐私保护 # 开发者

霖玉

|

6天前

|

博文

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

本文介绍了搜索引擎的核心架构与工作原理，重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐和位置索引等技术，搜索引擎能精准理解用户意图并高效召回结果，是文本检索领域的关键技术参考。

# 机器学习/深度学习 # 数据采集 # 自然语言处理 # 搜索推荐 # 索引

霖玉

|

6天前

|

博文

Chap01. 认识AI

本文介绍AI核心概念与大模型开发原理，涵盖人工智能发展历程及Transformer神经网络的关键作用。详解其注意力机制如何提升信息处理智能，并解析大语言模型（LLM）如何通过持续生成实现连贯文本输出，帮助理解GPT等模型的工作机制。

# 机器学习/深度学习 # 人工智能 # 自然语言处理

霖玉

|

6天前

|

博文

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？

本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引，采用Double Buffer实现无锁读写；对于大规模数据，则使用“全量+增量”索引结合方案，并通过删除列表处理删改。为避免频繁重建开销，提出滚动合并法，逐层整合天级、周级至全量索引，兼顾性能与资源。核心思想是读写分离，提升系统并发与稳定性。（238字）

# 存储 # 自然语言处理 # 搜索推荐 # Java # 索引

霖玉

|

6天前

|

博文

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？

在大规模检索系统中，分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片，各服务器并行处理，缩短单次查询时间，且易于扩展与维护；而基于关键词的垂直拆分虽减少请求复制，但易引发负载不均与运维复杂。工业界更倾向文档拆分，因其具备良好均衡性、可扩展性，支持高效检索与平滑扩容，是主流实践方案。（238字）

# 自然语言处理 # 运维 # 负载均衡 # 搜索推荐 # 索引

游客rs7q4jesaolmy

|

6天前

|

博文

阁下AI平台的模型可以自定义吗？

在评估一个AI工具平台时，我们通常关心其灵活性和定制能力。阁下AI平台在这方面的实现路径，与传统意义上的“模型微调”或“模型训练”有所不同，它更侧重于应用层的配置与编排。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 数据挖掘 # 机器人

霖玉

|

6天前

|

博文

05 | 倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的类比，深入浅出地讲解了正排索引与倒排索引的原理与应用。正排索引以文档ID为键，适合精确查找；而倒排索引以关键词为键，指向包含该词的文档列表，极大提升了关键词搜索效率。文章详细介绍了倒排索引的构建过程：文档编号、关键词解析、哈希表插入，并解释了如何通过归并有序链表实现多关键词联合查询（如交集、并集）。此外，还探讨了作者维度的扩展索引、敏感词检测的实现难点及大规模索引的存储优化方案，如压缩、磁盘索引和分布式分片。倒排索引虽原理简单，却是搜索引擎、数据库全文检索等系统的核心技术基础。

# 存储 # 自然语言处理 # 搜索推荐 # 数据库 # 索引

霖玉

|

6天前

|

博文

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据场景，如搜索引擎需处理万亿级网页，倒排索引远超内存容量。本文介绍通过分治思想将文档集拆分为小块，在内存中构建局部倒排索引，再写入磁盘生成有序临时文件，最后利用多路归并技术合并为全局倒排索引。该过程可迁移至MapReduce框架实现分布式加速。检索时，优先将词典加载至内存（如哈希表或FST），结合B+树或跳表等结构高效访问磁盘中的posting list，辅以缓存优化IO。核心理念是“数据尽量入内存”与“分而治之”，兼顾效率与扩展性。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

江佳豪

|

6天前

|

博文

|

来自：阿里云百炼

SpringAI+DeepSeek大模型应用开发

本教程以SpringAI为核心，讲解Java与大模型（如DeepSeek）融合开发，助力传统项目智能化。介绍AI基础、Transformer原理及SpringAI应用，推动Java在AI时代焕发新生。适合Java程序员入门大模型开发。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # Java # Spring

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

自然语言处理