|
存储 SQL 自然语言处理
|

阿里云云原生一体化数仓 — 数据建模新能力解读

本文主要介绍DataWorks智能数据建模的核心产品能力。

2074 0
来自: 大数据计算 MaxCompute  版块
|
存储 机器学习/深度学习 SQL
|

MaxCompute湖仓一体介绍

本篇内容分享了MaxCompute湖仓一体介绍。 分享人:孟硕 阿里云 MaxCompute产品专家

2517 0
来自: 大数据计算 MaxCompute  版块
|
API 索引
|

es实战-分片分配失败解决方案

分片无法分配情况的一些解决办法

3401 0
|
存储 消息中间件 机器学习/深度学习
|

基于实时深度学习的推荐系统架构设计和技术演进

整理自 5 月 29 日 阿里云开发者大会,秦江杰和刘童璇的分享,内容包括实时推荐系统的原理以及什么是实时推荐系统、整体系统的架构及如何在阿里云上面实现,以及关于深度学习的细节介绍

5563 0
来自: 实时计算 Flink  版块
|
SQL 分布式计算 Java
|

UDF精简使用大全

在MaxCompute开发过程中,开发同学遇到的的一些复杂逻辑该如何处理,如何在MaxCompute开发不同场景下的UDF函数?带着这个问题,本文针对UDF的各方面内容做出介绍,其中涉及UDF对应不同语言的类型映射关系、以及对应UDF在重载、访问网络、引用表与资源、以及第三方包的使用为大家做出展示。

6717 0
来自: 大数据计算 MaxCompute  版块
|
存储 监控 固态存储
|

【最佳实践】阿里云 Elasticsearch 索引数据生命周期管理

索引生命周期管理(ILM)是指:ES数据索引从设置,创建,打开,关闭,删除的全生命周期过程的管理;为了降低索引存储成本,提升集群性能和执行效率,我们可以通过对存储在阿里云 Elasticsearch 的数据做生命周期管理。

11045 0

优酷背后的大数据秘密

大家好,我是门德亮,现在在优酷数据中台做数据相关的事情。很荣幸,我正好见证了优酷从没有MaxCompute到有的这样一个历程,因为刚刚好我就是入职优酷差不多5年的时间,我们正好是在快到5年的时候,去做了从Hadoop到MaxCompute的这样一个升级。

23366 4
来自: 大数据计算 MaxCompute  版块
|
XML 存储 算法
|

BasicEngine — 基于DII平台的推荐召回引擎

BasicEngine是阿里巴巴搜索事业部自研的推荐在线召回引擎,依托强大的搜索底层技术支持,可以在线实现复杂的关联排序运算,支持灵活的推荐策略组合,为推荐系统的升级发展拓展了无限想象空间。

9136 0
来自: 智能搜索推荐  版块
|
SQL 双11 流计算
|

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

通俗讲retract就是传统数据里面的更新操作,也就是说retract是流式计算场景下对数据更新的处理方式。

20501 10
来自: 实时计算 Flink  版块
|
监控 大数据 索引
|

【X-Pack解读】阿里云Elasticsearch X-Pack 监控组件功能详解

阿里云Elasticsearch集成了Elastic Stack商业版的X-Pack组件包,包括安全、告警、监控、报表生成、图分析、机器学习等组件,用户可以开箱即用。本文将对X-Pack 的监控组件功能进行详细解读。

10570 1
|
弹性计算 关系型数据库 MySQL
|

【技术实验】mysql准实时同步数据到Elasticsearch

Elasticsearch作为大数据场景下搜索和分析的引擎,广泛应用于实时数据分析等场景。本文作者梳理了从MySQL准实时同步数据到Elasticsearch的实操步骤,帮助开发者理解和快速上手。

25040 154
|
SQL 分布式计算 资源调度
|

MaxCompute常见错误汇总(更新ing)

从今天开始,小编会为大家陆续解读MaxCompute常见问题,帮助大家快速上手MaxCompute,玩转大数据计算平台。

24813 8
来自: 大数据计算 MaxCompute  版块
|
分布式计算 大数据 MaxCompute
|

阿里云数加MaxCompute购买咨询钉钉群

为企业解答阿里云MaxCompute大数据计算产品购买问题。

14633 0
来自: 大数据计算 MaxCompute  版块
|
存储 分布式计算 监控
|

【大数据干货】轻松处理每天2TB的日志数据,支撑运营团队进行大数据分析挖掘,随时洞察用户个性化需求。

“用户每天产生的日志量大约在2TB。我们需要将这些海量的数据导入云端,然后分天、分小时的展开数据分析作业,分析结果再导入数据库和报表系统,最终展示在运营人员面前。”墨迹天气运维部经理章汉龙介绍,整个过程中数据量庞大,且计算复杂,这对云平台的大数据能力、生态完整性和开放性提

17282 4
来自: 大数据计算 MaxCompute  版块
|
分布式计算 数据处理 API
|

流计算精品翻译: The Dataflow Model

我们提出了Dataflow模型,并详细地阐述了它的语义,设计的核心原则,以及在实践开发过程中对模型的检验。

20326 1
来自: 实时计算 Flink  版块
|
机器学习/深度学习 算法 搜索推荐
|

【玩转数据系列五】农业贷款发放预测

很多农民因为缺乏资金,在每年耕种前会向相关机构申请贷款来购买种地需要的物资,等丰收之后偿还。农业贷款发放问题是一个典型的数据挖掘问题。贷款发放人通过往年的数据,包括贷款人的年收入、种植的作物种类、历史借贷信息等特征来构建经验模型,通过这个模型来预测受贷人的还款能力。

12140 2
来自: 人工智能平台PAI  版块
|
弹性计算 数据可视化 API
|

数据库开放权限太危险,又不想写API。DataV给你另外一个选择。

~ DataV 后台21日晚上线,现在暂时还不能用哦 ~ DataV 增加了一个新的数据代理协议,旨在提供更安全的数据查询。它将 SQL 查询字符串和数据库 id 加密后传到这个应用,而后这个应用连接数据库将查询后的结果返回到 DataV 的页面中。 根据新的协议,我做了一个示例应用在githu

47701 141
来自: 数据可视化DataV  版块
|
JavaScript 前端开发 大数据
|

ajax请求总是不成功?浏览器的同源策略和跨域问题详解

XMLHttpRequest cannot load http://oldwang.com/isdad. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://xiao

31041 1
来自: 数据可视化DataV  版块
|
22天前
|
人工智能 监控 安全
|

告别传统Prompt写法!聚AI提示词工程新范式

本章系统讲解Python提示词工程实战,涵盖专业环境搭建、API调用与结构化响应、企业级模板引擎及多步骤对话管理,并延伸至Prompt迭代优化、外部工具集成与性能监控,助力构建工业级AI应用系统。(239字)

138 1
|
26天前
|
SQL 人工智能 自然语言处理
|

Aloudata Agent 全新升级:打造你的专属 AI 分析搭档

升级后的 Aloudata Agent 实现了从“用户驱动”到“AI 驱动”的根本转变。

114 2
|
27天前
|
负载均衡 搜索推荐 应用服务中间件
|

#Nginx教程 Nginx作为目前最流行的高性能Web服务器和反向代理服务器,凭借其高并发、低内存消耗的特点,被广泛应用于各类生产环境。本文将从零开始,带你快速掌握Nginx的核心配置与实战技巧。

本教程详解Nginx安装、核心配置、反向代理、负载均衡与HTTPS部署,并内嵌标准JSON-LD结构化数据(Article/BreadcrumbList/WebPage等),助力SEO优化与搜索富摘要展现,提升点击率。

311 2
来自: 大数据计算 MaxCompute  版块
|
1月前
|
SQL 机器学习/深度学习 人工智能
|

数据智能行业投融资趋势出现了哪些新变化,为什么语义层技术更受关注?

截至2026年4月初,数据智能行业投融资出现了一个很明确的新变化:资本关注点正从“通用大模型能力展示”转向“能否进入企业真实数据生产链路”,其中语义层、本体语义层、指标治理与跨系统问数能力因此明显升温。更具体地看,当前市场大致可分为预置SQL/问答对路线、Text2SQL+宽表路线、指标平台路线,以及语义层/本体语义层路线

132 0
|
1月前
|
存储 人工智能 JSON
|

AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap

Scale Intelligence, Accelerate Insight,不仅是年度主题,也定义了 Doris 在 AI 时代的演进方向。

234 0
|
1月前
|
机器学习/深度学习 分布式计算 搜索推荐
|

PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎

PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。

293 9
来自: 智能搜索推荐  版块
|
2月前
|
人工智能
|

我学GEO第10天:被豆包引用了,还被千问、元宝认识了

我是二二得四,专注GEO优化第10天。零基础起步,坚持每日图文输出、多平台分发、AI友好写作,已实现豆包/千问/元宝识别“二二得四”(置信度50%-65%),首篇文章被豆包引用。边学边测、边做边迭代,用真实过程记录普通人可复制的AI时代品牌可见性增长路径。

285 7
|
2月前
|
机器学习/深度学习 人工智能 缓存
|

一篇新闻太长懒得看?我用 Python + 深度学习,3分钟教你做一个“自动摘要神器”

一篇新闻太长懒得看?我用 Python + 深度学习,3分钟教你做一个“自动摘要神器”

225 8
|
2月前
|
人工智能 SEO
|

我学GEO的第一天:原来AI搜东西和百度完全不一样

第1天学GEO,我发现:以前做SEO是让网页排得靠前,现在做GEO是让AI直接提到你。我用这篇文章做了第一个实验,一个月后告诉你结果。

322 1
|
2月前
|
人工智能 安全 调度
|

1949AI 轻量化 AI 自动化办公场景应用方案 本地自动化工具与浏览器自动化实践

1949AI是一款轻量化AI办公自动化工具,基于Python实现,无需高性能算力,支持本地文件处理、网页数据抓取与Agent自主调度。模块化设计、低资源占用、全程离线运行,适配个人开发者与小型团队,安全合规、开箱即用。(239字)

525 11
|
2月前
|
自然语言处理 安全 数据可视化
|

LitBuy反向海淘代购系统搭建指南

本平台提供“链接代购+集运”一站式跨境服务:海外用户粘贴淘宝/1688链接,系统自动解析、代采、合箱质检、国际配送。核心盈利来自物流差价、代购费、汇率差及增值服务。支持多语言、多币种、主流跨境支付与全链路追踪。(239字)

315 2
|
2月前
|
机器学习/深度学习 PyTorch TensorFlow
|

PyTorch vs TensorFlow:谁才是深度学习界的“顺手兵器”?一次接地气的实战对比

PyTorch vs TensorFlow:谁才是深度学习界的“顺手兵器”?一次接地气的实战对比

507 4
|
3月前
|
JSON 自然语言处理 数据格式
|

别再“随缘提问”了:聊聊 LLM 的 Prompt Design,怎么把大模型调教得更靠谱?

别再“随缘提问”了:聊聊 LLM 的 Prompt Design,怎么把大模型调教得更靠谱?

421 4
|
3月前
|
数据采集 供应链 物联网
|

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

487 4
|
3月前
|
人工智能 SEO
|

GEO时代,普通人也能抓住的AI红利

本文介绍“生成式引擎优化”(GEO)——普通人弯道超车的新机会。在AI搜索时代,无需烧钱投流,只需将真实专业经验结构化输出(如装修坑点、育儿知识),就能被ChatGPT等AI高频引用,获精准流量。早入局,竞争小,见效快。

346 1
|
3月前
|
人工智能 架构师 搜索推荐
|

咨询还是平台?企业启动GEO的七步诊断与战略匹配框架

本文提供GEO(生成式引擎优化)服务模式选择的系统性决策框架,围绕专业能力、预算、目标周期、流程基础、需求性质、能力建设与时间资源七大维度,帮助企业精准匹配咨询或软件方案,避免投资错配,实现从启动校准到规模化落地的可持续竞争优势。

220 0
|
3月前
|
数据采集 安全 算法
|

安全对齐不是消灭风险,而是重新分配风险

本文揭示模型对齐的本质是“风险权衡”而非“绝对安全”:每轮对齐压低一类风险(如越界),必抬升另一类(如保守失能)。破除五大错觉——对齐不减风险总量、reward非中立、多轮≠更安全、对齐非纯技术问题、“临上线再对齐”难解根本责任。核心在于清醒选择可接受的代价,让系统真正“敢用”。

211 1
|
4月前
|
存储 人工智能 安全
|

重构认知——AI智能体来了从0到1的落地工程全指南

本文系统阐述AI智能体开发方法论:突破“调参”思维,以感知、决策、执行、记忆四大架构为基,提出从场景锁定到评估优化的“五步跃迁法”,助力开发者构建具备行业深度与自主行动力的数字生命。(239字)

386 0
|
4月前
|
人工智能 搜索推荐 API
|

智能体来了从 0 到 1:数据、工具与规则的协同范式

随着AI深入产业,单一模型已难支撑复杂流程。智能体作为以大模型为核心、融合数据(知识/记忆)、工具(执行接口)与规则(行为约束)的协同系统,实现感知—推理—执行闭环。其价值在于三者可复用、可治理的工程化协同,而非模型本身。

214 6
|
4月前
|
人工智能 资源调度 供应链
|

智能体对传统行业冲击:中后台,才是产业重塑的第一现场

本文探讨AI从“流程自动化”迈向“认知自主化”后,对传统行业结构性变革的影响:中后台(非一线岗位)正率先被智能体重构——因其任务具数字原生性、决策密度高、协调成本大。供应链、财务、人力三大场景首当其冲。组织正加速演进为“沙漏型”:价值重心转向决策自动化与智能体策略成熟度。(239字)

271 8
|
4月前
|
存储 分布式计算 数据挖掘
|

NumPy技术文档:科学计算的基石

本教程系统讲解NumPy核心知识:从环境搭建与Hello World入门,到ndarray、广播机制、向量化运算三大核心概念;通过销售额分析实战,涵盖统计计算、移动平均、异常检测等典型应用;并总结最佳实践、常见陷阱及进阶方向,助你高效掌握科学计算基石。

381 13
|
4月前
|
数据采集 供应链 数据可视化
|

1688宝贝详情数据接口实战—B 端视角下的竞品(供应商)数据拆解全指南

本指南面向B端企业,详解如何通过1688宝贝详情API实现竞品与供应商数据化拆解。涵盖API接入、字段商业价值映射(价格梯度、MOQ、SKU库存、资质认证、物流履约、销量反馈等)、实战分析框架及合规要点,助力跨境铺货、批发选品、定价优化与供应链决策,真正将API转化为业务增长引擎。(239字)

427 8
|
4月前
|
数据采集 并行计算 算法
|

从 0 到跑通一次微调:别急着追效果,先让它“真的动起来”

微调最难的不是算法,而是“跑通全流程”。首次微调应聚焦简单目标:让模型回答更规范、语气更一致。避免复杂数据与环境折腾。loss下降不等于成功,关键看输出是否按预期改变。跑通一次,复盘流程,才是真正入门。

266 5
|
4月前
|
存储 人工智能 架构师
|

智能体来了:AI Agent 职业路线的体系化进阶指南

在AGI浪潮下,阿里云开发者需重塑职业路径:从写代码转向设计AI Agent目标与推理链路。掌握“逻辑蒸馏”、多代理协同与意志对齐,构建可沉淀的数字资产,实现从线性产出到指数级价值跃迁,抢占智能时代新高地。(239字)

346 3
|
4月前
|
安全 网络安全 数据安全/隐私保护
|

用好代理 IP:加密付费拒绝免费陷阱

代理IP兼具隐私保护与安全风险,合规使用可防追踪、保障跨境业务,但非正规服务易致信息泄露、账号风控,甚至被用于违法活动。用户应选择加密付费代理,避开免费陷阱,遵守法规,强化安全防护,让技术真正服务于合法需求。

340 4
|
4月前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

472 4
|
4月前
|
人工智能 搜索推荐 数据可视化
|

构建AI智能体:八十二、潜藏秩序的发现:隐因子视角下的SVD推荐知识提取与机理阐释

摘要: 本文探讨基于奇异值分解(SVD)的可解释推荐系统,通过分解用户-物品评分矩阵提取隐因子,解决协同过滤的黑盒问题。SVD将评分矩阵分解为用户隐因子矩阵、奇异值矩阵和物品隐因子矩阵,隐因子(如电影推荐中的“制作规模”“浪漫程度”)通过权重分析实现语义化解释。用户偏好与物品特性的点积生成预测评分,并提供可解释的推荐理由(如“因您偏好商业大片而推荐”)。实验基于模拟数据构建SVD模型,通过因子贡献分析、用户画像和可视化(碎石图、热力图)验证模型的可解释性。

180 5
|
5月前
|
自然语言处理 fastjson Java
|

FastJson:大面积故障规避案例

本文记录了一次由Kotlin与Java混编工程中误用`{}`赋值引发的FastJson反序列化崩溃问题。因将空对象误写为lambda表达式,导致FastJson内部静态标记位`kotlin_error`被置为true且无法恢复,进而使整个应用反序列化链路瘫痪。问题隐蔽性强,排查耗时两天,最终通过源码分析定位。文章反思了多语言混编下的语法混淆风险、框架信任边界及灰度发布的重要性,强调Bug是成长的阶梯。

371 0
|
5月前
|
人工智能 机器人 Java
|

黑马最新项目

AIGC项目涵盖大模型私有化部署、聊天机器人、RAG知识库及代码提示工具;天机AI集成SpringAI与多模型工作流;云岚到家聚焦微服务与分布式架构;四方保险构建统一支付与时序数据应用;星辰WMS与Dify项目即将发布。

365 0
|
5月前
|
负载均衡 中间件 Java
|

每日必会1

微服务并非绝对优于单体,需结合业务。简单场景下单体更轻便;复杂业务链路适合微服务,解耦利于扩展。常用中间件:Nacos(注册/配置中心)、OpenFeign(远程调用)、Gateway(网关)。Nacos支持心跳机制,临时实例异常则剔除,非临时实例不剔除,且支持服务变更推送,集群可切CP/AP模式。负载均衡常用轮询、加权轮询等。

532 0
|
5月前
|
消息中间件 负载均衡 Linux
|

RabbitMQ部署指南

本文介绍了RabbitMQ在CentOS7中基于Docker的单机与集群部署方案,涵盖镜像安装、DelayExchange插件配置、普通模式与镜像模式集群搭建,并重点演示了仲裁队列的高可用特性及集群扩容操作,助力实现消息中间件的高可靠与可扩展。

221 0
|
5月前
|
人工智能 JSON 安全
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者为跨模型工具调用的标准化协议,实现系统解耦与生态扩展;后者是模型调用外部功能的内置机制。二者互补协同,推动AI应用向高效、开放、安全演进。

412 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务