|
10月前
|
存储 缓存 Apache
|

Apache Iceberg数据湖高级特性及性能调优

性能调优涵盖索引优化、排序策略与元数据管理。通过布隆过滤器、位图索引等提升查询效率,结合文件内/间排序优化I/O与压缩,辅以Z-Order实现多维数据聚集。同时,合理配置元数据缓存与清单合并,加速查询规划。适用于点查、全表扫描及高并发写入场景,显著提升系统性能与资源利用率。

993 0
|
10月前
|
搜索推荐 数据挖掘 API
|

淘宝API文档:淘宝商品详情API接口

淘宝商品详情API(taobao.item.get)为开发者提供获取商品信息的途径,涵盖基础信息、价格、图文、评价及物流等。适用于电商数据分析、比价平台与购物助手开发。本文提供Python调用示例,含请求构造与响应处理流程。

465 0
|
11月前
|
人工智能 大数据 Swift
|

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

708 5
|
11月前
|
数据采集 人工智能 编解码
|

2025年颠覆闭源大模型?MonkeyOCR:这款开源AI文档解析模型,精度更高,速度更快!

还在依赖昂贵且慢的闭源OCR工具?华中科技大学开源的MonkeyOCR文档解析模型,以其超越GPT4o的精度和更快的推理速度,在单机单卡(3090)上即可部署,正颠覆业界认知。本文将深入解析其设计哲学、核心突破——大规模自建数据集,并分享实测体验与避坑指南。

2519 87
|
11月前
|
定位技术
|

安徽京准分享:北斗RDSS授时和北斗授时RNSS的区别

安徽京准分享:北斗RDSS授时和北斗授时RNSS的区别

1859 15
|
11月前
|
消息中间件 缓存 小程序
|

婚恋交友相亲公众号app小程序系统源码「脱单神器」婚恋平台全套代码 - 支持快速二次开发

这是一套基于SpringBoot + Vue3开发的婚恋交友系统,支持微信公众号、Uniapp小程序和APP端。系统包含实名认证、智能匹配、视频相亲、会员体系等功能,适用于婚恋社交平台和相亲交友应用。后端采用SpringBoot 3.x与MyBatis-Plus,前端使用Vue3与Uniapp,支持快速部署和二次开发。适合技术团队或有经验的个人创业者使用。

809 8
|
11月前
|
数据管理 数据挖掘 API
|

深入研究:shopee商品列表API接口指南

Shopee 是东南亚和中国台湾地区的跨境电商平台,其开放平台(Shopee Open API)为开发者提供商品数据、店铺管理和订单处理等接口。商品列表 API 为核心功能之一,支持按店铺获取商品列表和搜索平台商品。通过 shop_id 等参数可获取指定店铺商品信息,支持分页与状态筛选;通过关键词、类目 ID 和价格范围等条件可搜索平台商品,适用于构建比价工具和选品分析系统。

619 2
|
11月前
|
资源调度 Kubernetes 流计算
|

Flink在B站的大规模云原生实践

本文基于哔哩哔哩资深开发工程师丁国涛在Flink Forward Asia 2024云原生专场的分享,围绕Flink On K8S的实践展开。内容涵盖五个部分:背景介绍、功能及稳定性优化、性能优化、运维优化和未来展望。文章详细分析了从YARN迁移到K8S的优势与挑战,包括资源池统一、环境一致性改进及隔离性提升,并针对镜像优化、Pod异常处理、启动速度优化等问题提出解决方案。此外,还探讨了多机房容灾、负载均衡及潮汐混部等未来发展方向,为Flink云原生化提供了全面的技术参考。

639 9
来自: 实时计算 Flink  版块
|
12月前
|
人工智能 分布式计算 大数据
|

MCP、MaxFrame与大数据技术全景解析

本文介绍了 MCP 协议、MaxFrame 分布式计算框架以及大数据基础设施建设的相关内容。MCP(Model Context Protocol)是一种开源协议,旨在解决 AI 大模型与外部数据源及工具的集成问题,被比喻为大模型的“USB 接口”,通过统一交互方式降低开发复杂度。其核心架构包括 Client、Server、Tool 和 Schema 四个关键概念,并在百炼平台中得到实践应用。MaxFrame 是基于 Python 的高性能分布式计算引擎,支持多模态数据处理与 AI 集成,结合 MaxCompute 提供端到端的数据处理能力。

829 5
来自: 大数据计算 MaxCompute  版块
|
12月前
|
数据采集 存储 前端开发
|

Python爬虫自动化:批量抓取网页中的A链接

Python爬虫自动化:批量抓取网页中的A链接

621 4
|
22天前
|
人工智能 监控 安全
|

告别传统Prompt写法!聚AI提示词工程新范式

本章系统讲解Python提示词工程实战,涵盖专业环境搭建、API调用与结构化响应、企业级模板引擎及多步骤对话管理,并延伸至Prompt迭代优化、外部工具集成与性能监控,助力构建工业级AI应用系统。(239字)

138 1
|
26天前
|
SQL 人工智能 自然语言处理
|

Aloudata Agent 全新升级:打造你的专属 AI 分析搭档

升级后的 Aloudata Agent 实现了从“用户驱动”到“AI 驱动”的根本转变。

114 2
|
27天前
|
负载均衡 搜索推荐 应用服务中间件
|

#Nginx教程 Nginx作为目前最流行的高性能Web服务器和反向代理服务器,凭借其高并发、低内存消耗的特点,被广泛应用于各类生产环境。本文将从零开始,带你快速掌握Nginx的核心配置与实战技巧。

本教程详解Nginx安装、核心配置、反向代理、负载均衡与HTTPS部署,并内嵌标准JSON-LD结构化数据(Article/BreadcrumbList/WebPage等),助力SEO优化与搜索富摘要展现,提升点击率。

311 2
来自: 大数据计算 MaxCompute  版块
|
1月前
|
SQL 机器学习/深度学习 人工智能
|

数据智能行业投融资趋势出现了哪些新变化,为什么语义层技术更受关注?

截至2026年4月初,数据智能行业投融资出现了一个很明确的新变化:资本关注点正从“通用大模型能力展示”转向“能否进入企业真实数据生产链路”,其中语义层、本体语义层、指标治理与跨系统问数能力因此明显升温。更具体地看,当前市场大致可分为预置SQL/问答对路线、Text2SQL+宽表路线、指标平台路线,以及语义层/本体语义层路线

132 0
|
1月前
|
存储 人工智能 JSON
|

AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap

Scale Intelligence, Accelerate Insight,不仅是年度主题,也定义了 Doris 在 AI 时代的演进方向。

234 0
|
1月前
|
机器学习/深度学习 分布式计算 搜索推荐
|

PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎

PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。

293 9
来自: 智能搜索推荐  版块
|
2月前
|
人工智能
|

我学GEO第10天:被豆包引用了,还被千问、元宝认识了

我是二二得四,专注GEO优化第10天。零基础起步,坚持每日图文输出、多平台分发、AI友好写作,已实现豆包/千问/元宝识别“二二得四”(置信度50%-65%),首篇文章被豆包引用。边学边测、边做边迭代,用真实过程记录普通人可复制的AI时代品牌可见性增长路径。

285 7
|
2月前
|
机器学习/深度学习 人工智能 缓存
|

一篇新闻太长懒得看?我用 Python + 深度学习,3分钟教你做一个“自动摘要神器”

一篇新闻太长懒得看?我用 Python + 深度学习,3分钟教你做一个“自动摘要神器”

225 8
|
2月前
|
人工智能 SEO
|

我学GEO的第一天:原来AI搜东西和百度完全不一样

第1天学GEO,我发现:以前做SEO是让网页排得靠前,现在做GEO是让AI直接提到你。我用这篇文章做了第一个实验,一个月后告诉你结果。

322 1
|
2月前
|
人工智能 安全 调度
|

1949AI 轻量化 AI 自动化办公场景应用方案 本地自动化工具与浏览器自动化实践

1949AI是一款轻量化AI办公自动化工具,基于Python实现,无需高性能算力,支持本地文件处理、网页数据抓取与Agent自主调度。模块化设计、低资源占用、全程离线运行,适配个人开发者与小型团队,安全合规、开箱即用。(239字)

525 11
|
2月前
|
人工智能 安全 程序员
|

50%的人给了差评:龙虾为何在技术论坛翻车了?

OpenClaw(龙虾)AI工具因“自动赚钱”“代约主播”等夸张宣传走红,但吾爱破解论坛投票显示:50%技术用户未下载且不认可其能力。技术圈冷静源于见惯“神器”泡沫——AI擅写代码(搬砖),却难懂需求、统筹系统。它不是神药,而是待磨的砍柴刀。

357 3
|
2月前
|
自然语言处理 安全 数据可视化
|

LitBuy反向海淘代购系统搭建指南

本平台提供“链接代购+集运”一站式跨境服务:海外用户粘贴淘宝/1688链接,系统自动解析、代采、合箱质检、国际配送。核心盈利来自物流差价、代购费、汇率差及增值服务。支持多语言、多币种、主流跨境支付与全链路追踪。(239字)

315 2
|
2月前
|
机器学习/深度学习 PyTorch TensorFlow
|

PyTorch vs TensorFlow:谁才是深度学习界的“顺手兵器”?一次接地气的实战对比

PyTorch vs TensorFlow:谁才是深度学习界的“顺手兵器”?一次接地气的实战对比

507 4
|
3月前
|
JSON 自然语言处理 数据格式
|

别再“随缘提问”了:聊聊 LLM 的 Prompt Design,怎么把大模型调教得更靠谱?

别再“随缘提问”了:聊聊 LLM 的 Prompt Design,怎么把大模型调教得更靠谱?

421 4
|
3月前
|
数据采集 供应链 物联网
|

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

487 4
|
3月前
|
人工智能 SEO
|

GEO时代,普通人也能抓住的AI红利

本文介绍“生成式引擎优化”(GEO)——普通人弯道超车的新机会。在AI搜索时代,无需烧钱投流,只需将真实专业经验结构化输出(如装修坑点、育儿知识),就能被ChatGPT等AI高频引用,获精准流量。早入局,竞争小,见效快。

346 1
|
3月前
|
人工智能 架构师 搜索推荐
|

咨询还是平台?企业启动GEO的七步诊断与战略匹配框架

本文提供GEO(生成式引擎优化)服务模式选择的系统性决策框架,围绕专业能力、预算、目标周期、流程基础、需求性质、能力建设与时间资源七大维度,帮助企业精准匹配咨询或软件方案,避免投资错配,实现从启动校准到规模化落地的可持续竞争优势。

220 0
|
3月前
|
数据采集 安全 算法
|

安全对齐不是消灭风险,而是重新分配风险

本文揭示模型对齐的本质是“风险权衡”而非“绝对安全”:每轮对齐压低一类风险(如越界),必抬升另一类(如保守失能)。破除五大错觉——对齐不减风险总量、reward非中立、多轮≠更安全、对齐非纯技术问题、“临上线再对齐”难解根本责任。核心在于清醒选择可接受的代价,让系统真正“敢用”。

211 1
|
4月前
|
存储 人工智能 安全
|

重构认知——AI智能体来了从0到1的落地工程全指南

本文系统阐述AI智能体开发方法论:突破“调参”思维,以感知、决策、执行、记忆四大架构为基,提出从场景锁定到评估优化的“五步跃迁法”,助力开发者构建具备行业深度与自主行动力的数字生命。(239字)

386 0
|
4月前
|
人工智能 搜索推荐 API
|

智能体来了从 0 到 1:数据、工具与规则的协同范式

随着AI深入产业,单一模型已难支撑复杂流程。智能体作为以大模型为核心、融合数据(知识/记忆)、工具(执行接口)与规则(行为约束)的协同系统,实现感知—推理—执行闭环。其价值在于三者可复用、可治理的工程化协同,而非模型本身。

214 6
|
4月前
|
人工智能 资源调度 供应链
|

智能体对传统行业冲击:中后台,才是产业重塑的第一现场

本文探讨AI从“流程自动化”迈向“认知自主化”后,对传统行业结构性变革的影响:中后台(非一线岗位)正率先被智能体重构——因其任务具数字原生性、决策密度高、协调成本大。供应链、财务、人力三大场景首当其冲。组织正加速演进为“沙漏型”:价值重心转向决策自动化与智能体策略成熟度。(239字)

271 8
|
4月前
|
存储 分布式计算 数据挖掘
|

NumPy技术文档:科学计算的基石

本教程系统讲解NumPy核心知识:从环境搭建与Hello World入门,到ndarray、广播机制、向量化运算三大核心概念;通过销售额分析实战,涵盖统计计算、移动平均、异常检测等典型应用;并总结最佳实践、常见陷阱及进阶方向,助你高效掌握科学计算基石。

381 13
|
4月前
|
数据采集 供应链 数据可视化
|

1688宝贝详情数据接口实战—B 端视角下的竞品(供应商)数据拆解全指南

本指南面向B端企业,详解如何通过1688宝贝详情API实现竞品与供应商数据化拆解。涵盖API接入、字段商业价值映射(价格梯度、MOQ、SKU库存、资质认证、物流履约、销量反馈等)、实战分析框架及合规要点,助力跨境铺货、批发选品、定价优化与供应链决策,真正将API转化为业务增长引擎。(239字)

427 8
|
4月前
|
数据采集 并行计算 算法
|

从 0 到跑通一次微调:别急着追效果,先让它“真的动起来”

微调最难的不是算法,而是“跑通全流程”。首次微调应聚焦简单目标:让模型回答更规范、语气更一致。避免复杂数据与环境折腾。loss下降不等于成功,关键看输出是否按预期改变。跑通一次,复盘流程,才是真正入门。

266 5
|
4月前
|
存储 人工智能 架构师
|

智能体来了:AI Agent 职业路线的体系化进阶指南

在AGI浪潮下,阿里云开发者需重塑职业路径:从写代码转向设计AI Agent目标与推理链路。掌握“逻辑蒸馏”、多代理协同与意志对齐,构建可沉淀的数字资产,实现从线性产出到指数级价值跃迁,抢占智能时代新高地。(239字)

346 3
|
4月前
|
安全 网络安全 数据安全/隐私保护
|

用好代理 IP:加密付费拒绝免费陷阱

代理IP兼具隐私保护与安全风险,合规使用可防追踪、保障跨境业务,但非正规服务易致信息泄露、账号风控,甚至被用于违法活动。用户应选择加密付费代理,避开免费陷阱,遵守法规,强化安全防护,让技术真正服务于合法需求。

340 4
|
4月前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

472 4
|
4月前
|
人工智能 搜索推荐 数据可视化
|

构建AI智能体:八十二、潜藏秩序的发现:隐因子视角下的SVD推荐知识提取与机理阐释

摘要: 本文探讨基于奇异值分解(SVD)的可解释推荐系统,通过分解用户-物品评分矩阵提取隐因子,解决协同过滤的黑盒问题。SVD将评分矩阵分解为用户隐因子矩阵、奇异值矩阵和物品隐因子矩阵,隐因子(如电影推荐中的“制作规模”“浪漫程度”)通过权重分析实现语义化解释。用户偏好与物品特性的点积生成预测评分,并提供可解释的推荐理由(如“因您偏好商业大片而推荐”)。实验基于模拟数据构建SVD模型,通过因子贡献分析、用户画像和可视化(碎石图、热力图)验证模型的可解释性。

180 5
|
5月前
|
自然语言处理 fastjson Java
|

FastJson:大面积故障规避案例

本文记录了一次由Kotlin与Java混编工程中误用`{}`赋值引发的FastJson反序列化崩溃问题。因将空对象误写为lambda表达式,导致FastJson内部静态标记位`kotlin_error`被置为true且无法恢复,进而使整个应用反序列化链路瘫痪。问题隐蔽性强,排查耗时两天,最终通过源码分析定位。文章反思了多语言混编下的语法混淆风险、框架信任边界及灰度发布的重要性,强调Bug是成长的阶梯。

371 0
|
5月前
|
人工智能 机器人 Java
|

黑马最新项目

AIGC项目涵盖大模型私有化部署、聊天机器人、RAG知识库及代码提示工具;天机AI集成SpringAI与多模型工作流;云岚到家聚焦微服务与分布式架构;四方保险构建统一支付与时序数据应用;星辰WMS与Dify项目即将发布。

365 0
|
5月前
|
负载均衡 中间件 Java
|

每日必会1

微服务并非绝对优于单体,需结合业务。简单场景下单体更轻便;复杂业务链路适合微服务,解耦利于扩展。常用中间件:Nacos(注册/配置中心)、OpenFeign(远程调用)、Gateway(网关)。Nacos支持心跳机制,临时实例异常则剔除,非临时实例不剔除,且支持服务变更推送,集群可切CP/AP模式。负载均衡常用轮询、加权轮询等。

532 0
|
5月前
|
消息中间件 负载均衡 Linux
|

RabbitMQ部署指南

本文介绍了RabbitMQ在CentOS7中基于Docker的单机与集群部署方案,涵盖镜像安装、DelayExchange插件配置、普通模式与镜像模式集群搭建,并重点演示了仲裁队列的高可用特性及集群扩容操作,助力实现消息中间件的高可靠与可扩展。

221 0
|
5月前
|
人工智能 JSON 安全
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者为跨模型工具调用的标准化协议,实现系统解耦与生态扩展;后者是模型调用外部功能的内置机制。二者互补协同,推动AI应用向高效、开放、安全演进。

412 0
|
5月前
|
人工智能 缓存 NoSQL
|

AIGC项目

专注AI与高并发架构实战,精通大模型私有化部署、RAG知识库、AIGC生成(文生图/图修复)及Stable Diffusion应用。熟练掌握Spring Cloud微服务、Redis缓存、分库分表、分布式事务与任务调度,具备统一支付、保险系统、派单调度等复杂业务系统设计开发能力。

213 0
|
5月前
|
XML Java 数据库连接
|

MyBatis映射关系(1-1 1-n n-n)

本文介绍了MyBatis中四种核心关联映射:一对一(属性与字段映射)、一对多(如用户关联多个角色,使用`<collection>`)、多对一(如博客关联作者,使用`<association>`)和多对多(通过中间类实现,如用户与部门)。适用于解决实体间复杂关系映射问题。

278 1
|
5月前
|
关系型数据库 应用服务中间件 Nacos
|

Nacos配置中心

本章详解Nacos配置中心实战:实现微服务配置统一管理,支持热更新、配置共享与优先级控制,并搭建高可用集群,提升系统稳定性。

224 0
|
5月前
|
存储 安全 小程序
|

认识OAuth2.0

OAuth2.0是一种开放授权标准,允许第三方应用在用户授权下安全访问资源,无需获取用户账号密码。它通过令牌(token)机制实现权限控制,支持授权码、简化、密码和客户端四种模式,广泛用于第三方登录与服务间资源共享。

200 0
|
5月前
|
数据采集 自然语言处理 JavaScript
|

不写规则也能抽数据?

本文探讨了企业在招聘数据分析中对薪资信息采集的挑战,分析了从纯规则采集到智能解析的发展,并指出智能解析在招聘场景中的局限性。推荐企业采用人工规则与智能解析相结合的策略,以确保数据的稳定性和可解释性。

369 2
|
5月前
|
机器学习/深度学习 人工智能 数据可视化
|

构建AI智能体:七十三、模型的成绩单:一文读懂损失函数,看懂AI如何学习

本文系统介绍了损失函数在机器学习中的核心作用。首先通过类比教学场景,阐释损失函数作为模型"导师"的重要性。随后详细解析了回归任务中的均方误差(MSE)和平均绝对误差(MAE),通过房价预测案例展示了它们对误差的不同处理方式。在分类任务部分,重点讲解了二分类和多分类交叉熵损失函数,使用垃圾邮件识别和图像分类等实例,说明这些函数如何通过概率计算来评估预测准确性。文章通过可视化图表直观呈现了不同损失函数的特点,并强调损失函数作为模型优化的指南针,其设计直接影响学习效果。

649 20
|
5月前
|
人工智能 调度 芯片
|

Chiplet 技术:芯片终于不再“憋大招”,而是开始像搭积木一样干活了

Chiplet 技术:芯片终于不再“憋大招”,而是开始像搭积木一样干活了

293 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务