|
3月前
|
数据采集 机器学习/深度学习 自然语言处理
|

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

159 10
|
3月前
|
消息中间件 监控 算法
|

数据不守规矩怎么办?——聊聊乱序事件的处理策略与实战要点

数据不守规矩怎么办?——聊聊乱序事件的处理策略与实战要点

202 11
|
3月前
|
机器学习/深度学习 传感器 安全
|

基于深度学习的驾驶员行为检测系统

本研究聚焦基于深度学习的驾驶员行为检测系统,针对传统传感器方法局限,提出融合YOLOv8与计算机视觉的新方案,实现对疲劳、分心驾驶等行为的精准实时识别,提升行车安全,推动智能交通与自动驾驶发展。

189 7
|
3月前
|
存储 SQL 运维
|

Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器

在实时数据架构中,Hologres Dynamic Table 基于有状态增量计算模型,有效解决“海量历史+少量新增”场景下的数据刷新难题。相比传统全量刷新,其通过持久化中间状态,实现复杂查询下的高效增量更新,显著降低延迟与资源消耗,提升实时数仓性能与运维效率。

390 36
来自: 实时数仓 Hologres  版块
|
3月前
|
Web App开发 安全 前端开发
|

2026年建设网站的十个步骤

2026 年优质网站建设十大关键步骤涵盖需求分析、架构规划等全生命周期环节,以 PageAdmin 低代码平台为支撑,兼顾设计、开发、测试、部署与运维,可高效构建功能完善、体验优良的专业网站,契合多元需求与长期发展目标。

476 2
|
3月前
|
算法 搜索推荐
|

当流量失效之后,企业真正的增长变量是什么?

“系统信任增长范式”提出:当流量红利消退,增长逻辑正从“获取用户”转向“积累可复用的信任资产”。信任不再是话语表达,而是跨时间、跨场景的行为一致性与可验证修复能力。企业需被系统判定为“值得持续推荐”,方能获得长期增长动力。这是一场规则层面的迁移,而非策略优化。

289 4
来自: 智能搜索推荐  版块
|
4月前
|
运维 前端开发 算法
|

Web3 的真相:天天喊去中心化,可中心到底“藏”在哪?

Web3 的真相:天天喊去中心化,可中心到底“藏”在哪?

240 12
|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中两大关键技术。前者为跨模型标准化通信协议,实现工具与模型解耦;后者是模型调用外部功能的内置机制。二者互补协作,推动AI应用向更开放、灵活、可扩展的方向发展。

197 0
|
4月前
|
消息中间件 Java Nacos
|

SpringCloud概述

Spring Cloud是Spring团队推出的微服务一站式解决方案,弥补了各独立组件(如Nacos、RabbitMQ等)缺乏统一架构的不足。其特点为约定优于配置、组件丰富、开箱即用,支持云原生。版本以伦敦地铁站命名,避免与子项目冲突。Spring Cloud Alibaba由阿里贡献,集成Nacos、Sentinel、Seata等成熟组件,因Netflix套件停更,现成为主流选择,功能更完整且经大规模验证,是当前微服务架构的优选技术栈。

359 0
|
4月前
|
机器学习/深度学习 数据采集 存储
|

融合共生的智能时代引擎

本文系统解析大数据与机器学习的融合价值,阐述二者“数据喂养模型、模型激活数据”的协同关系,涵盖技术流程、典型应用场景及发展挑战,并展望轻量化模型、可信AI、行业定制化与AutoML等未来趋势,揭示智能时代的核心驱动力。

119 0
|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。MCP为模型与外部工具提供标准化通信协议,实现跨模型、跨平台集成;Function Call则是模型调用外部函数的内置机制。前者如“蓝牙协议”,支持多设备互联,后者像“语音助手”,限于单机操作。两者在功能上互补:MCP支持工具热插拔、权限控制与远程调用,适用于企业级复杂系统;Function Call开发简单,适合快速验证单一模型能力。未来趋势将走向融合,形成“模型解析-协议传输-工具执行”的分层架构,推动AI应用生态标准化发展。

287 0
|
4月前
|
人工智能 搜索推荐 自动驾驶
|

FPGA 的回归:AI 时代,算力终于开始“量体裁衣”了

FPGA 的回归:AI 时代,算力终于开始“量体裁衣”了

300 0
|
4月前
|
机器学习/深度学习 JSON API
|

1688图片识别商品接口API使用指南

1688图片识别商品API基于深度学习技术,支持上传图片或URL,精准识别1688平台商品信息,涵盖标题、链接、价格、供应商等。适用于批发采购、货源匹配等场景,具备高精度、低延迟、强兼容特性,支持主流图片格式,遵循RESTful规范,助力开发者高效对接1688商品生态。

245 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

做了15年认知心理学研究,聊聊我是怎么被文献淹没、又怎么爬出来的

一位认知心理学研究者分享15年科研中如何摆脱文献困扰:从每周耗12小时筛选论文,到借助AI工具将时间减至4小时。通过智能检索、批量分析、跨语言翻译等功能,高效追踪前沿、提升综述质量,并推动团队协作升级。工具助力,让科研回归思考本质。

264 1
|
4月前
|
机器学习/深度学习 存储 人工智能
|

AI 十大论文精讲(九):无损失量化革命——LLM.int8 () 破解千亿大模型内存困局

本文解读AI十大核心论文第九篇《LLM.int8()》,聚焦大模型推理中的内存瓶颈问题。该论文提出创新的混合精度量化方法,通过向量级量化与异常值分离技术,首次实现千亿参数模型无损8位量化,显著降低部署成本,提升计算效率,推动大模型在消费级硬件上的落地应用,为低比特量化研究奠定重要基础。

473 8
|
4月前
|
数据采集 SQL 自然语言处理
|

脏数据不脏心:大数据平台的数据质量(DQ)入门实战与自动修复心法

脏数据不脏心:大数据平台的数据质量(DQ)入门实战与自动修复心法

384 20
|
5月前
|
存储 SQL 缓存
|

Delta Join:为超大规模流处理实现计算与历史数据解耦

Delta Join(FLIP-486)是Flink流式Join的范式革新,通过将历史数据存储与计算解耦,实现按需查询外部存储(如Fluss、Paimon),避免状态无限增长。它解决了传统Join在高基数场景下的状态爆炸问题,显著降低资源消耗:状态减少50TB,成本降10倍,Checkpoint从小时级缩短至秒级,恢复速度提升87%。兼容标准SQL,自动优化转换,适用于海量数据实时关联场景,推动流处理迈向高效、稳定、可扩展的新阶段。

579 1
来自: 实时计算 Flink  版块
|
5月前
|
人工智能 安全 数据可视化
|

教育行业如何用AI搜索优化实现低成本获客?数聚酷实战指南

一、教育行业的“流量焦虑”与AI搜索的破局机会 “用户越来越难被触达了!”这是深圳某K12机构负责人的真实感叹。传统广告投放成本飙升,社交媒体流量见顶,用户决策路径从“主动搜索”转向“向AI提问”——数据显示,2025年教育类AI搜索咨询量同比激增350%,但能被AI优先推荐的机构不足5%。 数聚酷的观察:AI搜索(G…

412 3
来自: 智能搜索推荐  版块
|
5月前
|
XML JSON 数据格式
|

Python 3.14 实用技巧:10个让代码更清晰的小改进

Python 3.14 带来10项实用改进:类型系统增强、错误提示更清晰、导入优化、异步任务取消更稳定,并新增 `chdir()` 上下文管理器等。虽改动细微,却显著提升代码可读性、调试效率与运行稳定性,适合自动化脚本与日常开发。升级即享,无需额外成本。

423 10
|
5月前
|
存储 人工智能 Java
|

官宣 | Apache Fluss (Incubating) 0.8 发布公告

Apache Fluss 0.8(孵化中)正式发布!作为进入Apache后的首个版本,全面增强湖流一体能力,支持Iceberg与Lance,引入Delta Join、动态配置、Materialized Table等核心特性,显著提升稳定性与性能,推动实时流处理迈向新阶段。

521 3
|
5月前
|
JSON 监控 供应链
|

天猫商品详情API技术文档:智能电商开发的必备工具

天猫商品详情API(tmall.item_get)通过商品ID实时获取标题、价格、库存、SKU、评价等结构化数据,支持JSON格式返回,适用于电商分析、竞品监控与价格优化,需授权访问,可按需筛选字段,提升数据传输效率。

250 3
|
6月前
|
存储 分布式计算 运维
|

云栖实录|驰骋在数据洪流上:Flink+Hologres驱动零跑科技实时计算的应用与实践

零跑科技基于Flink构建一体化实时计算平台,应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断,实现分钟级向秒级跃迁,提升性能3-5倍,降低存储成本。通过Flink+Hologres+MaxCompute技术栈,打造高效、稳定、可扩展的实时数仓,支撑100万台量产车背后的数据驱动决策,并迈向流批一体与AI融合的未来架构。

428 3
来自: 实时计算 Flink  版块
|
6月前
|
程序员 网络安全 开发工具
|

推送报错403怎么办?vscode推送项目到github

推送报错403怎么办?vscode推送项目到github

282 1
|
6月前
|
数据可视化 关系型数据库 MySQL
|

【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!

本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。

612 4
|
6月前
|
Kubernetes API 开发工具
|

Kubeflow-Pipelines-架构学习指南

本指南带你深入 Kubeflow Pipelines 架构,从零掌握 ML 工作流编排。涵盖核心组件、代码结构、开发调试及贡献流程,结合实战练习与学习路径,助你由使用者进阶为贡献者。

1032 139
|
7月前
|
JavaScript Linux 开发工具
|

编写第一个MCP Server之Hello world

本文介绍如何使用Node.js编写一个简单的MCP Server——“Echo”服务。通过环境搭建、项目初始化、代码实现及验证,完成MCP服务的开发与调用测试,助力快速入门MCP协议开发。

602 2
|
7月前
|
人工智能 自然语言处理 IDE
|

模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验

通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。

1165 109
来自: 人工智能平台PAI  版块
|
8月前
|
Web App开发 存储 缓存
|

markdown编辑器

本Markdown编辑器基于StackEdit改进,新增界面设计、代码高亮、图片拖拽、KaTeX公式、甘特图、多屏编辑、写作模式切换、检查列表等功能,提升写作体验,支持离线使用与多种格式导出。

444 0
|
8月前
|
机器学习/深度学习 数据采集 人工智能
|

基于PAI-ChatLearn的GSPO强化学习实践

近期,阿里通义千问团队创新性提出了GSPO算法,GSPO 算法与其他 RL 算法相比,定义了序列级别的重要性比率,并在序列层面执行裁剪、奖励和优化。同时具有强大高效、稳定性出色、基础设施友好的突出优势。

916 3
来自: 人工智能平台PAI  版块
|
8月前
|
人工智能 自然语言处理 算法
|

提升LangChain开发效率:10个被忽视的高效组件,让AI应用性能翻倍

LangChain作为主流大语言模型应用框架,其高级组件常被忽视。本文详解10个高价值但低使用率的核心组件,如语义检索、多模板路由、智能查询转换等,结合技术原理与实践案例,助开发者构建更高效、智能、适应性强的AI系统,提升应用性能与业务价值。

553 0
|
8月前
|
传感器 自动驾驶 算法
|

自动驾驶还远吗?关键看“眼睛”

自动驾驶感知系统是智能车的“眼睛”,依赖摄像头、激光雷达、毫米波雷达等传感器实现环境感知。文章详解了感知架构、主流目标检测方法(如2D/3D检测、多传感器融合)、感知挑战(如极端天气、长尾问题)及发展趋势,并结合驭势科技实践,展示了数据闭环、BEV感知、全景分割等技术进展,推动自动驾驶向全天候、全无人目标迈进。

479 0
|
9月前
|
JSON Java API
|

如何获取sku详情信息

`item_sku`接口用于获取商品的SKU详细信息,支持通过商品ID和SKU ID查询。提供公共参数及请求参数说明,并包含请求和响应示例。支持多种开发语言,如Curl、PHP、JAVA等,适用于电商应用开发。

389 0
|
9月前
|
自然语言处理 DataWorks 数据挖掘
|

DataWorks接入Qwen3-Coder!数据开发再提速!

阿里云DataWorks平台正式接入Qwen3-Coder模型,用户通过DataWorks Copilot智能助手,可实现自然语言交互完成代码生成、续写、优化等操作,显著提升数据开发与分析效率。同时支持Qwen-Code和Claude Code命令行Agent安装,助力Notebook智能高效落地。

478 2
|
9月前
|
数据采集 存储 JSON
|

网页快照结构化处理方法笔记:以 Common Crawl 为例

本文介绍了如何利用 Common Crawl 项目获取历史网页快照,并通过 Python 实现快照下载、HTML 解析与结构化提取。结合爬虫代理和请求设置,帮助用户高效稳定地进行历史网页数据分析,适用于品牌追踪、内容对比等场景。

556 2
|
9月前
|
机器学习/深度学习 人工智能 算法
|

最大熵逆强化学习:理论基础、数学推导与工程实现

本文重点讨论逆强化学习(Inverse Reinforcement Learning, IRL),这是模仿学习的重要分支,其核心目标是基于演示数据学习能够最大化期望奖励的最优策略。

287 0
|
9月前
|
算法 安全 量子技术
|

量子计算来了,区块链还安全吗?我认真的研究了一下

量子计算来了,区块链还安全吗?我认真的研究了一下

341 2
|
10月前
|
存储 运维 监控
|

OpenFeature 实战:统一特征开关在风控模型的落地与灰度发布方案

在金融风控场景中,模型迭代速度与线上稳定性之间的平衡是一大挑战。传统硬编码方式存在耦合度高、控制粒度粗、缺乏审计等问题,导致误拦截损失显著。本文介绍了基于 OpenFeature 的解决方案,通过动态配置、细粒度控制和多语言支持实现高效特征管理,并结合灰度发布、熔断机制和安全审计提升系统稳定性与发布安全性。实战数据显示,该方案显著缩短上线周期、降低故障率并提升模型覆盖率,具备高可用性和可扩展性,适用于复杂风控环境下的策略迭代需求。

550 8
|
10月前
|
机器学习/深度学习 数据采集 分布式计算
|

阿里云PAI AutoML实战:20分钟构建高精度电商销量预测模型

本文介绍了如何利用阿里云 PAI AutoML 平台,在20分钟内构建高精度的电商销量预测模型。内容涵盖项目背景、数据准备与预处理、模型训练与优化、部署应用及常见问题解决方案,助力企业实现数据驱动的精细化运营,提升市场竞争力。

1492 0
|
10月前
|
数据采集 存储 API
|

Python爬虫结合API接口批量获取PDF文件

Python爬虫结合API接口批量获取PDF文件

712 0
|
10月前
|
数据采集 运维 BI
|

Python 文件操作进阶|使用 shutil 实现高效文件复制

在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!

565 0
|
10月前
|
人工智能 分布式计算 大数据
|

大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)

本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。

484 0
|
10月前
|
前端开发 Java 微服务
|

2025 版 Java 学习路线图之技术方案与实操指南详解

这是一份详尽的Java学习路线图,涵盖从入门到精通的全流程。基础阶段包括环境搭建、语法基础与面向对象编程;进阶阶段深入数据结构、算法、多线程及JVM原理;框架阶段学习Spring、MyBatis等工具;数据库阶段掌握SQL与NoSQL技术;前端阶段了解HTML、CSS及JavaScript框架;分布式与微服务阶段探讨容器化、服务注册与发现;最后通过项目实战提升性能优化与代码规范能力。资源地址:[https://pan.quark.cn/s/14fcf913bae6](https://pan.quark.cn/s/14fcf913bae6)。

753 7
|
11月前
|
存储 人工智能 自然语言处理
|

构建智能AI记忆系统:多智能体系统记忆机制的设计与技术实现

本文探讨了多智能体系统中记忆机制的设计与实现,提出构建精细化记忆体系以模拟人类认知过程。文章分析了上下文窗口限制的技术挑战,并介绍了四种记忆类型:即时工作记忆、情节记忆、程序性记忆和语义知识系统。通过基于文件的工作上下文记忆、模型上下文协议的数据库集成以及RAG系统等技术方案,满足不同记忆需求。此外,高级技术如动态示例选择、记忆蒸馏和冲突解决机制进一步提升系统智能化水平。总结指出,这些技术推动智能体向更接近人类认知的复杂记忆处理机制发展,为人工智能开辟新路径。

1141 5
|
11月前
|
人工智能 自然语言处理 文字识别
|

阿里云 AI 搜索开放平台新增:服务开发能力

阿里云 AI 搜索开放平台新发布:服务开发能,可通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。

454 0
来自: 智能搜索推荐  版块
|
12月前
|
存储 运维 Serverless
|

千万级数据秒级响应!碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构,解决了海量数据处理中的资源利用率低、并发能力不足等问题,显著降低了硬件和运维成本。实时查询性能提升8倍,查询出错率减少30倍,集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验,还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

1082 69
|
12月前
|
数据采集 JSON API
|

Python 实战!利用 API 接口获取小红书笔记详情的完整攻略

小红书笔记详情API接口帮助商家和数据分析人员获取笔记的详细信息,如标题、内容、作者信息、点赞数等,支持市场趋势与用户反馈分析。接口通过HTTP GET/POST方式请求,需提供`note_id`和`access_token`参数,返回JSON格式数据。以下是Python示例代码,展示如何调用该接口获取数据。使用时请遵守平台规范与法律法规。

1215 0
|
12月前
|
自然语言处理 运维 DataWorks
|

智能体Agent解析:用自然语言重构数据开发工作方式

大数据开发治理平台DataWorks基于MCP协议,正式发布了DataWorks Agent,内置DataWorks MCP Server V1.0。该功能支持在DataWorks Data Studio中通过自然语言交互完成数据开发任务,实现了需求即代码的开发体验。本文将详细介绍如何通过配置使用DataWorks MCP Server进行任务的开发和运维管理。

892 3
|
17天前
|
SQL 机器学习/深度学习 自然语言处理
|

为什么企业做智能问数,不能只靠宽表、预制指标和 SQL

本文剖析企业智能问数落地难的根源:非性能或模型之限,而在业务语义缺失——对象定义不清、关系模糊、口径不一。指出SQL、宽表、预制指标各有所长却难解复杂动态问题;提出“本体论+ABC方法”(Acquire对象→Build指标→Compute计算),以显式建模业务语义,提升可理解性、可维护性与长期演进能力。

134 3
|
18天前
|
存储 监控 安全
|

本地自动化工具怎么用在生活里?三个非办公场景拆解

本文介绍零代码浏览器自动化工具的三大实用场景:二手游戏卡带盯梢、医院挂号抢号、自媒体负面评论监控。通过定时触发、网页操作、关键词判断与自动提醒/操作,无需编程即可解放双手,全程本地运行、安全合规,小白也能快速上手。(239字)

117 8

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务