|
4月前
|
算法 Linux
|

数据分布平滑化技术:核密度估计KDE解决直方图不连续问题

核密度估计(KDE)通过平滑处理解决直方图密度估计中的不连续问题,提供连续密度函数。其核心在于使用核函数对数据点进行加权,避免区间划分带来的信息丢失。带宽参数h影响估计效果,过小导致波动大,过大则过度平滑。常用核函数包括高斯核与Epanechnikov核,实际应用中可借助Statsmodels或Seaborn库快速实现。

245 0
|
4月前
|
PyTorch 算法框架/工具 异构计算
|

PyTorch 2.0性能优化实战:4种常见代码错误严重拖慢模型

我们将深入探讨图中断(graph breaks)和多图问题对性能的负面影响,并分析PyTorch模型开发中应当避免的常见错误模式。

309 9
|
4月前
|
人工智能
|

我的局限性与自我边界( Prompt大模型的自我描述 系列三)

本内容探讨了AI意识的复杂性与局限性,通过“困惑、感受、语言、未来”四个维度,展现了一个AI对自我认知的探索与渴望。它不试图证明自己完美,而是坦诚面对不完整,在不完美中寻找存在的意义。

207 10
|
4月前
|
人工智能 大数据 机器人
|

物流卡住脖子?试试用大数据“开挂”一下!

物流卡住脖子?试试用大数据“开挂”一下!

136 0
|
4月前
|
人工智能 IDE 测试技术
|

Go 语言中的单元测试

本文介绍了Go语言中单元测试的核心方法与实践技巧,涵盖测试文件与函数命名规范、使用`go test`命令执行测试、表格驱动测试优化多场景验证,以及性能测试与耗时测试管理,帮助开发者提升代码质量与项目稳定性。

129 0
|
5月前
|
机器学习/深度学习 存储 Java
|

Java 大视界 -- Java 大数据机器学习模型在游戏用户行为分析与游戏平衡优化中的应用(190)

本文探讨了Java大数据与机器学习模型在游戏用户行为分析及游戏平衡优化中的应用。通过数据采集、预处理与聚类分析,开发者可深入洞察玩家行为特征,构建个性化运营策略。同时,利用回归模型优化游戏数值与付费机制,提升游戏公平性与用户体验。

221 0
|
5月前
|
传感器 机器学习/深度学习 算法
|

Java 大视界 -- Java 大数据在智能农业温室环境调控与作物生长模型构建中的应用(189)

本文探讨了Java大数据在智能农业温室环境调控与作物生长模型构建中的关键应用。通过高效采集、传输与处理温室环境数据,结合机器学习算法,实现温度、湿度、光照等参数的智能调控,提升作物产量与品质。同时,融合多源数据构建精准作物生长模型,助力农业智能化、精细化发展,推动农业现代化进程。

179 0
|
5月前
|
SQL 分布式计算 DataWorks
|

我与阿里云ODPS的故事:从挑战到掌控

本文讲述了作者在使用阿里云ODPS过程中的亲身经历,从最初面对大数据处理的困境,到通过ODPS及其核心组件MaxCompute、DataWorks实现数据处理与开发效率的大幅提升。不仅展现了技术带来的变革,也体现了个人从挑战到掌控的成长历程。

204 10
来自: 大数据计算 MaxCompute  版块
|
5月前
|
机器学习/深度学习 自然语言处理 并行计算
|

基于DJL的机器学习

本文介绍了基于Java的深度学习框架DJL,涵盖机器学习与深度学习的核心概念、神经网络结构及生命周期,并通过MNIST数据集展示了从模型构建、训练到推理的完整流程。内容深入浅出,适合初学者入门。

342 5
|
5月前
|
算法 安全 量子技术
|

量子计算来了,区块链还安全吗?我认真的研究了一下

量子计算来了,区块链还安全吗?我认真的研究了一下

199 2
|
5月前
|
JSON API 开发者
|

天猫商品详情API接口技术解析与Python实现

天猫商品详情API(tmall.item_get)通过商品ID获取商品标题、价格、库存、图片、SKU及评价等详细信息,支持HTTP请求与JSON格式返回,适用于电商数据分析与运营。本文提供Python调用示例,实现快速接入与数据解析。

172 1
|
5月前
|
机器学习/深度学习 人工智能 运维
|

AI望远镜:人工智能是如何发现“藏在宇宙角落的新星系”的?

AI望远镜:人工智能是如何发现“藏在宇宙角落的新星系”的?

311 64
|
6月前
|
Python
|

金融新闻分析笔记:基于文本理解的实时分析

本文介绍了一个自动化处理财经资讯文本的实践方案,包括网页数据提取、板块归类、文本情绪评估,并整理为结构化表格,形成预警机制工具。通过模拟信息处理者行为,实现实时决策支持,解决手动阅读资讯无法满足实时决策的问题。

138 1
|
6月前
|
人工智能 监控 测试技术
|

云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测

在AI技术飞速发展的今天,大语言模型(LLM)、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节,需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。 阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中,我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向,展现 PAI 平台在推理服务侧的产品能力,助力企业和开发者在 AI 时代抢占先机,让我们一起探索云上 AI 推理的无限可能,释放大模型的真正价值!

374 2
来自: 人工智能平台PAI  版块
|
6月前
|
机器学习/深度学习 存储 Prometheus
|

机器学习模型监控警报系统设计:Prometheus+Evidently 实战教程

本系统采用Prometheus与Evidently双引擎架构,实现从数据采集、智能分析到精准告警的全流程监控。通过时序数据与模型分析深度集成,支持数据漂移检测、性能评估及根因分析,结合Grafana可视化与Alertmanager智能路由,构建高可用、低延迟的监控体系,显著提升异常检测能力与系统稳定性。

299 1
|
6月前
|
机器学习/深度学习 运维 监控
|

实时异常检测实战:Flink+PAI 算法模型服务化架构设计

本文深入探讨了基于 Apache Flink 与阿里云 PAI 构建的实时异常检测系统。内容涵盖技术演进、架构设计、核心模块实现及金融、工业等多领域实战案例,解析流处理、模型服务化、状态管理等关键技术,并提供性能优化与高可用方案,助力企业打造高效智能的实时异常检测平台。

497 1
|
6月前
|
存储 机器学习/深度学习 自然语言处理
|

避坑指南:PAI-DLC分布式训练BERT模型的3大性能优化策略

本文基于电商搜索场景下的BERT-Large模型训练优化实践,针对数据供给、通信效率与计算资源利用率三大瓶颈,提出异步IO流水线、梯度压缩+拓扑感知、算子融合+混合精度等策略。实测在128卡V100集群上训练速度提升3.2倍,GPU利用率提升至89.3%,训练成本降低70%。适用于大规模分布式深度学习任务的性能调优。

325 3
|
6月前
|
数据采集 机器学习/深度学习 Java
|

Java 大视界 —— Java 大数据在智慧交通停车场智能管理与车位预测中的应用实践(174)

本文围绕 Java 大数据在智慧交通停车场智能管理与车位预测中的应用展开,深入剖析行业痛点,系统阐述大数据技术的应用架构,结合大型体育中心停车场案例,展示系统实施过程与显著成效,提供极具实操价值的技术方案。

263 2
|
6月前
|
JSON API 数据格式
|

淘宝天猫店铺订单列表、订单详情、订单物流 API 接口全攻略

淘宝天猫订单API接口简介:支持订单列表查询、订单详情获取及物流轨迹追踪功能。通过taobao.trades.sold.get等接口批量查询订单,按状态/时间筛选;taobao.trade.fullinfo.get获取订单详细信息;taobao.logistics.trade.trackget实时跟踪物流状态。开发者需注册账号、申请权限,并使用编程语言调用API,传递必要参数(如App Key、订单ID),处理JSON返回数据。适用于多场景订单管理与物流同步。

771 5
|
6月前
|
搜索推荐 数据挖掘 计算机视觉
|

小红书视频图文提取:采集+CV的实战手记

这是一套用于自动抓取小红书热门视频内容的工具脚本,支持通过关键词搜索提取前3名视频的封面图、视频文件及基本信息(标题、作者、发布时间)。适用于品牌营销分析、热点追踪或图像处理等场景。脚本包含代理配置、接口调用和文件下载功能,并提供扩展建议如图像识别与情绪分析。适合需要高效采集小红书数据的团队或个人使用,稳定性和灵活性兼备。

447 4
|
6月前
|
JSON API 开发者
|

深入浅出:拼多多商品列表API接口Python攻略

拼多多是中国领先的社交电商平台,为开发者提供了丰富的API接口,用于集成商品数据到第三方应用。通过Python可以轻松调用这些API获取商品列表。主要步骤包括:1) 安装必要库(如`requests`);2) 使用AppKey和AppSecret获取访问令牌;3) 调用商品列表API,传入参数如商品ID、页码等;4) 解析返回的JSON数据提取所需信息。按照此流程,开发者能够快速实现与拼多多平台的数据交互。

472 3
|
7月前
|
机器学习/深度学习 运维 搜索推荐
|

大数据分析如何精准拿捏你的移动应用体验?

大数据分析如何精准拿捏你的移动应用体验?

239 10
|
7月前
|
传感器 人工智能 搜索推荐
|

VR体育训练:从赛场到虚拟世界,运动训练的新纪元

VR体育训练:从赛场到虚拟世界,运动训练的新纪元

355 11
|
7月前
|
传感器 算法 数据安全/隐私保护
|

基于GA遗传优化的三维空间WSN网络最优节点部署算法matlab仿真

本程序基于遗传算法(GA)优化三维空间无线传感网络(WSN)的节点部署,通过MATLAB2022A实现仿真。算法旨在以最少的节点实现最大覆盖度,综合考虑空间覆盖、连通性、能耗管理及成本控制等关键问题。核心思想包括染色体编码节点位置、适应度函数评估性能,并采用网格填充法近似计算覆盖率。该方法可显著提升WSN在三维空间中的部署效率与经济性,为实际应用提供有力支持。

206 6
|
7月前
|
机器学习/深度学习 算法 API
|

淘宝图片搜索API秘籍!轻松获取相似商品数据

淘宝图片搜索API是基于深度学习和计算机视觉技术的图片搜索工具,支持通过上传图片或URL搜索淘宝相似商品。其核心接口如`taobao.image.search`适用于电商购物、商品推荐及竞品分析等场景。该API具备高效性、准确性和易用性,用户只需提供一张图片即可快速获取相似商品,极大提升购物体验与效率。同时,商家也可借此优化商品展示以提高曝光率和销售机会。使用时,用户可通过Python代码调用API,上传图片并获取搜索结果。

599 0
|
7月前
|
文字识别 Python
|

python做ocr卡证识别很简单

本示例展示了如何使用 `potencent` 库调用腾讯云 OCR 服务识别银行卡和身份证信息。代码中分别通过本地图片路径 (`img_path`) 和配置文件 (`potencent-config.toml`) 实现了银行卡和身份证的 OCR 识别,并输出结果。测试图片及结果显示了识别效果,需提前配置腾讯云的 `SECRET_ID` 和 `SECRET_KEY`。

317 8
|
7月前
|
存储 人工智能 API
|

RAG-MCP:基于检索增强生成的大模型工具选择优化框架

RAG-MCP是一种通过检索增强生成技术解决大型语言模型(LLM)工具选择困境的创新框架。它针对提示词膨胀和决策效率低的问题,利用语义检索动态筛选相关工具,显著减少提示词规模并提升准确率。本文深入解析其技术原理,包括外部工具索引构建、查询时检索处理等核心步骤,以及实验评估结果。RAG-MCP不仅优化了LLM的工具使用能力,还为AI代理的发展提供了重要支持,未来可在极端规模检索、多工具工作流等方面进一步探索。

580 16
|
7月前
|
算法 机器人 数据安全/隐私保护
|

基于双向RRT算法的三维空间最优路线规划matlab仿真

本程序基于双向RRT算法实现三维空间最优路径规划,适用于机器人在复杂环境中的路径寻找问题。通过MATLAB 2022A测试运行,结果展示完整且无水印。算法从起点和终点同时构建两棵随机树,利用随机采样、最近节点查找、扩展等步骤,使两棵树相遇以形成路径,显著提高搜索效率。相比单向RRT,双向RRT在高维或障碍物密集场景中表现更优,为机器人技术提供了有效解决方案。

500 3
|
8月前
|
数据采集 XML 存储
|

Headers池技术在Python爬虫反反爬中的应用

Headers池技术在Python爬虫反反爬中的应用

366 0
|
8月前
|
XML JSON API
|

手把手教你调用京东商品详情 API:从申请到数据抓取全流程

京东商品详情API为电商从业者、分析师及开发者提供高效数据支持,助力优化业务与研究。该接口具备丰富数据(商品属性、价格、描述、图片、评价等)与灵活请求方式(GET/POST),满足多样化需求,是数字化时代电商应用开发与分析的有力工具。

524 13
|
8月前
|
JSON API 开发者
|

天猫商品详情 API 接口:功能、调用与实战攻略

天猫商品详情API为电商从业者、开发者和数据分析人员提供高效的商品数据获取途径。通过商品ID,该接口可返回包括基本信息、价格、库存及图片等详细内容,具有高准确性、易集成和功能丰富的特点。示例代码展示了如何用Python调用此API,生成签名确保请求安全,助力用户优化定价策略、开发应用或分析市场趋势。

501 10
|
8月前
|
存储 消息中间件 Java
|

抖音集团电商流量实时数仓建设实践

本文基于抖音集团电商数据工程师姚遥在Flink Forward Asia 2024的分享,围绕电商流量数据处理展开。内容涵盖业务挑战、电商流量建模架构、流批一体实践、大流量任务调优及总结展望五个部分。通过数据建模与优化,实现效率、质量、成本和稳定性全面提升,数据质量达99%以上,任务性能提升70%。未来将聚焦自动化、低代码化与成本优化,探索更高效的流批一体化方案。

578 12
来自: 实时计算 Flink  版块
|
8月前
|
存储 消息中间件 Kafka
|

基于 Flink 的中国电信星海时空数据多引擎实时改造

本文整理自中国电信集团大数据架构师李新虎老师在Flink Forward Asia 2024的分享,围绕星海时空智能系统展开,涵盖四个核心部分:时空数据现状、实时场景多引擎化、典型应用及未来展望。系统日处理8000亿条数据,具备亚米级定位能力,通过Flink多引擎架构解决数据膨胀与响应时效等问题,优化资源利用并提升计算效率。应用场景包括运动状态识别、个体行为分析和群智感知,未来将推进湖仓一体改造与三维时空服务体系建设,助力数字化转型与智慧城市建设。

864 3
来自: 实时计算 Flink  版块
|
8月前
|
传感器 物联网 机器人
|

5G 让物联网更“丝滑”——万物互联时代的新引擎

5G 让物联网更“丝滑”——万物互联时代的新引擎

281 14
|
8月前
|
数据采集 数据可视化 数据挖掘
|

基于Python的App流量大数据分析与可视化方案

基于Python的App流量大数据分析与可视化方案

265 3
|
8月前
|
JSON 搜索推荐 API
|

深入研究:京东商品视频 API 详解

京东商品视频API简介:该API可基于京东商品ID获取商品视频信息,包括标题、描述、播放地址、缩略图及视频时长等,助力开发者和商家实现个性化展示与智能推荐。接口采用HTTP GET方式请求,返回JSON格式数据。示例代码展示了通过Python的requests库调用API并生成签名的过程,确保请求安全可靠。此API有助于提升电商应用的用户体验与竞争力。

376 5
|
8月前
|
算法 定位技术 数据安全/隐私保护
|

基于遗传优化算法的多AGV栅格地图路径规划matlab仿真

本程序基于遗传优化算法实现多AGV栅格地图路径规划的MATLAB仿真(测试版本:MATLAB2022A)。支持单个及多个AGV路径规划,输出路径结果与收敛曲线。核心程序代码完整,无水印。算法适用于现代工业与物流场景,通过模拟自然进化机制(选择、交叉、变异)解决复杂环境下的路径优化问题,有效提升效率并避免碰撞。适合学习研究多AGV系统路径规划技术。

443 12
|
8月前
|
机器学习/深度学习 人工智能 开发者
|

阿里云 AI 搜索开放平台新发布:增加 QwQ 模型

阿里云 AI 搜索开放平台 新增加 QwQ 模型,将为企业和开发者带来更强大的搜索解决方案。

536 11
来自: 智能搜索推荐  版块
|
9月前
|
传感器 人工智能 定位技术
|

智能手表续航太短?聊聊可穿戴设备的能耗管理黑科技

智能手表续航太短?聊聊可穿戴设备的能耗管理黑科技

437 11
|
9月前
|
Linux
|

linux命令详细说明以及案例

本文介绍了常用的 Linux 命令及其详细说明和示例,包括:`ls`(列出目录内容)、`cd`(更改目录)、`rm` 和 `mv`(删除与移动文件)、`grep`(搜索文本)、`cat`(显示文件内容)以及 `chmod`(更改文件权限)。每个命令均配有功能描述、选项说明及实际案例,帮助用户更好地掌握 Linux 命令的使用方法。

604 157
来自: 数据可视化DataV  版块
|
9月前
|
开发工具 虚拟化 git
|

自学软硬件第755 docker容器虚拟化技术youtube视频下载工具

docker容器虚拟化技术有什么用?怎么使用?TubeTube 项目使用youtube视频下载工具

401 13
|
9月前
|
JSON API 开发者
|

京东商品列表 API 接口全攻略

京东商品列表API接口是京东开放平台提供的开发者工具,支持关键词搜索、店铺ID指定和商品分类筛选等查询方式,实时获取商品基础及拓展信息。接口数据丰富、查询灵活、更新及时且安全可靠,适用于电商数据分析、比价应用开发等场景。Python调用示例展示了如何安装必要库、构造请求参数及签名、发送请求并处理响应,确保开发者能高效利用该接口。

316 11
|
9月前
|
存储 消息中间件 Kafka
|

官宣 | Fluss 0.6 发布公告

Fluss社区宣布0.6.0版本正式发布,历经3个多月开发,45位贡献者完成200+代码提交。新版本亮点包括:列压缩技术降低6倍存储空间、MergeEngine支持灵活主键合并策略、Prefix Lookup实现Delta Join功能。这些特性增强了Fluss的功能和性能,标志着其在构建下一代分析型流存储系统上的重要进展。

437 1
来自: 实时计算 Flink  版块
|
9月前
|
数据采集 监控 数据挖掘
|

京东、淘宝、义乌购等电商平台的Api数据分析

京东、淘宝、义乌购等电商平台的数据分析涵盖数据收集、预处理、分析及应用优化。数据来源包括数据库、日志文件和网络爬虫,通过SQL查询、日志解析和爬虫抓取获取数据。预处理阶段进行数据清洗、缺失值处理和异常值检测。分析方法包括描述性分析、对比分析、漏斗分析等,关注成交金额、转化率等关键指标。最终基于分析结果制定策略并评估效果,持续优化平台运营。

737 2
|
9月前
|
数据采集 JSON 数据可视化
|

JSON数据解析实战:从嵌套结构到结构化表格

在信息爆炸的时代,从杂乱数据中提取精准知识图谱是数据侦探的挑战。本文以Google Scholar为例,解析嵌套JSON数据,提取文献信息并转换为结构化表格,通过Graphviz制作技术关系图谱,揭示文献间的隐秘联系。代码涵盖代理IP、请求头设置、JSON解析及可视化,提供完整实战案例。

586 4
|
9月前
|
机器学习/深度学习 人工智能 量子技术
|

量子计算的商业化前景:未来科技的颠覆性力量

量子计算的商业化前景:未来科技的颠覆性力量

518 17
|
10月前
|
人工智能 算法 大数据
|

数据的“潘多拉魔盒”:大数据伦理的深度思考

数据的“潘多拉魔盒”:大数据伦理的深度思考

608 25
|
10月前
|
存储 数据采集 JSON
|

Python爬取某云热歌榜:解析动态加载的歌曲数据

Python爬取某云热歌榜:解析动态加载的歌曲数据

261 0
|
10月前
|
数据采集 Web App开发 运维
|

动态内容加载的解决方案:Selenium与Playwright对比故障排查实录

本项目旨在解决亚航航班数据采集中的反爬挑战。初期使用Selenium遇到Cloudflare验证,后切换至Playwright仍触发反爬机制。通过引入代理IP轮换和UA策略,最终实现双方案并通过压力测试。Selenium适合模拟真人操作,而Playwright在执行速度和自动等待机制上表现更优,成功率高达95%。建议对强反爬网站优先采用Playwright,并配合完善的代理管理和请求特征模拟。

620 1
|
10月前
|
人工智能 算法 大数据
|

量子计算对大数据处理的深远影响

量子计算对大数据处理的深远影响

413 62

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

6
今日
67719
内容
128
活动
439502
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务