|
11月前
|
存储 分布式计算 MaxCompute
|

使用PAI-FeatureStore管理风控应用中的特征

PAI-FeatureStore 是阿里云提供的特征管理平台,适用于风控应用中的离线和实时特征管理。通过MaxCompute定义和设计特征表,利用PAI-FeatureStore SDK进行数据摄取与预处理,并通过定时任务批量计算离线特征,同步至在线存储系统如FeatureDB或Hologres。对于实时特征,借助Flink等流处理引擎即时分析并写入在线存储,确保特征时效性。模型推理方面,支持EasyRec Processor和PAI-EAS推理服务,实现高效且灵活的风险控制特征管理,促进系统迭代优化。

263 6
来自: 人工智能平台PAI  版块
|
11月前
|
缓存 负载均衡 安全
|

Swift中的网络代理设置与数据传输

Swift中的网络代理设置与数据传输

325 4
来自: 智能搜索推荐  版块
|
11月前
|
人工智能 分布式计算 DataWorks
|

大数据& AI 产品月刊【2024年12月】

大数据& AI 产品技术月刊【2024年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

475 21
|
11月前
|
数据采集 XML API
|

深入解析BeautifulSoup:从sohu.com视频页面提取关键信息的实战技巧

深入解析BeautifulSoup:从sohu.com视频页面提取关键信息的实战技巧

284 7
|
11月前
|
分布式计算 数据处理 MaxCompute
|

云产品评测|分布式Python计算服务MaxFrame

云产品评测|分布式Python计算服务MaxFrame

228 2
|
11月前
|
数据采集 存储 数据挖掘
|

构建电商数据采集系统初定位

构建电商数据采集系统需经历需求分析、技术选型、系统设计、开发实现、测试优化及部署维护六大步骤。过程中要明确目标与数据范围,选择合适的工具和数据库,并设计合理的架构与采集策略。还需考虑合法合规、分布式采集、数据质量控制及动态调整等策略,确保系统高效、稳定运行,适应电商环境变化。

345 8
|
11月前
|
存储 供应链 监控
|

反向海淘中下单、支付方式、订单、库存管理、物流与配送

反向海淘指海外消费者通过跨境电商平台购买中国商品。其流程包括:1) 海外消费者在支持多语言和货币的平台上选品、加入购物车并填写准确收货信息下单;2) 支付方式涵盖国际信用卡、第三方支付平台(如PayPal)、本地支付及电子钱包;3) 订单管理涉及订单确认、拣货包装、发货跟踪及售后处理,并通过数据分析优化库存与销售;4) 库存管理强调实时监控、多渠道同步、预警补货及滞销处理;5) 物流方案提供国际快递、邮政包裹、专线物流和海外仓等多种选择,确保全程跟踪和清关服务。

453 7
|
11月前
|
传感器 算法
|

基于GA遗传优化的WSN网络最优节点部署算法matlab仿真

本项目基于遗传算法(GA)优化无线传感器网络(WSN)的节点部署,旨在通过最少的节点数量实现最大覆盖。使用MATLAB2022A进行仿真,展示了不同初始节点数量(15、25、40)下的优化结果。核心程序实现了最佳解获取、节点部署绘制及适应度变化曲线展示。遗传算法通过初始化、选择、交叉和变异步骤,逐步优化节点位置配置,最终达到最优覆盖率。

337 0
|
11月前
|
人工智能 安全 大数据
|

PAI年度发布:GenAI时代AI基础设施的演进

本文介绍了AI平台在大语言模型时代的新能力和发展趋势。面对推理请求异构化、持续训练需求及安全可信挑战,平台推出了一系列优化措施,包括LLM智能路由、多模态内容生成服务、serverless部署模式等,以提高资源利用效率和降低使用门槛。同时,发布了训推一体调度引擎、竞价任务等功能,助力企业更灵活地进行训练与推理任务管理。此外,PAI开发平台提供了丰富的工具链和最佳实践,支持从数据处理到模型部署的全流程开发,确保企业和开发者能高效、安全地构建AI应用,享受AI带来的红利。

359 1
来自: 人工智能平台PAI  版块
|
11月前
|
人工智能 分布式计算 数据处理
|

有奖评测,基于分布式 Python 计算服务 MaxFrame 进行数据处理

阿里云MaxCompute MaxFrame推出分布式Python计算服务MaxFrame评测活动,助力开发者高效完成大规模数据处理、可视化探索及ML/AI开发。活动时间为2024年12月17日至2025年1月31日,参与者需体验MaxFrame并发布评测文章,有机会赢取精美礼品。

219 3
来自: 大数据计算 MaxCompute  版块
|
12月前
|
机器学习/深度学习 分布式计算 数据挖掘
|

MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎

MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。

256 6
|
12月前
|
JSON 搜索推荐 API
|

拍立淘API是基于图像识别技术的服务接口,支持淘宝、1688和义乌购平台。

拍立淘API是基于图像识别技术的服务接口,支持淘宝、1688和义乌购平台。用户上传图片后,系统能快速匹配相似商品,提供精准搜索结果,并根据用户历史推荐个性化商品,简化购物流程。开发者需注册账号并获取API Key,授权权限后调用接口,返回商品详细信息如ID、标题、价格等。使用时需遵守频率限制,确保图片质量,保障数据安全。

466 5
|
12月前
|
安全 架构师 大数据
|

DataWorks 安全中心

DataWorks的安全中心,作为云上大数据体系的安全门户,致力于向您提供面向数据安全生命周期全过程的安全能力,同时在符合安全规范要求的前提下,提供各类安全诊断的最佳实践。帮助您快速构建平台的数据内容、个人隐私等相关的安全能力,满足企业面向高风险场景的各类安全要求。

246 0
|
12月前
|

DataWorks Copilot

DataWorks Copilot是您在DataWorks的智能助手,当前阶段可根据自然语言快速转换为需要的SQL命令,包括SQL生成、SQL改写、SQL纠错、生成注释等,帮助您轻松高效地完成数据ETL及数据分析工作。本文为您介绍在各个场景下DataWorks Copilot的智能SQL能力。

285 0
|
12月前
|
存储 数据采集 数据挖掘
|

CSV vs 数据库:数据存储的最佳选择是什么

本文介绍了爬虫数据存储中CSV和数据库的优缺点,分析了两者在不同场景下的适用性。CSV简单易用、资源消耗低,适合小量数据;数据库则在处理大量数据和复杂查询时表现出色,支持并发操作。通过Python代码示例,展示了如何使用多线程和爬虫代理IP技术将百度搜索数据存储到MySQL数据库中,适用于大型项目和复杂数据分析需求。

731 2
|
12月前
|
安全 Serverless API
|

aliyun多模态数据信息提取方案评测

该页面设计布局合理,左右分区呈现文档与操作区域,实现了理论指导与实际操作的紧密结合,极大提升了部署流程的便捷性和效率。关键步骤提供详细提示,降低用户学习成本和操作难度,尤其适合初次使用者。信息整合方便对比,减少错误,增强用户体验。整体简洁明了,鼓励自主操作,适用于新手和技术人员,显著提高了部署任务的流畅性和成功率。不足之处在于多模态数据融合处理和跨平台兼容性有待优化。

341 7
|
12月前
|
存储 监控 搜索推荐
|

tibble 和传统数据框:哪个更适合网页爬取的数据存储

本文探讨了R语言中传统数据框与tibble在网页爬取数据存储中的表现,并通过采集百度搜索前十关键词链接的实例进行对比。tibble在性能、灵活性和易用性方面优于传统数据框,尤其适合大规模数据处理。代码示例展示了如何结合代理IP和多线程技术高效爬取百度搜索结果并存储为tibble格式。总结指出,tibble更适合大型项目,而传统数据框适用于简单任务。

239 0
|
1月前
|
编解码 API 开发者
|

淘宝天猫商品视频API,轻松采集视频数据

淘宝天猫商品视频API可基于商品ID获取视频链接、时长、封面等信息,支持RESTful调用,适用于电商开发与内容分析。需注册开放平台账号并申请权限,提供高实时、精准的视频数据服务。

166 0
|
1月前
|
中间件 应用服务中间件 Linux
|

liunx环境安装PageAdmin Cms系统

Linux 环境安装 PageAdmin CMS,需按步骤配置环境,依托其兼顾模板与定制的优势,低技术门槛,助力企业高效搭建适配需求的网站。

103 1
|
1月前
|
大数据 BI 定位技术
|

当年轻人不再去KTV,我们该如何用数据读懂文化消费?

当年轻人不再去KTV,我们该如何用数据读懂文化消费?

105 5
|
1月前
|
JSON 监控 供应链
|

淘宝天猫店铺商品API:电商运营的数据赋能利器

天猫店铺商品API是淘宝开放平台的核心接口,支持通过店铺ID获取商品列表、库存、价格及多媒体信息。具备分页查询、字段筛选等功能,适用于电商分析、竞品监控与多平台运营,助力高效数据决策。(238字)

107 1
|
2月前
|
XML 供应链 监控
|

淘宝商品详情API赋能电商数据模型:从SKU分析到销量预测

淘宝商品详情API(taobao.item.get)通过商品ID实时获取标题、价格、库存等数据,支持RESTful风格与OAuth2.0认证,具备高实时性、字段定制和防封禁机制,适用于比价、库存监控等场景。

174 1
|
2月前
|
搜索推荐 关系型数据库 MySQL
|

2026版基于python的旅游景点推荐系统

本研究基于Python构建旅游景点推荐系统,利用Django框架与MySQL数据库,结合用户偏好、行为数据及景点多维度信息,实现个性化精准推荐,提升游客决策效率与体验,推动旅游智能化发展。

155 1
|
2月前
|
JSON API 定位技术
|

京东商品评论API技术指南

京东商品评论API提供标准化接口,支持按评分、排序、分页获取商品评论数据,返回JSON格式的评论内容、用户信息、评分星级及热门标签等,助力电商数据分析与运营决策。

161 1
|
2月前
|
关系型数据库 MySQL 数据处理
|

基于python的化妆品销售分析系统

本项目基于Python构建化妆品销售分析系统,结合Django框架与MySQL数据库,实现销售数据的采集、处理、分析与可视化,助力企业精准营销与决策优化,推动化妆品行业数字化转型。

169 9
|
2月前
|
数据采集 测试技术 数据处理
|

12 种 Pandas 测试技巧,让数据处理少踩坑

本文介绍12种实用的Pandas测试技巧,涵盖数据工厂、模式校验、属性测试、快照比对、边界用例、随机控制、NA处理、索引验证、双实现对照、性能监控、I/O往返和Join检查,帮助开发者提前发现隐藏bug,提升数据处理代码的可靠性与可维护性。

183 6
|
2月前
|
人工智能 算法 安全
|

手术也能“开外挂”?医学机器人如何让刀更稳、术更准

手术也能“开外挂”?医学机器人如何让刀更稳、术更准

153 15
|
2月前
|
Kubernetes 安全 API
|

深入 Kubernetes:从零到生产的工程实践与原理洞察

🌟蒋星熠Jaxonic带你深入Kubernetes核心:从控制回路到生产落地,详解部署、弹性、安全与可观测性。用代码绘制云原生星图,让每次发布如深空机动般精准可控。🚀

131 3
|
3月前
|
算法 安全 大数据
|

大数据时代,法律该咋护住咱的隐私?

大数据时代,法律该咋护住咱的隐私?

107 3
|
3月前
|
SQL 关系型数据库 MySQL
|

四、Sqoop 导入表数据子集

在实际数据导入场景中,我们经常只需要数据库中的一部分数据,比如按条件筛选的行、特定的几列。这篇文章详细讲解了如何使用 Sqoop 的 --where、--columns、--query 等方式灵活实现子集导入,配有完整示例和注意事项,助你更精准地控制数据流向 HDFS 或 Hive。

182 1
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
|

当AI遇上癌症:聊聊个性化治疗的新可能

当AI遇上癌症:聊聊个性化治疗的新可能

150 15
|
3月前
|
XML 数据格式
|

Parameter ‘**‘ not found. Available parameters are [0, 1, param1, param2]解决办法

Parameter ‘**‘ not found. Available parameters are [0, 1, param1, param2]解决办法

219 4
|
3月前
|
Java
|

java入门代码示例

本文介绍Java入门基础,包含Hello World、变量类型、条件判断、循环及方法定义等核心语法示例,帮助初学者快速掌握Java编程基本结构与逻辑。

421 0
|
3月前
|
机器学习/深度学习 搜索推荐 数据挖掘
|

看球还能更爽?数据分析教你解锁体育赛事新体验

看球还能更爽?数据分析教你解锁体育赛事新体验

150 4
|
3月前
|
人工智能 物联网 BI
|

诊断设备企业必看!垂直医疗行业的CRM软件有哪些?

2025年,诊断设备企业竞争核心转向精细化服务。传统CRM难堪重任,垂直医疗CRM成破局关键。本文深度解析八骏医疗云等五大解决方案,揭秘如何通过设备全周期管理、代理商管控、智能耗材预警与私有化部署,构建以客户为中心的服务体系,抢占增长制高点。

307 124
来自: 大数据计算 MaxCompute  版块
|
3月前
|
自然语言处理 测试技术 数据安全/隐私保护
|

速卖通开放平台接口实战:跨境电商商品检索与详情解析全方案(附多语言处理 + 签名避坑代码)

本文基于30+店铺实战经验,详解速卖通接口开发核心:从签名认证、多语言字段处理到商品检索与详情解析,提供可复用代码及避坑指南,助你快速实现选品工具、多平台同步等跨境场景,新手也能少走两天弯路。

155 0
|
3月前
|
搜索推荐 JavaScript Java
|

基于springboot的毕业旅游一站式定制系统

本系统基于Spring Boot、Vue等技术,构建毕业旅游一站式定制平台,整合旅游资源,利用大数据与人工智能实现个性化行程规划,满足毕业生多样化需求,提升旅游体验与行业效率。

130 0
|
3月前
|
人工智能 自然语言处理 监控
|

构建可观测、可治理的企业智能体:平台核心能力解析

在人工智能快速发展的背景下,企业智能体已成为推动数字化转型的重要力量。然而,其复杂性和不可预测性也带来了可靠性、透明性和可控性等挑战。构建具备全景可观测性、多层治理框架、智能体协同与知识管理、人类监督机制的智能体体系,成为企业实现安全、合规、高效运营的关键。通过系统化实施路径,企业可全面提升智能体的透明度与治理能力,把握智能时代发展机遇。

219 3
|
3月前
|
机器学习/深度学习 传感器 监控
|

大数据,真能帮我们“降温”吗?——聊聊科技如何应对气候变化

大数据,真能帮我们“降温”吗?——聊聊科技如何应对气候变化

100 7
|
3月前
|
人工智能 安全 Shell
|

Go并发编程避坑指南:从数据竞争到同步原语的解决方案

在高并发场景下,如钱包转账,数据一致性至关重要。本文通过实例演示了 Go 中如何利用 `sync.Mutex` 和 `sync.RWMutex` 解决数据竞争问题,帮助开发者掌握并发编程中的关键技能。

111 2
|
4月前
|
机器学习/深度学习 监控 大数据
|

数据当“安全带”:金融市场如何用大数据玩转风险控制?

数据当“安全带”:金融市场如何用大数据玩转风险控制?

166 10
|
4月前
|
传感器 边缘计算 机器人
|

5G加持下的工厂:智能制造的“加速器”

5G加持下的工厂:智能制造的“加速器”

129 5
|
4月前
|
JSON API 数据格式
|

小红书商品详情API数据解析(附代码)

本内容介绍了小红书商品详情API的使用方法,涵盖接口功能、数据结构及Python请求示例。适用于电商分析、市场研究,助力商家优化运营策略。

135 0
|
4月前
|
JSON 供应链 API
|

京东工业商品详情API数据python解析

京东工业商品详情API专为工业品采购设计,提供商品参数、资质认证、供应链等专业数据,适用于企业采购与供应链管理。支持多SKU查询,采用HTTPS协议与JSON格式,保障数据安全与高效调用。附Python调用示例,便于快速集成。

161 0
|
4月前
|
数据采集 NoSQL 数据挖掘
|

简单URL队列与复杂任务流转的边界实践 —— 速查小抄

本文对比了爬虫项目中“招聘市场监测”与“金融数据采集”两类场景下的任务调度策略,介绍了何时使用简单队列、何时采用复杂流转,并提供 Python 示例代码及代理配置建议,助你高效构建爬虫系统。

156 1
|
4月前
|
机器学习/深度学习 传感器 大数据
|

大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”

大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”

186 4
|
4月前
|
监控 物联网 5G
|

“地面+天上双保险”:5G遇上卫星互联网,会擦出怎样的火花?

“地面+天上双保险”:5G遇上卫星互联网,会擦出怎样的火花?

264 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

21
今日
67707
内容
128
活动
439498
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务