|
8月前
|
数据采集 数据可视化 安全
|

基于python大数据的天气可视化分析预测系统

本研究探讨基于Python的天气预报数据可视化系统,旨在提升天气数据获取、分析与展示的效率与准确性。通过网络爬虫技术快速抓取实时天气数据,并运用数据可视化技术直观呈现天气变化趋势,为公众出行、农业生产及灾害预警提供科学支持,具有重要的现实意义与应用价值。

636 8
|
9月前
|
JSON API 数据格式
|

1688店铺订单列表订单详情订单物流API响应数据解析

1688平台作为阿里巴巴旗下的B2B电商利器,提供高效订单管理API,支持订单查询、状态变更与物流同步,助力企业提升运营效率。本文附Python请求示例代码,实现便捷对接与数据获取。

457 0
|
10月前
|
数据处理 Apache 流计算
|

Flink Forward Asia 2025 城市巡回 · 上海站

Flink Forward Asia 2025 城市巡回上海站重磅来袭!8月16日,顶尖技术专家齐聚,共探实时计算前沿趋势与行业实践。大会涵盖技术分享、实战案例与开源生态共建,支持线上直播预约。立即报名,共赴技术盛宴!

774 0
来自: 实时计算 Flink  版块
|
10月前
|
JSON 监控 算法
|

1688商品列表API响应数据解析

1688商品列表API是阿里巴巴开放平台的核心接口,支持通过关键词、价格、类目等多维度筛选商品,返回商品标题、价格、销量等信息,适用于电商数据分析与竞品监控。接口采用RESTful设计,响应快、数据实时更新。本文提供Python调用示例,助您快速接入。

293 0
|
11月前
|
安全 物联网 API
|

核验身份证的一致性API的实战指南

随着网络空间安全问题日益突出,实名制成为保障安全与秩序的重要手段。探数API的身份证实名认证工具通过姓名和身份证号核验用户身份真实性,并返回扩展信息,广泛应用于各行业。本文介绍了其实现功能、调用流程及代码示例,同时解答了关于个人信息安全等常见疑问。接入该API不仅满足合规要求,更能提升用户信任,降低运营风险,共同构建安全高效的数字未来。

1182 1
|
2月前
|
编译器 程序员 C语言
|

C语言深度解析:未定义行为(UB)—— 90%玄学bug的根源

C语言因极致性能与硬件控制力成为系统开发首选,但其“自由”伴生未定义行为(UB):语法合法却结果不可控,是“调试正常、上线崩溃”的元凶。UB包括数组越界、有符号溢出、空指针解引用、序列点违规、重复释放等,编译器可任意优化或崩溃。规避需严守边界、开启高警告、判空置空、拆分表达式、预检溢出。(239字)

505 8
|
3月前
|
存储 人工智能 数据可视化
|

大模型应用:向量与元数据联动:解锁向量数据库复合查询的核心能力.30

本文深入解析向量数据库中“向量+元数据”复合查询技术:通过融合语义相似性与结构化过滤(如时间、标签、权限等),显著提升RAG等场景的检索精度、效率与业务适配性,并结合Chroma实战演示三种查询路径及多行业应用。

402 9
|
3月前
|
存储 分布式计算 OLAP
|

数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考

人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)

349 2
|
3月前
|
数据采集 数据挖掘 API
|

亚马逊商品详情 API 接入指南

本文详解亚马逊官方商品详情API:PA-API v5(面向第三方,免卖家权限,支持ASIN/关键词查询,覆盖标题、价格、主图、规格等核心字段)与SP-API(面向卖家,可获取自有商品全量后台数据)。强调合规、稳定、可持续,助力比价、导购、ERP等场景高效接入。(239字)

563 2
|
3月前
|
人工智能 自然语言处理 供应链
|

AI Agent 职业路线全解析:从入门到精通的体系化进阶指南

随着“人工智能+”深入推进,AI智能体正从辅助工具升级为协作伙伴。2027年应用率将超70%,催生生成式AI测试员、智能体设计师等新岗。我国AI人才缺口超500万,人社部、教育部已将其纳入国家职业与教育体系。本文梳理四阶进阶路径(零代码构建→流程集成→全栈开发→行业落地),助力开发者构建“人机协同”核心竞争力。(239字)

494 1
|
3月前
|
数据采集 自然语言处理 监控
|

你的模型真的“学”会了吗?微调效果评估实战指南

本文系统讲解大模型微调效果评估的核心方法论:强调评估比训练更重要,涵盖目标对齐、技术指标(Loss/PPL/BLEU/ROUGE)、人工评估四维度、业务验证(A/B测试、端到端场景)、泛化性检验及四步实战流程,并提供避坑指南与工具建议。重在目标驱动、多层验证、快速闭环。(239字)

452 1
|
4月前
|
人工智能 安全 物联网
|

告别数据泄露:三步构建企业级AI的隐私保护盾

企业微调大模型面临数据不出域与合规强监管的双重挑战。本文详解差分隐私(加噪声)、联邦学习(数据不动模型动)和LoRA(仅调0.1%参数)三重防护技术,覆盖脱敏、训练、部署全链路,并提供可运行代码与ε值选型指南,助你安全打造专属AI。(239字)

484 1
|
4月前
|
存储 安全 API
|

隐私合规红线不能碰:大模型微调3大重灾区防护手册

本文聚焦大模型微调中训练数据、中间产物与部署链路三大隐私泄露重灾区,剖析90%开发者易踩的技术陷阱,从分层脱敏、差分隐私到权限管控,提供全链路可落地的防护方案,并结合性能与安全双重验证,助力企业实现合规与效能双赢。

494 0
|
4月前
|
JSON 安全 JavaScript
|

闲鱼商品列表API接口指南

本指南基于逆向分析,提供闲鱼商品列表数据获取的技术方案,适用于关键词、地区、价格等条件筛选。支持网页端GET与移动端POST请求,返回HTML或JSON格式数据,需注意登录态与参数编码,仅用于学习研究。

539 2
|
5月前
|
监控 Java 测试技术
|

OOM排查之路:一次曲折的线上故障复盘

本文记录了一次Paimon数据湖与RocksDB集成服务中反复出现的内存溢出(OOM)问题排查全过程。通过MAT、NMT、async-profiler等工具,结合监控分析与专家协作,最终定位到RocksDB通过JNI申请的堆外内存未释放是根因,并分享了转向Flink写入Paimon的解决方案及排查思路,为类似技术栈提供借鉴。(239字)

400 1
|
5月前
|
安全 Java 数据安全/隐私保护
|

2.OAuth2.0实战案例

本文介绍基于Spring Boot与Spring Cloud的OAuth2安全认证实现,涵盖父工程搭建、资源服务与授权服务配置,并演示授权码、简化、密码及客户端四种模式的全流程测试,实现安全的分布式系统权限控制。

445 0
|
5月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心为自注意力机制,结合Token化、位置编码与嵌入层,支持万亿级参数规模。参数增长带来涌现能力,如复杂推理与泛化性能。混合专家模型(MoE)提升效率,推动模型持续扩展。

781 0
|
5月前
|
运维 安全 API
|

当安全事件不再“靠人吼”:一文带你搞懂 SOAR 自动化响应实战

当安全事件不再“靠人吼”:一文带你搞懂 SOAR 自动化响应实战

526 10
|
6月前
|
数据采集 JSON 供应链
|

1688商品列表API完整指南

1688商品列表API是阿里巴巴B2B平台核心接口,支持通过关键词、分类、价格等多条件筛选,分页批量获取商品信息、价格、供应商及库存数据,采用JSON格式与AppKey签名认证,助力企业高效实现商品搜索、数据采集与供应链自动化管理。

484 3
|
10月前
|
人工智能 数据库 开发工具
|

通过阿里云 Milvus 和 Dify 平台构建RAG系统

本文介绍了如何结合阿里云 Milvus 向量数据库与低代码 AI 平台 Dify,快速构建企业级检索增强生成(RAG)应用。通过该方案,可有效解决大语言模型的知识局限与“幻觉”问题,提升 AI 应用的回答准确性与可靠性。

1226 2
|
12月前
|
人工智能 自然语言处理 算法
|

DistilQwen-ThoughtX:变长思维链推理模型,能力超越DeepSeek蒸馏模型

阿里云PAI团队开发的 OmniThought 数据集,其中包含200万思维链,并标注了推理冗余度(RV)和认知难度(CD)分数。基于此数据集,我们还推出了 DistilQwen-ThoughtX 系列模型,可以通过RV和CD分数对思维链进行筛选,训练得到的模型获得根据问题和本身的认知能力,生成变长思维链的能力。同时在 EasyDistill 框架中开源了 OmniThought 数据集和 DistilQwen-ThoughtX 模型的全部权重。这些模型在性能上超过了 DeepSeek-R1-Distill 系列。

1307 9
来自: 人工智能平台PAI  版块
|
12月前
|
存储 消息中间件 OLAP
|

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

本文整理自淘天集团高级数据开发工程师朱奥在Flink Forward Asia 2024的分享,围绕实时数仓优化展开。内容涵盖项目背景、核心策略、解决方案、项目价值及未来计划五部分。通过引入Paimon和Hologres技术,解决当前流批存储不统一、实时数据可见性差等痛点,实现流批一体存储与高效近实时数据加工。项目显著提升了数据时效性和开发运维效率,降低了使用门槛与成本,并规划未来在集团内推广湖仓一体架构,探索更多技术创新场景。

1935 3
来自: 实时计算 Flink  版块
|
18天前
|
SQL 人工智能 监控
|

五年数据开发复盘:从数仓建设到 AI 产品化的阶段性思考

五年数据开发复盘:从数仓建设到AI产品化。作者深耕BI、SaaS数仓、数据血缘与建模,提出“以数仓为根基、实体建模为核心、工程稳定性为底座”,强调业务理解重于工具使用。面对AI浪潮,主张聚焦提示词工程、RAG、实体识别等AI工程化落地,而非算法底层——数据开发正演进为连接业务、数据、工程与AI的复合型角色。

133 3
|
1月前
|
人工智能
|

飞书OpenClaw配置教程,有吗?

253 3
来自:人工智能平台PAI 版块
已解决
|
2月前
|
人工智能 自然语言处理 供应链
|

AI 大模型时代:淘宝京东商品数据 API 如何重构电商智能决策

AI大模型正将传统API从“数据搬运工”升级为“智能决策中枢”,打通“数据→信息→知识→行动”全链路。通过融合电商API与大模型能力,在智能选品、竞品预警、内容生成、运营闭环四大场景实现从人工到自治的跃迁。(239字)

366 3
|
3月前
|
人工智能 关系型数据库 数据库
|

为什么传统数据库不够用,向量数据库如何补位?

本文通俗解析向量数据库:它让AI能按“语义相似性”而非关键词检索文本、图像等非结构化数据,是RAG技术的“记忆中枢”。详解嵌入原理、ANN索引(如HNSW)、实战搭建步骤及效果评估方法,强调其与传统数据库协同而非替代的关系。(239字)

343 1
|
4月前
|
机器学习/深度学习 供应链 监控
|

淘宝图片搜索API(taobao.item_search_img)

淘宝图片搜索API是阿里基于深度学习的视觉检索服务,支持以图搜同款/相似商品,毫秒级响应、高准确率。提供商品、交易、店铺等结构化数据,适配选品、同款监控、智能上架等场景,合规高效,助力电商数字化升级。(239字)

581 7
|
4月前
|
数据采集 监控 API
|

1688商品列表API接口快速上手指南

本文介绍如何通过1688开放平台官方API,合规高效地获取店铺商品列表数据。以`item_search_shop`接口为例,详解请求参数、签名生成规则与调用限制,结合Python实战实现稳定采集。强调签名安全、频率控制与数据合规使用,助力B2B电商分析、选品监控等场景高效落地。(238字)

408 1
|
4月前
|
机器学习/深度学习 算法 自动驾驶
|

基于YOLOv8模型的行人车辆多目标检测计数与跟踪系统

本研究基于YOLOv8模型,针对智能交通与公共安全需求,开展行人车辆多目标检测、计数与跟踪技术研究。通过融合YOLOv8高精度检测与DeepSORT稳定跟踪,实现复杂场景下目标的实时定位、统计与轨迹追踪,提升交通管理效率与公共安全保障能力,推动智慧城市发展。

477 13
|
5月前
|
消息中间件 存储 数据挖掘
|

应用架构图

本文介绍应用架构图的设计原理,涵盖单体与分布式架构。从展现层、业务层、数据层到基础层,阐述各层职责及技术选型逻辑,并通过调用关系明确系统边界,支撑业务落地。

435 0
|
5月前
|
Prometheus 运维 监控
|

别再裸奔搞监控了!一篇带你上手 Prometheus+Grafana 的实战指南

别再裸奔搞监控了!一篇带你上手 Prometheus+Grafana 的实战指南

1071 2
|
6月前
|
新能源 5G 芯片
|

Ansys Electronics 全流程电磁仿真降本增效,附安装包

Ansys Electronics Suite是Ansys推出的电磁仿真与电子系统设计平台,覆盖芯片、组件到系统级的电磁、热、电路及多物理场耦合仿真,广泛应用于5G、汽车、航天等领域,助力工程师优化设计、提升性能,缩短研发周期,降低开发成本。

565 2
|
6月前
|
人工智能 测试技术 Python
|

AI也有“智商”吗?我们到底该用什么标准来评估它?

AI也有“智商”吗?我们到底该用什么标准来评估它?

1044 8
|
6月前
|
JSON 供应链 API
|

1688商品列表API全攻略

1688商品列表API是阿里巴巴B2B平台核心接口,支持关键词、类目、价格等多维度检索,分页获取商品ID、标题、价格等50+字段,适用于电商整合、供应链管理与市场分析。

373 2
|
9月前
|
Java 测试技术 API
|

2025 年 Java 开发者必知的最新技术实操指南全览

本指南涵盖Java 21+核心实操,详解虚拟线程、Spring Boot 3.3+GraalVM、Jakarta EE 10+MicroProfile 6微服务开发,并提供现代Java开发最佳实践,助力开发者高效构建高性能应用。

1263 5
|
9月前
|
机器学习/深度学习 算法 数据可视化
|

近端策略优化算法PPO的核心概念和PyTorch实现详解

本文深入解析了近端策略优化(PPO)算法的核心原理,并基于PyTorch框架实现了完整的强化学习训练流程。通过Lunar Lander环境展示了算法的全过程,涵盖环境交互、优势函数计算、策略更新等关键模块。内容理论与实践结合,适合希望掌握PPO算法及其实现的读者。

1494 2
|
9月前
|
消息中间件 Java 数据库
|

Java 基于 DDD 分层架构实战从基础到精通最新实操全流程指南

本文详解基于Java的领域驱动设计(DDD)分层架构实战,结合Spring Boot 3.x、Spring Data JPA 3.x等最新技术栈,通过电商订单系统案例展示如何构建清晰、可维护的微服务架构。内容涵盖项目结构设计、各层实现细节及关键技术点,助力开发者掌握DDD在复杂业务系统中的应用。

1766 0
|
9月前
|
SQL 人工智能 数据挖掘
|

Apache Flink:从实时数据分析到实时AI

Apache Flink 是实时数据处理领域的核心技术,历经十年发展,已从学术项目成长为实时计算的事实标准。它在现代数据架构中发挥着关键作用,支持实时数据分析、湖仓集成及实时 AI 应用。随着 Flink 2.0 的发布,其在流式湖仓、AI 驱动决策等方面展现出强大潜力,正推动企业迈向智能化、实时化的新阶段。

1100 9
来自: 实时计算 Flink  版块
|
10月前
|
机器学习/深度学习 自然语言处理 搜索推荐
|

搜索结果太乱?5种重排序模型让你的搜索系统准确率提升40%

本文将系统性地分析重排序模型的技术原理,深入探讨从传统学习排序方法到基于Transformer架构的前沿解决方案。

1186 0
|
11月前
|
SQL 分布式计算 API
|

Apache Spark详解

Apache Spark 是一个开源、分布式计算引擎,专为大规模数据处理设计。它以高速、易用和通用为核心目标。通过内存计算、DAG 执行引擎和惰性求值等特性,大幅提升数据处理效率。其核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLlib 和 GraphX,支持批处理、实时流处理、机器学习和图计算。Spark 提供统一编程模型,支持多语言(Scala/Java/Python/R),并拥有强大的 Catalyst 优化器和类型安全的 Dataset API,广泛应用于大数据分析和处理场景。

1417 8
|
15天前
|
SQL 人工智能 自然语言处理
|

CEO 想要“可以追问”的报表:从静态 Dashboard 到交互式 AI 决策报告

把报表从“静态展示结果”升级为“可交互的决策分析入口”。

118 3
|
24天前
|
分布式计算 MaxCompute 流计算
|

PAI-FeatureStore特征平台的相关问答

本栏目解答FeatureStore常见问题:实时视图时间戳支持BIGINT/TIMESTAMP;ODPS同步需字段完全匹配;Item特征表由关联视图确定;离线视图禁止写入;实时数据查询延迟通常仅数秒。(238字)

160 1
来自: 人工智能平台PAI  版块
|
1月前
|
JSON 监控 搜索推荐
|

京东api:通过商品ID获取商品详情数据教程

京东商品详情API(jd.item.get)支持按SKU ID快速获取商品信息,返回标准JSON格式。含必填参数num_iid与access_token,可选字段过滤及促销信息控制。适用于ERP对接、比价监控、选品推广等场景,开箱即用,无需额外申请。

236 1
|
1月前
|
人工智能 移动开发 安全
|

3. OpenClaw本地AI建站教程:部署、生成、调试、上线,全程清晰可落地

本教程教你用本地离线AI工具OpenClaw,零代码快速搭建企业静态网站:从一键部署、文字描述需求、AI生成HTML/CSS/JS源码,到本地调试、自由修改及上线部署,全程实操清晰,30分钟即可完成,安全可控、高度定制。(239字)

394 1
|
2月前
|
存储 安全 数据安全/隐私保护
|

数据放云上就安全了?别天真:聊透“云上合规+数据主权”的那些坑与解法

数据放云上就安全了?别天真:聊透“云上合规+数据主权”的那些坑与解法

271 3
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

手撕 Transformer:从原理到代码,一步步造一个“小型大模型”

手撕 Transformer:从原理到代码,一步步造一个“小型大模型”

611 6
|
2月前
|
监控 数据挖掘 API
|

从踩坑到高效落地:淘宝商品详情API的实操心得

淘宝商品详情API提供全维度商品数据,含基础信息、详情页HTML、SKU、价格、销量等,支持比价、代购、数据分析及内容电商等场景,涵盖item.get、item.get_pro等核心接口,接入便捷高效。

362 4
|
3月前
|
数据采集 缓存 NoSQL
|

从踩坑到高效落地:关键词搜索淘宝天猫商品列表API的实操心得

本文分享淘宝/天猫关键词搜索API的实战避坑指南:直击搜不到、翻页断、价格假、限流封号等6大痛点,详解合规调用、精简字段、分页策略、缓存熔断与二次校验等高效落地方案,助选品、比价、代购、数据分析等场景稳定运行。(239字)

364 3
|
4月前
|
监控 API
|

金融行情系统中,API 接入常见的 5 个工程问题

本文以黄金、白银等高波动贵金属行情为例,剖析金融系统在API接入层面的五大典型工程问题:数据延迟放大、单点依赖风险、多源维护成本高、异常处理分散、缺乏统一接入层。强调统一、可控、可演进的API设计对系统稳定性与长期演进的关键价值。

269 5
来自: 大数据计算 MaxCompute  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

2
今日
69522
内容
128
活动
439955
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务