|
7月前
|
算法 搜索推荐 大数据
|

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

920 8
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

1039 9
|
7月前
|
机器学习/深度学习 大数据 关系型数据库
|

基于python大数据的台风灾害分析及预测系统

针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。

647 4
|
7月前
|
人工智能 自然语言处理 算法
|

【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”

2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”

908 9
来自: 智能搜索推荐  版块
|
7月前
|
JSON 监控 API
|

京东商品详情API接口(标题|主图|SKU|价格)

京东商品详情API提供标准化接口,支持通过HTTPS获取商品标题、价格、库存、销量等120+字段,数据实时更新至分钟级。包含jd.item.get和jd.union.open.goods.detail.query等接口,支持批量查询200个SKU,适用于价格监控、竞品分析等电商场景。

1171 156
|
7月前
|
数据可视化 关系型数据库 MySQL
|

基于python大数据的的海洋气象数据可视化平台

针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。

385 1
|
7月前
|
XML JSON API
|

苏宁商品详情API秘籍!轻松获取商品详情数据

苏宁商品详情API基于RESTful架构,支持JSON/XML格式,通过AppKey、AppSecret与签名三重认证,结合OAuth 2.0实现安全调用。开发者可获取商品名称、价格、销量、库存、促销等实时数据,适用于电商分析与商业智能。接口强制使用HTTPS协议,支持POST/GET请求,统一采用UTF-8编码,确保数据传输安全可靠。

660 1
|
7月前
|
数据采集 缓存 大数据
|

【赵渝强老师】大数据日志采集引擎Flume

Apache Flume 是一个分布式、可靠的数据采集系统,支持从多种数据源收集日志信息,并传输至指定目的地。其核心架构由Source、Channel、Sink三组件构成,通过Event封装数据,保障高效与可靠传输。

436 1
|
7月前
|
JSON 安全 API
|

亚马逊商品列表API秘籍!轻松获取商品列表数据

亚马逊商品列表API(SP-API)提供标准化接口,支持通过关键词、分类、价格等条件搜索商品,获取ASIN、价格、销量等信息。采用OAuth 2.0认证与AWS签名,保障安全。数据以JSON格式传输,便于开发者批量获取与分析。

604 1
|
7月前
|
机器学习/深度学习 人工智能 监控
|

别让医保钱“乱花”——用数据分析把医疗保险费用算明白!

别让医保钱“乱花”——用数据分析把医疗保险费用算明白!

318 13
|
7月前
|
安全 API
|

亚马逊商品详情 API 秘籍!轻松获取 SKU 属性数据

亚马逊商品详情API是官方接口,通过ASIN获取商品标题、价格、库存、评价等50余项数据,支持多站点查询。包含Product Advertising API与MWS两类,分别用于商品信息获取和卖家店铺管理,采用AWS4-HMAC-SHA256认证,保障请求安全。

329 1
|
7月前
|
自然语言处理 监控 API
|

速卖通商品详情API秘籍!轻松获取SKU属性数据

速卖通商品详情API(aliexpress.item.get)支持通过编程获取商品标题、价格、SKU、库存、销量、物流模板、评价及店铺信息,适用于价格监控、选品分析等场景。接口支持多语言返回,采用AppKey+AppSecret+Token认证,需签名验证,确保安全调用。

478 2
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

别怪推荐系统不懂你,可能是你的数据“太模糊”了

别怪推荐系统不懂你,可能是你的数据“太模糊”了

364 9
|
7月前
|
JSON 搜索推荐 API
|

拼多多商品详情API技术指南

拼多多商品详情API(pdd.goods.detail.get)支持通过商品ID获取商品标题、价格、销量、图片、库存及评价等详细信息,适用于电商数据分析、竞品监控与价格策略优化,返回标准JSON格式,便于集成开发。

943 1
|
7月前
|
机器学习/深度学习 人工智能 索引
|

RAG 切片利器 LumberChunker 是如何智能地把文档切割成 LLM 爱吃的块

RAG 里的文档应该怎么切割比较好呢?按固定的字符数或词数?按句?按段落?加个重叠窗口?还是 ...

391 1
|
7月前
|
JSON 监控 API
|

小红书笔记评论API:一键获取分层评论与用户互动数据

小红书笔记评论API可获取指定笔记的评论详情,包括内容、点赞数、评论者信息等,支持分页与身份认证,返回JSON格式数据,适用于舆情监控、用户行为分析等场景。

1140 1
|
7月前
|
人工智能 缓存 并行计算
|

用数学重构 AI的设想:流形注意力 + 自然梯度优化的最小可行落地

本文提出两个数学驱动的AI模块:流形感知注意力(D-Attention)与自然梯度优化器(NGD-Opt)。前者基于热核偏置,在局部邻域引入流形结构,降低计算开销;后者在黎曼流形上进行二阶优化,仅对线性层低频更新前置条件。二者均提供可复现代码与验证路径,兼顾性能与工程可行性,助力几何感知的模型设计与训练。

614 1
|
7月前
|
JSON API 数据格式
|

小红书API接口文档:笔记详情数据开发手册

小红书笔记详情API可获取指定笔记的标题、正文、互动数据及多媒体资源,支持字段筛选与评论加载。通过note_id和access_token发起GET/POST请求,配合签名验证,广泛用于内容分析与营销优化。

1441 3
|
7月前
|
机器学习/深度学习 人工智能 供应链
|

别再靠拍脑袋进货了!用大数据让电商库存“自己会算”

别再靠拍脑袋进货了!用大数据让电商库存“自己会算”

503 10
|
7月前
|
人工智能 API 数据处理
|

Flink Agents 0.1.0 发布公告

Apache Flink Agents 0.1.0 首发预览版上线!作为 Flink 新子项目,它在流处理引擎上构建事件驱动的 AI 智能体,融合 LLM、工具、记忆与动态编排,支持高吞吐、低延迟、精确一次语义,实现数据与 AI 无缝集成,助力电商、金融等实时场景智能决策。

689 39
来自: 实时计算 Flink  版块
|
7月前
|
数据采集 JSON API
|

微店API使用指南:高效获取商品列表数据

本文介绍如何使用Python爬虫调用微店item_search接口,根据关键词搜索商品并获取商品列表数据,涵盖请求方式、JSON数据解析、分页参数设置及筛选排序功能,适用于电商数据分析与竞品研究。

325 0
|
7月前
|

【实用卸载工具】Ashampoo UnInstaller 卸载软件安装包下载及安装教程!

Ashampoo UnInstaller 是德国公司开发的专业软件卸载工具,可深度清除应用残留文件与注册表项,支持强制移除顽固软件。提供30天免费试用,操作简单,确保系统干净稳定。

467 0
|
7月前
|
XML JSON 监控
|

微店商品详情API助力多店铺管理和竞品监控

微店商品详情API(micro.item_get)可获取商品名称、价格、库存、图片等20余项信息,支持GET/POST请求,返回JSON或XML格式数据,适用于电商开发、库存管理与跨平台展示。

220 0
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

【机器学习算法篇】K-近邻算法

K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)

2096 7
|
7月前
|
网络协议 Java Maven
|

多模块项目使用ElasticSearch报错

多模块项目使用ElasticSearch报错

261 9
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

当医生“上云端”:AI让远程医疗诊断更懂人心

当医生“上云端”:AI让远程医疗诊断更懂人心

507 8
|
7月前
|
算法 搜索推荐 数据挖掘
|

当学习遇上数据:在线课程也能“懂你”的秘密

当学习遇上数据:在线课程也能“懂你”的秘密

231 8
|
7月前
|
存储 数据库 索引
|

RAG检索质量差?这5种分块策略帮你解决70%的问题

RAG效果关键在于文档分块:固定、递归、语义、结构化与延迟分块各有优劣。合理选择能显著提升检索质量,减少幻觉,增强上下文理解,是构建高效RAG系统的核心环节。

962 4
|
7月前
|
人工智能 数据处理 API
|

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来

Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。

1338 6
来自: 实时计算 Flink  版块
|
7月前
|
JSON 供应链 监控
|

批量获取1688商品数据,精准筛选与分页查询

1688商品列表API(alibaba.product.list.get)支持按关键词、类目、价格等条件批量获取商品信息,适用于B2B场景下的商品管理与竞品分析。返回JSON格式数据,含商品ID、标题、价格、库存等核心字段,支持分页查询、动态筛选与排序,实时性强,字段可定制。

418 0
|
7月前
|
JSON 监控 API
|

从0到1掌握京东API:商品详情获取技巧与避坑指南

京东商品详情API提供商品基础信息、实时价格、SKU规格等120+字段,支持价格监控与竞品分析。采用HTTPS协议,响应延迟≤30秒,具备高并发能力,适用于电商数据应用。

358 0
|
7月前
|
机器学习/深度学习 传感器 人工智能
|

当“材料”变聪明:智能材料如何让生物医学设备更懂你

当“材料”变聪明:智能材料如何让生物医学设备更懂你

274 9
|
7月前
|
人工智能 算法 大数据
|

别让“热搜”骗了你:大数据如何让新闻更真实?

别让“热搜”骗了你:大数据如何让新闻更真实?

461 17
|
7月前
|
机器学习/深度学习 算法 前端开发
|

别再用均值填充了!MICE算法教你正确处理缺失数据

MICE是一种基于迭代链式方程的缺失值插补方法,通过构建后验分布并生成多个完整数据集,有效量化不确定性。相比简单填补,MICE利用变量间复杂关系,提升插补准确性,适用于多变量关联、缺失率高的场景。本文结合PMM与线性回归,详解其机制并对比效果,验证其在统计推断中的优势。

1738 11
|
7月前
|
canal 关系型数据库 MySQL
|

canal从mysql同步数据到es进行增量同步失效

234 0
|
7月前
|
存储 分布式计算 Hadoop
|

七、Sqoop Job:简化与自动化数据迁移任务及免密执行

平时用 Sqoop 导入导出时,命令一长就容易出错,特别是增量任务还得记 last-value,很麻烦。其实 Sqoop 有 Job 功能,能把命令“存档”,以后直接 --exec 执行,配合调度工具特别省心。本文手把手讲 Job 创建、管理、免密执行技巧(密码文件、Credential Provider),还带实战例子,搞完你就能写出稳稳当当的自动化 Sqoop 作业了!

326 0
|
7月前
|
机器学习/深度学习 人工智能 物联网
|

AR技术融入到产品质量检测:提升效率与精度的未来趋势

元幂境认为,AR技术正革新产品质量检测,通过虚实融合提升精度、降低门槛、强化培训与协作,广泛应用于制造、电子、医疗及航空航天领域,未来结合AI将迈向智能检测新阶段。

863 0
|
7月前
|
供应链 搜索推荐 API
|

从0到1掌握1688API:图片搜索获取技巧与避坑指南

1688图片搜索API基于图像识别技术,支持上传JPG/PNG格式图片(Base64或URL),实现同款或相似商品搜索。适用于电商选品、供应链管理等场景,提供价格、销量等多维度筛选,返回商品ID、标题、价格、销量及供应商信息。

638 3
|
7月前
|
分布式计算 关系型数据库 MySQL
|

六、Sqoop 导出

除了从数据库往 Hadoop 导,Sqoop 也能把 Hadoop 里的数据反向“倒”回数据库,做成 Export。很多场景用得上,比如 ETL 后结果回写,业务系统更新,或者补数据。这篇文章细讲了 Export 的用法,INSERT / UPDATE 模式啥区别,update-key、allowinsert 怎么配,暂存表咋用,配了完整例子,学完导出不用再踩坑!

370 1
|
7月前
|
安全 API
|

LlamaIndex检索调优实战:分块、HyDE、压缩等8个提效方法快速改善答案质量

本文总结提升RAG检索质量的八大实用技巧:语义分块、混合检索、重排序、HyDE查询生成、上下文压缩、元数据过滤、自适应k值等,结合LlamaIndex实践,有效解决幻觉、上下文错位等问题,显著提升准确率与可引用性。

716 8
|
7月前
|
API 开发者 数据采集
|

高效获取淘宝商品详情:API 开发实现链接解析的完整技术方案

2025反向海淘新机遇:依托代购系统,聚焦小众垂直品类,结合Pandabay数据选品,降本增效。系统实现智能翻译、支付风控、物流优化,助力中式养生茶等品类利润翻倍,新手也能快速入局全球市场。

1403 2
|
7月前
|
Windows
|

Microsoft Activation Scripts v3.6 (MAS)激活工具安装教程!中文汉化版(激活工具)

Microsoft Activation Scripts v3.6(MAS)是一款开源、轻量级的批量激活工具,支持HWID、KMS38、TSforge等多种方式,可离线永久激活Win7至Win11及Office全系列。兼容旧系统如Vista,操作简单,无误报风险。

10800 1
|
7月前
|
JSON 安全 算法
|

从0到1掌握1688API:商品详情获取技巧与避坑指南

1688商品详情API通过商品ID获取商品标题、价格库存、图片视频、SKU等结构化数据,支持字段定制与批发价查询,适用于电商整合与竞品分析。采用RESTful+JSON,需AppKey/Secret签名认证,保障数据实时安全。

469 1
|
7月前
|
JSON 监控 API
|

从0到1掌握京东API:商品列表获取技巧与避坑指南

京东商品列表API是京东开放平台的核心接口,支持按类目、价格、销量等多条件筛选,实时获取商品基础信息、价格、库存及促销数据。采用HTTPS协议,JSON格式返回,适用于竞品分析与价格监控。支持分页,通过MD5签名认证,保障数据安全。

287 1
|
7月前
|
人工智能 数据可视化 算法
|

FISSPACE 技术白皮书节选|因果自导机制(Causal Self-Guidance Mechanism)

FISSPACE提出因果自导机制(CSG),让智能体从被动训练迈向自主演化。通过内部能量流、压痕反馈与因果梯度闭环,构建具备自我修正与成长能力的智能系统,实现无外部奖励下的内驱进化,推动AI走向具有方向与意志的自演化时代。(238字)

427 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69520
内容
128
活动
439952
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务