|
10月前
|
XML API 数据格式
|

深入研究:亚马逊amazon商品详情API接口Python攻略

亚马逊商品详情API(Product Advertising API)让开发者以编程方式获取亚马逊商品信息,如标题、价格、库存、评价等。功能涵盖商品基本信息、购买属性、用户反馈、分类与促销信息。使用时需选择端点(如ItemLookup或ItemSearch)、构建请求、发送至服务器并处理响应数据(JSON/XML格式),同时做好错误处理。适合电商应用开发与数据分析。

267 8
|
10月前
|
Java 关系型数据库 MySQL
|

2025 年互联网公司校招 Java 面试题总结及答案实操示例解析

本项目基于Spring Boot 3与Java 17技术栈,围绕校园招聘常见面试题,提供核心知识点的实操示例。涵盖多线程、RESTful API设计、数据库操作(Spring Data JPA)、事务管理及异常处理等。通过完整代码实现与运行步骤,帮助理解用户管理、线程池配置等实际应用场景。资源包含项目结构、关键代码示例(如User实体类、UserService服务层、ThreadService多线程实现)及数据库迁移脚本,适合深入学习与实践。环境要求:JDK 17+、Maven 3.8+、MySQL 8.0+。

346 3
|
11月前
|
机器学习/深度学习 算法 测试技术
|

图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析

本文探讨了基于图的重排序方法在信息检索领域的应用与前景。传统两阶段检索架构中,初始检索速度快但结果可能含噪声,重排序阶段通过强大语言模型提升精度,但仍面临复杂需求挑战

367 0
|
11月前
|
数据采集 存储 NoSQL
|

Python爬虫Cookie管理最佳实践:存储、清理与轮换

Python爬虫Cookie管理最佳实践:存储、清理与轮换

551 3
|
11月前
|
SQL DataWorks 大数据
|

DataWorks x 婚礼纪:智能一站式数据开发治理平台让千万新人的幸福时刻“数智化”

婚礼纪是杭州火烧云科技推出的结婚服务平台,覆盖婚宴酒店、婚纱摄影等全产业链,年服务超2000万对新人。为应对海量数据处理挑战,婚礼纪选择阿里云DataWorks作为一站式大数据开发治理平台,解决数据血缘不清、指标口径混乱等问题。通过湖仓一体架构与全链路数据治理,实现多源异构数据高效整合,支撑精准营销、交易风控等核心场景。DataWorks新版数据开发Data Studio大幅提升开发效率,Copilot智能助手优化SQL代码生成与测试,助力婚礼纪构建数据驱动的结婚产业服务中枢。

628 6
|
11月前
|
机器学习/深度学习 人工智能 算法
|

大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析

该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。

844 13
|
11月前
|
SQL 安全 算法
|

解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级

Python 3.14 引入了七大核心技术特性,大幅提升开发效率与应用安全性。其中包括:t-strings(PEP 750)提供更安全灵活的字符串处理;类型注解惰性求值(PEP 649)优化启动性能;外部调试器API标准化(PEP 768)增强调试体验;原生支持Zstandard压缩算法(PEP 784)提高效率;REPL交互环境升级更友好;UUID模块扩展支持新标准并优化性能;finally块语义强化(PEP 765)确保资源清理可靠性。这些改进使Python在后端开发、数据科学等领域更具竞争力。

510 5
|
11月前
|
传感器 算法 数据安全/隐私保护
|

基于GA遗传优化的三维空间WSN网络最优节点部署算法matlab仿真

本程序基于遗传算法(GA)优化三维空间无线传感网络(WSN)的节点部署,通过MATLAB2022A实现仿真。算法旨在以最少的节点实现最大覆盖度,综合考虑空间覆盖、连通性、能耗管理及成本控制等关键问题。核心思想包括染色体编码节点位置、适应度函数评估性能,并采用网格填充法近似计算覆盖率。该方法可显著提升WSN在三维空间中的部署效率与经济性,为实际应用提供有力支持。

305 6
|
11月前
|
机器学习/深度学习 人工智能 算法
|

PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架

PaperCoder是一种基于多智能体LLM框架的工具,可自动将机器学习研究论文转化为代码库。它通过规划、分析和生成三个阶段,系统性地实现从论文到代码的转化,解决当前研究中代码缺失导致的可复现性问题。实验表明,PaperCoder在自动生成高质量代码方面显著优于基线方法,并获得专家高度认可。这一工具降低了验证研究成果的门槛,推动科研透明与高效。

860 19
|
11月前
|
机器学习/深度学习 数据采集 算法
|

智能限速算法:基于强化学习的动态请求间隔控制

本文分享了通过强化学习解决抖音爬虫限速问题的技术实践。针对固定速率请求易被封禁的问题,引入基于DQN的动态请求间隔控制算法,智能调整请求间隔以平衡效率与稳定性。文中详细描述了真实经历、问题分析、技术突破及代码实现,包括代理配置、状态设计与奖励机制,并反思成长,提出未来优化方向。此方法具通用性,适用于多种动态节奏控制场景。

580 6
|
11月前
|
传感器 人工智能 边缘计算
|

别让无人机“飞瞎”!5G才是它的“天眼”

别让无人机“飞瞎”!5G才是它的“天眼”

386 13
|
11月前
|
负载均衡 算法 关系型数据库
|

大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!

本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。

554 14
|
12月前
|
人工智能 运维 API
|

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中,Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型,比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。

330 2
来自: 人工智能平台PAI  版块
|
12月前
|
测试技术 语音技术 索引
|

GenPRM:思维链+代码验证,通过生成式推理的过程奖励让大模型推理准确率显著提升

本文提出GenPRM,一种生成式过程奖励模型,通过显式Chain-of-Thought推理与代码验证提升大型语言模型性能。针对传统PRMs的局限,GenPRM结合相对进展估计和监督微调,优化推理评估精度。实验表明,GenPRM在ProcessBench及数学任务中显著优于现有方法,且可通过测试时扩展进一步增强性能。然而,该方法在计算开销和跨领域应用上仍存在局限性。

415 0
|
12月前
|
人工智能 自动驾驶 物联网
|

5G到底有多牛?一文看懂它的原理与优势!

5G到底有多牛?一文看懂它的原理与优势!

870 19
|
12月前
|
机器学习/深度学习 编解码 PyTorch
|

从零实现基于扩散模型的文本到视频生成系统:技术详解与Pytorch代码实现

本文介绍了一种基于扩散模型的文本到视频生成系统,详细展示了模型架构、训练流程及生成效果。通过3D U-Net结构和多头注意力机制,模型能够根据文本提示生成高质量视频。

519 1
|
12月前
|
机器学习/深度学习 人工智能 算法
|

PeptideBERT:基于Transformer用于肽性质预测的语言模型

本文介绍了PeptideBERT模型及其在昇腾设备上的部署方法。PeptideBERT是一种基于Transformer架构的蛋白质语言模型,通过微调预训练模型ProtBERT,可预测肽的溶血性、溶解性和抗非特异性吸附性等关键性质。其输入表示包括词嵌入、物理化学属性编码和位置编码,并采用多头自注意力机制捕捉序列依赖关系。

556 4
|
12月前
|
人工智能 物联网 Apache
|

Flink Forward Asia 2025 新加坡站议题征集开启|The future of AI is Real-Time

Flink Forward Asia 2025 将于7月3日在新加坡盛大召开!作为Apache Flink社区顶级会议,大会聚焦实时AI、实时湖仓、实时分析等前沿方向,汇聚全球顶尖技术实践。即日起开放议题征集,诚邀开发者与数据专家分享创新经验。席位有限,立即行动!扫码或访问官网报名参与这场年度技术盛宴,共话实时计算未来。

756 17
来自: 实时计算 Flink  版块
|
12月前
|
存储 JSON API
|

深入研究:淘宝天猫商品详情查询API详解

淘宝开放平台提供一系列API接口,帮助开发者获取淘宝商品的详细信息并集成到自有应用中。主要功能包括:获取单个商品详情(item_get)、评论信息(item_review)、快递费用(item_fee)、等。此外,还支持搜索商品(item_search)、按图搜索(item_search_img)、优惠券查询(item_search_coupon)、类目信息(item_cat_get)等功能。返回数据通常为JSON格式,包含商品标题、价格、库存、主图链接等基本信息,以及HTML格式的详细描述内容,方便开发者解析与展示。

436 5
|
26天前
|
Java
|

java工具:《获取指定日期23时59分59秒》

java工具:《获取指定日期23时59分59秒》

110 4
|
1月前
|
人工智能 自然语言处理 数据管理
|

零安装在线网站制作,为什么正在成为新主流

零安装在线网站制作将开发环境云端化,用户无需配置本地环境,打开浏览器即可完成建站、编码、数据管理与部署。依托浏览器能力提升、云基建成熟及AI生成技术,如lynxcode(原lynx AI)支持自然语言生成全栈代码,大幅降低门槛,加速原型验证与快速迭代,尤其适合创业者与非技术人员。

111 5
|
2月前
|
机器学习/深度学习 SQL 人工智能
|

别再群发拜年消息了!三步微调AI,让它学会你的“独家语气”

每逢春节,通用AI祝福总显生硬空洞。本文探讨如何通过微调(LoRA),将“人情世故”转化为结构化数据(称呼/关系/细节/风格等),让AI真正学会你的语气与记忆,生成有温度、带梗、专属的个性化祝福——技术不是替代表达,而是帮你把来不及说的情意,说得恰到好处。(239字)

324 16
|
2月前
|
机器学习/深度学习 人工智能 物联网
|

春节祝福“AI味”太重?我用30分钟微调了一个能记住你我故事的专属模型

用30分钟微调Qwen3-32B,打造专属“马年祝福语创意伙伴”。借助LLaMA-Factory Online与PPO强化学习,让AI从“说正确的话”升级为“说走心的话”——懂关系、记细节、会调侃、有温度。技术不冰冷,祝福才动人。

244 9
|
2月前
|
安全 C++
|

关系记忆不是越完整越好:chunk size 的隐性代价

本文揭示关系型RAG(如祝福/道歉生成)中一个反直觉真相:关系信息并非越完整越好。大chunk会将“可引用的触发点”异化为“需总结的材料”,诱使模型转向安全、抽象、概括性表达,丧失走心感。核心原则是——切分重在“可被直接引用”,而非“逻辑完整”。

420 11
|
2月前
|
人工智能 小程序 物联网
|

为了不让拜年文案像“电子挽联”,我把Qwen3拉去做了30分钟特殊训练

春节前,团队开发马年祝福生成器,直面大模型“懂语法却不懂人情”的痛点。放弃Qwen3的深度思考能力,微调其基座模型,聚焦“关系感知”与场景适配;用人工种子+结构化数据(称呼/关系/交往细节等)训练,让祝福更自然、有分寸。实践证明:选模型不在最强,而在最听话。(239字)

141 1
|
2月前
|
人工智能 Kubernetes 物联网
|

轻量化部署:让你的祝福模型在小显卡上跑起来

本文揭秘春节祝福AI的轻量化部署:无需昂贵GPU,消费级显卡即可运行!通过INT4量化(模型缩至1/8)、LoRA微调(仅训MB级参数)及QLoRA组合,搭配vLLM推理优化与K8s弹性扩缩容,7B小模型高效生成祝福语。低成本、低门槛、高可用——大模型应用,人人可及。

215 0
|
2月前
|
人工智能 分布式计算 大数据
|

阿里云大数据 AI 产品月刊-2026年1月

阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

183 1
|
2月前
|
安全
|

RAG 里,什么时候该让模型“少看一点”

本文揭示RAG系统常见误区:盲目扩大TopK、增加文档量,实则导致“证据过载”,诱发模型强行综合、自信出错。核心观点:**“多看”不等于“更准”,反会稀释判断力;成熟RAG的关键,在于懂得何时主动“少看”**——守住模型的犹豫权与判断阈值。

126 0
|
2月前
|
C++
|

有些问题,调一百次参数也解决不了

本文揭示微调中一个关键认知:参数仅能优化模型内部行为,无法解决数据偏差、评估错位、系统约束缺失、RAG证据结构错误、不可解释性及拒绝能力缺失等六类根本问题。盲目调参实为逃避系统设计责任——真正的工程成熟,在于果断识别并止步于参数的边界。

106 4
|
3月前
|
机器学习/深度学习 算法 安全
|

大模型微调参数设置:你调的不是效果,是不确定性

本文揭示大模型微调中参数的本质:它们并非提升性能的“旋钮”,而是分配不确定性的“阀门”。learning rate 决定行为漂移半径,batch size 影响共识强度,epoch 加速偏差固化,正则项约束激进程度。参数间存在风险耦合,调参实为风险管理——目标不是最优指标,而是可控的系统行为。

218 10
|
3月前
|
机器学习/深度学习 安全 算法
|

为什么很多团队从 PPO 转向 DPO,却又离不开 PPO

PPO与DPO并非新旧替代关系,而是分属对齐不同阶段的工具:PPO用于行为“塑形”(强干预、纠偏乱序),DPO用于偏好“定型”(稳定微调、精细排序)。选型关键看模型是否已基本可控——乱则用PPO,稳则用DPO。

143 1
|
3月前
|
人工智能 监控 API
|

Opus 4.5、GPT-5.2 与 Gemini 3 Pro:企业级场景下的大模型工程表现对比

本文从工程与生产视角,对比Opus 4.5、GPT-5.2、Gemini 3 Pro三款大模型在输出一致性、可控性、长上下文、接口确定性等维度的表现,强调企业级AI选型应重稳定性与系统友好度,而非单纯比拼能力。

265 4
来自: 人工智能平台PAI  版块
|
3月前
|
SQL 存储 人工智能
|

数据工程新范式:NoETL 语义编织如何激活海量埋点数据价值?

数据工程师将从重复、低价值的 SQL 脚本编写和 ETL 运维中解放出来,转向更具战略性的工作。

145 2
|
3月前
|
自然语言处理 监控
|

RAG 效果差,80% 的问题和模型无关

RAG效果差,往往错不在模型,而在检索环节:切分不当、检索不相关、TopK过载、缺乏Rerank等。本文揭示RAG本质是“自然语言检索系统”,80%问题源于数据组织与检索质量,而非模型能力。重拾工程思维,先夯实检索,再谈生成。

162 7
|
3月前
|
机器学习/深度学习 人工智能 算法
|

光伏预测算法:AI 如何“看天吃饭”,把不确定性算明白

光伏预测算法:AI 如何“看天吃饭”,把不确定性算明白

173 10
|
3月前
|
人工智能 分布式计算 DataWorks
|

阿里云大数据AI产品月刊-2025年12月

大数据& AI 产品技术月刊【2025年 12 月】,涵盖 12 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

371 2
|
3月前
|

系统信任增长范式:一套正在成型的增长公约

在系统主导的时代,增长不再依赖技巧,而取决于是否“值得被长期信任”。《系统信任增长范式》揭示了一套正在成型的隐性公约:真实性、一致性、可修复性等行为将被持续奖励,捷径逐渐失效。它不提供速成模型,而是划清可持续增长的规则边界,让信任成为时间的朋友。(238字)

303 9
来自: 智能搜索推荐  版块
|
3月前
|
机器学习/深度学习 人工智能 算法
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】聚焦强化学习核心考点:从MDP、贝尔曼方程到策略梯度、Actor-Critic框架,详解价值函数、优势函数与GAE等高频概念,结合蒙特卡洛与TD方法的偏差方差权衡,助你系统掌握RL原理与面试要点,轻松应对大模型算法挑战!

223 0
来自: 人工智能平台PAI  版块
|
3月前
|
存储 人工智能 物联网
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】聚焦微调核心技术:详解指令微调、RLHF对齐、LoRA高效参数调整原理与实现,涵盖矩阵低秩分解、初始化策略、变体优化及Prompt Tuning等方法对比,助你攻克大模型面试核心考点,精准提升offer竞争力!

193 0
来自: 人工智能平台PAI  版块
|
3月前
|

当系统开始“记账”,企业到底在被记什么?

在系统主导流量的时代,增长不再依赖短期投放,而是源于长期行为积累的“信用账本”。系统默默记录企业的五大维度:一致性、耐性、真实互动、错误修复与可预测性,构建其“主体画像”。当企业仍紧盯ROI时,系统已在评估信任。真正的增长,是值得被长期推荐的结果。

250 7
来自: 智能搜索推荐  版块
|
3月前
|
机器学习/深度学习 算法 安全
|

基于yolov8深度学习的农作物识别检测系统

本研究基于YOLOv8深度学习技术,构建农作物识别检测系统,旨在实现对作物种类、生长状态及病虫害的快速精准识别。通过Python与先进算法结合,提升农业智能化水平,助力精准施肥、减少农药使用,推动农业可持续发展,具有重要应用价值。

270 1
|
3月前
|
人工智能 算法 搜索推荐
|

AI时代增长逻辑迁移白皮书

本白皮书探讨AI时代企业增长从“流量采购”向“系统信任”的范式迁移,提出SPREAD增长飞轮框架,解析算法推荐环境下的新逻辑,助力企业构建可持续、可复利的长期增长路径。

213 2
来自: 智能搜索推荐  版块
|
3月前
|
Java
|

判断和循环

本节介绍Java中判断与循环结构,包括if语句的两种格式、switch语句及其JDK12新特性,以及for循环的基本语法。涵盖键盘录入、条件判断、case穿透、break与default使用等核心知识点,帮助掌握程序流程控制。

112 0
|
4月前
|
机器学习/深度学习 人工智能 算法
|

基于深度学习的摔倒检测系统

针对人口老龄化背景下老年人摔倒问题突出,传统检测方法存在佩戴不便、隐私泄露等局限,本研究基于深度学习技术,利用YOLOv8模型与Python开发非接触式摔倒检测系统。通过高效算法与高质量数据集实现精准识别,具备实时性高、适应性强等优势,可广泛应用于家庭、社区及医疗机构,有效提升老年人安全监护水平,减轻照护负担,推动人工智能在智慧医疗领域的融合应用。

203 4
|
4月前
|
数据采集 JSON 监控
|

京东店铺所有商品API接口使用指南

本文介绍如何对接京东开放平台“店铺所有商品API”,通过调用`JD.item_search_shop`接口,以编程方式获取POP或自营店铺的商品信息(如ID、标题、价格、库存等),适用于运营分析、库存监控等场景。需配置AppKey、时间戳等公共参数,并传入seller_id、page_no等业务参数实现分页查询,无需access_token授权。

282 1
|
4月前
|
机器学习/深度学习 传感器 算法
|

Python | K折交叉验证的参数优化的LinearRegression(线性回归)预测及可视化算法

本教程涵盖Python线性回归预测全流程,包含数据处理、模型训练、K折交叉验证及贝叶斯、随机、网格搜索三种参数优化方法,适用于多领域回归任务,附完整代码与可视化实现。

139 1
|
4月前
|
存储 C++
|

C++变量类型

C++变量类型包括基本类型如bool、char、int、float、double等,支持整数、浮点数、字符和布尔值的存储。还包含指针、数组、结构体、类、共用体等复合类型。变量命名由字母、数字、下划线组成,首字符须为字母或下划线。支持变量声明与定义分离,局部变量需显式初始化,静态变量自动初始化为0。

166 1
|
4月前
|
JSON Java API
|

Feign远程调用

本文介绍了如何使用Feign替代RestTemplate实现微服务间的HTTP调用,涵盖依赖引入、注解配置、自定义日志、连接池优化及代码抽取等实践。通过Feign可简化远程调用,提升开发效率,并结合最佳实践实现代码复用与解耦。

102 0
|
4月前
|
SQL 监控 机器人
|

钉钉通知

本文介绍如何通过Java代码调用钉钉机器人API,实现系统告警消息的实时发送。涵盖机器人创建、Webhook配置、Postman测试及Java代码实现,并提供限流提示与常见失败原因分析,助力高效集成钉钉通知。

132 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69328
内容
128
活动
439810
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务