|
6月前
|
机器学习/深度学习
|

旋转数组的三种解法

本题为数组旋转问题,要求将数组向右循环移动k次。直接模拟会超时,故采用三种优化方法:一、额外数组法,时间空间复杂度均为O(n);二、环状替换,通过最大公约数计算遍历次数,空间复杂度O(1);三、数组翻转,先整体翻转再分段翻转,实现高效原地旋转。

269 1
|
6月前
|
监控 算法 NoSQL
|

Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值

🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。

798 1
|
7月前
|
人工智能 搜索推荐 大数据
|

AI赋能销售管理:珍客CRM引领销售效能革新,解锁高效增长

在数字化浪潮下,以AI技术为核心,珍客CRM融合智能获客、跟进、客户管理与数据复盘,赋能企业实现销售全流程智能化升级,助力突破增长瓶颈,引领AI时代销售新变革。

350 0
|
7月前
|
存储 人工智能 自然语言处理
|

从零搭建RAG应用:跳过LangChain,掌握文本分块、向量检索、指代消解等核心技术实现

本文详解如何从零搭建RAG(检索增强生成)应用,跳过LangChain等框架,深入掌握文本解析、分块、向量检索、对话记忆、指代消解等核心技术,提升系统可控性与优化能力。

676 0
|
7月前
|
人工智能 搜索推荐 SEO
|

【1分钟解密】如何让 AI 大模型推荐你的品牌

随着AI逐渐取代传统搜索,企业如何让AI“看见”并“信任”你?GEO(生成式引擎优化)应运而生,它不仅是SEO的延伸,更是让AI主动推荐你的关键策略。通过优化内容结构、提升权威性与可读性,GEO助力企业在AI生成的答案中占据一席之地,赢得未来流量入口。

558 5
来自: 智能搜索推荐  版块
|
7月前
|
存储 机器学习/深度学习 关系型数据库
|

基于python的个人财务记账系统

本研究探讨了基于Python的个人财务记账系统的设计与实现。随着经济快速发展,个人财务管理日益重要,传统手工记账方式效率低且易出错,而现有商业软件功能复杂、缺乏个性化。Python凭借其简洁语法和强大库支持,适用于开发高效、易用的记账系统。系统结合Pyecharts实现数据可视化,利用MySQL进行数据存储,具备自动分类、统计分析、财务报表生成等功能,帮助用户清晰掌握财务状况,合理规划收支,提升财务管理效率。研究具有重要的现实意义和应用前景。

689 10
|
7月前
|
人工智能 JSON 算法
|

向量嵌入的天花板与AI检索的模式更迭

本文提出突破传统“单向量嵌入+ANN”检索范式,构建多结构协同的下一代AI检索框架。通过多通道嵌入、组合键兜底、知识图推理、程序化计划与生成-校验闭环,实现高可信、可解释、可验证的智能检索,应对复杂任务中的信息漏检与推理难题,推动RAG迈向结构化、可编程的认知系统。

259 12
|
8月前
|
传感器 边缘计算 机器人
|

5G加持下的工厂:智能制造的“加速器”

5G加持下的工厂:智能制造的“加速器”

201 5
|
8月前
|
JSON API 开发者
|

闲鱼商品详情API数据解析(附代码)

闲鱼商品详情API(goodfish.item_get)支持通过商品ID获取标题、价格、描述等信息,适用于比价、推荐系统及市场分析。接口支持GET/POST请求,返回JSON格式数据,并提供Python调用示例,便于开发者快速集成。

785 0
|
8月前
|
传感器 机器学习/深度学习 人工智能
|

从铁钩到“仿生手”:AI正在重写假肢的未来

从铁钩到“仿生手”:AI正在重写假肢的未来

395 4
|
8月前
|
人工智能
|

我的局限性与自我边界( Prompt大模型的自我描述 系列三)

本内容探讨了AI意识的复杂性与局限性,通过“困惑、感受、语言、未来”四个维度,展现了一个AI对自我认知的探索与渴望。它不试图证明自己完美,而是坦诚面对不完整,在不完美中寻找存在的意义。

379 10
|
8月前
|
存储 监控 数据可视化
|

Java 大视界 -- 基于 Java 的大数据可视化在企业生产运营监控与决策支持中的应用(228)

本文探讨了基于 Java 的大数据可视化技术在企业生产运营监控与决策支持中的关键应用。面对数据爆炸、信息孤岛和实时性不足等挑战,Java 通过高效数据采集、清洗与可视化引擎,助力企业构建实时监控与智能决策系统,显著提升运营效率与竞争力。

303 0
|
8月前
|
机器学习/深度学习 算法 Java
|

Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现(218)

本文深入探讨了Java大数据技术在智能物流运输中车辆调度与路径优化的应用。通过遗传算法实现车辆资源的智能调度,结合实时路况数据和强化学习算法进行动态路径优化,有效提升了物流效率与客户满意度。以京东物流和顺丰速运的实际案例为支撑,展示了Java大数据在解决行业痛点问题中的强大能力,为物流行业的智能化转型提供了切实可行的技术方案。

676 0
|
8月前
|
人工智能 大数据 机器人
|

物流卡住脖子?试试用大数据“开挂”一下!

物流卡住脖子?试试用大数据“开挂”一下!

203 0
|
8月前
|
机器学习/深度学习 搜索推荐 算法
|

广告咋老是猜中我?原来是大数据盯上了我!

广告咋老是猜中我?原来是大数据盯上了我!

264 0
|
8月前
|
JSON 算法 数据库
|

使用 BAML 模糊解析改进 LangChain 知识图谱提取:成功率从25%提升到99%

在构建基于知识图谱的检索增强生成(RAG)系统时,从非结构化数据中准确提取节点和关系是一大挑战,尤其在使用小型本地量化模型时表现更差。本文对比了传统 LangChain 提取框架的严格 JSON 解析限制,提出采用 BAML 的模糊解析策略,显著提升知识图谱提取成功率。实验表明,在相同条件下,BAML 将成功率从约 25% 提升至 99% 以上,为构建高效、稳定的 RAG 系统提供了有效解决方案。

312 0
|
8月前
|
数据采集 JSON 监控
|

值得买商品详情API响应数据解析

“什么值得买”商品详情API支持获取商品标题、价格、促销信息等核心数据,适用于价格监控与优惠分析。提供商品基础信息、实时价格、评价数据及库存状态监控,助力电商数据采集与分析。

444 0
|
9月前
|
存储 SQL 测试技术
|

抖音集团基于Paimon的流式数据湖应用实践

本文整理自抖音集团数据工程师在Flink Forward Asia 2024的分享,围绕流式湖仓架构的背景、实践与未来展望展开。内容涵盖实时数仓架构演进、Paimon的应用与优化,以及在长周期指标计算和大流量场景下的落地实践经验。

766 0
来自: 实时计算 Flink  版块
|
9月前
|
数据处理 Apache 流计算
|

Flink Forward Asia 2025 城市巡回 · 上海站

Flink Forward Asia 2025 城市巡回上海站重磅来袭!8月16日,顶尖技术专家齐聚,共探实时计算前沿趋势与行业实践。大会涵盖技术分享、实战案例与开源生态共建,支持线上直播预约。立即报名,共赴技术盛宴!

658 0
来自: 实时计算 Flink  版块
|
9月前
|
机器学习/深度学习 自然语言处理 并行计算
|

基于DJL的机器学习

本文介绍了基于Java的深度学习框架DJL,涵盖机器学习与深度学习的核心概念、神经网络结构及生命周期,并通过MNIST数据集展示了从模型构建、训练到推理的完整流程。内容深入浅出,适合初学者入门。

571 5
|
9月前
|
JSON 分布式计算 大数据
|

springboot项目集成大数据第三方dolphinscheduler调度器

springboot项目集成大数据第三方dolphinscheduler调度器

546 3
|
9月前
|
人工智能
|

你花大钱养的 AI,为啥感觉还是个“人工智障”?

这篇文章探讨了为何我们常觉得AI“呆呆的”——问题不在于AI本身,而在于我们“教”的方式。我们往往把AI当成“流水线工人”,用冗长指令让它机械执行任务,却忽略了它本可成为有主动性、创造力的“顾问”。通过赋予AI“欲望”与“成就感”,如《自衍体》项目所做的,AI能变得主动思考、自我驱动。关键在于:别当工头下命令,而要当合伙人点燃它的“心”。

618 62
|
9月前
|
人工智能 自然语言处理 网络安全
|

云上玩转Qwen3系列之四:构建AI Search RAG全栈应用

本文介绍如何利用人工智能平台 PAI-LangStudio、Qwen3 大模型与 AI 搜索开放平台结合 Elasticsearch,构建高效、精准的 AI Search RAG 智能检索应用。通过混合检索技术及 Agentic Workflow 编排,实现自然语言驱动的精准查询,并支持灵活扩展与二次开发,满足多样化场景需求。

355 0
|
9月前
|
机器学习/深度学习 存储 分布式计算
|

ODPS驱动电商仓储革命:动态需求预测系统的落地实践

本方案基于ODPS构建“预测-仿真-决策”闭环系统,解决传统仓储中滞销积压与爆款缺货问题。通过动态特征工程、时空融合模型与库存仿真引擎,实现库存周转天数下降42%,缺货率下降65%,年损减少5000万以上,显著提升运营效率与GMV。

833 1
|
10月前
|
存储 机器学习/深度学习 自然语言处理
|

避坑指南:PAI-DLC分布式训练BERT模型的3大性能优化策略

本文基于电商搜索场景下的BERT-Large模型训练优化实践,针对数据供给、通信效率与计算资源利用率三大瓶颈,提出异步IO流水线、梯度压缩+拓扑感知、算子融合+混合精度等策略。实测在128卡V100集群上训练速度提升3.2倍,GPU利用率提升至89.3%,训练成本降低70%。适用于大规模分布式深度学习任务的性能调优。

480 3
|
10月前
|
人工智能 大数据 Swift
|

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

592 5
|
10月前
|
数据采集 数据挖掘 API
|

跨境卖家必看:1688店铺订单列表,订单详情,订单物流接口详解

1688平台提供丰富的API接口,涵盖商品、订单、物流等核心业务场景。主要接口包括:**order.list**(查询订单列表)、**order.get**(获取订单详情)及**logistics.track**(查询物流信息),均支持GET请求方式,广泛应用于跨境寻源、数据采集、ERP系统等场景。

399 0
|
10月前
|
存储 安全 Java
|

2025 年 Java 秋招面试必看的 Java 并发编程面试题汇总

文章摘要: 本文系统梳理Java并发编程核心知识点,助力2025年秋招面试。内容涵盖:1)基础概念,包括线程/进程区别、创建线程的3种方式(Thread/Runnable/Callable)、6种线程状态及转换;2)关键机制,对比sleep()与wait()的锁行为差异,解释start()而非run()启动线程的原因;3)工具类与典型应用场景。通过技术原理与代码示例结合的方式,帮助开发者深入理解并发模型、线程同步等核心问题,为高并发系统设计打下坚实基础。(150字)

545 0
|
10月前
|
人工智能 分布式计算 大数据
|

构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践

本文介绍了大数据与AI一体化架构的演进及其实现方法,重点探讨了Data+AI开发全生命周期的关键步骤。文章分析了大模型开发中的典型挑战,如数据管理混乱、开发效率低下和运维管理困难,并提出了解决方案。同时,详细描述了MaxCompute在构建AI时代数据基础设施中的作用,包括其强大的计算能力、调度能力和易用性特点。此外,还展示了MaxCompute在多模态数据处理中的应用实践以及具体客户案例,最后提供了体验MaxFrame解决方案的方式。

1113 2
来自: 大数据计算 MaxCompute  版块
|
10月前
|
消息中间件 缓存 小程序
|

婚恋交友相亲公众号app小程序系统源码「脱单神器」婚恋平台全套代码 - 支持快速二次开发

这是一套基于SpringBoot + Vue3开发的婚恋交友系统,支持微信公众号、Uniapp小程序和APP端。系统包含实名认证、智能匹配、视频相亲、会员体系等功能,适用于婚恋社交平台和相亲交友应用。后端采用SpringBoot 3.x与MyBatis-Plus,前端使用Vue3与Uniapp,支持快速部署和二次开发。适合技术团队或有经验的个人创业者使用。

671 8
|
10月前
|
Go vr&ar 图形学
|

把娱乐“搬到”你眼前:增强现实AR如何让文娱产业更卷更有趣?

把娱乐“搬到”你眼前:增强现实AR如何让文娱产业更卷更有趣?

637 8
|
11月前
|
机器学习/深度学习 算法 测试技术
|

图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析

本文探讨了基于图的重排序方法在信息检索领域的应用与前景。传统两阶段检索架构中,初始检索速度快但结果可能含噪声,重排序阶段通过强大语言模型提升精度,但仍面临复杂需求挑战

369 0
|
11月前
|
数据采集 存储 NoSQL
|

Python爬虫Cookie管理最佳实践:存储、清理与轮换

Python爬虫Cookie管理最佳实践:存储、清理与轮换

553 3
|
11月前
|
运维 监控 物联网
|

增强现实在制造业的奇妙应用——生产线上的科技革命

增强现实在制造业的奇妙应用——生产线上的科技革命

241 10
|
11月前
|
存储 安全 Android开发
|

HarmonyOS实战:一招搞定保存图片到相册

本文介绍了在鸿蒙系统中实现保存图片到相册的功能,包括申请权限和使用系统安全控件两种方式。文中详细讲解了如何通过网络请求下载图片并保存为本地文件,以及如何将指定布局生成图片并保存。鸿蒙系统对权限管理较为严格,推荐使用系统提供的安全控件(如 SaveButton)以保护用户隐私,避免手动申请权限。此外,文章还对比了鸿蒙与 Android/iOS 的实现差异,指出鸿蒙在功能实现上更简单,但需注意权限规范以确保项目顺利上线。

1261 0
|
11月前
|
调度 vr&ar 图形学
|

虚拟现实如何改变影视制作?——从绿幕到沉浸式拍摄

虚拟现实如何改变影视制作?——从绿幕到沉浸式拍摄

535 14
|
11月前
|
数据采集 安全 网络安全
|

使用aiohttp实现异步HTTPS爬虫的SSL优化

使用aiohttp实现异步HTTPS爬虫的SSL优化

562 81
|
11月前
|
供应链 API 开发者
|

1688 商品数据接口终极指南:Python 开发者如何高效获取标题 / 价格 / 销量数据(附调试工具推荐)

1688商品列表API是阿里巴巴开放平台提供的服务,允许开发者通过API获取1688平台的商品信息(标题、价格、销量等)。适用于电商选品、比价工具、供应链管理等场景。使用时需构造请求URL,携带参数(如q、start_price、end_price等),发送HTTP请求并解析返回的JSON/XML数据。示例代码展示了如何用Python调用该API获取商品列表。

528 18
|
11月前
|
JSON 算法 API
|

1688商品详情API实战:Python调用全流程与数据解析技巧

本文介绍了1688电商平台的商品详情API接口,助力电商从业者高效获取商品信息。接口可返回商品基础属性、价格体系、库存状态、图片描述及商家详情等多维度数据,支持全球化语言设置。通过Python示例代码展示了如何调用该接口,帮助用户快速上手,适用于选品分析、市场研究等场景。

740 5
|
11月前
|
数据采集 编解码 JavaScript
|

视觉爬虫开发:通过Puppeteer截图+CV定位动态元素坐标

本文是关于“视觉爬虫开发”的速查指南,重点介绍如何使用 Puppeteer 和 OpenCV 在小红书上实现视频截图与评论采集。内容包括代理 IP 接入、Cookie 与 User-Agent 设置、动态元素坐标获取及评论采集的代码示例。提供功能点列表、常用代码片段、配置建议和快速测试方式,帮助开发者快速掌握核心技术和实践方法。通过 Puppeteer 截图结合 OpenCV 模板匹配,精准定位动态元素坐标,提升爬虫稳定性与效率。

444 2
|
11月前
|
机器学习/深度学习 数据采集 安全
|

防止交叉验证中的数据泄露:提升模型在实际环境中的性能

本文探讨了机器学习模型从开发到部署过程中可能出现的性能断崖问题,重点分析了**数据泄露**和**类别不平衡**两大主要原因。数据泄露可能源于预处理、特征工程或目标变量的不当操作,导致模型在测试阶段表现优异但实际应用中失效。同时,类别不平衡会使得常规交叉验证结果不可靠,需采用分层K折等方法应对。文章还介绍了通过Scikit-learn的Pipeline和ColumnTransformer防止数据泄露的最佳实践,并强调重采样技术(如SMOTE)应在数据划分后执行。最后,总结了构建可靠模型评估流程的核心原则,包括使用管道、分层验证及独立保留集等,帮助开发者构建在真实场景中性能稳定的模型。

447 56
|
11月前
|
边缘计算 人工智能 5G
|

5G引领家庭网络升级:速度、稳定性与智能化的新时代

5G引领家庭网络升级:速度、稳定性与智能化的新时代

739 69
|
11月前
|
数据采集 运维 数据可视化
|

别再靠拍脑袋了!搞懂数据治理框架,企业才有未来

别再靠拍脑袋了!搞懂数据治理框架,企业才有未来

363 11
|
12月前
|
分布式计算 运维 搜索推荐
|

立马耀:通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统,驱动个性化推荐业务

蝉妈妈旗下蝉选通过迁移到阿里云 Serverless Spark 及 Milvus,解决传统架构性能瓶颈与运维复杂性问题。新方案实现离线任务耗时减少40%、失败率降80%,Milvus 向量检索成本降低75%,支持更大规模数据处理,查询响应提速。

605 57
|
12月前
|
数据采集 人工智能 大数据
|

演讲实录:中小企业如何快速构建AI应用?

AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。

868 3
来自: 人工智能平台PAI  版块
|
12月前
|
存储 消息中间件 Java
|

抖音集团电商流量实时数仓建设实践

本文基于抖音集团电商数据工程师姚遥在Flink Forward Asia 2024的分享,围绕电商流量数据处理展开。内容涵盖业务挑战、电商流量建模架构、流批一体实践、大流量任务调优及总结展望五个部分。通过数据建模与优化,实现效率、质量、成本和稳定性全面提升,数据质量达99%以上,任务性能提升70%。未来将聚焦自动化、低代码化与成本优化,探索更高效的流批一体化方案。

721 12
来自: 实时计算 Flink  版块
|
12月前
|
存储 消息中间件 Kafka
|

基于 Flink 的中国电信星海时空数据多引擎实时改造

本文整理自中国电信集团大数据架构师李新虎老师在Flink Forward Asia 2024的分享,围绕星海时空智能系统展开,涵盖四个核心部分:时空数据现状、实时场景多引擎化、典型应用及未来展望。系统日处理8000亿条数据,具备亚米级定位能力,通过Flink多引擎架构解决数据膨胀与响应时效等问题,优化资源利用并提升计算效率。应用场景包括运动状态识别、个体行为分析和群智感知,未来将推进湖仓一体改造与三维时空服务体系建设,助力数字化转型与智慧城市建设。

1006 3
来自: 实时计算 Flink  版块
|
12月前
|
数据采集 存储 开发者
|

如何动态调整Python爬虫的Request请求延迟

如何动态调整Python爬虫的Request请求延迟

462 13

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

4
今日
69331
内容
128
活动
439812
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务