|
5月前
|
存储 安全 小程序
|

1.认识OAuth2.0

OAuth2.0是一种开放授权协议,允许第三方应用在用户授权下访问其资源,而无需获取用户账号密码。它通过令牌(token)机制实现安全授权,广泛用于第三方登录、服务间资源调用等场景,支持授权码、简化、密码和客户端四种模式,兼顾安全性与灵活性。

340 0
|
5月前
|
Linux 数据安全/隐私保护 虚拟化
|

虚拟机安装(CentOS7)

准备CentOS7镜像及VMware Workstation虚拟机工具,可从百度云下载(提取码:h1y9/bkz3)。使用VMware创建虚拟机,参考知乎教程完成安装。默认登录用户为root,密码由用户自定义设置。需准备一台具备运行虚拟机条件的电脑。

255 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于训练数据,导致性别、种族等歧视;公平性追求无差别对待,需技术与社会协同;可解释性提升模型透明度,增强信任;安全对齐防止有害输出;人类对齐确保价值观一致;隐私保护防范数据泄露。这些维度共同构成负责任AI的发展基石,需多学科协作持续优化,以实现安全、公正、可信的AI系统。

310 0
|
5月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。MCP为模型与外部工具提供标准化通信协议,实现跨模型、跨平台集成;Function Call则是模型调用外部函数的内置机制。前者如“蓝牙协议”,支持多设备互联,后者像“语音助手”,限于单机操作。两者在功能上互补:MCP支持工具热插拔、权限控制与远程调用,适用于企业级复杂系统;Function Call开发简单,适合快速验证单一模型能力。未来趋势将走向融合,形成“模型解析-协议传输-工具执行”的分层架构,推动AI应用生态标准化发展。

434 0
|
5月前
|
数据采集 人工智能
|

听说现在AI爬虫很好用,有什么推荐的吗?

593 1
|
5月前
|
JSON 前端开发 API
|

京东商品详情 API 实战指南

京东商品详情API通过抓包分析前端异步请求,获取商品标题、价格、库存等核心信息,适用于电商数据分析与比价系统。本文详解接口逻辑、关键参数及Python实现,并强调反爬策略与合规性,助力开发者安全高效采集数据。(238字)

285 3
|
5月前
|
机器学习/深度学习 人工智能 数据可视化
|

构建AI智能体:七十三、模型的成绩单:一文读懂损失函数,看懂AI如何学习

本文系统介绍了损失函数在机器学习中的核心作用。首先通过类比教学场景,阐释损失函数作为模型"导师"的重要性。随后详细解析了回归任务中的均方误差(MSE)和平均绝对误差(MAE),通过房价预测案例展示了它们对误差的不同处理方式。在分类任务部分,重点讲解了二分类和多分类交叉熵损失函数,使用垃圾邮件识别和图像分类等实例,说明这些函数如何通过概率计算来评估预测准确性。文章通过可视化图表直观呈现了不同损失函数的特点,并强调损失函数作为模型优化的指南针,其设计直接影响学习效果。

649 20
|
5月前
|
存储 供应链 API
|

1688店铺详情API使用指南

1688店铺详情API是阿里巴巴开放平台核心接口,支持通过店铺ID获取商家基本信息、资质、等级及主营类目等数据,适用于电商分析、供应链对接等场景。本文详解接口参数、Python调用示例及注意事项,助开发者高效集成与应用。

428 1
|
5月前
|
数据采集 JSON Java
|

实战解析:淘宝商品评论item_review接口

本文详解2025年淘宝开放平台taobao.item.review.get接口合规调用方法,涵盖权限申请、参数配置、HMAC-SHA1签名生成及Java原生代码实现,无需第三方SDK,可快速集成至数据采集系统,稳定获取商品评论详情。

422 0
|
5月前
|
消息中间件 自然语言处理 供应链
|

Pandabuy复制指南:淘宝1688代购系统搭建

Pandabuy以“反向海淘”模式为核心,助力海外用户代购中国商品,主打欧美市场。通过物流收费、佣金、汇率差等多元盈利,两年营收达40亿元。依托网红营销、低价策略与社区运营,实现高速增长。系统搭建推荐微服务架构,对接淘宝1688 API,强化合规与供应链管理,结合SEO、社媒营销及风控体系,打造高效安全的国际代购平台。

500 1
|
5月前
|
SQL 自然语言处理 数据挖掘
|

ChatBI 选型必看:为什么说“准确率”是评估智能问数工具的第一基石?

当 ChatBI 的准确率不断提升,其价值将从“效率工具”升级为“决策中枢”

381 2
|
5月前
|
人工智能 自然语言处理 安全
|

AI 十大论文精讲(六):拆解 LLM 智能体的 “通用密码”

本文解读复旦NLP团队2023年重磅综述《The Rise and Potential of Large Language Model Based Agents》,系统剖析LLM智能体“大脑-感知-行动”三大核心模块,涵盖单智能体、多智能体、人机协作与智能体社群四大应用场景,提炼工具SKMA体系、安全护栏、结果检查三大落地要点,并提出AGI路径、虚拟到物理迁移等开放问题,为构建通用智能体提供统一范式,被誉为该领域“入门圣经”。

877 4
|
6月前
|
数据采集 存储 算法
|

数据资产上账记:企业如何把“看不见的数据”变成“看得见的资产”?

数据资产上账记:企业如何把“看不见的数据”变成“看得见的资产”?

297 10
|
6月前
|
存储 人工智能 自然语言处理
|

阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元

本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。

999 22
|
7月前
|
算法 数据挖掘 大数据
|

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

507 8
|
8月前
|
人工智能 运维 搜索推荐
|

大数据+游戏:原来玩家的快乐还能这样被“算”出来?

大数据+游戏:原来玩家的快乐还能这样被“算”出来?

797 11
|
8月前
|
机器学习/深度学习 算法 数据可视化
|

从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南

推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。

1176 2
|
8月前
|
传感器 数据挖掘
|

为你的数据选择合适的分布:8个实用的概率分布应用场景和选择指南

面对真实数据不知该用哪种分布?本文精炼总结8个实战必备概率分布,涵盖使用场景、避坑指南与代码实现。从二元事件到计数、等待时间、概率建模,再到小样本处理,教你快速选择并验证合适分布,用对模型显著提升分析准确性。

714 10
|
8月前
|
机器学习/深度学习 负载均衡 网络架构
|

Mixture of Experts架构的简要解析

Mixture of Experts(MoE)架构起源于1991年,其核心思想是通过多个专门化的“专家”网络处理输入的不同部分,并由门控网络动态组合输出。这种架构实现了稀疏激活,仅激活部分专家,从而在模型规模与计算成本之间取得平衡。MoE的关键在于门控机制的设计,如线性门控、噪声Top-K门控等,确保模型能根据输入特征自适应选择专家。

1484 8
|
9月前
|
JSON 数据挖掘 API
|

小红书笔记评论API数据解析(附代码)

本资源介绍如何通过小红书官方API获取笔记评论数据,包含评论内容、用户信息、点赞数等关键字段。支持分页请求,适用于舆情分析、用户研究及市场调研。提供完整Python调用示例,涵盖请求签名、响应解析等核心流程,助力高效获取结构化评论数据。

644 0
|
9月前
|
人工智能 自然语言处理 安全
|

Milvus x n8n :自动化拆解Github文档,零代码构建领域知识智能问答

本文介绍了在构建特定技术领域问答机器人时面临的四大挑战:知识滞后性、信息幻觉、领域术语理解不足和知识库维护成本高。通过结合Milvus向量数据库和n8n低代码平台,提出了一种高效的解决方案。该方案利用Milvus的高性能向量检索和n8n的工作流编排能力,构建了一个可自动更新、精准回答技术问题的智能问答系统,并介绍了部署过程中的可观测性和安全性实现方法。

1182 0
|
10月前
|
数据采集 自然语言处理 NoSQL
|

利用中间件实现任务去重与分发精细化:股吧舆情数据采集与分析实战

本项目针对东方财富股吧设计精细化采集方案,解决重复采集、调度混乱与反爬等问题,构建舆情分析数据模型。通过采集帖子内容、用户行为与情绪信号,实现情绪趋势可视化、热点识别与个股预警,助力把握市场风向。

585 0
|
10月前
|
存储 人工智能 机器人
|

让大语言模型在不知道答案时拒绝回答:KnowOrNot框架防止AI幻觉

在政府AI服务中,如何让系统在知识不足时恰当拒绝回答而非生成错误信息是一大挑战。KnowOrNot框架通过构建“知识库外”测试场景,评估AI是否能识别知识边界并合理拒答,从而提升AI服务的可靠性与安全性。

855 0
|
12月前
|
机器学习/深度学习 数据采集 缓存
|

为什么大厂面试官都在问XGBoost?

作为机器学习面试的必考题,XGBoost为什么如此重要?本文用通俗易懂的方式,带你掌握XGBoost的核心知识点,让你在面试中侃侃而谈,轻松拿下offer!

633 1
|
18天前
|
JSON API 数据格式
|

国内电商平台商品详情API返回数据Python模型格式

本接口服务支持淘宝、京东、1688三大平台商品详情数据获取,返回标准化Python字典,涵盖标题、价格、库存、图片、SKU、规格、评价等核心字段,含OAuth2.0/签名认证、调用示例及统一解析函数,助力电商数据高效对接。

108 1
|
22天前
|
人工智能 监控 安全
|

告别传统Prompt写法!聚AI提示词工程新范式

本章系统讲解Python提示词工程实战,涵盖专业环境搭建、API调用与结构化响应、企业级模板引擎及多步骤对话管理,并延伸至Prompt迭代优化、外部工具集成与性能监控,助力构建工业级AI应用系统。(239字)

138 1
|
1月前
|
人工智能 JSON 监控
|

天猫商品详情API数据解析

天猫商品详情API解析方案,涵盖taobao/tmall.item.get接口字段说明、JSON结构、解析代码及SKU/详情图/规格提取。支持价格库存、竞品监测、舆情预警等场景,AI智能清洗、卖点解析与爆款预测,助力中小卖家高效用数。(239字)

153 0
|
1月前
|
存储 人工智能 API
|

基于Flutter3.41+Dart3.11+DeepSeek生成式AI对话应用App助手

Flutter3.41+Dart3+Dio+Getx+Markdown聚合DeepSeek-chat实战AI流式打字智能会话模板。新增深度思考模式、latex公式、mermaid图表,代码高亮/复制代码、图片预览、链接、表格等功能。

150 4
|
1月前
|
机器学习/深度学习 分布式计算 搜索推荐
|

PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎

PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。

293 9
来自: 智能搜索推荐  版块
|
2月前
|
自然语言处理
|

别再只会“复制粘贴数据”了:聊聊 NLP 数据增强的那些实战骚操作

别再只会“复制粘贴数据”了:聊聊 NLP 数据增强的那些实战骚操作

241 3
|
2月前
|
人工智能 监控 安全
|

1949AI轻量化AI自动化:有头浏览器自动化竞品词排名监控与邮件提醒实践

1949AI轻量化AI自动化工具,基于Playwright实现有头浏览器本地监控:可视化调试、低资源占用、安全合规。支持关键词排名追踪、波动预警与邮件提醒,单文件部署、零外部依赖,专为个人开发者与小型团队打造。

367 5
|
2月前
|
人工智能 安全 调度
|

1949AI 轻量化 AI 自动化办公场景应用方案 本地自动化工具与浏览器自动化实践

1949AI是一款轻量化AI办公自动化工具,基于Python实现,无需高性能算力,支持本地文件处理、网页数据抓取与Agent自主调度。模块化设计、低资源占用、全程离线运行,适配个人开发者与小型团队,安全合规、开箱即用。(239字)

525 11
|
2月前
|
存储 缓存 负载均衡
|

Linux内核三大核心模块深度解析:调度、内存与I/O

Linux内核三大核心模块——进程调度(CFS/EEVDF等)、内存管理(buddy/slub、页回收、THP)与文件I/O(io_uring、页缓存、I/O调度)——共同决定系统性能与稳定性。深入理解其原理及协同机制,是高性能开发、调优与故障诊断的基石。(239字)

310 2
|
2月前
|
人工智能 自然语言处理 数据管理
|

零安装在线网站制作,为什么正在成为新主流

零安装在线网站制作将开发环境云端化,用户无需配置本地环境,打开浏览器即可完成建站、编码、数据管理与部署。依托浏览器能力提升、云基建成熟及AI生成技术,如lynxcode(原lynx AI)支持自然语言生成全栈代码,大幅降低门槛,加速原型验证与快速迭代,尤其适合创业者与非技术人员。

235 5
|
3月前
|
JSON 监控 供应链
|

亚马逊商品详情数据获取实战:从商品链接提取 ID 到解析详情

亚马逊商品详情API(PA-API v5与SP-API)是官方合规数据接口,分别面向第三方开发者与入驻卖家,支持获取ASIN/关键词对应的商品标题、价格、图片、评价等核心信息,广泛用于比价、选品、竞品分析及Listing优化。接入稳定、数据权威。(239字)

330 1
|
3月前
|
数据采集 人工智能 自然语言处理
|

大模型微调后,如何判断它是不是“变聪明”了?这套评估方法论请收好。

本文系统阐述大模型微调效果评估的核心价值与实践方法:强调评估是检验泛化能力的“试金石”,须坚持人工主观评估(重业务适配性)与自动化客观评估(重量化指标)双轨并行;详解测试集构建、指标选择、基线对比等关键步骤,助力从0到1建立科学、可信、可迭代的评估体系。(239字)

348 3
|
3月前
|
调度 C++ 异构计算
|

梯度累积真的省显存吗?它换走的是什么成本

梯度累积常被当作OOM“急救药”,但它并非免费:仅降低单步显存峰值,却牺牲训练速度、梯度信号密度、优化器响应灵敏度与调参手感。它适合快速验证,却不适配长期精调——真正的瓶颈,往往不是显存,而是系统设计。

298 7
|
3月前
|
人工智能 缓存 C++
|

模型不该背的锅:哪些风险应该交给系统

本文揭示大模型项目中常见误区:问题常不在模型本身,而在系统责任边界模糊。模型只应负责生成与理解,而合规审查、回答授权、输入过滤、规则执行、兜底逻辑和一致性保障等,必须由系统层承担。厘清“能力”与“责任”之分,方能构建稳健AI系统。

189 4
|
4月前
|
人工智能 自动驾驶 算法
|

智能体来了!2026 AI 元年:在全新赛道上重构人类生产力边界

2026年被定义为“智能体元年”:AI从“能说”跃升为“能干”,实现自主决策、跨系统协作与具身执行。产业迎来智能体市场、数字劳动力网络和可信治理三大爆发点,人类角色转向目标设定与智能体调度。技术终指向人的升华。(239字)

445 3
|
4月前
|
人工智能 搜索推荐 数据挖掘
|

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的?

深度AI学术融合百度学术与Google Scholar优势,聚合2.8亿文献,支持中英文语义检索、AI自动摘要、引用追踪及趋势分析;创新提供批量翻译、自定义维度解析与学术报告生成,打造智能科研助手。(239字)

366 7
来自: 智能搜索推荐  版块
|
4月前
|
人工智能 搜索推荐 API
|

智能体来了从 0 到 1:数据、工具与规则的协同范式

随着AI深入产业,单一模型已难支撑复杂流程。智能体作为以大模型为核心、融合数据(知识/记忆)、工具(执行接口)与规则(行为约束)的协同系统,实现感知—推理—执行闭环。其价值在于三者可复用、可治理的工程化协同,而非模型本身。

214 6
|
4月前
|
数据采集 机器学习/深度学习 人工智能
|

大模型“驯化”指南:从人类偏好到专属AI,PPO与DPO谁是你的菜?

本文深入解析让AI“懂你”的关键技术——偏好对齐,对比PPO与DPO两种核心方法。PPO通过奖励模型间接优化,适合复杂场景;DPO则以对比学习直接训练,高效稳定,更适合大多数NLP任务。文章涵盖原理、实战步骤、评估方法及选型建议,并推荐从DPO入手、结合低代码平台快速验证。强调数据质量与迭代实践,助力开发者高效驯化大模型,实现个性化输出。

826 8
|
4月前
|
存储 缓存 人工智能
|

向量数据库技术内核:从存储到检索,拆解其高效运作的秘密

本文深入剖析向量数据库从存储到检索的工程实现,揭秘其高效运作的核心机制。不同于传统数据库,它通过近似最近邻(ANN)、向量压缩与分层索引(如HNSW)等技术,在高维空间中以“算得少”实现“查得快”。文章结合真实场景,揭示其本质:不是追求绝对精确,而是工程权衡下的极致优化,是AI时代数据检索的实用化落地。

367 3
|
4月前
|
安全 网络安全 数据安全/隐私保护
|

用好代理 IP:加密付费拒绝免费陷阱

代理IP兼具隐私保护与安全风险,合规使用可防追踪、保障跨境业务,但非正规服务易致信息泄露、账号风控,甚至被用于违法活动。用户应选择加密付费代理,避开免费陷阱,遵守法规,强化安全防护,让技术真正服务于合法需求。

340 4
|
5月前
|
数据采集 JSON 监控
|

京东店铺所有商品API接口使用指南

本文介绍如何对接京东开放平台“店铺所有商品API”,通过调用`JD.item_search_shop`接口,以编程方式获取POP或自营店铺的商品信息(如ID、标题、价格、库存等),适用于运营分析、库存监控等场景。需配置AppKey、时间戳等公共参数,并传入seller_id、page_no等业务参数实现分页查询,无需access_token授权。

428 1
|
5月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中两大关键技术。前者为跨模型标准化通信协议,实现工具与模型解耦;后者是模型调用外部功能的内置机制。二者互补协作,推动AI应用向更开放、灵活、可扩展的方向发展。

272 0
|
5月前
|
机器学习/深度学习 人工智能 算法
|

让AI真正读懂长文本的秘密武器

通义实验室推出QwenLong-L1.5,基于Qwen3-30B-A3B打造的长文本推理专家。通过高质量多跳数据合成、稳定强化学习算法与突破窗口限制的记忆框架,系统性解决长文本“学不好、用不了”难题,在多跳推理、超长上下文等任务中媲美GPT-5与Gemini。

657 0
|
5月前
|
存储 缓存 Java
|

SpringCloud自定义注解

本文介绍Java自定义注解的实现与应用,结合Spring AOP与过滤器,演示日志处理、权限控制等场景。通过@Target、@Retention等元注解定义注解,并在Controller中结合AOP或拦截器实现登录验证等功能,提升代码可读性与复用性。(238字)

155 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务