|
4月前
|
机器学习/深度学习 人工智能 物联网
|

AR技术融入到产品质量检测:提升效率与精度的未来趋势

元幂境认为,AR技术正革新产品质量检测,通过虚实融合提升精度、降低门槛、强化培训与协作,广泛应用于制造、电子、医疗及航空航天领域,未来结合AI将迈向智能检测新阶段。

791 0
|
11月前
|
数据采集 存储 数据可视化
|

分布式爬虫框架Scrapy-Redis实战指南

本文介绍如何使用Scrapy-Redis构建分布式爬虫系统,采集携程平台上热门城市的酒店价格与评价信息。通过代理IP、Cookie和User-Agent设置规避反爬策略,实现高效数据抓取。结合价格动态趋势分析,助力酒店业优化市场策略、提升服务质量。技术架构涵盖Scrapy-Redis核心调度、代理中间件及数据解析存储,提供完整的技术路线图与代码示例。

1205 0
|
DataWorks 关系型数据库 MySQL
|

DataWorks产品使用合集之RDS和ADB的区别是什么

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

663 2
|
2天前
|
人工智能 算法 物联网
|

别再骂AI不懂人情世故了,是你没把它“喂”对

春节祝福别再复制粘贴!本文分享如何用30分钟微调Qwen3-32B模型,借助LLaMA-Factory Online平台,注入“关系颗粒度”六维数据(称呼、关系、交往细节等),让AI告别公文腔,学会因人制宜、带梗走心的拜年话——技术不炫技,只为一句刚刚好的祝福。(239字)

51 0
|
23天前
|
数据采集 人工智能 监控
|

告别“垃圾进垃圾出”:打造高质量数据集的完整指南

本文深入解析AI时代“数据比算法更重要”的核心理念,系统阐述高质量数据集的定义、黄金标准(含16条可操作规范)与七步构建法,并提供自动化检查、基线验证及人工评审等实用评估手段,助力开发者高效打造可靠、合规、可持续迭代的优质训练数据。(239字)

266 12
|
3月前
|
关系型数据库 MySQL PHP
|

0 基础建站?PageAdmin CMS 10 分钟搞定,源码免费拿!

PageAdmin CMS 为无编程基础用户提供高效建站方案。步骤包括:准备服务器、域名及源码;上传源码并配置数据库;通过安装向导完成基础设置;在后台创建栏目、填充内容;测试功能后上线。全程无需编程,简单操作即可搭建独立网站,支持后续维护与扩展。

418 1
|
3月前
|
存储 搜索推荐 安全
|

电脑必备软件:PortableApps便携式软件管理工具安装使用教程:U盘装软件随身带

PortableApps是一款免费开源的便携式软件管理平台,支持将软件安装至U盘,即插即用,拔出不留痕迹。内置近500款实用软件,无需安装,跨平台使用便捷,支持个性化主题设置,让软件随身携带,工作学习更高效。

696 1
|
5月前
|

一键解决 Office 卸载难题!微软官方卸载工具,点击下载开启轻松卸载之旅

微软官方Office卸载工具可彻底清除Office 2007至2021及365版本残留,解决重装报错问题。支持深度扫描与一键卸载,操作简单,卸载后需重启生效。

1729 18
|
6月前
|
监控 Linux iOS开发
|

PyCharm启动项目和调试项目

本文介绍了在 PyCharm 中启动和调试 Python 项目的详细步骤,涵盖单文件运行、配置管理、命令行工具使用、断点调试、变量监控、远程调试及常见问题解决方案,帮助开发者高效利用 PyCharm 的调试功能提升开发效率。

1366 4
来自: 人工智能平台PAI  版块
|
搜索推荐 算法 UED
|

必应SEO优化步骤:提升网站在必应搜索引擎中的排名

本文深入剖析了必应(Bing)搜索引擎的优化策略,为网站管理员提供了一套完整的必应SEO优化步骤。文章内容兼具深度与独特见解,旨在帮助读者在激烈的网络竞争中脱颖而出。助力您的网站迈向更高的排名。

1262 3
来自: 智能搜索推荐  版块
|
机器学习/深度学习 分布式计算 DataWorks
|

机器学习PAI常见问题之安装pyalink卡在qtconsole 4.0如何解决

PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。

622 0
来自: 人工智能平台PAI  版块

如何在cmd中打开指定文件夹路径

如何在cmd中打开指定文件夹路径

2795 0
|
数据可视化 算法 JavaScript
|

数字孪生核心技术揭秘(一):渲染引擎

从2017年“数字孪生城市”概念走红开始,全国各地“数字孪生城市”如雨后春笋般涌现,迅速推动了整个行业快速发展。与此同时,整个“数字孪生城市”产业链路上的技术瓶颈开始显现,尤其是数字孪生城市构建的核心环节之一的三维渲染引擎已经成为制约数字孪生城市项目正真实战落地的核心痛点。

7767 4
来自: 数据可视化DataV  版块
|
1天前
|
数据采集 存储 小程序
|

从踩坑到高效落地:微店商品详情API的实操心得

本文分享电商数据服务商对接微店商品详情API的实战经验:详解OAuth2.0授权、多类型商品字段兼容、滑动窗口限流三大典型坑及解决方案,助力私域电商实现商品/库存/价格实时同步,提升数据准确率至99.5%+。

50 0
|
6天前
|
SQL 人工智能 自然语言处理
|

步向“数字一局”,中交一公局“语义 + AI”双引擎驱动经营管理智能化转型

不仅在技术上实现了“Data + AI”的深度融合,更构建起以数据驱动、以智能辅助决策的新型经营管理模式

50 3
|
7天前
|
物联网 C++
|

模型能不能训练出来是技术问题,敢不敢上线是评估问题

大模型工程中,训练失败显性易察,评估失败却隐匿致命:指标好看、demo流畅,却可能放行高风险错误。评估本质是定义“何为成功”,需权衡技术、业务与责任,直面尾部风险而非平均表现。它难自动化、缺共识、重判断——真正决定能否上线的,不是模型多强,而是我们敢为哪些错误担责。

77 2
|
3月前
|
人工智能 Cloud Native 数据可视化
|

PyCharm 2025.1 完整教程:下载安装 + 中文设置 + 激活,一步到位,附安装包

PyCharm 2025.1 发布,重磅升级AI代码补全、类型推断与ruff集成,提升开发效率。支持渐进式补全、智能提交信息生成、冲突可视化解决,优化启动速度与内存占用,全面增强云原生及现代Python开发体验。

1160 5
|
4月前
|
存储 缓存 调度
|

vLLM 吞吐量优化实战:10个KV-Cache调优方法让tokens/sec翻倍

十个经过实战检验的 vLLM KV-cache 优化方法 —— 量化、分块预填充、前缀重用、滑动窗口、ROPE 缩放、后端选择等等 —— 提升 tokens/sec。

1573 10
|
10月前
|
人工智能 自然语言处理 运维
|

让搜索引擎“更懂你”:AI × Elasticsearch MCP Server 开源实战

本文介绍基于Model Context Protocol (MCP)标准的Elasticsearch MCP Server,它为AI助手(如Claude、Cursor等)提供与Elasticsearch数据源交互的能力。文章涵盖MCP概念、Elasticsearch MCP Server的功能特性及实际应用场景,例如数据探索、开发辅助。通过自然语言处理,用户无需掌握复杂查询语法即可操作Elasticsearch,显著降低使用门槛并提升效率。项目开源地址:<https://github.com/awesimon/elasticsearch-mcp>,欢迎体验与反馈。

2664 1
来自: 智能搜索推荐  版块
|
2天前
|
人工智能 自然语言处理
|

效果评估:如何判断一个祝福 AI 是否“走心”

本文以「码上拜年」AI为例,探讨创意生成任务(如春节祝福)的评估困境:传统指标(loss、BLEU)失效,因“走心”无法量化。提出三维主观评估框架——事实准确、风格契合、表达自然,并强调评估核心是“人是否愿意直接发送”,即用户真实感受才是终极标准。

49 8
|
14天前
|
人工智能 自然语言处理 安全
|

Gemini:2026年最强AI模型之一,如何在实际应用中挑战GPT与Claude的地位?

2026年,大模型竞争正从“谁更强”转向“谁更稳、更适配工程”。Gemini凭借推理结构一致性、长上下文稳定性及多模型协同友好性,成为生产系统关键选项,推动AI架构向“可调度的模型能力”演进。

170 1
来自: 人工智能平台PAI  版块
|
10月前
|
存储 人工智能 自然语言处理
|

LangChain RAG入门教程:构建基于私有文档的智能问答助手

本文介绍如何利用检索增强生成(RAG)技术与LangChain框架构建基于特定文档集合的AI问答系统。通过结合检索系统和生成机制,RAG能有效降低传统语言模型的知识局限与幻觉问题,提升回答准确性。文章详细展示了从环境配置、知识库构建到系统集成的全流程,并提供优化策略以改进检索与响应质量。此技术适用于专业领域信息检索与生成,为定制化AI应用奠定了基础。

3396 5
|
10月前
|
传感器 人工智能 物联网
|

智能鞋:从脚下开始的科技革命

智能鞋:从脚下开始的科技革命

825 6
|
11月前
|
JSON 自然语言处理 API
|

合合信息TextIn大模型加速器2.0发布:智能图表解析测评

随着人工智能技术的飞速发展,大规模语言模型(LLM)在自然语言处理、图像识别、语音合成等领域的应用日益广泛。然而,大模型的计算复杂度和资源消耗问题也日益凸显。为了解决这一问题,合合信息TextIn推出了大模型加速器2.0,旨在提升大模型的训练和推理效率,降低计算成本,完成智能问答与对话式交互,深度概括与定位等。本文将对合合信息TextIn大模型加速器2.0进行详细测评,重点关注其在智能图表解析任务中的表现。

824 0
|
数据采集 DataWorks 安全
|

DataWorks产品使用合集之如何通过接口单独触发业务流程里面的某些节点运行

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

220 0
|
Docker 容器
|

docker保存镜像、打包tar、加载tar镜像

本文记录docker保存镜像、打包tar、加载tar镜像。

4541 0
|
存储 人工智能 算法
|

聚类的k值确定之轮廓系数

聚类的k值确定之轮廓系数

3949 0
|
7天前
|
安全 数据挖掘 C++
|

基于语义切分 vs 基于结构切分的实际差异

RAG系统中,切分方式并非简单预处理,而是决定系统“如何犯错”的关键设计:语义切分将理解责任前置给embedding,易致“看错”;结构切分保留原文约束,暴露“没看到”,更可控。选型应基于错误成本,而非召回指标。

57 12
|
10月前
|
JSON 搜索推荐 API
|

深入研究:京东商品视频 API 详解

京东商品视频API简介:该API可基于京东商品ID获取商品视频信息,包括标题、描述、播放地址、缩略图及视频时长等,助力开发者和商家实现个性化展示与智能推荐。接口采用HTTP GET方式请求,返回JSON格式数据。示例代码展示了通过Python的requests库调用API并生成签名的过程,确保请求安全可靠。此API有助于提升电商应用的用户体验与竞争力。

496 5
|
机器学习/深度学习 算法 安全
|

随机性、熵与随机数生成器:解析伪随机数生成器(PRNG)和真随机数生成器(TRNG)

随机性在密码学、仿真和机器学习等领域中至关重要,本文探讨了随机性、熵的概念以及伪随机数生成器(PRNG)和真随机数生成器(TRNG)的原理和应用。PRNG通过算法生成看似随机的序列,适用于高效需求;TRNG利用物理过程生成真正随机数,适用于高安全需求。文章还讨论了两者的协同应用及其面临的挑战。

996 5
|
2天前
|
数据采集 人工智能 自然语言处理
|

场景判断:什么情况下值得做微调?三个维度帮你做决策

本文提出微调选型三维度决策框架:任务复杂度(知识查询/格式遵从/能力涌现)、风格要求(可选→固定→品牌级)、数据可得性(量、质、多样性),并对比提示词工程、RAG等轻量替代方案,助技术决策者科学评估微调必要性,避免资源浪费。

47 4
|
7天前
|
机器学习/深度学习 数据采集 人工智能
|

不会选数据,别说你会AI:一份给新手的极简数据集实战手册

数据集是AI模型的“基石”,决定其性能上限。本文以通俗语言解析数据集的核心概念、获取途径、质量评估与实战步骤,手把手教你打造高质量数据,助力AI项目成功,堪称新手入门与实践的必备指南。

68 0
|
16天前
|
Web App开发
|

代理ip在浏览器的配置指南

本文分三步详解代理IP配置:①打开浏览器对应设置(Chrome设为“设置”,Firefox为“选项”,Edge为“Internet选项”);②在“局域网设置”中填写代理IP与端口并保存;③百度搜“IP”验证是否生效。附注意事项及稳定IP推荐,操作清晰易上手。

155 3
|
20天前
|
算法 搜索推荐 Serverless
|

为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

Elasticsearch 7.x后默认返回10,000总数,实为Block-Max WAND算法的性能优化——跳过低分文档块以提升查询速度。强行开启`track_total_hits:true`将禁用该优化,导致CPU飙升、延迟激增。本文深入Lucene底层,解析其原理、陷阱与治理方案。

299 1
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
|

让大模型“读懂”你的文档:RAG核心技术——文档切分完全指南

文档切分是智能问答系统成败的关键。本文深入解析RAG技术中分块(Chunking)的核心原理,涵盖五大切分策略:从基础的按句子、固定长度切分,到更智能的递归与语义切分。通过LangChain实战代码,手把手教你处理文本、Markdown、代码等多格式文档,并优化块大小、重叠与分隔符参数。提供人工抽样、模拟检索和端到端测试三大评估方法,助你构建高效精准的知识检索体系。

157 0
|
1月前
|
人工智能
|

大模型产生幻觉的原因,如何解决?

大模型“幻觉”指AI生成看似合理但错误或虚构的信息,源于其概率预测机制、训练数据缺陷及缺乏事实核查能力。可通过RAG、微调、联网检索、自我核查等方法降低幻觉风险,提升输出准确性与可靠性。(238字)

348 3
|
1月前
|
算法 搜索推荐
|

当流量失效之后,企业真正的增长变量是什么?

“系统信任增长范式”提出:当流量红利消退,增长逻辑正从“获取用户”转向“积累可复用的信任资产”。信任不再是话语表达,而是跨时间、跨场景的行为一致性与可验证修复能力。企业需被系统判定为“值得持续推荐”,方能获得长期增长动力。这是一场规则层面的迁移,而非策略优化。

173 4
来自: 智能搜索推荐  版块
|
5月前
|
数据采集 自动驾驶 机器人
|

数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响

数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响

433 1
|
6月前
|
存储 缓存 Apache
|

StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询

A+流量分析平台是阿里集团统一的全域流量数据分析平台,致力于通过埋点、采集、计算构建流量数据闭环,助力业务提升流量转化。面对万亿级日志数据带来的写入与查询挑战,平台采用Flink+Paimon+StarRocks技术方案,实现高吞吐写入与秒级查询,优化存储成本与扩展性,提升日志分析效率。

862 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长,它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下,将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程,其具备多种功能模块,包括数据合成、基础和进阶蒸馏训练。通过数据合成,丰富训练集的多样性;基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化,从而提升小模型的性能。

1759 7
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 PyTorch 算法框架/工具
|

SE 注意力模块 原理分析与代码实现

本文介绍SE注意力模块,它是在SENet中提出的,SENet是ImageNet 2017的冠军模型;SE模块常常被用于CV模型中,能较有效提取模型精度,所以给大家介绍一下它的原理,设计思路,代码实现,如何应用在模型中。

5078 0
|
存储 SQL 缓存
|

技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

本文为作者在 StarRocks Summit Asia 2022 上的分享

1926 0
|
分布式计算 Hadoop 分布式数据库
|

阿里封神谈hadoop生态学习之路

在大数据时代,要想个性化实现业务的需求,还是得操纵各类的大数据软件,如:hadoop、hive、spark等。笔者(阿里封神)混迹Hadoop圈子多年,经历了云梯1、ODPS等项目,目前base在E-Mapreduce。在这,笔者尽可能梳理下hadoop的学习之路。

50680 13
|
5天前
|
数据采集 安全 算法
|

热门技术的隐性陷阱:LoRA、PPO、DPO、RAG 的误用边界

本文警示:LoRA、PPO、DPO、RAG等技术是“放大器”,不解决问题,只放大已有对错。当术语取代问题分析——如“该上LoRA吗?”替代“问题本质是什么?”,便已陷入误用陷阱。真正关键,是保持工程判断力:用对时机,更要敢于不用。

46 2
|
10天前
|
人工智能 自然语言处理 人机交互
|

智能体来了:2026AI元年,如何抓住时代机遇?

2026年,AI正跨越临界点:智能体从实验走向系统化应用,呈现三大演进——由工具升级为协作伙伴、领域专业化深化、多智能体分布式协同。人机关系、工作流程与交互范式随之重构。机遇不在技术速胜,而在理解复杂性、保持判断力、构建可持续共处能力。

88 1
|
20天前
|
分布式计算 Serverless 测试技术
|

有奖实践:EMR Serverless StarRocks × Serverless Spark x DLF 共探 TPC 极致性能

免费试用 EMR Serverless StarRocks 与 EMR Serverless Spark,体验“实时分析冠军”与“批处理之神”的极致性能表现!

278 1
|
8月前
|
数据采集 自动驾驶 Java
|

PAI-TurboX:面向自动驾驶的训练推理加速框架

PAI-TurboX 为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推理,提供了全方位的加速解决方案。PAI-Notebook Gallery 提供PAI-TurboX 一键启动的 Notebook 最佳实践

2762 2
来自: 人工智能平台PAI  版块
|
存储 运维 监控
|

服务器高效运维管理方案

智能运维作为保障业务连续性和提升系统性能的关键环节,其重要性日益凸显。服务器作为承载各类应用与数据的核心基础设施,其稳定性、安全性和性能直接关系到企业的业务运行效率和用户体验

1004 1

Fama-French模型,特别是三因子模型(Fama-French Three-Factor Model)

Fama-French模型,特别是三因子模型(Fama-French Three-Factor Model)

1987 1
|
存储 自然语言处理 NoSQL
|

Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读

引入知识图谱技术后,传统RAG链路到Graph RAG链路会有什么样的变化,如何兼容RAG中的向量数据库(Vector Database)和图数据库(Graph Database)基座,以及蚂蚁的Graph RAG开源技术方案和未来优化方向。

7974 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务