数据采集的搜索结果_文章_第19页-阿里云开发者社区

小白学大数据

|

1月前

|

博文

Scrapy框架在小米应用市场爬虫项目中的实战应用

# 数据采集 # JSON # 中间件 # 数据格式 # Python

奔跑的数据

|

1月前

|

博文

|

来自：大数据与机器学习

我为什么彻底切到Playwright

本文分享从Puppeteer迁移到Playwright的实战经验，详解架构升级动因、模块重构与核心代码。Playwright凭借更强的隔离性、原生反检测支持、简洁代理配置及多浏览器兼容，彻底解决Puppeteer时代资源争抢、稳定性差等痛点，助力构建高可用、易维护的现代数据系统。

# 数据采集 # Web App开发 # 调度 # 数据库 # 数据安全/隐私保护

aliyun3816472094

|

1月前

|

博文

|

来自：大数据与机器学习

AI 十大论文精讲（二）：GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力？

摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明：当Transformer模型参数规模扩大到1750亿时，仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式，无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现，其中在LAMBADA长文本任务上准确率达86.4%，较此前最优提升18.4%。这一研

# 数据采集 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 测试技术

站大爷

|

1月前

|

博文

Python时间序列数据分析与可视化实战指南

本文以贵州茅台股价为例，详解Python时间序列分析全流程：从数据获取、清洗预处理到可视化与异常检测，涵盖移动平均、季节性分解、自相关分析等核心技术，并结合Plotly实现交互式图表，助你挖掘金融数据中的趋势与规律。

# 数据采集 # 运维 # 数据可视化 # 数据挖掘 # Python

nick6507384252

|

1月前

|

博文

NeurlPS2025| 告别手动制表:电子科大+之江实验室提出Table2LaTeX-RL创新性高保真表格生成方法

电子科技大学联合之江实验室提出Table2LaTeX-RL，利用多模态大模型与双奖励强化学习（VSGRPO），实现高保真表格图像到LaTeX转换。该方法在复杂表上表现卓越，CW-SSIM达0.6145，TEDS-Structure达0.9218，编译率高达0.9917，显著优于现有方法，尤其适用于科学文档中含合并单元格、嵌套结构的复杂表格重建。

# 机器学习/深度学习 # 数据采集 # 存储 # 自然语言处理 # 算法

modelscope

|

1月前

|

博文

|

来自： ModelScope模型即服务

腾讯混元&清华开源15M高质量多模态训练数据，全面开放MLLM迎来质变时刻

腾讯混元与清华推出Bee项目，首创“以数据为中心”的全栈开源方案，通过Honey-Data-15M高质量数据集、HoneyPipe数据增强管线及Bee-8B模型，显著提升全开源多模态大模型性能，缩小与闭源模型差距。

# 数据采集 # 文字识别 # 算法

winx_19970108018

|

1月前

|

博文

|

来自：大数据与机器学习

京东工业平台商品详情API

京东工业平台商品详情API基于HTTPS和JSON，提供商品基础信息、SKU规格及批量查询功能，支持分钟级价格库存更新。开发者需注册企业账号并完成签名认证，单次请求可获取最多20个SKU数据，高效便捷，适用于工业品电商集成与数据同步场景。

# 数据采集 # JSON # API # 开发者 # 数据格式

WFGukasha

|

1月前

|

博文

《服务器行为规范》实施细则（第一版）

《服务器成精鉴定指南》以幽默笔调规范机房行为：严禁用手机摸鱼、违规支架，违者断电、支教或通报；发现拟人化、跨兴趣、身份错乱等“成精”迹象，分级处置并引导正向发展，兼顾纪律与创意。（238字）

# 数据采集 # 缓存 # 人工智能 # iOS开发 # 异构计算

此星光明

|

1月前

|

博文

LBA-ECO ND-08 桉树和原始森林的生物量、养分和分解作用

本数据集记录1999–2001年巴西Jari地区桉树人工林与原始森林中根、凋落物及叶片的氮、磷、钾等养分浓度、生物量与分解动态，涵盖旱雨两季，采样深度达100厘米，含5个CSV文件。存在元数据缺失问题。

# 数据采集 # 数据中心 # Python

探索云世界

|

1月前

|

博文

|

来自：大数据与机器学习

AI 加持，和你的“地图小白”身份说再见！

DataV Atlas地理数据编辑器，让普通人也能轻松绘制地图！无需GIS基础，通过AI对话即可生成行政区、电子围栏、物流路线等矢量数据，支持手绘、几何运算与空间分析，助力数据可视化与业务决策。

# DataV数据可视化 # 数据采集 # 人工智能 # 数据可视化 # 定位技术 # atlas

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据采集