数据处理的搜索结果_文章_第14页-阿里云开发者社区

代码bug生产队

|

2月前

|

博文

告别繁琐循环：用Java Stream优雅处理集合

# Java # API # 数据处理

代码bug生产队

|

2月前

|

博文

为什么你的Java代码应该多用Stream？从循环到声明式的思维转变

# Java # 数据处理 # API # 开发者 # 索引

Deephub

|

2月前

|

博文

|

来自：大数据与机器学习

12 种 Pandas 测试技巧，让数据处理少踩坑

本文介绍12种实用的Pandas测试技巧，涵盖数据工厂、模式校验、属性测试、快照比对、边界用例、随机控制、NA处理、索引验证、双实现对照、性能监控、I/O往返和Join检查，帮助开发者提前发现隐藏bug，提升数据处理代码的可靠性与可维护性。

# 数据采集 # 测试技术 # 数据处理 # 索引 # Python

技术员阿伟

|

2月前

|

博文

《大模型赋能文化遗产数字化：古籍修复与知识挖掘的技术实践》

本文记录大模型赋能文化遗产数字化的实践，针对古籍异体字识别难、残缺文本补全不准、隐性知识难挖掘、多模态数据割裂、中小机构部署难、知识难更新等痛点，提出对应方案：搭建古籍文字与语境知识库提升识别理解率，以多源史料关联与历史逻辑约束实现文本精准补全，构建多层级框架挖掘隐性知识，设计多模态语义对齐整合多元信息，通过轻量化优化与混合部署降低使用门槛，建立动态机制保障知识迭代。优化后多项关键指标显著提升，为古籍数字化提供有效路径。

# 文字识别 # 自然语言处理 # 数据处理 # 数据库 # 知识图谱

fzqoetf642qao

|

2月前

|

博文

淘宝商品信息批量获取接口技术详解

本文介绍批量获取淘宝商品信息的两种方法：官方API与Python爬虫。涵盖应用场景、技术实现、代码示例及合规注意事项，助您高效采集标题、价格、销量等数据，用于市场分析与竞品监控，兼顾可行性与风险控制。（238字）

# 数据采集 # 监控 # API # 数据处理 # Python

游客vphb4ae2je2zi

|

2月前

|

博文

阿里云企业网盘收费标准：存储空间、用户数配置价格及功能使用全解析

阿里云盘企业版，500GB仅169元/年，支持协同办公、360°权限管理、智能文件检索、多重安全防护及极速传输，高性价比助力企业高效协作，适用于多行业数字化办公需求。

# 云解析DNS # 网盘与相册服务 # 存储 # 新零售 # 安全 # 数据处理 # 数据安全/隐私保护

凉凉心.

|

2月前

|

博文

|

来自：大数据与机器学习

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构每一列都属于Series类型，不同列之间数据类型可以不一样，但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列，该列记录了每一行的索引在DataFrame中，若列之间的元素个数不匹配，且使用Series填充时，在DataFrame里空值会显示为NaN；当列之间元素个数不匹配，并且不使用Series填充，会报错。在指定了index 属性显示情况下，会按照index的位置进行排序，默认是 [0,1,2,3,...] 从0索引开始正序排序行。

# Java # 数据处理 # 索引 # Python # 容器

凉凉心.

|

2月前

|

博文

|

来自：大数据与机器学习

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas 是一个开源的数据分析和数据处理库，它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具，特别适用于处理结构化数据，如表格型数据（类似于Excel表格）。 Pandas 是数据科学和分析领域中常用的工具之一，它使得用户能够轻松地从各种数据源中导入数据，并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构：Series 和 DataFrame。

# 人工智能平台 PAI # Java # 数据挖掘 # 数据处理 # 索引 # Python

凉凉心.

|

2月前

|

博文

|

来自：大数据与机器学习

（numpy）Python做数据处理必备框架！（二）：ndarray切片的使用与运算；常见的ndarray函数：平方根、正余弦、自然对数、指数、幂等运算；统计函数：方差、均值、极差；比较函数...

ndarray切片索引从0开始索引/切片类型描述/用法基本索引通过整数索引直接访问元素。行/列切片使用冒号：切片语法选择行或列的子集连续切片从起始索引到结束索引按步长切片使用slice函数通过slice(start,stop,strp)定义切片规则布尔索引通过布尔条件筛选满足条件的元素。支持逻辑运算符 &、|。

# Java # 数据处理 # 索引 # Python # 容器

凉凉心.

|

2月前

|

博文

|

来自：云原生

（numpy）Python做数据处理必备框架！（一）：认识numpy；从概念层面开始学习ndarray数组：形状、数组转置、数值范围、矩阵...

Numpy是什么？ numpy是Python中科学计算的基础包。它是一个Python库，提供多维数组对象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法，包括数学、逻辑、形状操作、排序、选择、I/0 、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等等。 Numpy能做什么？ numpy的部分功能如下: ndarray，一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组用于对整组数据进行快速运算的标准数学函数(无需编写循环)。用于读写磁盘数据的工具以及用于操作内存映射文件的工具。线性代数、随机数生成以及傅里叶变换功能。用于集成由C、C++

# 存储 # Java # 数据处理 # Python # 容器

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据处理