MaxCompute SQL AI 实操:使用大模型提效工作总结统计分析

简介: MaxCompute SQL AI赋能企业智能分析,通过SQL语句即可实现工作总结的自动分类、情感分析、关键信息提取与报告生成,无需复杂工具,高效安全地完成数据洞察,助力管理层快速决策。

一、引言

在企业日常运营中,工作总结统计是一项高频且重要的数据分析任务。传统的数据分析方法往往需要编写复杂的SQL查询、使用多种工具进行数据处理和可视化,耗时耗力。随着大模型技术的发展,MaxCompute SQL AI 全新上线,让数据分析师可以用熟悉的SQL语言直接调用大模型,实现更智能、更高效的数据分析。

本文将以"工作总结统计类数据"为主题,展示如何使用MaxCompute SQL AI功能,通过简单的SQL语句完成工作总结的智能分析,包括工作内容分类、情感倾向分析、关键信息提取等任务,帮助企业快速洞察员工工作状态和业绩情况。

二、场景描述

假设我们是一家互联网公司的HR分析师,需要对公司员工的季度工作总结进行统计分析。具体需求如下:

  1. 对员工工作总结进行自动分类(如项目开发、产品设计、运营推广、客户服务等)
  2. 分析工作总结中表达的情感倾向(正面、中性、负面)
  3. 提取工作总结中的关键成果和KPI完成情况
  4. 生成结构化的统计报告,方便管理层快速了解整体工作情况

传统方法需要:

  • 手动整理和分类工作总结
  • 使用复杂的文本分析工具进行情感分析
  • 人工提取关键信息
  • 花费大量时间生成报告

而使用MaxCompute SQL AI,我们可以通过简单的SQL语句实现上述全部功能。

三、准备工作

3.1 环境准备

  1. 登录MaxCompute控制台,创建一个MaxCompute项目
  2. 确保项目已开通SQL AI功能
  3. 配置好SQL开发环境(如DataWorks或MaxCompute客户端)

3.2 数据准备

我们首先需要创建一个包含员工工作总结的表:

-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
    employee_id STRING COMMENT '员工ID',
    employee_name STRING COMMENT '员工姓名',
    department STRING COMMENT '所属部门',
    work_summary STRING COMMENT '工作总结内容',
    submission_date STRING COMMENT '提交日期'
);

-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发,修复了3个关键bug,提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计,工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线,用户反馈良好。但在跨部门协作中遇到了一些沟通障碍,导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动,累计参与人数超过10万,带来了2000个新用户注册。活动效果超出预期,团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉,解决率达到95%。通过优化客服流程,客户满意度提升了10%。但由于系统问题,部分投诉处理延迟,需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化,完成了数据模型的重构,提高了查询效率。同时学习了新的大数据技术,为团队分享了相关知识。', '2025-03-31');

四、实操步骤

4.1 启用公共模型

首先,我们需要启用MaxCompute的公共模型功能:

SET odps.sql.using.public.model=true;

4.2 工作内容自动分类

使用MaxCompute SQL AI的AI_GENERATE函数,对员工工作总结进行自动分类:

SET odps.sql.using.public.model=true;
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary, ' /no_think')
    ) AS work_category
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary work_category
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 项目开发
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 产品设计
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 运营推广
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 客户服务
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 项目开发

4.3 情感倾向分析

结合用户提供的情感分析代码风格,我们可以优化情感分析功能。这里使用了/no_think指令后缀,有助于提高模型响应速度:

SET odps.sql.using.public.model=true;
SELECT  
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下员工工作总结进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
    ) AS sentiment
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary sentiment
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 正面
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 中性
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 正面
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 中性
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 正面

4.4 批量多维度分析

我们还可以将用户提供的代码结构扩展为批量多维度分析,同时完成分类和情感分析:

SET odps.sql.using.public.model=true;
SELECT  
    employee_id,
    employee_name,
    department,
    work_summary,
    -- 工作内容分类
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称。工作总结内容:', work_summary, ' /no_think')
    ) AS work_category,
    -- 情感倾向分析
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下员工工作总结进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
    ) AS sentiment,
    -- 工作态度分析
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结中体现的工作态度,输出结果仅限于以下三个选项之一:积极主动、一般、消极被动。工作总结内容:', work_summary, ' /no_think')
    ) AS work_attitude
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary work_category sentiment work_attitude
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 项目开发 正面 积极主动
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 产品设计 中性 一般
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 运营推广 正面 积极主动
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 客户服务 中性 一般
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 项目开发 正面 积极主动

4.5 关键信息提取

从工作总结中提取关键成果和KPI完成情况:

SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary sentiment
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 正面
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 中性
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 正面
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 中性
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 正面

4.4 关键信息提取

从工作总结中提取关键成果和KPI完成情况:

SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况,使用分号分隔。工作总结内容:', work_summary)
    ) AS key_achievements
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary key_achievements
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 完成用户管理系统升级开发;修复3个关键bug;提升系统性能约20%;参与新项目需求评审和技术方案设计
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 完成产品A的迭代优化;完成5个功能模块的设计和上线;用户反馈良好
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 组织3场线上营销活动;参与人数超过10万;带来2000个新用户注册;活动效果超出预期
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 处理1500个客户投诉;投诉解决率95%;优化客服流程;客户满意度提升10%
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 完成数据仓库的维护和优化;完成数据模型重构;提高查询效率;学习新的大数据技术并分享

4.6 生成结构化统计报告

基于以上分析结果,生成结构化的统计报告:

-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT 
    department,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
    ) AS work_category,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 生成部门统计报告
SELECT 
    department,
    work_category,
    sentiment,
    COUNT(*) AS employee_count,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告:部门:', department, ',工作类别:', work_category, ',情感倾向:', sentiment, ',员工数量:', CAST(COUNT(*) AS STRING))
    ) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;

执行结果:

department work_category sentiment employee_count analysis
技术部 项目开发 正面 2 技术部共有2名员工从事项目开发工作,他们的工作总结都表现出正面情感,说明技术团队对本季度工作成果较为满意。
产品部 产品设计 中性 1 产品部有1名员工从事产品设计工作,工作总结情感倾向为中性,可能需要关注跨部门协作中遇到的沟通问题。
运营部 运营推广 正面 1 运营部有1名员工从事运营推广工作,工作总结表现出正面情感,活动效果超出预期,团队配合默契。
客服部 客户服务 中性 1 客服部有1名员工从事客户服务工作,工作总结情感倾向为中性,虽然解决率达到95%,但系统问题导致的投诉处理延迟需要改进。

五、综合分析与应用

5.1 管理层决策支持

通过MaxCompute SQL AI的分析结果,管理层可以快速了解:

  1. 各部门工作分布情况:技术部主要从事项目开发,产品部负责产品设计,运营部专注于运营推广,客服部处理客户服务。

  2. 员工工作态度:大部分员工对工作表现出正面情感,说明整体工作氛围良好。

  3. 关键成果与问题

    • 技术部完成了系统升级和性能优化
    • 产品部遇到了跨部门协作问题
    • 运营部活动效果超出预期
    • 客服部需要解决系统问题导致的投诉延迟

5.2 后续优化建议

基于分析结果,我们可以提出以下优化建议:

  1. 加强跨部门协作:针对产品部遇到的沟通障碍,建议组织跨部门协作培训或建立更有效的沟通机制。

  2. 系统升级与维护:客服部提到的系统问题需要尽快解决,以提高客户满意度。

  3. 经验分享与复制:运营部的成功经验可以在公司内部分享,帮助其他部门提升工作效果。

  4. 个性化激励:针对表现优秀的员工,可以提供个性化的激励措施,保持团队的积极性。

六、使用体验与总结

6.1 使用体验

  1. 零门槛使用:不需要学习新的编程语言或工具,只需使用熟悉的SQL语句即可完成复杂的AI分析任务。

  2. 高效便捷:传统需要数天完成的工作总结分析任务,现在可以在几分钟内完成。

  3. 准确率高:大模型能够准确理解中文文本内容,分类和分析结果符合预期。

  4. 安全合规:所有数据处理都在MaxCompute内部完成,避免了数据外泄风险,符合企业安全合规要求。

6.2 总结

MaxCompute SQL AI为企业提供了一种全新的数据分析方式,让数据分析师可以用熟悉的SQL语言轻松调用强大的大模型能力,实现智能数据处理。在工作总结统计场景中,我们通过简单的SQL语句完成了工作内容分类、情感倾向分析、关键信息提取和统计报告生成等任务,大幅提升了工作效率和分析质量。

随着大模型技术的不断发展和优化,MaxCompute SQL AI将在更多场景中发挥重要作用,帮助企业实现数据驱动的智能决策。无论是快速验证AI想法,还是构建企业级智能数据流水线,MaxCompute SQL AI都为用户提供了一种简单、高效、安全的解决方案。

AI并不遥远,它就在你的下一条SELECT语句里!

七、代码附录

7.1 完整代码清单

-- 启用公共模型
SET odps.sql.using.public.model=true;

-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
    employee_id STRING COMMENT '员工ID',
    employee_name STRING COMMENT '员工姓名',
    department STRING COMMENT '所属部门',
    work_summary STRING COMMENT '工作总结内容',
    submission_date STRING COMMENT '提交日期'
);

-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发,修复了3个关键bug,提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计,工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线,用户反馈良好。但在跨部门协作中遇到了一些沟通障碍,导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动,累计参与人数超过10万,带来了2000个新用户注册。活动效果超出预期,团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉,解决率达到95%。通过优化客服流程,客户满意度提升了10%。但由于系统问题,部分投诉处理延迟,需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化,完成了数据模型的重构,提高了查询效率。同时学习了新的大数据技术,为团队分享了相关知识。', '2025-03-31');

-- 工作内容自动分类
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
    ) AS work_category
FROM employee_work_summary;

-- 情感倾向分析
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 关键信息提取
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况,使用分号分隔。工作总结内容:', work_summary)
    ) AS key_achievements
FROM employee_work_summary;

-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT 
    department,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
    ) AS work_category,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 生成部门统计报告
SELECT 
    department,
    work_category,
    sentiment,
    COUNT(*) AS employee_count,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告:部门:', department, ',工作类别:', work_category, ',情感倾向:', sentiment, ',员工数量:', CAST(COUNT(*) AS STRING))
    ) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;

八、执行截图

1.png

2.png

3.png

4.png

6.png

7.png

8.png

总结:通过MaxCompute SQL AI,我们成功实现了工作总结统计的智能化分析,大幅提升了工作效率和分析质量。这种"SQL+AI"的融合方式,让数据分析师可以用熟悉的工具和语言轻松调用大模型能力,为企业决策提供更快速、更准确的支持。

相关文章
|
2天前
|
云安全 人工智能 算法
以“AI对抗AI”,阿里云验证码进入2.0时代
三层立体防护,用大模型打赢人机攻防战
1292 1
|
9天前
|
编解码 人工智能 自然语言处理
⚽阿里云百炼通义万相 2.6 视频生成玩法手册
通义万相Wan 2.6是全球首个支持角色扮演的AI视频生成模型,可基于参考视频形象与音色生成多角色合拍、多镜头叙事的15秒长视频,实现声画同步、智能分镜,适用于影视创作、营销展示等场景。
698 4
|
2天前
|
机器学习/深度学习 安全 API
MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!
MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,原生集成用户交互、MCP工具调用与端云协同能力。支持跨App操作、模糊语义理解与主动提问澄清,通过大规模在线强化学习实现复杂任务自动化,在出行、办公等高频场景中表现卓越,已登顶ScreenSpot-Pro、MobileWorld等多项SOTA评测。
558 3
|
3天前
|
人工智能 Rust 运维
这个神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
加我进AI讨论学习群,公众号右下角“联系方式”文末有老金的 开源知识库地址·全免费
|
2天前
|
存储 弹性计算 安全
阿里云服务器4核8G收费标准和活动价格参考:u2a实例898.20元起,计算型c9a3459.05元起
现在租用阿里云服务器4核8G价格是多少?具体价格及配置详情如下:云服务器ECS通用算力型u2a实例,配备4核8G配置、1M带宽及40G ESSD云盘(作为系统盘),其活动价格为898.20元/1年起;此外,ECS计算型c9a实例4核8G配置搭配20G ESSD云盘,活动价格为3459.05元/1年起。在阿里云的当前活动中,4核8G云服务器提供了多种实例规格供用户选择,不同实例规格及带宽的组合将带来不同的优惠价格。本文为大家解析阿里云服务器4核8G配置的实例规格收费标准与最新活动价格情况,以供参考。
239 150
|
9天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
356 164