MaxCompute SQL AI 实操：使用大模型提效工作总结统计分析-阿里云开发者社区

一、引言

在企业日常运营中，工作总结统计是一项高频且重要的数据分析任务。传统的数据分析方法往往需要编写复杂的SQL查询、使用多种工具进行数据处理和可视化，耗时耗力。随着大模型技术的发展，MaxCompute SQL AI 全新上线，让数据分析师可以用熟悉的SQL语言直接调用大模型，实现更智能、更高效的数据分析。

本文将以"工作总结统计类数据"为主题，展示如何使用MaxCompute SQL AI功能，通过简单的SQL语句完成工作总结的智能分析，包括工作内容分类、情感倾向分析、关键信息提取等任务，帮助企业快速洞察员工工作状态和业绩情况。

二、场景描述

假设我们是一家互联网公司的HR分析师，需要对公司员工的季度工作总结进行统计分析。具体需求如下：

对员工工作总结进行自动分类（如项目开发、产品设计、运营推广、客户服务等）
分析工作总结中表达的情感倾向（正面、中性、负面）
提取工作总结中的关键成果和KPI完成情况
生成结构化的统计报告，方便管理层快速了解整体工作情况

传统方法需要：

手动整理和分类工作总结
使用复杂的文本分析工具进行情感分析
人工提取关键信息
花费大量时间生成报告

而使用MaxCompute SQL AI，我们可以通过简单的SQL语句实现上述全部功能。

三、准备工作

3.1 环境准备

登录MaxCompute控制台，创建一个MaxCompute项目
确保项目已开通SQL AI功能
配置好SQL开发环境（如DataWorks或MaxCompute客户端）

3.2 数据准备

我们首先需要创建一个包含员工工作总结的表：

-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
    employee_id STRING COMMENT '员工ID',
    employee_name STRING COMMENT '员工姓名',
    department STRING COMMENT '所属部门',
    work_summary STRING COMMENT '工作总结内容',
    submission_date STRING COMMENT '提交日期'
);

-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发，修复了3个关键bug，提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计，工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线，用户反馈良好。但在跨部门协作中遇到了一些沟通障碍，导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动，累计参与人数超过10万，带来了2000个新用户注册。活动效果超出预期，团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉，解决率达到95%。通过优化客服流程，客户满意度提升了10%。但由于系统问题，部分投诉处理延迟，需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化，完成了数据模型的重构，提高了查询效率。同时学习了新的大数据技术，为团队分享了相关知识。', '2025-03-31');

四、实操步骤

4.1 启用公共模型

首先，我们需要启用MaxCompute的公共模型功能：

SET odps.sql.using.public.model=true;

4.2 工作内容自动分类

使用MaxCompute SQL AI的AI_GENERATE函数，对员工工作总结进行自动分类：

SET odps.sql.using.public.model=true;
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一：项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称，不要输出其他内容。工作总结内容：', work_summary, ' /no_think')
    ) AS work_category
FROM employee_work_summary;

执行结果：

employee_id	employee_name	department	work_summary	work_category
E001	张三	技术部	本季度主要完成了用户管理系统的升级开发...	项目开发
E002	李四	产品部	本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线...	产品设计
E003	王五	运营部	本季度组织了3场线上营销活动，累计参与人数超过10万...	运营推广
E004	赵六	客服部	本季度处理了1500个客户投诉，解决率达到95%...	客户服务
E005	孙七	技术部	本季度主要负责数据仓库的维护和优化，完成了数据模型的重构...	项目开发

4.3 情感倾向分析

结合用户提供的情感分析代码风格，我们可以优化情感分析功能。这里使用了/no_think指令后缀，有助于提高模型响应速度：

SET odps.sql.using.public.model=true;
SELECT  
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下员工工作总结进行情感分析分类，输出结果仅限于以下三个选项之一：正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
    ) AS sentiment
FROM employee_work_summary;

执行结果：

employee_id	employee_name	department	work_summary	sentiment
E001	张三	技术部	本季度主要完成了用户管理系统的升级开发...	正面
E002	李四	产品部	本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线...	中性
E003	王五	运营部	本季度组织了3场线上营销活动，累计参与人数超过10万...	正面
E004	赵六	客服部	本季度处理了1500个客户投诉，解决率达到95%...	中性
E005	孙七	技术部	本季度主要负责数据仓库的维护和优化，完成了数据模型的重构...	正面

4.4 批量多维度分析

我们还可以将用户提供的代码结构扩展为批量多维度分析，同时完成分类和情感分析：

SET odps.sql.using.public.model=true;
SELECT  
    employee_id,
    employee_name,
    department,
    work_summary,
    -- 工作内容分类
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一：项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称。工作总结内容：', work_summary, ' /no_think')
    ) AS work_category,
    -- 情感倾向分析
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下员工工作总结进行情感分析分类，输出结果仅限于以下三个选项之一：正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
    ) AS sentiment,
    -- 工作态度分析
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结中体现的工作态度，输出结果仅限于以下三个选项之一：积极主动、一般、消极被动。工作总结内容：', work_summary, ' /no_think')
    ) AS work_attitude
FROM employee_work_summary;

执行结果：

employee_id	employee_name	department	work_summary	work_category	sentiment	work_attitude
E001	张三	技术部	本季度主要完成了用户管理系统的升级开发...	项目开发	正面	积极主动
E002	李四	产品部	本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线...	产品设计	中性	一般
E003	王五	运营部	本季度组织了3场线上营销活动，累计参与人数超过10万...	运营推广	正面	积极主动
E004	赵六	客服部	本季度处理了1500个客户投诉，解决率达到95%...	客户服务	中性	一般
E005	孙七	技术部	本季度主要负责数据仓库的维护和优化，完成了数据模型的重构...	项目开发	正面	积极主动

4.5 关键信息提取

从工作总结中提取关键成果和KPI完成情况：

SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向，输出结果仅限于以下三个选项之一：正面、中性、负面。工作总结内容：', work_summary)
    ) AS sentiment
FROM employee_work_summary;

执行结果：

employee_id	employee_name	department	work_summary	sentiment
E001	张三	技术部	本季度主要完成了用户管理系统的升级开发...	正面
E002	李四	产品部	本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线...	中性
E003	王五	运营部	本季度组织了3场线上营销活动，累计参与人数超过10万...	正面
E004	赵六	客服部	本季度处理了1500个客户投诉，解决率达到95%...	中性
E005	孙七	技术部	本季度主要负责数据仓库的维护和优化，完成了数据模型的重构...	正面

4.4 关键信息提取

从工作总结中提取关键成果和KPI完成情况：

SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况，使用分号分隔。工作总结内容：', work_summary)
    ) AS key_achievements
FROM employee_work_summary;

执行结果：

employee_id	employee_name	department	work_summary	key_achievements
E001	张三	技术部	本季度主要完成了用户管理系统的升级开发...	完成用户管理系统升级开发;修复3个关键bug;提升系统性能约20%;参与新项目需求评审和技术方案设计
E002	李四	产品部	本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线...	完成产品A的迭代优化;完成5个功能模块的设计和上线;用户反馈良好
E003	王五	运营部	本季度组织了3场线上营销活动，累计参与人数超过10万...	组织3场线上营销活动;参与人数超过10万;带来2000个新用户注册;活动效果超出预期
E004	赵六	客服部	本季度处理了1500个客户投诉，解决率达到95%...	处理1500个客户投诉;投诉解决率95%;优化客服流程;客户满意度提升10%
E005	孙七	技术部	本季度主要负责数据仓库的维护和优化，完成了数据模型的重构...	完成数据仓库的维护和优化;完成数据模型重构;提高查询效率;学习新的大数据技术并分享

4.6 生成结构化统计报告

基于以上分析结果，生成结构化的统计报告：

-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT 
    department,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一：项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称，不要输出其他内容。工作总结内容：', work_summary)
    ) AS work_category,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向，输出结果仅限于以下三个选项之一：正面、中性、负面。工作总结内容：', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 生成部门统计报告
SELECT 
    department,
    work_category,
    sentiment,
    COUNT(*) AS employee_count,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告：部门：', department, '，工作类别：', work_category, '，情感倾向：', sentiment, '，员工数量：', CAST(COUNT(*) AS STRING))
    ) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;

执行结果：

department	work_category	sentiment	employee_count	analysis
技术部	项目开发	正面	2	技术部共有2名员工从事项目开发工作，他们的工作总结都表现出正面情感，说明技术团队对本季度工作成果较为满意。
产品部	产品设计	中性	1	产品部有1名员工从事产品设计工作，工作总结情感倾向为中性，可能需要关注跨部门协作中遇到的沟通问题。
运营部	运营推广	正面	1	运营部有1名员工从事运营推广工作，工作总结表现出正面情感，活动效果超出预期，团队配合默契。
客服部	客户服务	中性	1	客服部有1名员工从事客户服务工作，工作总结情感倾向为中性，虽然解决率达到95%，但系统问题导致的投诉处理延迟需要改进。

五、综合分析与应用

5.1 管理层决策支持

通过MaxCompute SQL AI的分析结果，管理层可以快速了解：

各部门工作分布情况：技术部主要从事项目开发，产品部负责产品设计，运营部专注于运营推广，客服部处理客户服务。
员工工作态度：大部分员工对工作表现出正面情感，说明整体工作氛围良好。
关键成果与问题：
- 技术部完成了系统升级和性能优化
- 产品部遇到了跨部门协作问题
- 运营部活动效果超出预期
- 客服部需要解决系统问题导致的投诉延迟

5.2 后续优化建议

基于分析结果，我们可以提出以下优化建议：

加强跨部门协作：针对产品部遇到的沟通障碍，建议组织跨部门协作培训或建立更有效的沟通机制。
系统升级与维护：客服部提到的系统问题需要尽快解决，以提高客户满意度。
经验分享与复制：运营部的成功经验可以在公司内部分享，帮助其他部门提升工作效果。
个性化激励：针对表现优秀的员工，可以提供个性化的激励措施，保持团队的积极性。

六、使用体验与总结

6.1 使用体验

零门槛使用：不需要学习新的编程语言或工具，只需使用熟悉的SQL语句即可完成复杂的AI分析任务。
高效便捷：传统需要数天完成的工作总结分析任务，现在可以在几分钟内完成。
准确率高：大模型能够准确理解中文文本内容，分类和分析结果符合预期。
安全合规：所有数据处理都在MaxCompute内部完成，避免了数据外泄风险，符合企业安全合规要求。

6.2 总结

MaxCompute SQL AI为企业提供了一种全新的数据分析方式，让数据分析师可以用熟悉的SQL语言轻松调用强大的大模型能力，实现智能数据处理。在工作总结统计场景中，我们通过简单的SQL语句完成了工作内容分类、情感倾向分析、关键信息提取和统计报告生成等任务，大幅提升了工作效率和分析质量。

随着大模型技术的不断发展和优化，MaxCompute SQL AI将在更多场景中发挥重要作用，帮助企业实现数据驱动的智能决策。无论是快速验证AI想法，还是构建企业级智能数据流水线，MaxCompute SQL AI都为用户提供了一种简单、高效、安全的解决方案。

AI并不遥远，它就在你的下一条SELECT语句里！

七、代码附录

7.1 完整代码清单

-- 启用公共模型
SET odps.sql.using.public.model=true;

-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
    employee_id STRING COMMENT '员工ID',
    employee_name STRING COMMENT '员工姓名',
    department STRING COMMENT '所属部门',
    work_summary STRING COMMENT '工作总结内容',
    submission_date STRING COMMENT '提交日期'
);

-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发，修复了3个关键bug，提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计，工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化，完成了5个功能模块的设计和上线，用户反馈良好。但在跨部门协作中遇到了一些沟通障碍，导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动，累计参与人数超过10万，带来了2000个新用户注册。活动效果超出预期，团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉，解决率达到95%。通过优化客服流程，客户满意度提升了10%。但由于系统问题，部分投诉处理延迟，需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化，完成了数据模型的重构，提高了查询效率。同时学习了新的大数据技术，为团队分享了相关知识。', '2025-03-31');

-- 工作内容自动分类
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一：项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称，不要输出其他内容。工作总结内容：', work_summary)
    ) AS work_category
FROM employee_work_summary;

-- 情感倾向分析
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向，输出结果仅限于以下三个选项之一：正面、中性、负面。工作总结内容：', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 关键信息提取
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况，使用分号分隔。工作总结内容：', work_summary)
    ) AS key_achievements
FROM employee_work_summary;

-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT 
    department,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一：项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称，不要输出其他内容。工作总结内容：', work_summary)
    ) AS work_category,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向，输出结果仅限于以下三个选项之一：正面、中性、负面。工作总结内容：', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 生成部门统计报告
SELECT 
    department,
    work_category,
    sentiment,
    COUNT(*) AS employee_count,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告：部门：', department, '，工作类别：', work_category, '，情感倾向：', sentiment, '，员工数量：', CAST(COUNT(*) AS STRING))
    ) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;

八、执行截图

总结：通过MaxCompute SQL AI，我们成功实现了工作总结统计的智能化分析，大幅提升了工作效率和分析质量。这种"SQL+AI"的融合方式，让数据分析师可以用熟悉的工具和语言轻松调用大模型能力，为企业决策提供更快速、更准确的支持。

MaxCompute SQL AI 实操：使用大模型提效工作总结统计分析

一、引言

二、场景描述

三、准备工作

3.1 环境准备

3.2 数据准备

四、实操步骤

4.1 启用公共模型

4.2 工作内容自动分类

执行结果：

4.3 情感倾向分析

执行结果：

4.4 批量多维度分析

执行结果：

4.5 关键信息提取

执行结果：

4.4 关键信息提取

执行结果：

4.6 生成结构化统计报告

执行结果：

五、综合分析与应用

5.1 管理层决策支持

5.2 后续优化建议

六、使用体验与总结

6.1 使用体验

6.2 总结

七、代码附录

7.1 完整代码清单

八、执行截图

云原生

热门文章

最新文章

相关电子书