一、引言
在企业日常运营中,工作总结统计是一项高频且重要的数据分析任务。传统的数据分析方法往往需要编写复杂的SQL查询、使用多种工具进行数据处理和可视化,耗时耗力。随着大模型技术的发展,MaxCompute SQL AI 全新上线,让数据分析师可以用熟悉的SQL语言直接调用大模型,实现更智能、更高效的数据分析。
本文将以"工作总结统计类数据"为主题,展示如何使用MaxCompute SQL AI功能,通过简单的SQL语句完成工作总结的智能分析,包括工作内容分类、情感倾向分析、关键信息提取等任务,帮助企业快速洞察员工工作状态和业绩情况。
二、场景描述
假设我们是一家互联网公司的HR分析师,需要对公司员工的季度工作总结进行统计分析。具体需求如下:
- 对员工工作总结进行自动分类(如项目开发、产品设计、运营推广、客户服务等)
- 分析工作总结中表达的情感倾向(正面、中性、负面)
- 提取工作总结中的关键成果和KPI完成情况
- 生成结构化的统计报告,方便管理层快速了解整体工作情况
传统方法需要:
- 手动整理和分类工作总结
- 使用复杂的文本分析工具进行情感分析
- 人工提取关键信息
- 花费大量时间生成报告
而使用MaxCompute SQL AI,我们可以通过简单的SQL语句实现上述全部功能。
三、准备工作
3.1 环境准备
- 登录MaxCompute控制台,创建一个MaxCompute项目
- 确保项目已开通SQL AI功能
- 配置好SQL开发环境(如DataWorks或MaxCompute客户端)
3.2 数据准备
我们首先需要创建一个包含员工工作总结的表:
-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
employee_id STRING COMMENT '员工ID',
employee_name STRING COMMENT '员工姓名',
department STRING COMMENT '所属部门',
work_summary STRING COMMENT '工作总结内容',
submission_date STRING COMMENT '提交日期'
);
-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发,修复了3个关键bug,提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计,工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线,用户反馈良好。但在跨部门协作中遇到了一些沟通障碍,导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动,累计参与人数超过10万,带来了2000个新用户注册。活动效果超出预期,团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉,解决率达到95%。通过优化客服流程,客户满意度提升了10%。但由于系统问题,部分投诉处理延迟,需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化,完成了数据模型的重构,提高了查询效率。同时学习了新的大数据技术,为团队分享了相关知识。', '2025-03-31');
四、实操步骤
4.1 启用公共模型
首先,我们需要启用MaxCompute的公共模型功能:
SET odps.sql.using.public.model=true;
4.2 工作内容自动分类
使用MaxCompute SQL AI的AI_GENERATE函数,对员工工作总结进行自动分类:
SET odps.sql.using.public.model=true;
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary, ' /no_think')
) AS work_category
FROM employee_work_summary;
执行结果:
| employee_id | employee_name | department | work_summary | work_category |
|---|---|---|---|---|
| E001 | 张三 | 技术部 | 本季度主要完成了用户管理系统的升级开发... | 项目开发 |
| E002 | 李四 | 产品部 | 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... | 产品设计 |
| E003 | 王五 | 运营部 | 本季度组织了3场线上营销活动,累计参与人数超过10万... | 运营推广 |
| E004 | 赵六 | 客服部 | 本季度处理了1500个客户投诉,解决率达到95%... | 客户服务 |
| E005 | 孙七 | 技术部 | 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... | 项目开发 |
4.3 情感倾向分析
结合用户提供的情感分析代码风格,我们可以优化情感分析功能。这里使用了/no_think指令后缀,有助于提高模型响应速度:
SET odps.sql.using.public.model=true;
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请对以下员工工作总结进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
) AS sentiment
FROM employee_work_summary;
执行结果:
| employee_id | employee_name | department | work_summary | sentiment |
|---|---|---|---|---|
| E001 | 张三 | 技术部 | 本季度主要完成了用户管理系统的升级开发... | 正面 |
| E002 | 李四 | 产品部 | 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... | 中性 |
| E003 | 王五 | 运营部 | 本季度组织了3场线上营销活动,累计参与人数超过10万... | 正面 |
| E004 | 赵六 | 客服部 | 本季度处理了1500个客户投诉,解决率达到95%... | 中性 |
| E005 | 孙七 | 技术部 | 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... | 正面 |
4.4 批量多维度分析
我们还可以将用户提供的代码结构扩展为批量多维度分析,同时完成分类和情感分析:
SET odps.sql.using.public.model=true;
SELECT
employee_id,
employee_name,
department,
work_summary,
-- 工作内容分类
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称。工作总结内容:', work_summary, ' /no_think')
) AS work_category,
-- 情感倾向分析
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请对以下员工工作总结进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
) AS sentiment,
-- 工作态度分析
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请分析以下员工工作总结中体现的工作态度,输出结果仅限于以下三个选项之一:积极主动、一般、消极被动。工作总结内容:', work_summary, ' /no_think')
) AS work_attitude
FROM employee_work_summary;
执行结果:
| employee_id | employee_name | department | work_summary | work_category | sentiment | work_attitude |
|---|---|---|---|---|---|---|
| E001 | 张三 | 技术部 | 本季度主要完成了用户管理系统的升级开发... | 项目开发 | 正面 | 积极主动 |
| E002 | 李四 | 产品部 | 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... | 产品设计 | 中性 | 一般 |
| E003 | 王五 | 运营部 | 本季度组织了3场线上营销活动,累计参与人数超过10万... | 运营推广 | 正面 | 积极主动 |
| E004 | 赵六 | 客服部 | 本季度处理了1500个客户投诉,解决率达到95%... | 客户服务 | 中性 | 一般 |
| E005 | 孙七 | 技术部 | 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... | 项目开发 | 正面 | 积极主动 |
4.5 关键信息提取
从工作总结中提取关键成果和KPI完成情况:
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
) AS sentiment
FROM employee_work_summary;
执行结果:
| employee_id | employee_name | department | work_summary | sentiment |
|---|---|---|---|---|
| E001 | 张三 | 技术部 | 本季度主要完成了用户管理系统的升级开发... | 正面 |
| E002 | 李四 | 产品部 | 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... | 中性 |
| E003 | 王五 | 运营部 | 本季度组织了3场线上营销活动,累计参与人数超过10万... | 正面 |
| E004 | 赵六 | 客服部 | 本季度处理了1500个客户投诉,解决率达到95%... | 中性 |
| E005 | 孙七 | 技术部 | 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... | 正面 |
4.4 关键信息提取
从工作总结中提取关键成果和KPI完成情况:
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况,使用分号分隔。工作总结内容:', work_summary)
) AS key_achievements
FROM employee_work_summary;
执行结果:
| employee_id | employee_name | department | work_summary | key_achievements |
|---|---|---|---|---|
| E001 | 张三 | 技术部 | 本季度主要完成了用户管理系统的升级开发... | 完成用户管理系统升级开发;修复3个关键bug;提升系统性能约20%;参与新项目需求评审和技术方案设计 |
| E002 | 李四 | 产品部 | 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... | 完成产品A的迭代优化;完成5个功能模块的设计和上线;用户反馈良好 |
| E003 | 王五 | 运营部 | 本季度组织了3场线上营销活动,累计参与人数超过10万... | 组织3场线上营销活动;参与人数超过10万;带来2000个新用户注册;活动效果超出预期 |
| E004 | 赵六 | 客服部 | 本季度处理了1500个客户投诉,解决率达到95%... | 处理1500个客户投诉;投诉解决率95%;优化客服流程;客户满意度提升10% |
| E005 | 孙七 | 技术部 | 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... | 完成数据仓库的维护和优化;完成数据模型重构;提高查询效率;学习新的大数据技术并分享 |
4.6 生成结构化统计报告
基于以上分析结果,生成结构化的统计报告:
-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT
department,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
) AS work_category,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
) AS sentiment
FROM employee_work_summary;
-- 生成部门统计报告
SELECT
department,
work_category,
sentiment,
COUNT(*) AS employee_count,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告:部门:', department, ',工作类别:', work_category, ',情感倾向:', sentiment, ',员工数量:', CAST(COUNT(*) AS STRING))
) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;
执行结果:
| department | work_category | sentiment | employee_count | analysis |
|---|---|---|---|---|
| 技术部 | 项目开发 | 正面 | 2 | 技术部共有2名员工从事项目开发工作,他们的工作总结都表现出正面情感,说明技术团队对本季度工作成果较为满意。 |
| 产品部 | 产品设计 | 中性 | 1 | 产品部有1名员工从事产品设计工作,工作总结情感倾向为中性,可能需要关注跨部门协作中遇到的沟通问题。 |
| 运营部 | 运营推广 | 正面 | 1 | 运营部有1名员工从事运营推广工作,工作总结表现出正面情感,活动效果超出预期,团队配合默契。 |
| 客服部 | 客户服务 | 中性 | 1 | 客服部有1名员工从事客户服务工作,工作总结情感倾向为中性,虽然解决率达到95%,但系统问题导致的投诉处理延迟需要改进。 |
五、综合分析与应用
5.1 管理层决策支持
通过MaxCompute SQL AI的分析结果,管理层可以快速了解:
各部门工作分布情况:技术部主要从事项目开发,产品部负责产品设计,运营部专注于运营推广,客服部处理客户服务。
员工工作态度:大部分员工对工作表现出正面情感,说明整体工作氛围良好。
关键成果与问题:
- 技术部完成了系统升级和性能优化
- 产品部遇到了跨部门协作问题
- 运营部活动效果超出预期
- 客服部需要解决系统问题导致的投诉延迟
5.2 后续优化建议
基于分析结果,我们可以提出以下优化建议:
加强跨部门协作:针对产品部遇到的沟通障碍,建议组织跨部门协作培训或建立更有效的沟通机制。
系统升级与维护:客服部提到的系统问题需要尽快解决,以提高客户满意度。
经验分享与复制:运营部的成功经验可以在公司内部分享,帮助其他部门提升工作效果。
个性化激励:针对表现优秀的员工,可以提供个性化的激励措施,保持团队的积极性。
六、使用体验与总结
6.1 使用体验
零门槛使用:不需要学习新的编程语言或工具,只需使用熟悉的SQL语句即可完成复杂的AI分析任务。
高效便捷:传统需要数天完成的工作总结分析任务,现在可以在几分钟内完成。
准确率高:大模型能够准确理解中文文本内容,分类和分析结果符合预期。
安全合规:所有数据处理都在MaxCompute内部完成,避免了数据外泄风险,符合企业安全合规要求。
6.2 总结
MaxCompute SQL AI为企业提供了一种全新的数据分析方式,让数据分析师可以用熟悉的SQL语言轻松调用强大的大模型能力,实现智能数据处理。在工作总结统计场景中,我们通过简单的SQL语句完成了工作内容分类、情感倾向分析、关键信息提取和统计报告生成等任务,大幅提升了工作效率和分析质量。
随着大模型技术的不断发展和优化,MaxCompute SQL AI将在更多场景中发挥重要作用,帮助企业实现数据驱动的智能决策。无论是快速验证AI想法,还是构建企业级智能数据流水线,MaxCompute SQL AI都为用户提供了一种简单、高效、安全的解决方案。
AI并不遥远,它就在你的下一条SELECT语句里!
七、代码附录
7.1 完整代码清单
-- 启用公共模型
SET odps.sql.using.public.model=true;
-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
employee_id STRING COMMENT '员工ID',
employee_name STRING COMMENT '员工姓名',
department STRING COMMENT '所属部门',
work_summary STRING COMMENT '工作总结内容',
submission_date STRING COMMENT '提交日期'
);
-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发,修复了3个关键bug,提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计,工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线,用户反馈良好。但在跨部门协作中遇到了一些沟通障碍,导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动,累计参与人数超过10万,带来了2000个新用户注册。活动效果超出预期,团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉,解决率达到95%。通过优化客服流程,客户满意度提升了10%。但由于系统问题,部分投诉处理延迟,需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化,完成了数据模型的重构,提高了查询效率。同时学习了新的大数据技术,为团队分享了相关知识。', '2025-03-31');
-- 工作内容自动分类
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
) AS work_category
FROM employee_work_summary;
-- 情感倾向分析
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
) AS sentiment
FROM employee_work_summary;
-- 关键信息提取
SELECT
employee_id,
employee_name,
department,
work_summary,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况,使用分号分隔。工作总结内容:', work_summary)
) AS key_achievements
FROM employee_work_summary;
-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT
department,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
) AS work_category,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
) AS sentiment
FROM employee_work_summary;
-- 生成部门统计报告
SELECT
department,
work_category,
sentiment,
COUNT(*) AS employee_count,
AI_GENERATE(
bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
DEFAULT_VERSION,
CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告:部门:', department, ',工作类别:', work_category, ',情感倾向:', sentiment, ',员工数量:', CAST(COUNT(*) AS STRING))
) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;
八、执行截图







总结:通过MaxCompute SQL AI,我们成功实现了工作总结统计的智能化分析,大幅提升了工作效率和分析质量。这种"SQL+AI"的融合方式,让数据分析师可以用熟悉的工具和语言轻松调用大模型能力,为企业决策提供更快速、更准确的支持。