ModelScope运营小助手_个人页

个人头像照片 ModelScope运营小助手
个人头像照片
290
52
3

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2024年05月

2023年12月

2023年11月

2023年10月

  • 10.26 09:56:50
    发表了文章 2023-10-26 09:56:50

    WordArt Designer:基于用户驱动与大语言模型的艺术字生成

    本文介绍了一个基于用户驱动,依赖于大型语言模型(LLMs)的艺术字生成框架WordArt Designer。
  • 10.24 14:46:07
    发表了文章 2023-10-24 14:46:07

    社区供稿 | EcomGPT:基于任务链数据的电商大模型(附魔搭推理实践)

    在电商领域中,自然语言处理和深度学习的发展对电商技术的推进做出了很大的贡献。通过这些技术,可以实现从产品信息提取到用户查询理解等多种能力,尤其是近期各类大语言模型(Large Language Models,LLMs)的涌现,让我们看到了它们在电商领域引用的潜力。然而,通用的大语言模型并不是专门为电商领域设计的,这可能导致它们在电商任务中表现不佳。
  • 10.24 14:44:07
    发表了文章 2023-10-24 14:44:07

    AgentLM:智谱AI对齐Agent能力微调语言模型,模型&数据集均开源

    为探索提升智能体任务之间的促进及泛化效果,智谱AI&清华KEG提出了一种对齐Agent能力的微调方法 AgentTuning,该方法使用少量数据微调已有模型,显著激发了模型的 Agent能力,同时可以保持模型原有的通用能力。
  • 10.24 14:36:52
    发表了文章 2023-10-24 14:36:52

    魔搭+Xinference 平台:CPU,GPU,Mac-M1多端大模型部署

    随着 Llama2 的开源,以及通义千问、百川、智谱等国内大模型的问世,很多用户有了本地部署去尝试大模型的需求,然而硬件的需求阻碍了很多人的尝试,并不是所有人都拥有一块英伟达显卡的,所以 Llama2 问世不久,大神 Andrej Karpathy 的一个 weekend project 爆火——llama2.c。
  • 10.18 15:23:38
    发表了文章 2023-10-18 15:23:38

    探索“数据菜谱”无限可能:首届Data-Juicer大模型数据竞赛

    数据是LLaMA、Alpaca等大语言模型(LLM) 的“食物” ,你心中的大模型米其林菜单会是什么样呢?
  • 10.18 15:19:11
    发表了文章 2023-10-18 15:19:11

    DAIL-SQL: 发掘LLM的NL2SQL能力

    最近,DAIL-SQL在魔搭创空间上线,并在NL2SQL任务上取得了新的SOTA。DAIL-SQL可以更好地利用LLM的NL2SQL能力,本文对其进行详细解读。
  • 10.16 17:11:58
    发表了文章 2023-10-16 17:11:58

    IDEA研究院Ziya2-13B首发魔搭社区(含社区推理微调最佳实践教程)

    10月16日,IDEA研究院(粤港澳大湾区数字经济研究院)CCNL封神榜团队开源中文基座模型Ziya2-13B-Base及其对话模型Ziya2-13B-Chat,两款模型均完全免费、可商用,已在魔搭社区首发上架。
  • 10.16 15:03:46
    发表了文章 2023-10-16 15:03:46

    多语言对话模型 openbuddy-mistral-7b,魔搭社区免费算力环境最佳实践

    近日,法国人工智能初创公司 Mistral AI 发布了一款新模型 Mistral 7B,其在每个基准测试中,都优于 Llama 2 13B,同时已免费开源可商用!
  • 10.12 13:20:54
    发表了文章 2023-10-12 13:20:54

    CogVLM智谱AI 新一代多模态大模型发布,魔搭社区最佳实践体验!

    继 5 月 18 日推出 VisualGLM-6B 后,智谱AI&清华KEG 潜心打磨,于近日发布并直接开源了更强大的多模态大模型——CogVLM-17B。模型已第一时间发布在魔搭社区,可体验!
  • 10.09 11:00:05
    发表了文章 2023-10-09 11:00:05

    社区供稿 l ChatGLM金融开源FinGLM学习笔记

    日前,由中国中文信息学会社会媒体处理专委会主办,智谱 AI、安硕信息、阿里云、魔搭社区、北京交通大学联合承办的「SMP 2023 ChatGLM 金融大模型挑战赛」落下帷幕,该赛事旨在推动大模型在金融垂直行业应用的研究和开发,沉淀大模型落地实践经验。赛后,赛事方第一时间开源开放了赛事相关的代码,目前也开始有开发者小伙伴基于此整理了一些干货笔记,小编特搜罗来向大家分享,希望能给正在关注大模型行业落地的小伙伴们一些帮助。
  • 10.08 11:19:46
    发表了文章 2023-10-08 11:19:46

    multi-agent:多角色Agent协同合作,高效完成复杂任务

    随着LLM的涌现,以LLM为中枢构建的Agent系统在近期受到了广泛的关注。Agent系统旨在利用LLM的归纳推理能力,通过为不同的Agent分配角色与任务信息,并配备相应的工具插件,从而完成复杂的任务。

2023年09月

  • 09.28 16:21:35
    发表了文章 2023-09-28 16:21:35

    社区供稿 | 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0 再创榜单新高,魔搭开源可体验!

    使用自然语言生成高质量的代码是大模型落地中的高频需求。近日,IDEA研究院封神榜团队正式开源最新的代码大模型Ziya-Coding-34B-v1.0,我们在HumanEval Pass@1的评测上,取得了75.5的好成绩,超过了GPT-4(67.0)的得分,也成为目前已知开源模型新高。
  • 09.27 18:26:25
  • 09.27 18:05:31
    发表了文章 2023-09-27 18:05:31

    单卡可推理CodeFuse-CodeLlama-34B 4bits量化版本魔搭开源!

    继2023-09-11 CodeFuse-CodeLlama-34B发布,HumanEval pass@1指标达到74.4% (贪婪解码), 为当前开源SOTA。最近,CodeFuse-CodeLlama-34B 4bits量化版本发布,CodeFuse-CodeLlama-34B-4bits是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通过QLoRA对基座模型CodeLlama-34b-Python进行多代码任务微调而得到的代码大模型,模型输入长度为4K。
  • 09.27 17:53:33
    发表了文章 2023-09-27 17:53:33

    元象开源70 亿参数通用大模型 XVERSE-7B,全开源、免费可商用,魔搭最佳实践来啦!

    元象推出 70 亿参数通用大模型 XVERSE-7B 底座与对话版,保持高性能、全开源、免费可商用,让海量中小企业和 AI 开发者能以低成本用上高性能大模型,并在魔搭社区开源,共同推动中国大模型生态建设。
  • 09.25 17:48:45
    发表了文章 2023-09-25 17:48:45

    通义千问14B开源!内附魔搭最佳实践

    9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。阿里云此前开源的70亿参数模型Qwen-7B等,一个多月下载量破100万,成为开源社区的口碑之作。
  • 09.25 17:42:47
    发表了文章 2023-09-25 17:42:47

    智谱AI数学课代表MathGLM魔搭首发,社区体验推理教程来啦!

    GLM家族又发布了一个新成员 数学模型 MathGLM ,以提升大语言模型的数学推理能力。它可以在不使用计算器工具的情况下,高效执行复杂算术运算,解答中文数学应用题,已经在魔搭社区全球首发开源啦!
  • 09.22 11:20:26
    发表了文章 2023-09-22 11:20:26

    大模型时代,还缺一只雨燕 | SWIFT:魔搭社区轻量级微调推理框架

    伴随着大数据的发展和强大的分布式并行计算能力,以预训练+微调的模型开发范式渐渐成为深度学习领域的主流。 2023年各家推出的大模型浩如烟海,如GPT4、Llama、ChatGLM、Baichuan、RWKV、Stable-Diffusion等。这些模型在达到越来越好的效果的同时也需要越来越多的算力资源:全量finetune它们动辄需要几十至上百G显存训练部署,一般的实验室和个人开发者无力承担。
  • 发表了文章 2024-05-15

    联合XTuner,魔搭社区全面支持数据集的长文本训练

  • 发表了文章 2024-05-15

    NPU推理&微调大模型实战

  • 发表了文章 2024-05-15

    LISA微调技术解析:比LoRA更低的显存更快的速度

  • 发表了文章 2024-05-15

    幻方开源第二代MoE模型 DeepSeek-V2,魔搭社区推理、微调最佳实践教程

  • 发表了文章 2024-05-15

    学习资料大全​ | 一起来魔搭社区学AI吧!

  • 发表了文章 2024-05-15

    社区供稿 |【中文Llama-3】Chinese-LLaMA-Alpaca-3开源大模型项目正式发布

  • 发表了文章 2024-05-15

    社区供稿 | 元象首个多模态大模型XVERSE-V开源,刷新权威大模型榜单,支持任意宽高比输入

  • 发表了文章 2024-05-15

    社区供稿 | 中文llama3模型哪家强?llama3汉化版微调模型大比拼

  • 发表了文章 2024-05-15

    社区供稿 | XTuner发布LLaVA-Llama-3-8B,支持单卡推理,评测和微调

  • 发表了文章 2024-05-15

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

  • 发表了文章 2024-05-15

    千亿大模型来了!通义千问110B模型开源,魔搭社区推理、微调最佳实践

  • 发表了文章 2024-05-15

    社区供稿 | Llama3-8B中文版!OpenBuddy发布新一代开源中文跨语言模型

  • 发表了文章 2024-05-15

    Phi-3:小模型,大未来!(附魔搭社区推理、微调实战教程)

  • 发表了文章 2024-05-15

    Llama3 中文通用Agent微调模型来啦!(附手把手微调实战教程)

  • 发表了文章 2024-05-15

    社区供稿 | 140B参数、可商用!OpenBuddy 发布首个开源千亿中文 MoE 模型的早期预览版

  • 发表了文章 2024-05-15

    在魔搭使用SD-WebUI,玩转AIGC!

  • 发表了文章 2024-05-15

    vLLM部署Yuan2.0:高吞吐、更便捷

  • 发表了文章 2024-05-15

    8卡环境微调Grok-1实战

  • 发表了文章 2024-05-15

    新一代端侧模型,面壁 MiniCPM 2.0开源,魔搭社区最佳实践

  • 发表了文章 2024-05-15

    【RAG实践】Rerank,让RAG更近一步

正在加载, 请稍后...
滑动查看更多
  • 提交了问题 2024-05-27

    最近大模型降价潮,哪家才是真的“价美”也“物美”?

  • 提交了问题 2023-09-27

    魔搭社区源开源最新的代码大模型Ziya-Coding-34B-v1.0

  • 回答了问题 2022-11-08

    这个警告标签可以通过去掉?

    可以参考一下我们的数据集卡片的介绍文档 https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E5%8D%A1%E7%89%87 也可以参考一下其他数据集的模型卡片(readme),比如 https://www.modelscope.cn/datasets/modelscope/chinese-poetry-collection/file/view/master/README.md
    踩0 评论0
  • 提交了问题 2022-11-07

    有没有开源的英文多轮对话模型?

  • 提交了问题 2022-11-07

    请教clip finetune demo里的muge数据集的格式手机怎么样的。怎么使用自定义数据集进

  • 提交了问题 2022-11-07

    中英文翻译数据集写着2500万,怎么是空的

  • 提交了问题 2022-11-07

    模型部署到EAS的时候,access key secret在哪获取?

  • 提交了问题 2022-11-07

    有开源的垂直领域英中数据集吗,专业术语那种,很多开源数据集连个cbam自动驾驶这种近几年的名词都翻译

  • 提交了问题 2022-11-07

    文本生成,更细致的参数设置,例如生成长度等等,这些有文档吗?

  • 提交了问题 2022-11-07

    什么时候开放离线SDK

  • 提交了问题 2022-11-07

    各位大佬 这个项目的OCR图片识别可以在java里集成吗 我好像没在网站看到相关内容

  • 提交了问题 2022-11-07

    希望能提供一个脚本实现一系列模型排队训练和自动试最大batchsize和一个单标签图像分类的demo

  • 提交了问题 2022-11-07

    modelscope能自己去试最大batchsize吗

  • 提交了问题 2022-11-07

    modelscope有类似auto deeplearning的功能吗,我想数据集送进去电脑自己算一周

  • 提交了问题 2022-11-07

    新人。问一下支持Mac m1,m2芯片么?谢谢

  • 提交了问题 2022-11-07

    这个damo-yolo 跟阿里之前的easycv 有关系嘛

  • 提交了问题 2022-11-07

    你好,为什么我在windows+pycharm的环境里,安装好了环境,但是用文字生成图片的调用缺报错

  • 回答了问题 2022-11-07

    智能客服领域,如何搭建FAQ问答系统?

    我们有FAQ问答的模型,可以参考使用:https://modelscope.cn/models/damo/nlp_structbert_faq-question-answering_chinese-base/summary
    踩0 评论0
  • 回答了问题 2022-11-07

    各位大佬 这个项目的OCR图片识别可以在java里集成吗 我好像没在网站看到相关内容

    转载回答: 我们目前所有模型都是提供原生python libraray支持,如果要在java里面集成,需要使用java-python的跨语言调用,比如jython等。
    踩0 评论0
  • 回答了问题 2022-11-07

    中英文翻译数据集写着2500万,怎么是空的

    转载回答: 你好,这个数据集是有的,通过git clone也可以下载: 我们也会更加推荐通过我们dataset的sdk来使用。类似这样的操作:
    踩0 评论0
正在加载, 请稍后...
滑动查看更多