SEMIKONG:专为半导体领域设计的大型语言模型,支持制造优化、辅助 IC 设计等半导体制造任务

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: SEMIKONG 是专为半导体行业定制的大型语言模型,能够优化制造过程、辅助 IC 设计,并整合专家知识,推动领域特定 AI 模型的研究与应用。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 领域定制:专为半导体行业设计,解决制造和设计中的复杂问题。
  2. 功能强大:支持制造过程优化、IC 设计辅助和专家知识整合。
  3. 技术先进:基于大规模领域特定数据集,结合预训练和微调技术。

正文(附运行示例)

SEMIKONG 是什么

公众号: 蚝油菜花 - semikong

SEMIKONG 是专为半导体行业定制的大型语言模型(LLM),由 Aitomatic、FPT Software 和东京电子有限公司联合推出。该模型基于深入的领域知识,旨在解决半导体制造和设计中的独特挑战,如复杂的物理和化学问题。

SEMIKONG 通过整合专家知识和优化预训练过程,提供了能够专家级理解刻蚀问题的基础模型。相较于通用 LLMs,SEMIKONG 在半导体制造任务中展现出更优的性能,为公司或工具特定的专有模型开发奠定了基础,推动了领域特定 AI 模型的进一步研究和应用。

SEMIKONG 的主要功能

  • 理解半导体专业知识:能够理解半导体制造和设计中的复杂问题,尤其是在刻蚀领域。
  • 优化制造过程:基于学习大量的半导体相关数据,协助优化半导体制造过程,如参数优化、异常检测和预测性维护。
  • 辅助 IC 设计:能够辅助集成电路(IC)设计任务,包括设计规则检查、布局生成和设计空间探索。
  • 提高 AI 解决方案性能:基于微调预训练的大型语言模型,提高 AI 驱动的半导体制造任务的性能。
  • 专家知识整合:引入一个框架,整合专家知识推进领域特定 AI 模型的评估过程。

SEMIKONG 的技术原理

  • 数据策划:开发始于大规模、高质量的半导体领域特定文本数据集的策划,包括技术书籍、论文和专利。
  • 预训练和微调:用预训练和微调的方法训练模型,预训练阶段用特定领域的数据增强模型的领域知识,微调阶段让模型执行特定的任务。
  • 领域本体论:与半导体专家合作,构建系统化的半导体制造过程本体论,有助于 AI 研究人员更有效地开发领域特定的 AI 模型。
  • 专家反馈循环:基于专家反馈循环,用专家评估模型生成的答案,生成评估标准和高质量的基准测试。
  • 模型量化和适配:在预训练和微调之后,进行模型量化和适配处理,便于模型部署。

如何运行 SEMIKONG

1. 准备环境

首先,确保已安装 Python 3.10 或更高版本,并克隆 SEMIKONG 的 GitHub 仓库:

git clone https://github.com/aitomatic/semikong.git
cd semikong
pip install -r requirements.txt

2. 下载模型

从 Hugging Face 下载 SEMIKONG 模型的权重和分词器:

# 示例:下载 SEMIKONG-8B-Instruct 模型
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = 'pentagoniac/SEMIKONG-8B-Instruct'
tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", torch_dtype='auto').eval()

3. 执行推理

使用以下代码进行推理:

messages = [{
   "role": "user", "content": "hi"}]
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt')
output_ids = model.generate(input_ids.to('cuda'))
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
人工智能 自然语言处理 运维
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(上)
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(上)
1852 1
|
8月前
|
机器学习/深度学习 存储 人工智能
边缘AI与嵌入式存储器的革新:实现数据智能化的关键
边缘AI与嵌入式存储器的革新:实现数据智能化的关键
243 10
|
8月前
|
监控 安全 物联网
相比4G,5G有那些优势满足工业4.0的技术需求
5G凭借其超高速率、超低延迟、高可靠性、大连接数等核心技术优势,有力满足了工业4.0对于实时通信、灵活生产、高效自动化及大规模物联网应用的需求。
177 0
|
自动驾驶
智能电动汽车和传统汽车有哪些优势
智能电动汽车和传统汽车各有各的优势,以下是它们的一些主要区别和优势
192 2
|
JSON 自然语言处理 算法
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(下)
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(下)
749 0
|
机器学习/深度学习 人工智能 定位技术
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
144 0
对话赛灵思Gilles Garcia:深度糅合技术属性与客户需求,做极致的Xilinx式服务
因为对技术的持续追求与钻研以及可编程芯片特有的灵活性,赛灵思能够在变幻莫测的市场环境中以不变应万变,深入到各行各业的应用创新中。
372 0
中英三校合作开发新电池结构,可用于改善可穿戴设备体验
这种新结构增加了电池在压力下的灵活性,对于可穿戴技术的发展非常重要。
333 0
|
传感器 机器学习/深度学习 存储
产业|嵌入式传感器将是未来机器人等技术增长的核心
移动即服务(MaaS)被认为是智能移动的一个关键要素,而机器人汽车技术将是智能移动的一个重要因素,它又高度依赖于嵌入式传感器。
|
机器学习/深度学习 区块链 芯片
后通用芯片时代: 专用芯片兴起背后的经济学
_周末抽空整理了一下关于从经济学视角看专用(e.g. AI/挖矿)芯片崛起的感想,首发于[StarryHeavensAbove](https://mp.weixin.qq.com/s/99AQC20w2_Ene4o1zYlTkg)公众号,然后被[新智元](https://mp.
853 0

热门文章

最新文章