❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
🚀 快速阅读
- 领域定制:专为半导体行业设计,解决制造和设计中的复杂问题。
- 功能强大:支持制造过程优化、IC 设计辅助和专家知识整合。
- 技术先进:基于大规模领域特定数据集,结合预训练和微调技术。
正文(附运行示例)
SEMIKONG 是什么
SEMIKONG 是专为半导体行业定制的大型语言模型(LLM),由 Aitomatic、FPT Software 和东京电子有限公司联合推出。该模型基于深入的领域知识,旨在解决半导体制造和设计中的独特挑战,如复杂的物理和化学问题。
SEMIKONG 通过整合专家知识和优化预训练过程,提供了能够专家级理解刻蚀问题的基础模型。相较于通用 LLMs,SEMIKONG 在半导体制造任务中展现出更优的性能,为公司或工具特定的专有模型开发奠定了基础,推动了领域特定 AI 模型的进一步研究和应用。
SEMIKONG 的主要功能
- 理解半导体专业知识:能够理解半导体制造和设计中的复杂问题,尤其是在刻蚀领域。
- 优化制造过程:基于学习大量的半导体相关数据,协助优化半导体制造过程,如参数优化、异常检测和预测性维护。
- 辅助 IC 设计:能够辅助集成电路(IC)设计任务,包括设计规则检查、布局生成和设计空间探索。
- 提高 AI 解决方案性能:基于微调预训练的大型语言模型,提高 AI 驱动的半导体制造任务的性能。
- 专家知识整合:引入一个框架,整合专家知识推进领域特定 AI 模型的评估过程。
SEMIKONG 的技术原理
- 数据策划:开发始于大规模、高质量的半导体领域特定文本数据集的策划,包括技术书籍、论文和专利。
- 预训练和微调:用预训练和微调的方法训练模型,预训练阶段用特定领域的数据增强模型的领域知识,微调阶段让模型执行特定的任务。
- 领域本体论:与半导体专家合作,构建系统化的半导体制造过程本体论,有助于 AI 研究人员更有效地开发领域特定的 AI 模型。
- 专家反馈循环:基于专家反馈循环,用专家评估模型生成的答案,生成评估标准和高质量的基准测试。
- 模型量化和适配:在预训练和微调之后,进行模型量化和适配处理,便于模型部署。
如何运行 SEMIKONG
1. 准备环境
首先,确保已安装 Python 3.10 或更高版本,并克隆 SEMIKONG 的 GitHub 仓库:
git clone https://github.com/aitomatic/semikong.git
cd semikong
pip install -r requirements.txt
2. 下载模型
从 Hugging Face 下载 SEMIKONG 模型的权重和分词器:
# 示例:下载 SEMIKONG-8B-Instruct 模型
from transformers import AutoModelForCausalLM, AutoTokenizer
model_path = 'pentagoniac/SEMIKONG-8B-Instruct'
tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", torch_dtype='auto').eval()
3. 执行推理
使用以下代码进行推理:
messages = [{
"role": "user", "content": "hi"}]
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt')
output_ids = model.generate(input_ids.to('cuda'))
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)
资源
- 项目官网:https://semikong.ai
- GitHub 仓库:https://github.com/aitomatic/semikong
- HuggingFace 模型库:https://huggingface.co/pentagoniac
- arXiv 技术论文:https://arxiv.org/pdf/2411.13802
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦