LLM本地部署全过程记录

news/发布时间2024/5/20 22:10:38

部署时间：2024年5月10日

环境

Windows11
RTX4060
miniconda
VSCode

下载开源 LLM：ChatGLM3

下载代码，通过VSCode打开ChatGLM3文件夹，作为工作目录

下载模型，大概十几G，记录下保存的目录，形如X:\xxx\xxx\xxx\chatglm3-6b

另一篇参考流程

安装miniconda

官网

将会在虚拟环境中配置所需的Python环境

安装CUDA

首先通过命令 nvidia-smi 查看显卡支持的CUDA最高版本
然后在pytorch官网查看你想安装的pytorch版本对应的CUDA版本
官网安装CUDA ，根据我的环境与任务，我选择的是CUDA12.1

随便百度一篇可以参考

配置python环境

关于pytorch版本与安装命令，请严格按照官网的来
参考 https://pytorch.org/get-started/locally/
参考 https://pytorch.org/get-started/previous-versions/#linux-and-windows-6
在WINDOWS下如果安装pytorch2.3，后续运行模型时可能会报警告（1Torch was not compiled with flash attention.），当然，似乎不影响使用；于是选择pytorch2.1.2，不会报警告，当然，暂时没发现性能或其它方面（与会报警告的2.3.0比较）有什么优势。 ——谨此说明

conda create -n GPT python=3.11 -y

activate GPT

activate GPT

conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia

然后，将VSCode的Python解释器选成GPT环境中的解释器。

接下来，所有操作在VScode中直接新建终端，就默认是在虚拟环境GPT中的终端，在这个终端运行命令

pip install -r requirements.txt

安装完成后，就可以运行 ChatGLM3\中的各种应用demo做测试，其中，代码中的MODEL_PATH都要修改为LLM的模型保存目录，例如，可以这样改 MODEL_PATH=X:\\xxx\\xxx\\xxx\\chatglm3-6b

关于代码怎么写怎么用，查阅源代码提供的各个文档，或者上官网

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.ulsteruni.cn/article/13073715.html

如若内容造成侵权/违法违规/事实不符，请联系编程大学网进行投诉反馈email:xxxxxxxx@qq.com，一经查实，立即删除！

相关文章

K8s必须掌握的7个调试技巧

K8s必须掌握的7个调试技巧

K8s必须掌握的7个调试技巧原创艾叔编程艾叔编程 2024-05-09 09:35 北京听全文Kubernetes（K8s）调试技术是指在使用Kubernetes集群过程中，用于定位和解决问题的方法和技术。Kubernetes是一个复杂的系统，它负责管理容器化的应用程序，确保它们按照预期运行。当应用程序出现…

阅读更多...

联芯集成电路产品与方案

联芯集成电路产品与方案

联芯集成电路产品与方案逻辑制程解决方案逻辑 / 混合信号 / 射频技术是数字电视、蓝牙、Wi-Fi、图像处理器，射频收发器等众多应用中最常用的晶圆专工解决方案。联电为不同的数据处理、混合信号及射频组件技术建立了广泛的跨代技术，也同时为建立专业技术平台奠定了坚实的基础…

阅读更多...

定时将系统时间更新在日志文件中

定时将系统时间更新在日志文件中

获取当前系统时间，把时间转换为特定格式”yy年mm月dd日星期x tt:mm:ss”，并每隔1s写入到本地磁盘中一个叫做log.txt的文本中，如果文本不存在则创建V1.0 2024年5月9日发布于博客园实现：设计程序，获取当前系统时间，把时间转换为特定格式”yy年mm月dd日星期x tt:mm:ss”，…

阅读更多...

iceoryx源码阅读（一）——全局概览

iceoryx源码阅读（一）——全局概览

一、什么是iceoryx iceoryx是一套基于共享内存实现的进程间通信组件。二、源码结构 iceoryx源码包括若干工程，整理如下表所示：下图展示了主要项目之间的依赖（FROM：iceoryx(冰羚)-Architecture）：三、iceoryx应用程序结构 iceoryx应用程序有三类进程，分别为Publisher、Su…

阅读更多...

再探URLDNS链(手搓exp)

再探URLDNS链(手搓exp)

夜深了，想着还需要沉淀自己的基础能力，于是乎没有继续往CC链里爬，通过研究了一下ysoserial里的URLDNS链，决定自己尝试写一个类似却有些不同的exp，使自己的基础更加牢固一些，故有了今天这篇文章。 ysoserial里的URLDNS链我就不再多说，有兴趣的话自己可以去看下面这篇文章…

阅读更多...

《编译原理》阅读笔记：p4-p17

《编译原理》阅读笔记：p4-p17

《编译原理》学习第 2 天，p4-p17总结，总计 14 页。一、技术总结 1.structure of compiler 编译器组成包括：Lexical Analyzer -> Syntax Analazer -> Semantic tree -> Intermediate Code Generator -> Machine-Independent Code Optimizer -> Code Genera…

阅读更多...

推荐文章

最新文章