问题一、Linux查看硬件配置信息

在Linux系统中,你可以使用一些命令来查看硬件配置信息。以下是几个常用的命令:
1️⃣:查看CPU

cat /proc/cpuinfo

解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP
一些关键性指标:

2️⃣:查看内存信息

cat /proc/meminfo

解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP
一些关键的内存相关指标:

3️⃣:查看显卡信息
方法一:lspci | grep VGA
此方法会列出所有的显卡设备,如果系统中有多个显卡,将会显示它们的信息
方法二:nvidia-smi
此方法仅仅针对 Nvidia 显卡的命令,它可以提供更详细的 Nvidia GPU 相关信息,包括 GPU 的型号、温度、内存使用情况等。

4️⃣:查看硬盘信息

fdisk -l

命令会显示硬盘的分区表、分区的起始扇区和结束扇区、分区的大小、分区的类型等信息。这些信息可以帮助用户了解硬盘的分区情况,以及分区的用途和格式。

解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP

问题二、迁移虚拟环境到离线机器

有时候我们在维护服务器、更换机器、迁移服务器、模型固化部署等情况时会经常碰到迁移,这时如果重新在目标机器再安装一次虚拟环境,耗时耗力,而且也有可能目标机器是离线状态。

这时需要将本地的环境移植到新的机器上。

解决方案:conda 常用来执行虚拟环境配置和包管理工作,可以使用conda-pack 进行conda 环境打包和分发。

  1. 安装conda pack:conda install conda-pack
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP

  2. 复制一份虚拟环境:conda create -n xx(拷贝虚拟环境命名) --clone **(源虚拟环境),这一步是避免打包的时候出现问题导致源虚拟环境受损,可选做。
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP

  3. 打包刚刚拷贝的虚拟环境:conda pack -n xx,这里需要等待一段时间,包涉及到的库越多,打包时间越长;
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP

  4. 得到一个 xx.tar.gz的文件,将该.tar.gz压缩包下载,大小在几百MB到几个G不等
    解决方案:查看机器CPU、GPU、内存配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题-LMLPHP

  5. 输入 conda config --show ,查找Anaconda虚拟环境

  6. 通过mobaxterm或者其他方式把 xx.tar.gz上传到目标服务器的如下目录里面:/home/用户名/anaconda3/envs/xx/

  7. 在目标服务器上解压压缩包:tar -xzf xx.tar.gz

  8. 在目标服务器上查看虚拟环境:conda info --envs

问题三、输出tensor有省略号

问题描述:Torch 在输出tensor的时候,如何指定输出全部,不要省略号略过中间值
tensor([[[-102.1618, -102.1618, -103.8347, …, -117.6031, -111.0496,-111.0496],[-102.1618, -102.1618, -103.8347, …, -117.6031, -111.0496,-111.0496], device=‘cuda:0’)

问题原因:输出的时候,由于tensor太长,pytorch会自动将其省略

解决方案:
在开始增加:torch.set_printoptions(threshold=np.inf)

这个方法是来修改pytorch中的打印选项的(其实就是和numpy中更改打印方法一样),就是使用print打印tensor时,我们显示的元素精度,最多显示元素个数等一系列的有关操作的选项。其参数含义如下:

12-07 11:05