问题一、Linux查看硬件配置信息
在Linux系统中,你可以使用一些命令来查看硬件配置信息。以下是几个常用的命令:
1️⃣:查看CPU
cat /proc/cpuinfo
一些关键性指标:
2️⃣:查看内存信息
cat /proc/meminfo
一些关键的内存相关指标:
3️⃣:查看显卡信息
方法一:lspci | grep VGA
此方法会列出所有的显卡设备,如果系统中有多个显卡,将会显示它们的信息
方法二:nvidia-smi
此方法仅仅针对 Nvidia 显卡的命令,它可以提供更详细的 Nvidia GPU 相关信息,包括 GPU 的型号、温度、内存使用情况等。
4️⃣:查看硬盘信息
fdisk -l
命令会显示硬盘的分区表、分区的起始扇区和结束扇区、分区的大小、分区的类型等信息。这些信息可以帮助用户了解硬盘的分区情况,以及分区的用途和格式。
问题二、迁移虚拟环境到离线机器
有时候我们在维护服务器、更换机器、迁移服务器、模型固化部署等情况时会经常碰到迁移,这时如果重新在目标机器再安装一次虚拟环境,耗时耗力,而且也有可能目标机器是离线状态。
这时需要将本地的环境移植到新的机器上。
解决方案:conda 常用来执行虚拟环境配置和包管理工作,可以使用conda-pack
进行conda 环境打包和分发。
-
安装conda pack:
conda install conda-pack
-
复制一份虚拟环境:
conda create -n xx(拷贝虚拟环境命名) --clone **(源虚拟环境)
,这一步是避免打包的时候出现问题导致源虚拟环境受损,可选做。
-
打包刚刚拷贝的虚拟环境:
conda pack -n xx
,这里需要等待一段时间,包涉及到的库越多,打包时间越长;
-
得到一个 xx.tar.gz的文件,将该.tar.gz压缩包下载,大小在几百MB到几个G不等
-
输入
conda config --show
,查找Anaconda虚拟环境 -
通过mobaxterm或者其他方式把 xx.tar.gz上传到目标服务器的如下目录里面:
/home/用户名/anaconda3/envs/xx/
-
在目标服务器上解压压缩包:
tar -xzf xx.tar.gz
-
在目标服务器上查看虚拟环境:
conda info --envs
问题三、输出tensor有省略号
问题描述:Torch 在输出tensor的时候,如何指定输出全部,不要省略号略过中间值
tensor([[[-102.1618, -102.1618, -103.8347, …, -117.6031, -111.0496,-111.0496],[-102.1618, -102.1618, -103.8347, …, -117.6031, -111.0496,-111.0496], device=‘cuda:0’)
问题原因:输出的时候,由于tensor太长,pytorch会自动将其省略
解决方案:
在开始增加:torch.set_printoptions(threshold=np.inf)
这个方法是来修改pytorch中的打印选项的(其实就是和numpy中更改打印方法一样),就是使用print
打印tensor
时,我们显示的元素精度,最多显示元素个数等一系列的有关操作的选项。其参数含义如下: