現(xiàn)如今英偉達虛擬化GPU(vGPU)已經(jīng)被應(yīng)用到不同領(lǐng)域。在虛擬GPU這一概念提出以前,應(yīng)用程序GRID vApp和桌面虛擬化技術(shù)GRID vPC已經(jīng)存在很長時間,那么VGPU究竟是什么,VPC、VApp、vDWS三種授權(quán)方式有什么區(qū)別呢?
目前具備GPU虛擬化技術(shù)的主要是Intel、AMD、NIVIDA三個廠家主要用于支持交付圖形豐富的虛擬桌面和工作站。而NVIDIA GPU 是當今市場上最強大的數(shù)據(jù)中心GPU,使用虛擬GPU軟件可以將GPU資源重新劃分,以保證GPU資源可以在多個虛擬機之間共享,或者可以將多個GPU分配給一個虛擬機,vGPU為最苛刻的工作流提供了動力。NVIDIA虛擬GPU軟件運行在基于NVIDIA Turing?、Volta?、Pascal?和Maxwell?體系結(jié)構(gòu)的GPU上。
NVIDIA vGPU軟件是一個圖形虛擬化平臺,可以讓虛擬機(VM)使用NVIDIA GPU的技術(shù)。NVIDIA VGPU軟件可以以多種方式使用。
NVIDIA? vGPU支持多個虛擬機(VM)能夠同時訪問部署在宿主機系統(tǒng)上的NVIDIA單個物理GPU。通過這樣做,NVIDIAvGPU為VM提供了無與倫比的圖形性能和應(yīng)用程序兼容性,以及通過在多個工作負載之間共享GPU帶來的成本效益和可擴展性。
通過使用VDI(桌面云虛擬化),IT管理員可以集中管理資源,而無需在每個工作位置為單獨的工作站提供支持。此外,還可以根據(jù)項目和應(yīng)用程序的需求增加和減少用戶的數(shù)量。
NVIDIA虛擬GPU監(jiān)控功能可為IT部門提供各種工具和見解,從而幫助他們節(jié)省錯誤排查的時間,并將更多時間用于戰(zhàn)略性項目。IT管理員對基礎(chǔ)架構(gòu)的了解可以細化到應(yīng)用程序?qū)用?,從而能夠及早發(fā)現(xiàn)問題,未雨綢繆。這樣可以減少支持請求和問題上報的數(shù)量,并縮減解決問題所需的時間。
借助VDI,IT人員還能夠更好地理解用戶的需求并調(diào)整資源分配。這樣可以節(jié)省運營成本,同時實現(xiàn)更好的用戶體驗。此外,利用NVIDIA GPU加速虛擬機的實時遷移功能,IT人員還可以執(zhí)行關(guān)鍵服務(wù)(如工作負載均衡、基礎(chǔ)架構(gòu)韌性和服務(wù)器軟件更新),而不會造成任何虛擬機停機。它讓IT人員可以真正為用戶提供高可用性,實現(xiàn)優(yōu)質(zhì)用戶體驗。
下圖展示NVIDIA vGPU 的構(gòu)架。在NVIDIA vGPU manager的控制下,NIVDIA 物理GPU 支持多個vGPU,vGPU可以直接分配給虛擬機。
每個vGPU 都類似于物理GPU,有固定的顯存大小,一個或者更多的虛擬顯示輸出。vGPU的存在創(chuàng)建時就從物理GPU中分配出來,并且是獨占的。
我們一起先了解一下NVIDIA vGPU的內(nèi)部架構(gòu)。vGPU跟傳統(tǒng)的GPU類似,具有固定數(shù)量的GPU幀緩沖器和一個或多個虛擬顯示輸出。在vGPU虛擬機被創(chuàng)建的時候,幀緩沖區(qū)就被分配到物理GPU的幀緩沖區(qū)中,vGPU保留對該緩沖區(qū)的獨占使用,直到它被銷毀為止。留在物理GPU上的所有vGPU虛擬機共享對GPU引擎的訪問,包括圖形(3D)、視頻編解碼引擎等。
每次vGPU的虛擬機運行的時候都會向License服務(wù)器發(fā)起License授權(quán)請求:
當配置有vGPU虛擬機發(fā)起License授權(quán)請求,授權(quán)服務(wù)器會根據(jù)License中所包含的GRID License版本,加載不同的vGPU驅(qū)動(普通驅(qū)動和專業(yè)Quodra卡驅(qū)動)。目前vPC和vApp的License對應(yīng)加載的都是普通的顯示驅(qū)動。
整個License獲取和釋放的過程發(fā)生在如下兩個階段:
1、License獲取階段:
虛擬機在啟動的時候通過訪問License服務(wù)器的地址+端口7070發(fā)起License的請求,當正常獲取License后加載GRID驅(qū)動。
2、License釋放階段:
當關(guān)閉虛擬機的時候,之前虛擬機獲得的License會自動釋放,還回到License服務(wù)器中。
注意事項:
當虛擬機處于關(guān)閉狀態(tài)的時候是不占用任何GRID License的。只有在使用Tesla M60/M10 GPU 時,GRID虛擬工作站或虛擬PC的授權(quán)版本須經(jīng)由網(wǎng)絡(luò)從NVIDIA GRID License 服務(wù)器獲取到license,激活使用。
NVIDIA虛擬GPU解決方案目前已經(jīng)更新到最新的9.2版本,在最新的版本中,新增了面向AI、深度學習和數(shù)據(jù)科學服務(wù)器虛擬化場景的vComputeServer類型。至此,NVIDIA vGPU授權(quán)證書產(chǎn)品組合共包含四種類型:
虛擬工作站可通過數(shù)據(jù)中心提供GPU資源讓用戶隨時隨地在任何設(shè)備上安全訪問數(shù)據(jù),用戶不再受物理位置的限制,NVIDIA Quadro vDWS 能夠進一步發(fā)揮 Quadro 的優(yōu)勢,實現(xiàn)真正的GPU 加速數(shù)據(jù)中心,通過數(shù)據(jù)中心虛擬化應(yīng)用程序為終端用戶如建筑師、工程師和設(shè)計師提供專業(yè)工作站級別的用戶體驗。在《英偉達Quadro vdws工作站講解》中有具體內(nèi)容。
常用應(yīng)用程序:?Adobe? Creative Cloud?、Allplan ANSYS、Autodesk 3ds Max、Autodesk AutoCAD、Autodesk Maya、Autodesk Revit、Bentley AECOsim Bentley MicroStation、Dassault Systèmes SOLIDWORKS、Esri ArcGIS Pro、Siemens PLM NX等
每天,數(shù)千萬的創(chuàng)意和技術(shù)專業(yè)人士需要通過各種設(shè)備訪問要求極高的應(yīng)用程序、需要隨時隨地開展工作并處理大型數(shù)據(jù)集,同時還要確保信息的安全。
他們可能是需要在會議期間提供遠程問診服務(wù)和訪問高質(zhì)量圖像的心臟病專家;或是提供沉浸式模擬培訓體驗的政府機構(gòu);或是正在構(gòu)思新車設(shè)計,需要確保知識產(chǎn)權(quán)和專有設(shè)計在數(shù)據(jù)中心內(nèi)安全無虞,同時還要與客戶辦公室的其他人進行協(xié)作的研發(fā)工程師。
對于具有上述復雜圖形密集需求的人士,Quadro vDWS可以提供從數(shù)據(jù)中心或云到任意設(shè)備、任意位置的功能最為強大的虛擬工作站。
面向普通圖形加速場景(辦公),配合虛擬桌面VDI解決方案,基于vGPU數(shù)量授權(quán)。具體可以參考《英偉達vPC桌面授權(quán)及部署》。
NVIDIA GRID? 虛擬 PC (GRID vPC) 和虛擬應(yīng)用程序 (GRID vApp)? 等虛擬化解決方案提供的用戶體驗與本地 PC 幾乎別無二致。借助服務(wù)器端圖形以及全面管理和監(jiān)控功能,GRID 為您的 VDI 環(huán)境提供長效的解決方案。為組織中的每臺 VM(虛擬機)提供 GPU 加速能力,為各種現(xiàn)代企業(yè)應(yīng)用程序提供卓越用戶體驗的解決方案,這些程序包括 Microsoft Outlook、Office 2016、網(wǎng)絡(luò)瀏覽器、Adobe Photoshop 以及 Windows 10 操作系統(tǒng)。成本有效地擴展至整個企業(yè),并將 VDI 的覆蓋范圍擴展到每個成員。
提供了虛擬化GPU和加速計算密集型服務(wù)器工作負載的能力,包括AI,深度學習和數(shù)據(jù)科學。有了這個,汽車制造商可以使用最新的模擬和計算技術(shù)來創(chuàng)建最節(jié)省燃料和時尚的設(shè)計,研究人員可以分析基因的功能,以更快地開發(fā)醫(yī)療。
GRID vAPP(vApps) – 基于使用vGPU的并發(fā)用戶會話數(shù)授權(quán)
GRID vPC(vPC) – 基于使用vGPU的并發(fā)數(shù)授權(quán)
vComputeServer(vCS) – 基于物理GPU授權(quán),且僅支持訂閱模式
Quadro Virtual Data Center Workstation (vDWS) – 基于使用vGPU的并發(fā)數(shù)授權(quán)
什么物理GPU支持vGPU?能夠跟linux kvm兼容的vGPU版本是5.0到5.2目前有七種型號能夠兼容
tesla M60
tesla M10
tesla M6
tesla p100
tesla p100(12GB)
tesla P40
tesla P4
詳細如下表
每一種物理GPU支持的vGPU類型都不一樣。vGPU顯卡性能主要以分配的顯存及顯卡類型進行劃分,即虛擬機所分配的虛擬顯卡型號。vGPU有幾種后綴:
A系列NVIDIAvGPU支持低分辨率的單個顯示器,因為它們旨在支持遠程應(yīng)用程序環(huán)境,如RDSH和XenApp。在這些環(huán)境中,虛擬應(yīng)用程序通常呈現(xiàn)在屏幕外的緩沖區(qū)中。因此,A系列NVIDIA vGPU的最大分辨率與顯示器的最大分辨率無關(guān)。
有幾點是要注意的:
1、NVIDIAvGPU是所有支持的GPU主板上的許可產(chǎn)品。需要軟件許可才能啟用來賓虛擬機中的所有vGPU功能。所需許可證的類型取決于vGPU類型。
2、NIVDIA? vGPU是需要授權(quán)的,根據(jù)不同的應(yīng)用場景(vDWS、vPC、vAPP)來按數(shù)量授權(quán)。
3、一顆物理GPU核心只能劃分為一種vGPU模式,多GPU的卡可以支持多種模式,例如M60有兩顆GPU芯片,可支持兩種模式。
注意要點:
虛擬機兼容性
Windows支持所有類型的vGPU
Linux只支持q系列vGPU
M6 M10 M60的8q系列vGPU以及P4 P6 P40P100的q系列才支持cuda以及 Unified Memory的OpenCL(估計就是性能和兼容性好些)。
直接運行run文件就可以了:NVIDIA-Linux-x86_64-430.46-vgpu-kvm.run
A physical GPU that is passed through to a VM is bound to the vfio-pci kernel module. A physical GPU that is bound to the vfio-pci kernel module can be used only for pass-through. To enable the GPU to be used for vGPU, the GPU must be unbound from vfio-pci kernel module and bound to the nvidia kernel module.
#? lspci -d 10de: -k
b1:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)
Subsystem: NVIDIA Corporation Device 1306
Kernel driver in use: nvidia
Kernel modules: nvidiafb, nouveau, nvidia_vgpu_vfio, nvidia
root@example:~# lspci | grep NVID
b1:00.0 3D controller: NVIDIA Corporation Device 1db4 (rev a1)
root@example:/sys/class/mdev_bus/0000:b1:00.0/mdev_supported_types# grep -l “V100-1Q” nvidia-*/name
nvidia-105/name
注意:至于要創(chuàng)建哪種類型的vGPU,就看具體的物理GPU型號和vGPU要求了,看這個xxxx-grid-vgpu-user-guide.pdf文檔能找到類似如下,各個物理GPU都有詳細配置,根據(jù)自己情況來:
root@example:/sys/class/mdev_bus/0000:b1:00.0/mdev_supported_types# cat nvidia-105/available_instances
16
root@example:/sys/class/mdev_bus/0000:b1:00.0/mdev_supported_types# uuidgen
b0ff7f66-c989-4841-ba57-6d5adcd55a2d
root@example:/sys/class/mdev_bus/0000:b1:00.0/mdev_supported_types# echo “b0ff7f66-c989-4841-ba57-6d5adcd55a2d” > nvidia-105/create
root@example:/sys/class/mdev_bus/0000:b1:00.0/mdev_supported_types# uuidgen
b94a0c97-946d-4e57-b317-8bdaa38e455a
root@example:/sys/class/mdev_bus/0000:b1:00.0/mdev_supported_types# echo “b94a0c97-946d-4e57-b317-8bdaa38e455a” > nvidia-105/create
root@example:~# ls -l /sys/bus/mdev/devices/
total 0
lrwxrwxrwx 1 root root 0 Aug 21 12:41 b0ff7f66-c989-4841-ba57-6d5adcd55a2d -> ../../../devices/pci0000:ae/0000:ae:02.0/0000:b1:00.0/b0ff7f66-c989-4841-ba57-6d5adcd55a2d
lrwxrwxrwx 1 root root 0 Aug 21 13:44 b94a0c97-946d-4e57-b317-8bdaa38e455a -> ../../../devices/pci0000:ae/0000:ae:02.0/0000:b1:00.0/b94a0c97-946d-4e57-b317-8bdaa38e455a
-device vfio-pci,sysfsdev=/sys/bus/mdev/devices/b94a0c97-946d-4e57-b317-8bdaa38e455a -uuid xxxxxxxxxxxxxxxxxxxxx
后面就是虛擬機內(nèi)部安裝對應(yīng)的驅(qū)動程序了,一般名稱為:xxxx_grid_win10_server2016_server2019_64bit_international.exe
root@example:/sys/devices/pci0000:ae/0000:ae:02.0/0000:b1:00.0/mdev_supported_types/nvidia-105/devices# echo 1 > b0ff7f66-c989-4841-ba57-6d5adcd55a2d/remove
Nvidia的vGPU在虛擬機內(nèi)部使用是需要購買license的,具體的部署方式是需要搭建一臺授權(quán)服務(wù)器,虛擬機內(nèi)部安裝顯卡驅(qū)動后需要配置授權(quán)服務(wù)器的地址和端口,前提是虛擬機和授權(quán)服務(wù)器網(wǎng)絡(luò)是通的,虛擬機每次開機后都要連接到授權(quán)服務(wù)器進行授權(quán)。
GRID vPC大概2600元,GRID vApps 380元,RTX vWDS 7200元,VCS 3600元。具體的可以聯(lián)系同袍存儲工作人員。
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲 粵ICP備2021121885號網(wǎng)站地圖