NVIDIA NeMo Framework felhasználói útmutató

Töltse le a legújabb kiadást a GitHub NeMo-Framework-Launcher Releases oldaláról.
További információkért keresse fel az NVIDIA Product Security oldalt.

Biztonsági frissítés részletei:
A biztonsági frissítés az NVIDIA NeMo-keretrendszer egyik biztonsági rését szünteti meg, amely kódfuttatáshoz és adatátvitelhez vezethet.amptévedés.

Szoftver frissítés:
Ha korábbi ági kiadást használ, a biztonsági probléma megoldása érdekében ajánlatos frissíteni a legújabb fióki kiadásra.

Felettview

Az NVIDIA NeMo Framework egy méretezhető és felhőben natív generatív mesterséges intelligencia keretrendszer, amely azon kutatók és fejlesztők számára készült. Nagy nyelvi modellek, Multimodális és Beszéd AI (például Automatikus beszédfelismerés és Szövegfelolvasó). Lehetővé teszi a felhasználók számára, hogy hatékonyan hozzanak létre, testreszabjanak és telepítsenek új generatív AI modelleket a meglévő kód és az előre betanított modellellenőrző pontok felhasználásával.

Beállítási utasítások: Telepítse a NeMo Framework-et

Nagy nyelvi modellek és multimodális modellek
A NeMo Framework teljes körű támogatást nyújt a nagy nyelvi modellek (LLM) és a multimodális modellek (MM) fejlesztéséhez. Rugalmasságot biztosít a helyszíni, adatközpontban vagy az Ön által előnyben részesített felhőszolgáltatónál történő használathoz. Támogatja a végrehajtást SLURM vagy Kubernetes-kompatibilis környezetekben is.

Adatkezelés
NeMo kurátor [1] egy Python-könyvtár, amely modulokat tartalmaz adatbányászathoz és szintetikus adatgeneráláshoz. Skálázhatóak és GPU-kra optimalizáltak, így ideálisak természetes nyelvi adatok kurálására az LLM-ek betanításához vagy finomhangolásához. A NeMo Curator segítségével hatékonyan kinyerhet kiváló minőségű szöveget kiterjedt nyersanyagból web adatforrások.

Képzés és testreszabás

A NeMo Framework eszközöket biztosít a hatékony képzéshez és testreszabáshoz LLM-ek és multimodális modellek. Tartalmazza az alapértelmezett konfigurációkat a számítási fürt beállításához, az adatok letöltéséhez és a modell hiperparamétereihez, amelyek beállíthatók az új adatkészletekre és modellekre való képzéshez. Az előképzésen kívül a NeMo támogatja a felügyelt finomhangolást (SFT) és a Parameter Efficient Fine-Tuning (PEFT) technikákat is, mint például a LoRA, a Ptuning stb.

Két lehetőség áll rendelkezésre a képzés elindításához a NeMo-ban – a NeMo 2.0 API felülettel vagy a NeMo Run segítségével.

NeMo Run segítségével (ajánlott): A NeMo Run interfészt biztosít a kísérletek konfigurációjának, végrehajtásának és kezelésének egyszerűsítéséhez a különböző számítási környezetekben. Ez magában foglalja a feladatok elindítását a munkaállomáson helyileg vagy nagy fürtökön – akár SLURM-kompatibilis, akár Kubernetes felhőkörnyezetben.
- Előképzés és PEFT gyorsindítás a NeMo Run segítségével

A NeMo 2.0 API használata: Ez a módszer jól működik egy egyszerű beállításnál, amely kis modelleket foglal magában, vagy ha saját egyéni adatbetöltőt szeretne írni, betanítási ciklusokat szeretne írni vagy modellrétegeket szeretne változtatni. Nagyobb rugalmasságot és irányítást biztosít a konfigurációk felett, valamint megkönnyíti a konfigurációk programozott bővítését és testreszabását.
- TraIning Quickstart with NeMo 2.0 API
- Migráció a NeMo 1.0-ról a NeMo 2.0 API-ra

Igazítás

NeMo-Aligner [1] egy méretezhető eszközkészlet a hatékony modelligazításhoz. Az eszközkészlet támogatja a legmodernebb modell-igazítási algoritmusokat, például a SteerLM-et, a DPO-t, az RLHF-t és még sok mást. Ezek az algoritmusok lehetővé teszik a felhasználók számára, hogy biztonságosabbá, ártalmatlanabbá és hasznosabbá tegyék a nyelvi modelleket.

Az összes NeMo-Aligner ellenőrzőpont keresztkompatibilis a NeMo ökoszisztémával, lehetővé téve a további testreszabást és következtetések telepítését.

Az RLHF mindhárom fázisának lépésről lépésre történő munkafolyamata egy kis GPT-2B modellen:

SFT képzés
Jutalommodell képzés

PPO képzés

Ezen túlmenően bemutatjuk számos más új igazítási módszer támogatását:

DPO: könnyű igazítási algoritmus az RLHF-hez képest egyszerűbb veszteségfüggvénnyel.
Önjáték Finomhangolás (SPIN)

SteerLM: kondicionált SFT-n alapuló technika, irányítható kimenettel.

További információkért tekintse meg a dokumentációt: Igazítási dokumentáció

Multimodális modellek

A NeMo Framework optimalizált szoftvert biztosít a legkorszerűbb multimodális modellek betanításához és telepítéséhez több kategóriában: Multimodális nyelvi modellek, Vision-Language Foundations, Text-to-Image modellek és azon túl, hogy a 2D-s generálást neurális sugárzási mezők (NeRF) segítségével végezzük.
Mindegyik kategória úgy lett kialakítva, hogy megfeleljen a speciális igényeknek és a területen elért előrelépéseknek, kihasználva a legmodernebb modelleket az adattípusok széles skálájának kezelésére, beleértve a szöveget, képeket és 3D modelleket.

Jegyzet
A multimodális modellek támogatását a NeMo 1.0-ról a NeMo 2.0-ra állítjuk át. Ha időközben szeretné felfedezni ezt a tartományt, kérjük, olvassa el a NeMo 24.07 (korábbi) kiadás dokumentációját.

Telepítés és következtetés
A NeMo-keretrendszer különféle útvonalakat biztosít az LLM-következtetésekhez, kielégítve a különböző telepítési forgatókönyveket és teljesítményigényeket.

Telepítse az NVIDIA NIM-mel

A NeMo Framework zökkenőmentesen integrálható a vállalati szintű modelltelepítési eszközökkel az NVIDIA NIM-en keresztül. Ezt az integrációt az NVIDIA TensorRT-LLM hajtja, biztosítva az optimalizált és méretezhető következtetést.
A NIM-mel kapcsolatos további információkért látogasson el az NVIDIA oldalára webtelek.

Telepítse a TensorRT-LLM vagy vLLM segítségével

A NeMo Framework szkripteket és API-kat kínál a modellek exportálásához két következtetésre optimalizált könyvtárba, a TensorRT-LLM-be és a vLLM-be, valamint az exportált modell telepítéséhez az NVIDIA Triton Inference Server segítségével.
Az optimalizált teljesítményt igénylő forgatókönyvek esetén a NeMo modellek kihasználhatják a TensorRT-LLM-et, egy speciális könyvtárat az LLM következtetések felgyorsítására és optimalizálására NVIDIA GPU-kon. Ez a folyamat magában foglalja a NeMo modellek konvertálását a TensorRT-LLM-mel kompatibilis formátumba a nemo.export modul használatával.
- Az LLM bevezetésének végeview
- Telepítse a NeMo nagy nyelvű modelleket a NIM segítségével
- Telepítse a NeMo nagy nyelvi modelleket a TensorRT-LLM segítségével
- Telepítse a NeMo nagy nyelvi modelleket a vLLM segítségével

Támogatott modellek

Nagy nyelvi modellek

Nagy nyelvi modellek
Nagy nyelvi modellek	Előképzés és SFT	PEFT	Igazítás	FP8 képzési konvergencia	TRT/TRTLLM	Átalakítás átölelő arcra és arcról	Értékelés
Llama3 8B/70B, Llama3.1 405B	Igen	Igen	x	Igen (részben igazolva)	Igen	Mindkét	Igen
Mixtral 8x7B/8x22B	Igen	Igen	x	Igen (ellenőrizetlen)	Igen	Mindkét	Igen
Nemotron 3 8B	Igen	x	x	Igen (ellenőrizetlen)	x	Mindkét	Igen
Nemotron 4 340B	Igen	x	x	Igen (ellenőrizetlen)	x	Mindkét	Igen
Baichuan2 7B	Igen	Igen	x	Igen (ellenőrizetlen)	x	Mindkét	Igen
ChatGLM3 6B	Igen	Igen	x	Igen (ellenőrizetlen)	x	Mindkét	Igen
Gemma 2B/7B	Igen	Igen	x	Igen (ellenőrizetlen)	Igen	Mindkét	Igen
Gemma2 2B/9B/27B	Igen	Igen	x	Igen (ellenőrizetlen)	x	Mindkét	Igen
Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B	Igen	Igen	x	Igen (ellenőrizetlen)	x	x	Igen
Phi3 mini 4k	x	Igen	x	Igen (ellenőrizetlen)	x	x	x
Qwen2 0.5B/1.5B/7B/72B	Igen	Igen	x	Igen (ellenőrizetlen)	Igen	Mindkét	Igen
StarCoder 15B	Igen	Igen	x	Igen (ellenőrizetlen)	Igen	Mindkét	Igen
StarCoder2 3B/7B/15B	Igen	Igen	x	Igen (ellenőrizetlen)	Igen	Mindkét	Igen
BERT 110M/340M	Igen	Igen	x	Igen (ellenőrizetlen)	x	Mindkét	x
T5 220M/3B/11B	Igen	Igen	x	x	x	x	x

Látásnyelvi modellek

Látásnyelvi modellek
Látásnyelvi modellek	Előképzés és SFT	PEFT	Igazítás	FP8 képzési konvergencia	TRT/TRTLLM	Átalakítás átölelő arcra és arcról	Értékelés
NeVA (LLaVA 1.5)	Igen	Igen	x	Igen (ellenőrizetlen)	x	Tól	x
Llama 3.2 Vision 11B/90B	Igen	Igen	x	Igen (ellenőrizetlen)	x	Tól	x
LLaVA Next (LLaVA 1.6)	Igen	Igen	x	Igen (ellenőrizetlen)	x	Tól	x

Modellek beágyazása

Modellek beágyazása
Nyelvi modellek beágyazása	Előképzés és SFT	PEFT	Igazítás	FP8 képzési konvergencia	TRT/TRTLLM	Átalakítás átölelő arcra és arcról	Értékelés
SBERT 340M	Igen	x	x	Igen (ellenőrizetlen)	x	Mindkét	x
Láma 3.2 1B beágyazás	Igen	x	x	Igen (ellenőrizetlen)	x	Mindkét	x

Világalapítványi modellek

Világalapítványi modellek
Világalapítványi modellek	Edzés utáni	Gyorsított következtetés
Cosmos-1.0-Diffusion-Text2World-7B	Igen	Igen
Cosmos-1.0-Diffusion-Text2World-14B	Igen	Igen
Cosmos-1.0-Diffusion-Video2World-7B	Hamarosan	Hamarosan
Cosmos-1.0-Diffusion-Video2World-14B	Hamarosan	Hamarosan
Kozmosz-1.0-Autoregresszív-4B	Igen	Igen
Cosmos-1.0-Autoregresszív-Video2World-5B	Hamarosan	Hamarosan
Kozmosz-1.0-Autoregresszív-12B	Igen	Igen
Cosmos-1.0-Autoregresszív-Video2World-13B	Hamarosan	Hamarosan

Jegyzet
A NeMo támogatja a diffúziós és autoregresszív architektúrák előképzését is text2world alapozó modellek.

Beszéd AI

A társalgási AI-modellek fejlesztése összetett folyamat, amely magában foglalja a modellek meghatározását, felépítését és betanítását bizonyos területeken belül. Ez a folyamat általában több iterációt igényel a magas szintű pontosság eléréséhez. Gyakran több iterációt is magában foglal a nagy pontosság elérése érdekében, a különféle feladatok és tartományspecifikus adatok finomhangolása, a képzési teljesítmény biztosítása és a modellek előkészítése a következtetések telepítéséhez.

A NeMo Framework támogatást nyújt a Speech AI modellek képzéséhez és testreszabásához. Ez magában foglalja az olyan feladatokat, mint az automatikus beszédfelismerés (ASR) és a szövegfelolvasó (TTS) szintézis. Zökkenőmentes átmenetet kínál a vállalati szintű éles üzembe helyezésre az NVIDIA Riva segítségével. A fejlesztők és kutatók segítése érdekében a NeMo Framework korszerű előre betanított ellenőrzőpontokat, reprodukálható beszédadat-feldolgozási eszközöket, valamint beszédadatkészletek interaktív feltárását és elemzését szolgáló funkciókat tartalmaz. A NeMo Framework for Speech AI összetevői a következők:

Képzés és testreszabás
A NeMo Framework mindent tartalmaz, ami a beszédmodellek betanításához és testreszabásához (ASR, Beszédosztályozás, Hangszóró felismerése, Beszélő naplózása, és TTS) reprodukálható módon.

SOTA előképzett modellek

A NeMo Framework a legkorszerűbb recepteket és számos előképzett ellenőrzőpontot kínál ASR és TTS modelleket, valamint a betöltési utasításokat.
Beszédeszközök
A NeMo Framework az ASR és TTS modellek fejlesztéséhez hasznos eszközöket biztosít, beleértve:
- NeMo Forced Aligner (NFA) token-, szó- és szegmens szintű időmérő generálásáhozampbeszéd hangban a NeMo CTC-alapú automatikus beszédfelismerési modelljei segítségével.
- Beszédadat-feldolgozó (SDP), egy eszköztár a beszédadat-feldolgozás egyszerűsítésére. Lehetővé teszi, hogy az adatfeldolgozási műveleteket egy konfigurációban ábrázolja file, minimálisra csökkentve az alapkódot, lehetővé téve a reprodukálhatóságot és a megoszthatóságot.
- Speech Data Explorer (SDE), Dash alapú web alkalmazás beszédadatkészletek interaktív feltárására és elemzésére.
- Adatkészlet-készítő eszköz amely funkciót biztosít a hosszú hangok összehangolására files a megfelelő átiratokkal, és bontsa fel rövidebb töredékekre, amelyek alkalmasak az automatikus beszédfelismerés (ASR) modellképzésére.
- Összehasonlító eszköz Az ASR-modellek számára, hogy összehasonlítsák a különböző ASR-modellek előrejelzéseit szópontossági és kimondási szinten.
- ASR értékelő az ASR-modellek és egyéb funkciók, például a hangtevékenység-érzékelés teljesítményének értékeléséhez.
- Szövegnormalizációs eszköz szöveg konvertálása írott formáról beszélt formára és fordítva (pl. „31.” vs „harmincegyedik”).
Útvonal a telepítéshez
A NeMo keretrendszerrel betanított vagy testreszabott NeMo modellek optimalizálhatók és telepíthetők az NVIDIA Rivával. A Riva konténereket és Helm diagramokat kínál, amelyeket kifejezetten a nyomógombos telepítés lépéseinek automatizálására terveztek.

Egyéb források

GitHub Repos

NeMo: A NeMo Framework fő tárolója
NeMo–Fut: Eszköz a gépi tanulási kísérletek konfigurálásához, elindításához és kezeléséhez.

NeMo-Aligner: Méretezhető eszközkészlet a hatékony modelligazításhoz
NeMo-kurátor: Skálázható adat-előfeldolgozási és kurátori eszköztár LLM-ek számára

Segítség kérése
Vegyen részt a NeMo közösséggel, tegyen fel kérdéseket, kérjen támogatást vagy jelentse a hibákat.

NeMo beszélgetések

NeMo problémák

Programozási nyelvek és keretrendszerek

Piton: A NeMo Framework használatának fő felülete

Pytorch: A NeMo Framework a PyTorch tetejére épül

Licencek

A NeMo Github repo licence az Apache 2.0 licenc alatt van

A NeMo Framework licence az NVIDIA AI TERMÉKSZERZŐDÉSE értelmében biztosított. A konténer húzásával és használatával Ön elfogadja a jelen licenc feltételeit.
A NeMo Framework tároló láma anyagokat tartalmaz, amelyekre a Meta Llama3 közösségi licencszerződés vonatkozik.

Lábjegyzetek
Jelenleg a Multimodális modellek NeMo Curator és NeMo Aligner támogatása folyamatban van, és hamarosan elérhető lesz.

GYIK

K: Hogyan ellenőrizhetem, hogy a rendszeremet érinti-e a biztonsági rés?
V: A telepített NVIDIA NeMo Framework verziójának ellenőrzésével ellenőrizheti, hogy a rendszer érintett-e. Ha a 24-es verzió alatt van, akkor a rendszere sebezhető lehet.

K: Ki jelentette a CVE-2025-23360 biztonsági problémát?
V: A biztonsági problémát az Or Peles – JFrog Security jelentette. Az NVIDIA elismeri hozzájárulásukat.

K: Hogyan kaphatok jövőbeli biztonsági közleményeket?
V: Látogassa meg az NVIDIA Product Security oldalát, ahol feliratkozhat a biztonsági közleményekre, és értesülhet a termékbiztonsági frissítésekről.

Dokumentumok / Források

NVIDIA NeMo Framework [pdf] Felhasználói útmutató
NeMo Framework, NeMo, Framework

Hivatkozások

Felhasználói kézikönyv

NVIDIA NeMo Framework

Műszaki adatok

A termék használati útmutatója

Felettview

Képzés és testreszabás

Igazítás

Multimodális modellek

Támogatott modellek

Beszéd AI

GYIK

Dokumentumok / Források

Hivatkozások

Hagyj megjegyzést

Válasz visszavonása