Koszty szkolenia AI nie są już dominowane przez obliczenia. Dominują je dane ludzkie. W przypadku modeli frontier, wydatki na etykietowanie teraz przewyższają marginalne obliczenia treningowe o ~3×. Jednak większość tych danych trafia do pipeline'ów bez wyraźnej własności, pochodzenia lub odpowiedzialności. OpenLedger wprowadza atrybucję i weryfikowalną linię pochodzenia do danych etykietowanych, dzięki czemu każdy wkład jest śledzony, a każdy wynik niesie dowód pochodzenia.