Blir allt mer Crypto X Robotics pillad: - Robotar förlitar sig på synmodeller för att tolka och navigera i sin omgivning. - De verkar i en komplex, multiplanär, tredimensionell värld. - Visionsmodeller kräver unika, verkliga 3D-datauppsättningar för att möjliggöra fysisk rörelse och beslutsfattande. - Till skillnad från LLM:er som kan tränas på hela det skrapbara internet, finns det för närvarande ingen strukturerad "verklig datauppsättning" tillgänglig för att starta träningskörningar av nya visionsmodeller. - Stort beroende av syntetisk data i detta utrymme kommer med betydande nackdelar. - "Universumet" av mänskligt skapade uppgifter är i praktiken oändligt och omfattar otaliga arbetsflöden, mänskliga manér och kontextuella nyanser som måste fångas i träningsbara datauppsättningar. - Även när verkliga data har samlats in är det fortfarande mycket svårt att strukturera och märka dem. Krypto kan ge incitament över hela stacken, från datainsamling till märkning, och mobilisera storskaliga, distribuerade mänskliga bidrag.