„Brian Roemmele stellt die Verwendung von minderwertigen Internetdaten wie Reddit für das Training von KI in Frage und argumentiert, dass sie "niedrigwertiges" statistisches Rauschen einführt, das Wortassoziationen verzerrt, unterstützt durch seine Analyse offener Datensätze wie Common Crawl.“