‘Brian Roemmele daagt het gebruik van laagwaardige internetdata zoals Reddit voor AI-training uit, en stelt dat het "laag eiwit" statistisch ruis introduceert die woordassociaties vervormt, ondersteund door zijn analyse van open datasets zoals Common Crawl’