「ブライアン・ロエメル氏は、Reddit のような低品質のインターネット データを AI トレーニングに使用することに異議を唱え、単語の連想を歪める「低タンパク質」の統計的ノイズが導入されると主張しており、これは Common Crawl などのオープン データセットの分析によって裏付けられています。」