‘布萊恩·羅梅爾挑戰使用低質量的互聯網數據(如Reddit)進行AI訓練,認為這會引入“低蛋白”統計噪聲,扭曲詞語關聯,他的分析支持了這一觀點,分析了像Common Crawl這樣的開放數據集’