La gente mi chiede sempre di questo, quindi metto qui la risposta per risparmiare fatica. La RPC è indietro sul PGS (predizione poligenica di tratti complessi) perché si è impegnata fortemente nel sequenziamento dell'intero genoma e quindi non ha (ancora) dataset super grandi da analizzare. Questa è stata la cattiva influenza di BGI (che ha sviluppato la propria tecnologia di sequenziamento indigena per competere con Illumina). Ma non hanno gli stessi pregiudizi ideologici che abbiamo noi in Occidente, quindi alla fine potrebbero avanzare. Quasi tutti i dati utilizzati finora nel PGS provengono da genotipi a basso costo che si concentrano su varianti comuni. Ho passato anni cercando di convincere le persone della RPC (inclusi quelli di BGI) che i dati da array erano più efficienti in termini di costi, ma avevano un incentivo a spingere per il sequenziamento e quindi nessuno dei più grandi dataset di biobanche si trova nella RPC. Ironia della sorte, la biobanca di Taiwan (con cui collaboro) ha circa 1 milione di genomi da array ed è una delle più grandi al mondo. Ci vuole una vita di impegno per far avanzare questi progetti scientifici... per un teorico è tutto banale e i passi che richiedono molti anni di lavoro sono super frustranti... hai bisogno di un tipo speciale di pazienza per fare grande scienza.