La gente me pregunta sobre esto todo el tiempo, así que estoy poniendo la respuesta aquí para ahorrar esfuerzo. La RPC está rezagada en PGS (predicción poligénica de rasgos complejos) porque se comprometieron fuertemente con la secuenciación del genoma completo y, por lo tanto, no tienen (aún) conjuntos de datos super grandes para analizar. Esta fue la mala influencia de BGI (que desarrolló su propia tecnología de secuenciación indígena para competir con Illumina). Pero no tienen los mismos sesgos ideológicos que tenemos en Occidente, así que eventualmente pueden avanzar. Casi todos los datos utilizados hasta ahora en PGS provienen de genotipos de matriz menos costosos que se centran en variantes comunes. Pasé años tratando de convencer a la gente de la RPC (incluidos en BGI) de que los datos de matriz eran más rentables, pero tenían un incentivo para impulsar la secuenciación y, por lo tanto, ninguno de los mayores conjuntos de datos de biobanco está en la RPC. Irónicamente, el biobanco de Taiwán (con el que colaboro) tiene ~1M de genomas de matriz y es uno de los más grandes del mundo. Se necesita una vida de esfuerzo para avanzar en estos proyectos científicos... para un teórico todo es trivial y los pasos que toman muchos años de simios son súper frustrantes... necesitas un tipo especial de paciencia para hacer ciencia a gran escala.