Les gens me posent des questions à ce sujet tout le temps, donc je mets la réponse ici pour gagner du temps. La RPC est en retard sur le PGS (prédiction polygénique de traits complexes) car ils se sont engagés fermement dans le séquençage du génome entier et n'ont donc pas (encore) de super grands ensembles de données à analyser. C'était la mauvaise influence de BGI (qui a développé sa propre technologie de séquençage indigène pour rivaliser avec Illumina). Mais ils n'ont pas les mêmes biais idéologiques que nous avons en Occident, donc finalement, ils pourraient prendre de l'avance. Presque toutes les données utilisées jusqu'à présent dans le PGS proviennent de génotypes d'array moins coûteux qui se concentrent sur les variantes communes. J'ai passé des années à essayer de convaincre les gens de la RPC (y compris chez BGI) que les données d'array étaient plus rentables, mais ils avaient un intérêt à promouvoir le séquençage et donc aucun des plus grands ensembles de données de biobanques ne se trouve en RPC. Ironiquement, la biobanque de Taïwan (avec laquelle je collabore) a ~1M de génomes d'array et est l'une des plus grandes au monde. Il faut une vie d'efforts pour faire avancer ces projets scientifiques... pour un théoricien, tout cela est trivial et les étapes qui prennent de nombreuses années de singe sont super frustrantes... il faut une patience spéciale pour faire de la grande science.