Análisis de los genes E6, E7 y L1 del virus papiloma humano tipo 16 como marcadores pronóstico tempranos de la progresión de lesiones de cuello uterino
Abstract
El Virus Papiloma Humano tipo 16 (VPH16) es uno de los principales responsables del desarrollo de cáncer de cuello de útero. El cáncer cervical es el tercer cáncer más común entre las mujeres en todo el mundo y el cuarto cáncer más frecuente entre las mujeres en Argentina. La provincia de Misiones, se considera una región con alta prevalencia de infección por VPH y tasa de mortalidad por cáncer cervical. Este escenario epidemiológico ha convertido al VPH16 en el blanco de vacunas y justifican los estudios de genética viral. Según la variación descripta en sus genomas, el VPH16 se clasifica en 4 linajes: A, B, C y D, que en diversos estudios, muestran una distribución geográfica y un potencial oncogénico diferentes. En este contexto, profundizamos en la variabilidad de la LCR y 3 genes virales del VPH16 (E6, E7 y L1) y su asociación como marcadores de riesgo en el desarrollo de lesiones precursoras y cáncer cervical en mujeres residentes en la ciudad de Posadas (Misiones, Argentina). Para alcanzar este objetivo se estudió una población a 160 mujeres con prueba positiva de infección por VPH16 y diagnóstico citológico de NLIM, LSIL y HSIL/CC. Se realizó la caracterización genética de la LCR viral y los genes E6, E7 y L1 mediante amplificación por PCR y secuenciación directa por método de Sanger. La clasificación filogenética se realizó mediante métodos bayesianos. Para estimar la asociación entre las variantes genéticas y el riesgo de cáncer cervical se calculó la razón de probabilidad (RP). Las secuencias se tradujeron a proteínas y las variantes proteicas se analizaron in silico para comprender su asociación con sus principales blancos celulares. Los polimorfismos diagnósticos y los árboles filogenéticos confirmaron la presencia de linaje A (90,2 %) y D (7,3 %) en la población, similares a otros porcentajes encontrados en Argentina. La presencia del linaje D se asoció con el desarrollo del cáncer cervical con un RP de 13,8 (1,6 – 117,0). Con respecto al gen L1, se identificaron 36 secuencias diferentes, siendo la más común linaje A L1 6434G (35,6 %). La presencia de A6434G no se asoció con la progresión a HSIL/CC [RP= 1,54 (0,45 – 5,2)]. En relación al gen E6, se identificaron 11 secuencias diferentes, la variante más frecuente fue linaje A E6 350G (58,9 %). El polimorfismo T350G se asoció con la progresión a HSIL/CC, con un RP de 19,41 (4,95 - 76,10). En el gen E7 se identificaron 5 secuencias diferentes, de las cuales 2 eran no sinónimas. Debido a su baja frecuencia no pudieron establecerse estudios de asociación en este gen. La traducción a proteína de estos SNPs frecuentes indicó un cambio de Treonina por Alanina en la posición 266 de L1 (L1 266A) y un cambio de Lisina por Valina en la posición 83 del gen E6 (E6 83V). El modelado de la estructura terciaria indicó que L1 266A se encuentra en los bucles superficiales del epítope antigénico y ocupa una posición involucrada en la interacción con el heparánsulfato durante el proceso de infección. Por otra parte, el análisis de la estructura terciaria de la proteína E6 indicó que el residuo 83 se encuentra cerca del sitio de unión con la proteína ubiquitin quinasa E6AP, aunque no participaría directamente en las interacciones. La sustitución por Valina no induciría cambios en la estructura terciaria de la proteína, pero podría aportar cierta flexibilidad y aumentar la afinidad de unión de E6 con la E6AP y otras proteínas con motivos LxxLL. Futuros estudios in vitro permitirán comprender la relevancia de estos hallazgos. Finalmente, ninguno de los SNPs de E7 ocuparon posiciones involucradas en contactos esenciales para la interacción con pRb o la formación de la estructura dimérica de E7, la cual es fundamental para la función in vivo de la proteína. Esta secuencia conservada de E7 probablemente se deba a limitaciones funcionales de esta pequeña proteína. Nuestros resultados confirmaron la asociación del linaje D y la variante E6 350G con un mayor riesgo de desarrollar cáncer cervical en la población de estudio. Estos datos contribuyen a comprender las bases biológicas de la incidencia de cáncer cervical en la región, identificar marcadores genéticos para una mejor definición de los grupos de riesgo en la era de la vacuna y generar en el ámbito local una base de datos de secuencias que contribuya al diseño de nuevos fármacos en la terapia contra el cáncer asociado al VPH16. Human Papillomavirus (HPV) is the primary risk factor for developing cervical cancer, particularly HPV type 16. Cervical cancer is the third most common cancer among women worldwide and the fourth most common cancer among women in Argentina. Misiones province is considered to be a region with a high prevalence of HPV infection and mortality rate of cervical carcinoma. Due to this epidemiological scenario, HPV16 has become the target of commercial vaccines and justifies viral genetic studies. According to variation described in its genomes, HPV16 is classified into 4 lineages: A, B, C and D, which in epidemiological studies exhibited different geographic distribution and oncogenic potential. In this context, we focused in the variability of HPV16 LCR and the 3 viral genes (E6, E7 and L1) regarding to their association as risk markers for the development of cervix lesions and cervical cancer progression in women residing in Posadas city (Misiones, Argentina). To achieve this objective, a population of 160 women with a positive test for HPV16 infection and a cytological diagnosis of NLIM, LSIL and HSIL/CC was studied. Genetic characterization of LCR and E6, E7 and L1 genes was performed by PCR amplification and direct Sanger sequencing method. The phylogenetic classification was carried out using Bayesian methods. Association between genetic variants and risk of cervical cancer, was estimated through odds ratio (OR) calculation. Sequences were translated into proteins, and protein variants were analyzed in silico to understand their association with their main cell targets. Diagnostic polymorphisms and phylogenetic trees confirmed the presence of the lineage A (90.2%) and D (7.3%) in the population, similar to other percentages found in Argentina. HPV variants from lineage D were more frequently found in women with H-SIL+ than those from lineage A, at an OR of 13.8 (CI 95% = 1.6–117.0). Thirty six different sequences were identified for L1 gene, being the most common the lineage A L1 6434G (35.6%). A6434G polymorphism did not show association with progression to HSIL/CC [OR= 1.54 (0.45 – 5.2)]. Regarding the E6 gene, eleven different sequences were identified, and the most frequent variant was lineage A E6 350G (58.9%). T350G polymorphism was associated with progression to HSIL/CC, with OR of 19.41 (4.95 - 76.10). Five different sequences were identified for the E7 gene, but only two had nonsynonymous changes. Due to its low frequency, association studies for this gene could not be established. Translation of frequent SNPs indicated a change from Threonine to Alanine at position 266 of L1 (L1 266A) and a change from Lysine to Valine at position 83 of E6 gene (E6 83V). Protein structure showed that L1 266A is found in the surface loops of the antigenic epitope and is involved in the interaction with heparan sulfate during the infection process. On the other hand, the analysis of E6 protein indicated that residue 83 is close to the binding site with the e6ap ubiquitin kinase protein, although it would not participate directly in these interactions, this
substitution would not induce changes in the tertiary structure of the protein, but could provide some flexibility and increase the binding affinity of E6 for the e6ap and other proteins with LxxLL motifs. Finally, none of the E7 SNPs were involved in essential contacts with pRb or the formation of the dimeric structure of E7, which would be fundamental for the in vivo function of the protein. This conservation of E7 is probably due to functional limitations of this small protein. Results confirmed the association of Lineage D and the E6 350G variant with an increased risk of developing cervical cancer in the study population. This data contributes to understand the biological bases of cervical cancer incidence in this region, to identify genetic markers for a better definition of risk groups in the vaccine era, and to generate locally a database of sequences in order to design new drugs for therapy against HPV16-associated cancer.
Collections
- Doctorado [59]
The following license files are associated with this item: