Logotipo de Zephyrnet

Análisis de la calidad de la vacuna de ARNm mediante secuenciación de ARN – Nature Communications

Fecha:

Diseño y síntesis de plásmido de referencia.

Primero se diseñó una construcción de referencia, con la intención de optimizar la producción de terapias de ARN para la investigación preclínica. La secuencia codificante de eGFP.30 fue seleccionado como indicador en la región codificante, ya que su producto proteico se puede analizar simplemente mediante citometría de flujo y otros métodos fluorométricos. La transcripción se inicia utilizando un promotor T7 modificado (5'-TAATACGACTCACTATAAGG-3'), que es compatible con reactivos CleanCap AG (TriLink BioTechnologies) para la protección cotranscripcional durante la IVT de ARNm, y las secuencias UTR 5' y 3' se seleccionaron de Alfa globina humana y AES-mtRNR1 respectivamente, debido a su efecto demostrado sobre la estabilidad y expresión del ARNm31,32,33. Se seleccionó una cola poli(A) segmentada de 126 nt, ya que se predijo que reduciría la aparición de recombinación de plásmidos en E. coli durante la propagación y clonación de plásmidos, sin comprometer la vida media del ARNm y la eficiencia de la traducción en células de mamíferos17. Nuestra construcción fue sintetizada y clonada en una columna vertebral de pUC57-Kan (GenScript), que contiene un origen de replicación y un gen de resistencia a kanamicina.

El ADN plasmídico se transformó mediante choque térmico en NEB Stable competente E. coli células (NEB, C3040H). Luego se amplificó una única colonia que contenía el plásmido en medio LB con 30 µg/ml de kanamicina. E. coli Se recogió de 2500 ml de cultivo mediante centrifugación y se lisó mediante lisis alcalina. Luego, el ADN plasmídico superenrollado se purificó mediante purificación por FPLC de varios pasos, primero mediante cromatografía de intercambio aniónico y luego mediante una columna de desalinización, donde el tampón se intercambió por TE. Se linealizó un mg de ADN plasmídico superenrollado utilizando la enzima de restricción Bsal-HFv2 (NEB, R3733), generando un único fragmento que termina en el extremo de la cola poli(A). Esta linealización garantiza la transcripción in vitro, terminando inmediatamente en 3' con respecto a la cola poli(A). Después de la linealización, el ADN plasmídico se purificó adicionalmente con cromatografía de interacción hidrófoba (HIC). El ADN plasmídico linealizado se diluyó con 3 volúmenes de sulfato de amonio 4 M y luego se purificó usando HIC para eliminar otras isoformas de ADN plasmídico. Las fracciones reunidas correspondientes al ADN plasmídico lineal se intercambiaron con tampón TE en una columna de desalinización para eliminar el sulfato de amonio. El ADN plasmídico lineal purificado se concentró usando precipitación con isopropanol hasta una concentración aproximada de 500 ng/μl.

Evaluamos la longitud y la pureza de nuestra plantilla de plásmido linealizado utilizando una variedad de métodos analíticos diferentes. En primer lugar, se comparó la distribución de tamaños del plásmido linealizado con el plásmido superenrollado utilizando electroforesis en gel de agarosa. Esto permite el análisis de la proporción de plásmidos linealizados en la preparación. En segundo lugar, se analizó mediante HPLC la pureza del ADN plasmídico superenrollado y linealizado utilizando un CIMac™. El pDNA se analizó en una columna de intercambio aniónico débil de dietil-aminoetilo (DEAE) de 0.3 ml (1.4 mm) (BIA Separations, Adjovščina, Eslovenia) conectada a un sistema de HPLC analítico PATfix® (Sartorius, Goettingen, Alemania). La HPLC se realizó utilizando el tampón A de fase móvil (Tris 0.1 M, guanidina-HCl 0.3 M, Tween-1 al 20 % (p/v), pH 8.0) y el tampón B (Tris 0.1 M, guanidina-HCl 0.3 M, NaCl 0.7 M). , 1 % de Tween-20 (p/v), pH 8.0).

Secuenciación de plásmidos Oxford Nanopore

Se utilizó la secuenciación Oxford Nanopore para medir la precisión y pureza de las preparaciones de plantillas de plásmidos. Se prepararon bibliotecas de secuenciación de ligación (SQK-LSK109) a partir de plantillas de plásmidos linealizados (descritas anteriormente) y se marcaron con códigos de barras nativos libres de PCR (EXP-NBD104). Las bibliotecas se prepararon según las instrucciones del fabricante (Oxford Nanopore Technologies), con la excepción de que se utilizaron 2 µg de plantilla como entrada en lugar de 1 µg recomendado. Las bibliotecas resultantes se cuantificaron en un instrumento Qubit (Invitrogen) con el kit dsDNA HS y el análisis cualitativo de la distribución de la longitud de los fragmentos se completó con D5000 ScreenTapes (Agilent Technologies, EE. UU.). Los resultados de los análisis cuantitativos y cualitativos se utilizaron para calcular las concentraciones de biblioteca requeridas para la agrupación y la carga. Las bibliotecas con códigos de barras se secuenciaron en R9.4.1 (FLO-MIN106D) o en Flongle Flow Cells, con llamadas de base en vivo de alta precisión habilitadas (Guppy v5.1.13 y MinKNOW Core 4.5.4). Todas las lecturas de nanoporos con puntuaciones de calidad> 9 se utilizaron para formar un archivo FASTQ concatenado y se procedió a un análisis adicional.

Análisis bioinformático de la secuenciación de plásmidos Oxford Nanopore.

En primer lugar, se eliminaron los códigos de barras con Porechop v0.2.4 Oxford Nanopore. Los datos de secuenciación de pDNA se mapearon y analizaron utilizando una canalización personalizada. Las lecturas FASTQ concatenadas y filtradas por calidad se alinearon con la referencia del plásmido a través de Minimap2 (versión 2.20-r1064) con -ax map-ont para Nanopore34. Los archivos de alineación SAM resultantes se procesaron a través de SAMtools v1.15 para generar archivos BAM ordenados e indexados, así como varios otros archivos de análisis de mapeo.35. Los archivos BAM generados se vieron y analizaron utilizando Integrative Genomics Viewer (IGV v2.12.3)36. Se adquirieron más estadísticas de calidad de ejecución y muestra a través de NanoPlot v1.38.1 y pycoQC v v2.5.237,38.

El perfil de error por nucleótido de las lecturas mapeadas se determinó en relación con la secuencia del índice de referencia utilizando pysamstats v 1.1.2 con opciones –max-profundidad=300000000 –FASTA –variación de tipo (https://github.com/alimanfoo/pysamstats). Para realizar una corrección de errores simple, el perfil de error por nucleótido de las secuencias de plásmido se restó de los nucleótidos correspondientes dentro de las secuencias de ADNc/ARNd. Los gráficos y los análisis estadísticos se realizaron utilizando el software Excel (v 16.67 para Mac) y GraphPad Prism (v 9.3.1 para Mac).

Para investigar el contenido de las lecturas no asignadas en busca de posible contaminación, se generó un archivo BAM para lecturas no asignadas a través de SAMtools (v1.15) utilizando SAMtools view -S -b -f 4 y esto se convirtió en un archivo FASTA a través de SAMtools FASTA. Este archivo FASTA fue alineado con un la E.coli La secuencia de referencia utiliza Minimap2, luego los archivos BAM ordenados e indexados y las estadísticas de alineación se generaron con SAMtools como se describió anteriormente. Homología de secuencia de las lecturas que no se alinearon con el la E.coli La referencia se investigó utilizando la colección de nucleótidos nr/nt de la herramienta básica de búsqueda de alineación local (BLAST) proporcionada por el Centro Nacional de Información Biotecnológica.

La llamada de variantes y la generación de secuencias de consenso se completaron utilizando bcftools (v1.15)35 con el siguiente conjunto de comandos comparando el archivo BAM con la referencia y generando un VCF; bcftools compilar -d 300000000 –no-BAQ –min-BQ 0 -Ou -f | bcftools llama -c -M –ploidy 1 -Oz -o *.vcf.gz. El VCF resultante se indexó y normalizó con respecto a la referencia y se generó un BCF. Se generó una secuencia consenso.fa después de comparar el VCF con la secuencia de referencia con el comando bcftools consenso y la opción -a – para reemplazar las posiciones ausentes del VCF (cobertura cero) con un carácter.

Secuenciación del ADN del plásmido Illumina

A continuación se secuenciaron plantillas de ADN plasmídico en un instrumento Illumina MiSeq. Se prepararon bibliotecas libres de PCR de ADN de Illumina con código de barras a partir de la misma plantilla de plásmido linealizado utilizada para la secuenciación de ONT, de acuerdo con las instrucciones del fabricante (Illumina). Las bibliotecas resultantes se secuenciaron en un instrumento MiSeq en el Centro Australiano de Investigación del Genoma utilizando química v2, configurada en un extremo de 150 pares de bases.

Los archivos BCL generados en Illumina MiSeq se procesaron con la canalización Illumina DRAGEN BCL Convert 07.021.609.3.9.3 para generar archivos FASTQ.gz. La calidad de las lecturas dentro de estos archivos se verificó con FastQC (v0.11.9). Luego, las lecturas se adaptaron y se recortó la calidad utilizando TrimGalore (v0.6.8dev) para crear archivos FASTQ.gz con lecturas que superan el umbral Q20.39. Los adaptadores se recortaron de las bibliotecas Illumina PCR-Free utilizando –stranded_illumina –paired. Además, se eliminaron los excedentes de T de las bibliotecas de ARNm trenzado de Illumina usando –clip_r1 1 –clip_r2 1. Los archivos recortados resultantes se verificaron con FastQC y luego se alinearon con un archivo de referencia de plásmido indexado.40 utilizando BWA-MEM (bwa-0.7.17-r1188).

Transcripción in vitro de ARNm.

Se produjo ARNm protegido con nucleótidos modificados mediante transcripción in vitro (IVT) utilizando ARN polimerasa T7 siguiendo los protocolos descritos en Henderson et al.41 y según las instrucciones del fabricante (NEB, E2080S). Brevemente, se usaron 50 µg/ml de ADN plasmídico lineal purificado como plantilla para una reacción IVT a 32 °C durante 3 h con 16 µg/ml de ARN polimerasa T7 (NEB M0251), ribonucleótidos (ATP 6 mM, CTP 5 mM, CTP 5 mM, GTP; NEB, N0450), N5-metilpseudouridina-1'-trifosfato 5 mM (TriLink BioTechnologies, TRN108110) o UTP 5 mM para controles no modificados emparejados, tampón de transcripción (Tris·HCl 40 mM, pH 8.0, acetato de magnesio 16.5 mM, 10 ditiotreitol mM (DTT), espermidina 20 mM, Triton X-0.002 al 100 % (v/v), pirofosfatasa inorgánica de levadura 2 U/mL (NEB, M2403) y inhibidor de RNasa murina 1000 U/mL (NEB, M0314). El análogo de Cap1 se incorporó cotranscripcionalmente al extremo 5' del ARNm mediante la adición de reactivos CleanCap AG 4 mM (TriLink, TRN711310) a la reacción. La reacción de ARNm IVT se detuvo mediante la adición de 200 unidades de ADNasaI (NEB, M0303) por ml de reacción IVT y la incubación a 37 °C durante 15 minutos. Los ARNm resultantes se purificaron utilizando kits de limpieza de ARN Monarch (NEB, T2050) según las instrucciones del fabricante con la elución final en agua destilada ultrapura (ThermoFisher Scientific, 10977015).

Evaluamos el rendimiento, la longitud y la pureza de los ARNm de IVT utilizando una variedad de métodos analíticos diferentes. El ARNm se cuantificó mediante análisis de espectrofotometría UV utilizando un NanoPhotometer N120 (Implen) y la distribución de tamaños se evaluó mediante electroforesis TapeStation con RNA ScreenTapes (Agilent Technologies, EE. UU., 5067-5576).

Detección de contaminantes de ARNbc mediante análisis de transferencia puntual.

Las muestras de ARNm de IVT se diluyeron en agua libre de nucleasas hasta concentraciones finales de 200, 500, 1000 y 2000 ng/μl. De las muestras diluidas, se cargaron alícuotas de 5 μl en una membrana de nailon cargada positivamente (Roche, Basilea, Suiza), lo que dio como resultado una cantidad de carga total de 1000, 2500, 5000 y 10,000 XNUMX ng de muestras de ARNm de IVT en cada transferencia, respectivamente. dsRNA fue fabricado internamente42 como control positivo y agua libre de nucleasas como control negativo. Las muestras se cargaron en un aparato de microfiltración Bio-Dot® (Bio-Rad, CA, EE. UU.) según las instrucciones del fabricante. La membrana se secó al aire, luego se bloqueó mediante inmersión y se incubó con tampón de bloqueo que contenía 5% de leche en polvo descremada en TBS-T (Tris-HCl 50 mM, NaCl 150 mM, Tween al 0.05% (p/v)) a temperatura ambiente. durante 1 hora con agitación.

Para la detección de ARNbc, la membrana se incubó durante la noche a 4 ° C con dos anticuerpos monoclonales murinos (mAb) específicos de ARNbc diferentes, que se derivaron de los clones 3G1 y 2G4 (Mozzy Mabs, Brisbane, Australia). Ambos anticuerpos se incubaron por separado durante la noche a una dilución 1:5, diluidos en tampón de incubación (leche en polvo desnatada al 1% en TBS-T). Luego, las membranas se enjuagaron 3 veces y luego se lavaron 3 veces durante 15 minutos en cada lavado con TBS-T. Luego, las membranas se incubaron con anticuerpo secundario de inmunoglobulina G (IgG) anti-ratón de cabra conjugado con peroxidasa de rábano picante (HRP) (Abclonal, MA, EE. UU.) a una dilución de 1: 5000, diluido en tampón de incubación, durante 1 h con agitación. Luego, las membranas se enjuagaron 3 veces y luego se lavaron 3 veces durante 15 minutos en cada lavado. La detección de quimioluminiscencia se realizó utilizando el kit de sustrato quimioluminiscente Novex™ ECL (Invitrogen, MA, EE. UU.) y las intensidades de señal de los puntos se visualizaron utilizando el sistema de imágenes ChemiDoc MP (Bio-Rad, CA, EE. UU.).

Secuenciación de ADNc-PCR de ONT

Se utilizó la secuenciación de ADNc-PCR para determinar la precisión y pureza de los ARNm de IVT. Primero, la concentración de ARNm se calculó utilizando el kit Qubit RNA BR (ThermoFisher Scientific). Los ARNm se diluyeron en agua libre de nucleasas hasta una concentración adecuada para la preparación de la biblioteca (~1 ng/μl) y las concentraciones se confirmaron utilizando un kit Qubit RNA HS (ThermoFisher). Se prepararon bibliotecas de ADNc-PCR de ONT con código de barras (SQK-PCB109 y SQK-PCS111) de acuerdo con las instrucciones del fabricante (Oxford Nanopore Technologies), con las siguientes excepciones. La evaporación durante el paso de síntesis de ADNc se evaluó midiendo el volumen de reacción y los tubos se llenaron con agua libre de nucleasas cuando correspondía. El ADNc se amplificó durante 14 a 16 ciclos (la recomendación es de 14 a 18 ciclos). Finalmente, las bibliotecas se eluyeron en 8 µl de tampón de elución (en lugar del volumen recomendado de 12 µl) para aumentar las concentraciones finales de las bibliotecas. Esto era necesario, ya que las bibliotecas preparadas con plantillas que contienen bases modificadas parecen producir bibliotecas con un rendimiento menor que las preparadas con bases no modificadas.

Las bibliotecas resultantes se cuantificaron mediante un instrumento Qubit (Invitrogen) con el kit dsDNA HS (ThermoFisher Scientific) y se realizó un análisis cualitativo de la distribución de la longitud de los fragmentos utilizando D5000 ScreenTapes (Agilent Technologies, EE. UU.). Los resultados del análisis cuantitativo y cualitativo se utilizaron para ajustar las concentraciones de la biblioteca para la agrupación y la carga. Se secuenciaron hasta 10 bibliotecas de códigos de barras en cada celda de flujo R9.4.1 (FLO-MIN106D), con llamadas de base en vivo de alta precisión habilitadas (Guppy v5.1.13 y MinKNOW Core 4.5.4). Todas las lecturas de nanoporos con una puntuación de calidad> 9 se asignaron según se aprobaron y se procedió a un análisis adicional.

Análisis bioinformático de la secuenciación de ADNc-PCR de ONT.

Los datos de ADNc-PCR se analizaron como se describe para la secuenciación de ADNp de ONT (ver arriba). Además, se realizaron los siguientes análisis. Para identificar transcripciones FASTQ completas que contienen cebadores SSP y VNP en la orientación correcta, se utilizó la herramienta pychopper (v.2.5.0) (con parámetros predeterminados). Luego se recortaron estos adaptadores y se generaron nuevos archivos FASTQ. Las lecturas recortadas de las carpetas rescatadas y completas se fusionaron y estas lecturas se asignaron como se describe anteriormente con Minimap2 a la referencia del plásmido. También se generaron archivos BAM como se describió anteriormente y se usaron para el análisis de las longitudes de lectura del ADNc. Se utilizó SAMtools (v1.15) que utiliza la vista SAMtools -F 2048 para extraer distribuciones de longitud de lectura de las lecturas alineadas primarias de los archivos BAM. Los gráficos y los análisis estadísticos se realizaron utilizando el software GraphPad Prism (v9.4.1 para Mac) para crear perfiles de distribución de longitud de lectura para cada muestra.

A continuación, analizamos la proporción de lecturas objetivo de nuestro conjunto de datos de ADNc-PCR (es decir, lecturas que se transcribieron correctamente y que probablemente se traduzcan en una proteína funcional). Primero, se utilizó BEDtools (v2.27.1) intersect para analizar los archivos BAM ordenados e identificar las proporciones de lecturas dentro y fuera del objetivo. Se generaron archivos BED, que indican las coordenadas del objetivo que incluyen el inicio de la secuencia de Kozak y el final de la UTR 3'. Las lecturas se agruparon como en el objetivo y se generó un archivo BAM si se superponían las coordenadas de inicio y parada; todas las demás lecturas se agruparon como fuera del objetivo. Las lecturas fuera del objetivo se filtraron aún más según la superposición de coordenadas de inicio o parada, lo que indica una degradación de 3' o 5'. Los archivos BAM generados se vieron y analizaron utilizando Integrative Genomics Viewer (IGV v2.12.3).

La llamada de variantes y la generación de secuencias de consenso de la región codificante de ARNm se completaron como se describió anteriormente, excepto que también utiliza la opción –objetivos para restringir la acumulación a las coordenadas de inicio y parada especificadas anteriormente.

Cálculo de la longitud de la cola de poli (A) mediante secuenciación de ADNc-PCR de ONT

La longitud de la cola de poli(A) se estimó a partir de datos de ADNc-PCR (SQK PCS111) que ancla el cebador oligo dT al extremo 3', y utilizando buscador de cola (v1.3) utilizando protocolos descritos en Kraus et al.21. Brevemente, se ingresan archivos FAST5 no alineados, que luego se segmentan en el adaptador de secuenciación, el adaptador de férula, la cola poli(A) y el cuerpo del gen. Luego se calcula la longitud de la cola de poli(A) basándose en estimaciones del tiempo de translocación de los poros. La longitud de la cola de Poly(A) se estimó a partir de archivos Fast5 generados a partir del kit de ADNc-PCR original (SQK PCB109) y la versión actualizada (SQK PCS111). Aquí, los archivos Fast5 de ambos kits se llamaron base con alta precisión utilizando la siguiente configuración dna_r9.4.1_450bps_hac.cfg (Guppy v5.1.13 y MinKNOW Core 4.5.4). Entonces, la función find_tails de buscador de cola (v1.3) se ejecutó usando la configuración predeterminada21. Los archivos Fast5 generados a partir del kit SQK PCB109 requerían la especificación de los detalles del cebador personalizado de ADNc 5' (TTTCTGTTGGTGCTGATATTGCT) y 3' (ACTTGCCTGTCGCTCTATCTTC) para permitir la estimación.

Secuenciación del ADNc de Illumina

Se prepararon bibliotecas de ARNm de cadena de Illumina con código de barras a partir de las mismas plantillas de ARNm de IVT utilizadas para la secuenciación de ONT, de acuerdo con las instrucciones del fabricante (Illumina). Las bibliotecas resultantes se multiplexaron con las bibliotecas de ADN plasmídico y se secuenciaron en un instrumento MiSeq en el Centro Australiano de Investigación del Genoma utilizando química v2, configurada en un extremo de 150 bases pareadas. El recorte y el mapeo de nuestros datos de secuenciación de ADNc de Illumina siguieron el proceso descrito para la secuenciación de ADNp de Illumina (ver arriba).

La generación de estadísticas de mapeo, cálculos de errores por nucleótido, llamadas de variantes, generación de secuencias de consenso y análisis de lecturas no mapeadas se realizaron como se describió anteriormente para la secuenciación ONT. Para las muestras secuenciadas en la plataforma Illumina, las lecturas dentro y fuera del objetivo se calcularon mediante un método diferente debido a la corta duración de las lecturas. Se utilizó SAMtools (v1.15) con el comando SAMtools view (varias coordenadas) para extraer lecturas en sentido descendente y ascendente de la región de codificación de ARNm de la referencia y generar los archivos BAM correspondientes. Se utilizó SAMtools flagstat para contar las lecturas primarias contenidas en estos archivos BAM y este número se comparó con el total de lecturas primarias para calcular los números de lectura objetivo.

Para identificar lecturas antisentido utilizamos la vista SAMtools para separar las lecturas que se originaron en la cadena directa (la segunda en el par de la cadena delantera, -b -f 128 -F 16 y la primera en el par de la cadena inversa, -b -f 80) o en la cadena inversa. (segundo en par si se asignan a la cadena inversa, -b -f 144 y primero en par si se asignan a la cadena delantera, -b -f 64 -F 16). Las lecturas que se originan en la cadena inversa se denominaron lecturas antisentido.

Protocolo de poliadenilación modificado

Para detectar fragmentos que carecen de una cola poli(A) en nuestros ARN sintéticos, agregamos enzimáticamente colas poli(A) a nuestro ARNm de eGFP. Este se preparó según un protocolo Oxford Nanopore, utilizando E. coli Poli(A) polimerasa. Brevemente, se incubaron hasta 10 µg de ARN con NEB E. coli Poli(A) polimerasa (M0276) y ATP 1 mM durante 1.5 min. La reacción se detuvo usando EDTA (hasta una concentración final de 10 mM), obteniendo un volumen final de 25 µL. Luego se limpió el ARN de cola poli(A) utilizando 72 µl de perlas Agencourt RNAClean XP (Beckman Coulter A63987) y se eluyó en 12 µl de agua libre de nucleasas. Luego, el eluato se cuantificó utilizando los kits Qubit BR o HS RNA (dependiendo de la cantidad de ARN que se introdujo en la reacción). Luego se usó una cantidad adecuada de ARN como plantilla para la preparación de la biblioteca SQK-PCB109 o SQK-RNA002. Las bibliotecas se prepararon y secuenciaron como se describe anteriormente.

Secuenciación directa de ARN con Oxford Nanopore

Se utilizó la secuenciación directa de ARN para determinar la precisión y pureza de los ARNm de IVT. Las bibliotecas se prepararon utilizando el kit ONT SQK-RNA002 según las instrucciones del fabricante (Oxford Nanopore Technologies), con las siguientes excepciones. En primer lugar, se utilizaron 400 ng de plantilla para preparar cada biblioteca, en lugar de los 500 o 50 ng recomendados en los protocolos de secuenciación directa de ARN de ONT. Utilizamos el paso de síntesis de ADNc, que mejora la estabilidad de la plantilla. Además, utilizamos Superscript IV, en lugar del Superscript III recomendado, debido a su mayor eficiencia. Las bibliotecas se cuantificaron utilizando un kit Qubit RNA BR (ThermoFisher Scientific). Cada biblioteca se secuenció en una celda de flujo R9.4.1 (FLO-MIN106D) separada durante 72 h. Posteriormente, los archivos Fast5 se llamaron base con alta precisión utilizando la siguiente configuración rna_r9.4.1_70bps_hac.cfg (Guppy v5.1.13). Todas las lecturas de nanoporos con una puntuación de calidad> 9 se asignaron según se aprobaron y se procedió a un análisis adicional. Los datos de secuenciación directa de ARN se analizaron como para el ADNc, con la excepción de la detección de códigos de barras utilizando Pychopper y los cálculos de detección dentro y fuera del objetivo. Además, los cálculos de la longitud de la cola de poli(A) se realizaron como se describe para las bibliotecas SQK PCS111 (arriba).

A continuación, se estimó la longitud de la cola de poli(A) a partir de datos de secuenciación directa de ARN (SQK-RNA002). La longitud de la cola de Poly(A) se estimó utilizando buscador de cola (v1.3), utilizando protocolos descritos en Kraus et al.21. buscador de cola (v1.3) utiliza los archivos Fast5 para estimar la longitud de la cola y esta herramienta se ejecutó inicialmente en el mismo conjunto de datos de ARN directo que Nanopolish v0.13.3 poli(A). Después de comparar la longitud estimada de la cola del poli(A), se analizaron más muestras. buscador de cola se ejecutó con la configuración predeterminada, generando un archivo.tsv como salida. Este archivo.tsv se interrogó con un script R personalizado que generó un gráfico de densidad de la longitud estimada de la cola de poli(A) para cada lectura.

Estadística y reproducibilidad

Los datos descritos en este documento son predominantemente una prueba de concepto y van desde n = 1 a n = 4. Los detalles sobre la replicación experimental se incluyen en las secciones de resultados individuales. No se utilizó ningún método estadístico para predeterminar el tamaño de la muestra. No se excluyeron datos de los análisis. Los experimentos no fueron aleatorios, ya que la calidad de la plantilla es el determinante más importante de la calidad de la secuenciación, más que cualquier covariante alternativa. Los investigadores no estaban cegados a la asignación durante los experimentos y la evaluación de resultados, ya que era poco probable que el conocimiento de la identidad de la muestra sesgara la interpretación de los resultados.

Resumen de informes

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de la cartera de naturaleza vinculado a este artículo.

punto_img

Información más reciente

punto_img