Logotipo de Zephyrnet

¿Se puede utilizar ChatGPT para realizar investigaciones médicas? – Regenexx

Fecha:

Si lee este blog regularmente, sabrá que soy un gran admirador de la IA y predigo que cambiará la ciencia y la medicina para mejor. Sin embargo, a medida que ChatCPT comenzó a enfocarse en los últimos meses, varios colegas afirmaron que ahora puede usarlo para realizar investigaciones médicas en línea y generar texto para trabajos de investigación médica. Por lo tanto, probé esto, pero los resultados que obtuve fueron inicialmente preocupantes y, eventualmente, posiblemente prometedores, pero un análisis posterior mostró que estaba siendo peligrosamente engañado. Profundicemos en este tema.

Robots de IA

ChatGPT es un proyecto iniciado por OpenAI. Google Bard es una versión del mismo concepto. Básicamente, utiliza grandes redes neuronales alimentadas con fragmentos seleccionados de Internet. Estas máquinas intentan adivinar lo que sigue a medida que los humanos clasifican las respuestas. Las respuestas correctas fortalecen ciertas conexiones neuronales en el software y debilitan las incorrectas.

Ambas herramientas están un poco promocionadas en este momento, pero a medida que evolucionan, no hay duda de que poder hacer que una IA haga el trabajo duro de investigar la literatura médica ayudará a que la medicina avance más rápidamente. Por ejemplo, si un bot de IA puede buscar con precisión la literatura médica y sacar conclusiones de docenas o cientos de referencias y citar referencias sobre cómo llegó a esa conclusión, los científicos podrán ver las conexiones entre las cosas en segundos en lugar de semanas de búsqueda.

Encuentre una ubicación de Regenexx cerca de usted

94 clínicas que ofrecen soluciones Regenexx no quirúrgicas para el dolor musculoesquelético.

94 clínicas que ofrecen soluciones Regenexx no quirúrgicas para el dolor musculoesquelético.

Encontrar una ubicación

Colegas que usan IA para escribir

Varios colegas afirman que ahora usan ChatGPT para ayudar a escribir introducciones para artículos o investigar varios temas. Uno afirmó que esto fue transformador y le ahorró mucho tiempo. Por lo tanto, pensé que era hora de darle una oportunidad.

Mi búsqueda de investigación médica de IA

He notado que en algunos de mis pacientes jóvenes con CCI hay evidencia de osteofitos (espolones óseos) en la unión craneocervical. Dado que, según mi experiencia médica, esto sería raro de ver; Quería investigar con qué frecuencia esto se informa en adultos jóvenes normales. Lo que significa que si rara vez se ve en personas sanas en estudios de investigación dedicados, entonces es otro signo de inestabilidad, ya que sabemos que se forman espolones óseos en esa condición de la columna. Si es más común de lo que pensaba, entonces tal vez sea solo un hallazgo aleatorio en mis pacientes y no causado por su inestabilidad craneocervical.

Mi primera inmersión profunda fue observar esta prevalencia en la unión craneocervical. Rechacé las búsquedas iniciales en PubMed y Google, seguí el consejo de mi colega y usé ChapGPT y Bard. Eso resultó inútil, probablemente porque hay muchos términos para los niveles craneocervicales. Lo que significa que puede llamar a esto la unión craneocervical, atalontoaxial, atlantodental, atlantoodontoides, etc. Lo mal que estos servicios se desempeñaron con esta solicitud sin duda despertó mi interés, así que decidí limitar mi búsqueda a un nivel espinal en C2-C3 y comparar y contrastar los resultados. .

La pregunta, que formulé de varias maneras diferentes, era simple. Escriba un artículo científico breve sobre la prevalencia de espolones óseos (osteofitos) en C2-C3 en comparación con otros niveles del cuello.

Después de décadas de leer la literatura médica, leer miles de resonancias magnéticas y tomografías computarizadas de la columna cervical y media vida de ser médico, sé que la respuesta correcta es que hay muchos menos espolones óseos en la parte superior del cuello en C2- C3 en comparación con los niveles cervicales inferiores (como C5-C6, por ejemplo, donde son comunes en la mediana edad).

Primero probé Google Bard:

Lo que obtuve fue muy peligroso. ¿Por qué? Bard creó una tabla completa que parecía autorizada que comparaba la prevalencia de osteofitos en varios niveles de la columna. Como puede ver arriba, en C2-C3, fijó la prevalencia en un 40 %, que fue más alto que el porcentaje informado para C5-C6, el nivel más probable en la columna vertebral en el que se encuentran espolones óseos. Por lo que puedo decir, compuso esta tabla o extrajo estos números de alguna fuente aleatoria fuera de contexto.

El siguiente fue ChatGPT:

Esto no es peligroso, pero es solo un párrafo de basura sin sentido regurgitado en la página. Hace referencia a un estudio que ni siquiera incluía el nivel sobre el que se preguntó, que era C2-C3.

Luego, volví a Bard y reformulé mi pregunta pidiéndole que incluyera referencias científicas:

Aquí obtuve tres estudios, uno en punto (resaltado arriba) y dos que no tenían nada que ver con mi pregunta. Estos dos se centraron en cómo los osteofitos C2-C3 afectan la deglución. Así que diría que esto es quizás un poco mejor que una simple búsqueda en Google porque encontré un nuevo estudio para leer.

Finalmente, volví a ChatGPT después de actualizar de la antigua versión 3.5 a la nueva 4.0. Esto es lo que recuperé:

El primer párrafo que destaqué cita un estudio que nunca analizó el nivel C2-C3 y llegó a la conclusión de que este nivel tenía menos osteofitos sin evidencia citada. La buena noticia es que la conjetura es correcta, pero ChatGPT no puede hacer referencia a cómo llegó allí. El segundo párrafo es simplemente extraño porque incluye un estudio de caballos. Eso puede tener algún sentido, ya que nunca le dije que incluyera solo humanos. Luego, le pregunté a ChatGPT 4 sobre la prevalencia relativa y me aseguré de que supiera que solo estaba hablando de humanos. Aquí está el resultado:

Eso eliminó el estudio de caballos y, de nuevo, adivinó la respuesta correcta, y al menos ahora reconoció que no tenía las citas de investigación sobre la prevalencia de osteofitos en el nivel C2-C3.

Luego volví a Bard y le hice la misma pregunta que había hecho antes: “¿Qué tan comunes son los osteofitos C2-C3 en relación con otros niveles cervicales? Incluir referencias científicas.” Al igual que la segunda respuesta de ChatCPT 4, fue mucho mejor:

Esta respuesta de Bard es lo que hubiera esperado que regresara un compañero al que se le asignó esta tarea. Sin embargo, estas referencias que Bard citó, por lo que puedo decir, ¡no existen! Parecen estar completamente inventados. 

¿Por qué ambos servicios de IA mejoraron con preguntas repetidas? ¿Podría ser que fui el único ser humano en la tierra en hacer esta pregunta desde que se crearon estas herramientas de IA? Eso es posible ya que la experiencia en CCI se limita a menos de una docena de personas en todo el mundo. Mi mejor conjetura es que ambos estaban aprendiendo cuando hice estas preguntas similares. Bard parece haberse dado cuenta más rápido que ChatGPT 4, pero como se mencionó anteriormente, llegó allí mediante la fabricación de citas de investigación.

Únase a nosotros para un seminario web gratuito de Regenexx.

Lo bueno, lo malo y lo feo

Al final, las respuestas son terriblemente malas. Por ejemplo, si un paciente o un médico joven hubiera seguido la tabla afirmando que la prevalencia de espolones óseos en C2-C3 era del 40 % y disminuía a medida que se bajaba del cuello a niveles cervicales más bajos, eso habría sido una desinformación retrógrada. O si confió en las referencias en la respuesta final de Bard, habría confiado en información que no existe. Por lo tanto, no confiaría en ninguno de los dos servicios para realizar investigaciones médicas.

¿El resultado? Estas serán fantásticas herramientas de investigación médica a medida que evolucionen en los próximos años. Esto aumentará el ritmo de la innovación médica a medida que estos servicios sean más precisos que los humanos y puedan clasificar cientos de trabajos de investigación médica para sacar conclusiones precisas en segundos. Sin embargo, sería muy cauteloso al usarlos para investigar algo médico.

Dr. Chris Centeno es especialista en medicina regenerativa y en el nuevo campo de la Ortopedia Intervencionista. Centeno fue pionera en los procedimientos ortopédicos con células madre en 2005 y es responsable de gran parte de las investigaciones publicadas sobre el uso de células madre para aplicaciones ortopédicas.
Ver Perfil

Si tiene preguntas o comentarios sobre esta publicación de blog, envíenos un correo electrónico a GME@dhr-rgv.com

NOTA: Esta publicación de blog proporciona información general para ayudar al lector a comprender mejor la medicina regenerativa, la salud musculoesquelética y temas relacionados. Todo el contenido proporcionado en este blog, sitio web o cualquier material vinculado, incluidos texto, gráficos, imágenes, perfiles de pacientes, resultados e información, no está destinado y no debe considerarse ni utilizarse como un sustituto del consejo, diagnóstico o tratamiento médico. . Siempre consulte con un proveedor de atención médica profesional y certificado para analizar si un tratamiento es adecuado para usted.

Actualizaciones de Regenexx en su bandeja de entrada

Únase a nuestro boletín gratuito.

Únase al boletín de Regenexx

Suscribete al Blog

punto_img

Información más reciente

punto_img