OpenAI, la empresa detrás de ChatGPT, presentó HealthBench, un nuevo estándar para medir el desempeño de la inteligencia artificial en el sector salud. Para desarrollarlo, trabajó junto a 262 médicos de 60 países, que crearon 5.000 conversaciones con rúbricas personalizadas para evaluar la calidad y precisión de las respuestas de los modelos.
Según la empresa, este nuevo parámetro apunta a que los sistemas de IA en salud cumplan con tres condiciones clave:
- Que sean útiles: deben funcionar con eficacia en escenarios clínicos reales y aportar un impacto concreto.
- Que sean confiables: los modelos tienen que seguir los criterios que priorizaría un profesional médico formado.
- Y que sean escalables: deben mantener la capacidad de adaptarse y mejorar su rendimiento con el tiempo.
Además, la semana pasada OpenAI confirmó la compra de la startup IO, fundada por Jony Ive, por US$ 6.500 millones. Con esta operación, la empresa entra en el terreno del hardware y los dispositivos. Ive es reconocido por haber diseñado el iPhone original y otros productos icónicos en los primeros años de Apple en el negocio de los celulares.
La decisión marca una apuesta concreta de OpenAI por desarrollar un dispositivo propio que pueda incorporar su tecnología de inteligencia artificial. Aunque todavía no se conocen detalles, circulan versiones que describen el futuro equipo como "discreto y totalmente consciente de la vida y el entorno del usuario".
¿Por qué importa todo esto?
Porque la conexión entre la inteligencia artificial y la salud está tomando fuerza, sobre todo ahora que las grandes tecnológicas y las empresas que dominan la infraestructura digital invierten miles de millones de dólares en mejorar modelos enfocados en este sector.
La incorporación de dispositivos físicos suma una capa nueva a esta tendencia. Los usuarios podrán interactuar de forma más natural con su entorno, llevar un control más preciso de sus indicadores diarios de salud y contar con un "compañero inteligente" que funcione casi como un médico de cabecera, siempre presente.
Un buen ejemplo de este avance lo da Meta, que desarrolló uno de los modelos de código abierto más usados: Llama. A principios de este mes, la empresa publicó un estudio clave sobre cómo un sistema de salud importante (MHS) usó el modelo Llama 3.1 8B para generar documentación clínica y simplificar tareas internas.
El modelo permitió reducir el tiempo que se destina a extraer datos de las historias clínicas electrónicas, sin comprometer la privacidad de los pacientes. También ayudó a acortar procesos manuales como la anotación clínica y la revisión de historiales médicos.
Según el informe, la herramienta permitió recortar entre el 70% y el 80% del trabajo manual, lo que representa un ahorro estimado de US$ 176 por cada historia clínica. Escalado a sistemas de salud grandes y a lo largo del tiempo, eso podría implicar un ahorro de miles de millones de dólares y liberar miles de horas del personal médico.
Además, Meta prepara el lanzamiento de sus gafas Orion, que podrían ampliar aún más las capacidades vinculadas al cuidado de la salud.
Otro caso relevante es el de Med-PaLM, el modelo de lenguaje médico de Google. La primera versión tuvo un desempeño notable: superó el 60% en el Examen de Licencia Médica de EE.UU. (USMLE). Desde entonces, la empresa avanzó bastante y su versión Med-PaLM 2 alcanzó un 86,5% en las pruebas médicas de referencia.
La semana pasada, Google presentó su modelo más reciente: MedGemma, que mejora la comprensión tanto de textos como de imágenes médicas. Además, trabaja con distintas organizaciones y sistemas de salud para aplicar estos modelos en tareas como la documentación clínica, la mejora de procesos internos, la automatización de tareas y el uso de agentes especializados.
También anunció una nueva línea de gafas con inteligencia artificial: Android XR.
De hecho, todo este campo viene creciendo con fuerza. Un artículo publicado en Nature en 2023 analizó el impacto que puede tener el avance de los modelos de lenguaje grandes (LLM) entrenados para el ámbito médico. "Los LLM tienen el potencial de mejorar la atención al paciente al ampliar las competencias médicas fundamentales, como el conocimiento factual o las habilidades de comunicación interpersonal", sostiene el texto.
El estudio identifica áreas donde estos modelos ya están marcando una diferencia: mejoran la comunicación con los pacientes, facilitan la transmisión de información médica compleja, permiten resumir y organizar datos provenientes de distintas fuentes y ayudan en la investigación científica, que suele implicar el análisis de grandes volúmenes de información.
Tanto el impulso de OpenAI con HealthBench como el avance general de la industria hacia dispositivos más integrados tienen el potencial de mejorar la atención médica y la salud pública, siempre que se apliquen con responsabilidad, pruebas rigurosas y un enfoque centrado en la persona.