Forbes Uruguay
Alex Ratner, director ejecutivo de Snorkel AI, dijo que su empresa está poniendo
Innovacion

Esta startup de etiquetado de datos recaudó US$ 100 millones y ya vale US$ 1300 millones

Rashi Shrivastava

Share

La startup, surgida del laboratorio de IA de Stanford, dejó atrás el clásico etiquetado de datos para enfocarse en la generación de conjuntos especializados y en la evaluación del rendimiento de modelos ya entrenados, un área clave en la nueva era del "post-entrenamiento".

30 Mayo de 2025 18.00

Alex Ratner, director ejecutivo de Snorkel AI, recuerda una época en la que el etiquetado de datos —la tarea de añadir contexto a grandes volúmenes de datos sin procesar y calificar la respuesta de un modelo de inteligencia artificial— se consideraba un trabajo de "limpieza" entre investigadores del sector. Pero eso cambió en 2022, cuando ChatGPT sorprendió al mundo e inyectó miles de millones de dólares a una serie de startups que salieron a ofrecer datos etiquetados por humanos a empresas como OpenAI y Anthropic para entrenar modelos más precisos.

Hoy, el negocio del etiquetado de datos atraviesa otra transformación. Cada vez menos empresas entrenan modelos de lenguaje desde cero; esa tarea quedó en manos de los gigantes tecnológicos. En su lugar, afinan modelos ya existentes y desarrollan productos en sectores como el software, la salud y las finanzas. Esto generó una necesidad de datos más específicos.

Los chatbots dejaron de limitarse a redactar ensayos o haikus. Ahora cumplen tareas sensibles, como asistir a médicos en diagnósticos o analizar solicitudes de crédito. Pero también se equivocan más. Evaluar cómo funciona un modelo pasó a ser clave para que las empresas puedan confiar y usar inteligencia artificial, según Ratner. "La evaluación se ha convertido en el nuevo punto de entrada", dijo a Forbes.

La necesidad urgente de medir el rendimiento de la inteligencia artificial en situaciones concretas empujó a Snorkel AI a tomar otro rumbo. La empresa ahora colabora con compañías que quieren armar sistemas de evaluación y conjuntos de datos para probar sus modelos y ajustarlos.

Científicos de datos y especialistas internos usan el software de Snorkel para seleccionar y generar miles de pares de indicaciones y respuestas, que sirven como ejemplos de lo que sería una buena contestación. Luego, evalúan al modelo con ese conjunto de datos y lo entrenan para mejorar su rendimiento.

chatbots-el-sistema-que-comienzan-a-tomar-la-posta-de-la-atencion-al-cliente
Los chatbots dejaron de limitarse a redactar ensayos o haikus. Ahora cumplen tareas sensibles, como asistir a médicos en diagnósticos o analizar solicitudes de crédito.

La empresa recaudó US$ 100 millones en una ronda de financiación Serie D liderada por Addition, una firma de capital riesgo con sede en Nueva York. Su valuación subió a US$ 1.300 millones, un 30 % más que los US$ 1.000 millones que tenía en 2021. Ese salto modesto podría mostrar que la compañía no creció como esperaban los inversores. Sin embargo, Ratner dijo que responde a una "corrección positiva en el mercado en general". Snorkel AI no quiso dar detalles sobre sus ingresos.

Especialistas en atención al cliente de una de las principales empresas de telecomunicaciones usaron Snorkel AI para evaluar y ajustar su chatbot, que responde consultas sobre facturación y agenda turnos, según contó Ratner a Forbes. Oficiales de crédito de uno de los tres bancos más grandes de Estados Unidos entrenaron un sistema con Snorkel para consultar bases de datos y responder preguntas sobre grandes clientes institucionales. Según Ratner, mejoraron la precisión del sistema del 25 % al 93 %. Para Rox, una startup de inteligencia artificial que no contaba con el equipo ni el tiempo para evaluar su asistente virtual para vendedores, Snorkel permitió subir la precisión entre un 10 % y un 12 %, afirmó Sriram Sridharan, cofundador de la empresa, también en diálogo con Forbes.

Este cambio marca una nueva etapa para Snorkel AI, que nació en 2019 desde el Laboratorio de Inteligencia Artificial de Stanford con un software que ayudaba a clasificar miles de imágenes y textos. Sin embargo, tras la aparición de ChatGPT en 2022, la empresa perdió protagonismo frente a competidores más grandes que se volcaron al negocio del etiquetado de datos.

Scale AI, que también ofrece servicios de etiquetado y evaluación, estaría por cerrar una venta de acciones con una valuación de US$ 25.000 millones, muy por encima de los US$ 13.800 millones de hace un año. Otros jugadores son Turing, que duplicó su valuación a US$ 2.200 millones desde 2021, e Invisible Technologies, que facturó US$ 134 millones en 2024 sin grandes aportes de capital riesgo.

Al enfocarse en la evaluación —que también implica generar datos—, Snorkel empezó a contratar a decenas de miles de profesionales calificados, entre ellos docentes de ciencias, abogados, contadores y escritores de ficción. Su tarea es armar conjuntos de datos especializados para distintos desarrolladores de inteligencia artificial, que después los usan para evaluar el rendimiento de sus modelos. Snorkel no quiso decir con qué laboratorios de avanzada trabaja. Según Ratner, esos datos también sirven para sumar nuevas funciones a los chatbots, como la capacidad de desglosar y razonar sobre consultas complejas o investigar a fondo un tema.

Aun en el terreno de las evaluaciones más específicas, Snorkel enfrenta una competencia dura, tanto de jugadores nuevos como históricos. Varias empresas líderes publicaron puntos de referencia públicos y bases de datos abiertas para medir a sus modelos. LMArena, una plataforma popular para este tipo de pruebas, se convirtió en empresa y consiguió US$ 100 millones en su primera ronda de inversión. Su valuación alcanzó los US$ 600 millones, según Bloomberg. También compiten firmas como Scale, Turing e Invisible, que ofrecen servicios similares. Sin embargo, Ratner remarcó que Snorkel se armó desde el inicio con especialistas humanos, lo que —según él— la diferencia del resto.

Saam Motamedi, socio de Greylock que participó en la ronda, sostuvo que los nuevos servicios especializados en conjuntos de datos representan una parte cada vez más importante del negocio de Snorkel. Esto se da en un momento en que la industria avanza hacia lo que se conoce como "post-entrenamiento", que consiste en ajustar el rendimiento de los modelos para tareas puntuales. Como la inteligencia artificial ya procesó la mayoría de los datos disponibles en internet, los conjuntos hechos por especialistas ganaron peso. "Creo que este impulso del mercado ha sido muy positivo para Snorkel", dijo.

 

*Con información de Forbes US.

10