Los datos son el combustible de la IA en dermatología

En la era de la inteligencia artificial, los datos son la base fundamental de la innovación. Al igual que el combustible impulsa los motores, los conjuntos de datos impulsan el entrenamiento de los modelos de IA, determinando su precisión, fiabilidad y eficacia. A la hora de desarrollar soluciones basadas en IA para la detección de enfermedades cutáneas, ya sean aplicaciones móviles de escáner cutáneo de IA, plataformas basadas en la nube o software de diagnóstico, el primer paso y el más esencial es la recopilación y preparación de datos. Sin imágenes de alta calidad, diversas y bien etiquetadas de las afecciones cutáneas, ni siquiera las redes neuronales más avanzadas funcionarán con eficacia en las aplicaciones del mundo real.

Este artículo ofrece una revisión exhaustiva de 10 conjuntos de datos de enfermedades de la piel disponibles públicamente que pueden servir como valiosos recursos para la investigación en IA. Si usted es un científico de datos, un desarrollador de IA sanitaria o un emprendedor en el sector de la salud digital, esta guía le ayudará a navegar por el panorama de los conjuntos de datos de dermatología, comprender sus fortalezas y limitaciones, y tomar decisiones informadas para el desarrollo de su modelo de IA.

Para cada conjunto de datos, analizamos:

  • El número de imágenes y la variedad de afecciones cutáneas cubiertas
  • La fuente y la calidad de etiquetado de los datos
  • Los tipos de imágenes (clínicas o dermatoscópicas) y la calidad de la resolución
  • Las condiciones de licencia del conjunto de datos y su accesibilidad
  • Principales ventajas e inconvenientes

Además, exploramos por qué los conjuntos de datos disponibles públicamente no suelen estar a la altura de las soluciones comerciales de IA, incluyendo problemas como la limitada diversidad de imágenes, los desequilibrios de clase y las restricciones legales. También analizamos los siguientes pasos críticos en el desarrollo de la IA: preprocesamiento de datos, formación de modelos, cumplimiento de la normativa e implantación.

Por último, presentamos Skinive.Cloud, un avanzado motor API de análisis de la piel basado en IA que ofrece una alternativa a la creación de un modelo de IA desde cero. Con acceso a un gran conjunto de datos propio de millones de imágenes, certificación CE-Mark e integración API Whitelabel sin fisuras, Skinive.Cloud permite a las empresas de salud y belleza de la piel implementar soluciones de análisis de la piel basadas en IA de forma rápida, rentable y sin obstáculos normativos.

Si desea desarrollar una solución de IA para dermatología, este artículo es su punto de partida. Siga leyendo para descubrir los mejores conjuntos de datos para su proyecto y aprenda a acelerar su desarrollo de IA con tecnología líder del sector.


1. ISIC Archive

  • URL: https://www.isic-archive.com
  • Número de imágenes: 85,000+
  • Categorías de enfermedades: Melanoma, carcinoma basocelular, carcinoma espinocelular y lesiones cutáneas benignas
  • Recogida de datos y etiquetado: Dermatólogos y oncólogos
  • Tipo y calidad de la imagen: Imágenes dermatoscópicas de alta resolución
  • Condiciones de uso: Gratis para uso en investigación
  • Puntos fuertes: Gran conjunto de datos, anotaciones de expertos, ampliamente utilizado en la investigación de la IA.
  • Limitaciones: Clases desequilibradas (más lesiones benignas que casos malignos).

2. HAM10000

  • URL: https://www.kaggle.com/kmader/skin-cancer-mnist-ham10000
  • Número de imágenes: 10,015
  • Categorías de enfermedades: 7 enfermedades de la piel, incluyendo melanoma y dermatofibroma
  • Recogida de datos y etiquetado: Dermatólogos
  • Tipo y calidad de la imagen: Imágenes dermatoscópicas de alta resolución
  • Condiciones de uso: Código abierto (Kaggle)
  • Puntos fuertes: conjunto de datos bien etiquetado con clases equilibradas
  • Limitaciones: Número limitado de imágenes

3. DermaMNIST

  • URL: https://medmnist.com
  • Número de imágenes: 10.015 (redimensionadas para el entrenamiento de IA)
  • Categorías de enfermedades: 7 enfermedades de la piel
  • Recogida de datos y etiquetado: Profesionales médicos
  • Tipo y calidad de las imágenes: Imágenes dermatoscópicas de baja resolución
  • Condiciones de uso: Acceso abierto
  • Puntos fuertes: Conjunto de datos ligero ideal para experimentos rápidos
  • Limitaciones: La menor resolución de la imagen afecta a la precisión del modelo

4. SD-198

  • URL: https://derm.cs.sfu.ca
  • Número de imágenes: 6,584
  • Categorías de Enfermedades: 198 enfermedades de la piel
  • Recogida de datos y etiquetado: Investigadores de la Universidad de Stanford
  • Tipo y calidad de las imágenes: Imágenes clínicas (macrofotografías)
  • Condiciones de uso: Acceso basado en solicitud
  • Puntos fuertes: Gran variedad de afecciones
  • Limitaciones: Acceso público limitado

5. PAD-UFES-20

  • URL: https://www.kaggle.com/datasets/mahdavi1202/skin-cancer
  • Descripción: Conjunto de datos de la Universidad Federal de Espírito Santo con imágenes clínicas del mundo real.
  • Tamaño: 2.298 imágenes.
  • Categorías: 8 tipos de enfermedades.
  • Anotaciones: Metadatos con información demográfica.
  • Disponibilidad: Disponible públicamente.
  • Ideal para: Aplicaciones generales de IA en dermatología.

6. Conjunto de datos PH^2

  • URL: https://www.fc.up.pt/addi/ph2%20database.html
  • Descripción: Un conjunto de datos dermatoscópicos para el análisis de melanomas.
  • Tamaño: 200 imágenes.
  • Categorías: Incluye melanoma, nevos atípicos y nevos benignos.
  • Anotaciones: Máscaras de segmentación a nivel de píxel.
  • Disponibilidad: Disponible previa solicitud.
  • Ideal para: Segmentación e investigación de clasificación de melanomas.

7. Conjunto de datos Derm7pt

  • URL: https://github.com/jeremykawahara/derm7pt
  • Descripción: Se centra en los criterios de la lista de comprobación de siete puntos del melanoma.
  • Tamaño: 1.011 imágenes.
  • Categorías: Cáncer de piel melanoma y no melanoma.
  • Anotaciones: Anotaciones detalladas de características.
  • Disponibilidad: Gratuita para uso de investigación.
  • Ideal para: IA explicable y clasificación basada en características.

8. Fitzpatrick 17K

  • URL: https://github.com/mattgroh/fitzpatrick17k
  • Descripción: Conjunto de datos sobre la diversidad de tonos de piel en modelos de inteligencia artificial.
  • Tamaño: 16.577 imágenes.
  • Categorías: Cubre una amplia gama de condiciones de la piel.
  • Anotaciones: Etiquetado con los tipos de piel de Fitzpatrick.
  • Disponibilidad: Disponible a través de Google Dataset Search.
  • Ideal para: Reducir el sesgo de la IA en la detección de enfermedades cutáneas.

9. BCN20000

  • URL: https://paperswithcode.com/dataset/bcn-20000
  • Descripción: Conjunto de datos para la clasificación del cáncer de piel desarrollado por el Barcelona Supercomputing Center.
  • Tamaño: 26.426 imágenes.
  • Categorías: 8 tipos de lesiones cutáneas.
  • Anotaciones: Diagnosticadas por dermatólogos.
  • Disponibilidad: Gratuita para uso académico.
  • Ideal para: Entrenamiento de modelos de IA para dermatología clínica.

10. Conjunto de datos de clasificación de melanoma SIIM-ISIC

  • URL: https://www.kaggle.com/competitions/siim-isic-melanoma-classification
  • Descripción: Un conjunto de datos alojado en Kaggle diseñado para desafíos de clasificación de melanoma.
  • Tamaño: 33.126 imágenes.
  • Categorías: Melanoma vs. lesiones benignas.
  • Anotaciones: Etiquetas de clasificación binarias.
  • Disponibilidad: Disponible en Kaggle.
  • Ideal para: Evaluación comparativa de modelos de IA en la detección de melanomas.

▶️ Video: Cómo construir un modelo ML de clase mundial para la detección de melanoma

Si quieres aplicar técnicas de IA en dermatología, echa un vistazo al vídeo de YouTube «Cómo crear un modelo ML de primera clase para la detección del cáncer de piel«. Es un recurso excelente para aprender sobre estrategias avanzadas de aprendizaje automático en el diagnóstico de enfermedades de la piel.


Próximos pasos en el desarrollo de IA para dermatología

Incluso con un conjunto de datos, el entrenamiento de modelos de IA requiere:

  • Preprocesamiento y aumento: Limpieza y estandarización de imágenes.
  • Contratación de científicos de datos: Profesionales cualificados para construir y afinar modelos de IA.
  • Recursos informáticos: GPU de alto rendimiento y computación en la nube para entrenar modelos de aprendizaje profundo.
  • Experimentación continua: Múltiples iteraciones para lograr una precisión óptima.

Una vez entrenado el modelo de IA, el siguiente paso es desarrollar una aplicación móvil, web o de escritorio con funcionalidad de análisis de la piel. Sin embargo, antes de lanzar el producto, este debe superar rigurosos procesos de certificación médica, entre ellos CE-Mark, FDA, ISO 13485, HIPPA, GDPR… garantizando su conformidad como dispositivo médico.

Todo el proceso, desde la recogida de datos hasta la certificación, puede llevar años y costar cientos de miles o incluso millones de dólares…


¿Por qué los conjuntos de datos gratuitos suelen ser insuficientes para el entrenamiento de la IA?

Aunque estos conjuntos de datos disponibles públicamente proporcionan una base sólida para la investigación, a menudo se quedan cortos en las aplicaciones del mundo real debido a:

  • Desequilibrio de datos: La mayoría de los conjuntos de datos contienen más lesiones benignas que casos malignos, lo que afecta al entrenamiento del modelo.
  • Baja calidad de las imágenes: Muchos conjuntos de datos tienen resoluciones variadas, lo que limita la precisión de la IA.
  • Diversidad limitada: Los conjuntos de datos públicos suelen carecer de imágenes de diferentes grupos de edad, etnias y tipos de piel.
  • Restricciones legales y éticas: El uso de algunos conjuntos de datos en aplicaciones comerciales puede requerir permisos adicionales.

Para las aplicaciones comerciales, a menudo es necesario recopilar y etiquetar los datos de forma independiente, garantizando conjuntos de datos de alta calidad, diversos y conformes a la ley.


Una solución más rápida y rentable: Skinive.Cloud

Skinive.Cloud ofrece una API de análisis de la piel impulsada por IA con importantes ventajas:

  • Construida sobre un conjunto de datos masivo (más de 3 millones de imágenes) verificado por dermatólogos y oncólogos.
  • Cumple con el marcado CE y el GDPR (software de grado médico), listo para uso comercial.
  • Solución de marca blanca: Fácilmente personalizable para su marca.
  • Perfecta integración API en aplicaciones móviles, web y de escritorio.
  • Mejora continua de los modelos de IA sin costes de desarrollo adicionales.
  • Rentabilidad: Evite los elevados costes de desarrollar su propia solución de IA.

Más allá de la tecnología: Apoyo experto para su empresa

En Skinive, no solo ofrecemos asistencia técnica, sino también asesoramiento empresarial para ayudarle a alcanzar sus objetivos. Contamos con una amplia experiencia en la integración de análisis de la piel basados en IA en diversos sectores, entre ellos:

  • Aplicaciones de salud y belleza (como la aplicación AI Skin Scanner)
  • Plataformas de telemedicina (sistemas EMR/EHR)
  • Comercio electrónico de productos para el cuidado de la piel
  • Compañías de seguros
  • Hospitales y laboratorios de diagnóstico
  • Clínicas de belleza y SPA

Comience hoy mismo su viaje al análisis de la piel con inteligencia artificial

En lugar de invertir años en investigación, desarrollo y certificación, puede integrar Skinive.Cloud hoy mismo y lanzar al mercado una solución de análisis de la piel impulsada por IA de forma más rápida y asequible.

🔗 Más información en Skinive.Cloud

📞 ¡Programe una llamada con nuestro equipo de ventas hoy mismo!