¡ Se acabó el conocimiento !

La #AI ha aprendido todo lo que conoce la humanidad.

El científico ex-jefe de #OpenAI, #IlyaSutskever, abordó en #NeurIPS, la conferencia sobre #MachineLearning, durante un discurso en Diciembre. #Sutskever, quien dijo que la industria de la #AI había alcanzado lo que él llamó "pico de datos", predijo que la falta de datos de entrenamiento obligará a un cambio en la forma en que se desarrollan los modelos hoy en día.

#Musk sugirió que los datos sintéticos (datos generados por los propios modelos de #AI) son el camino a seguir. “La única forma de complementar (los datos del mundo real) es con datos sintéticos, donde la #AI crea (datos de entrenamiento)”, dijo. “Con los datos sintéticos… (la #AI) se calificará a sí misma y pasará por un proceso de autoaprendizaje”.

Otras empresas, entre ellas gigantes tecnológicos como #Microsoft, #Meta, #OpenAI y #Anthropic, ya están utilizando datos sintéticos para entrenar modelos de #AI emblemáticos.

El entrenamiento con datos sintéticos tiene otras ventajas, como el ahorro de costes. Pero también hay desventajas. Algunas investigaciones sugieren que los datos sintéticos pueden provocar el colapso del modelo, que se vuelve menos “creativo” (y más sesgado) en sus resultados, lo que eventualmente compromete seriamente su funcionalidad. Debido a que los modelos crean datos sintéticos, si los datos utilizados para entrenar estos modelos tienen sesgos (bias en inglés) y limitaciones, sus resultados también estarán contaminados.

Reply to this note

Please Login to reply.

Discussion

No replies yet.