El año pasado, el empresario convertido en inversor Nat Friedman se convirtió, sin saberlo, en un corredor de chips informáticos a tiempo completo para nuevas empresas de inteligencia artificial. “Hubo semanas en las que pasé la mayor parte de mi tiempo buscando GPU para personas”, dijo a Forbes, haciendo referencia a las unidades de procesamiento de gráficos que impulsan el análisis de datos de IA. “Preguntar a los fundadores en qué necesitaban ayuda fue el problema número uno”.

Friedman, ex director ejecutivo de la plataforma de desarrollo de Microsoft, GitHub, y su socio inversor frecuente Daniel Gross, quien vendió su primera startup a Apple, pedían tantos favores a los proveedores de chips que, a mediados de año, decidieron que sería mejor contratar y equipo de ingenieros y gastando nueve cifras por adelantado para construir su propia supercomputadora. Ahora dirigen el Andromeda Cluster, el nombre que dan a varias reservas informáticas que suman un total de más de 4,000 GPU, que ponen a disposición de las empresas de su cartera para que las utilicen por una tarifa inferior al precio de mercado. Desde su anuncio en junio pasado, otros inversores en tecnología han seguido su ejemplo con ofertas para apoyar a las empresas. Index Ventures anunció un programa el otoño pasado para brindar a las nuevas empresas acceso gratuito a un clúster administrado por Oracle. Microsoft ha reservado varios miles de chips para que los utilicen las nuevas empresas en su brazo de riesgo M12, el acelerador de startups Y Combinator y un puñado de otros fondos en etapa inicial. Conviction Partners también gestiona un grupo más pequeño, dijo a Forbes la fundadora Sarah Guo.

Andreessen Horowitz está negociando con proveedores de chips para crear un programa informático, según tres fuentes. Una persona con conocimiento directo dijo que la empresa apunta a decenas de miles de GPU para una oferta que “hará que todo lo demás palidezca en comparación”. La firma se negó a hacer comentarios.

“Es importante para el ecosistema de Silicon Valley que el outsider de alto rendimiento y la persona que trabaja en Google tengan acceso a cantidades similares de oportunidades y computación”, dijo Gross a Forbes en una entrevista. “Ese simplemente no fue el caso de la IA”.

“¿POR QUÉ UNA INDUSTRIA TAN CERCANA A LA TECNOLOGÍA DE PUNTA ESTÁ TAN ESTANCADA?”

DANIEL GROSS

Como director ejecutivo de GitHub de 2018 a 2021, Friedman estuvo a cargo de acumular más de 4000 GPU para crear GitHub Copilot, una herramienta que ayuda a los ingenieros de software a escribir código que hoy es uno de los primeros éxitos comerciales de la IA generativa con ingresos superiores a los 100 millones de dólares. La demanda no ha hecho más que intensificarse a medida que los chips pasaron a servir como columna vertebral para entrenar modelos de IA como ChatGPT de OpenAI y su sucesor GPT-4. El mes pasado, Mark Zuckerberg anunció planes para acumular 350.000 H100 (el chip de gama alta de Nvidia que se vende a más de 30.000 dólares cada uno) para finales de año para avanzar en los esfuerzos de IA de Meta. La ferviente demanda impulsó a Nvidia a una capitalización de mercado de un billón de dólares. Mientras tanto, Google, Amazon y empresas tradicionales de semiconductores como AMD están luchando por producir en masa sus propios chips de IA, pero se topan con limitaciones en la cadena de suministro, ya que todos están en deuda con un único productor de semiconductores.

La escasez de oferta, a su vez, ha obstaculizado el progreso técnico. Las empresas emergentes, en particular, están en desventaja. Incluso si empresas como Microsoft Azure o Amazon Web Services tuvieran capacidad informática disponible para vender, es más probable que hagan negocios con un cliente grande. “La forma en que se reserva una porción no trivial de GPU es que hay que reservarlas durante varios años a la vez y pagar una porción no trivial por adelantado”, dijo Friedman. “Si sólo has recaudado unas pocas decenas de millones, ni siquiera puedes hacer eso”.

Andrómeda, entonces, funciona efectivamente como el gran cliente capaz de asumir un contrato a largo plazo. Friedman y Gross dividen el acceso a él entre docenas de empresas de cartera, incluido el clonador de voz ElevenLabs y el generador de vídeo Pika, y lo facturan en función del uso. “Cobramos un margen realmente pequeño para cubrir nuestros costos operativos, pero ganamos dinero ayudando a las nuevas empresas a tener éxito”, dijo Friedman. El precio era competitivo, dijo el director ejecutivo de Pika, Demi Guo, lo que permitió a la startup, que inicialmente solo se centró en construir un motor para generar videos de estilo anime, experimentar con videos realistas. Poder hacerlo aceleró el progreso de la compañía en un momento en que Guo dijo que muchos de sus pares de startups de IA estaban esperando acceso a la computación. Gross lo llama un “mecanismo de dilatación del tiempo”: “Lo que necesitas más que nada es tiempo. La computación sirve como una forma de acelerar el tiempo, de modo que se puede tomar un modelo que tardaría un año en entrenarse y terminarse en nuestro clúster en una semana”.

Pero gestionar un clúster no es una tarea fácil. Friedman y Gross pagaron costos iniciales de nueve cifras para arrendar los chips, la mayoría de los cuales provienen del proveedor de computación en la nube CoreWeave, una startup de 7 mil millones de dólares que respaldaron. El dúo también está pendiente del mantenimiento. Eso requirió contratar un equipo de ingenieros para administrar la supercomputadora y desarrollar software que permitiera a las nuevas empresas programar reservas por sí mismas (Friedman y Gross contribuyeron con parte del código). También es necesario: contratistas para monitorear el centavo de datos para GPUs que se queman y mueren.

Lee más: Descubren en Cajamarca una plaza monumental de la época de las pirámides de Giza y Stonehenge

LOS INVERSORES EN IA ESTÁN CORTEJANDO A LAS EMPRESAS EMERGENTES CON GRUPOS INFORMÁTICOS MASIVOS

Toda esta experimentación es posible, dijo Gross, porque él y Friedman tienen una proporción “significativamente mayor” de su dinero personal invertido en su práctica centrada en la IA en comparación con las normas de la industria. No estar tan sujetos a las expectativas de los socios comanditarios les ha ofrecido libertad para subvertir el manual estándar de capital de riesgo, dijo: “¿Por qué una industria tan cercana a la tecnología de punta está tan estancada?”

Nat Friedman (izquierda) y Daniel Gross (derecha) lanzaron el verano pasado el Clúster de Andrómeda, que ahora contiene más de 4000 GPU. NAT FRIEDMAN Y DANIEL GROSS

“Es una operación a escala industrial. Requiere trasnochar, madrugar y fines de semana sin dormir”, dijo Gross sobre el cúmulo de Andrómeda. “Si Nat y yo no tuviéramos una década de experiencia ejecutando proyectos de software y hardware, sería complicado ejecutarlo”.

Ésa es una de las razones por las que los esfuerzos de otras empresas por brindar soporte informático han sido más modestos. Index paga a Oracle para gestionar la infraestructura. “Tener que contratar a un equipo completo de personas para administrar un grupo de servidores simplemente no parece ser el mejor uso de nuestro tiempo”, dijo a Forbes la socia Erin Price-Wright. La oferta de Index sirve como un punto de entrada sin costo que las empresas utilizan durante aproximadamente tres meses con fines de prueba para poder pronosticar mejor cuántas GPU comprarán más adelante, dijo. Y Combinator y M12 funcionan de manera similar al ofrecer acceso informático gratuito por un tiempo limitado a través de la asociación con Microsoft. El programa está destinado a proporcionar una zona de pruebas para la experimentación; a menudo, las nuevas empresas utilizan las GPU para lanzar sus primeros prototipos, dijo Annie Pearl, vicepresidenta corporativa.

“RESERVAMOS LO QUE PENSÁBAMOS QUE ERA UN GRUPO GRANDE, PERO RESULTA QUE LA GENTE NECESITA MÁS”.

NAT FRIEDMAN

Aunque no hay límite de uso para Andromeda, también está dirigido principalmente a empresas emergentes y de Serie A debido a su tamaño actual, dijo Friedman. “Ningún clúster de nadie es lo suficientemente grande para cuando sus empresas crezcan”, dijo Guo de Conviction, señalando que si una empresa de inteligencia artificial madura lo suficiente como para necesitar varios miles de chips, necesitará negociar directamente con los proveedores de la nube. Están surgiendo varios proveedores de nube especializados en GPU, como CoreWeave, Lambda Labs, Tether y Together, para ayudar a negociar acuerdos para estas medianas empresas.

Pero la mayoría de los inversores en IA con los que habló Forbes dijeron que la demanda de GPU sigue superando la oferta. Y a medida que los nuevos modelos de IA como Claude 2.0 de Anthropic y Gemini de Google muestran mejoras de rendimiento con respecto a sus predecesores de menor tamaño, la mayoría de los laboratorios de investigación líderes están decidiendo seguir construyendo modelos más grandes. Anthropic recaudó 750 millones de dólares el mes pasado en una ronda de financiación inusual después de conseguir miles de millones el año pasado. Forbes informó en agosto que un equipo de ex investigadores de Meta que buscaban desarrollar un modelo de lenguaje de IA para biología pronosticaba que necesitaría 477 millones de dólares de capital en sus primeros tres años de existencia (se proyectaba que más de la mitad de esa cantidad se gastaría en computación).

La escasez de GPU puede estar disminuyendo para los usuarios que sólo necesitan grupos más pequeños, dijo Friedman, pero continúa con grandes grupos de miles o decenas de miles de chips. Con eso en mente, él y Gross están explorando convertir a Andrómeda en una supercomputadora aún más grande que pueda ser útil para empresas más grandes. “Reservamos lo que pensábamos que era un grupo grande, pero resulta que la gente necesita más”, dijo Friedman. “Así que estamos explorando los próximos dos horizontes aquí y viendo si hay un lugar para que podamos marcar la diferencia”.

Este artículo fue publicado originalmente por Forbes US.

Te puede interesar: Este es ‘Bobi’, el canino que perdió el título al ‘perro más viejo del mundo’