Google har begränsat Metas användning av Gemini eftersom efterfrågan på GPU-kapacitet blivit större än vad Google kan leverera. Begränsningarna ska ha funnits på plats sedan mars och enligt Reuters har de försenat delar av Metas interna AI-arbete.
En av världens största AI-satsningar kan nu bromsas av en konkurrent som sitter på infrastrukturen. AI-marknaden börjar därmed handla mindre om vem som har snyggast demo och mer om vem som faktiskt får tillgång till chip, tokenbudgetar och serverkapacitet när belastningen ökar.
AI-kapacitet blir ny maktfaktor
Meta har använt Gemini till bland annat säkerhetsautomatisering, kundtjänst och kodutveckling. Det säger något om hur stora AI-bolag arbetar i praktiken. Även bolag som bygger egna modeller använder konkurrenternas system när de är bättre, snabbare eller enklare att skala internt.
Problemet är att Gemini inte bara är en modell. Den är också en tjänst som kräver enorma mängder kapacitet varje gång den används. Varje fråga, kodförslag eller intern analys räknas i tokens, alltså de textenheter som AI-modellen bearbetar. När ett bolag som Meta kör stora mängder interna arbetsflöden genom Gemini blir det snabbt en fråga om kapacitet, inte bara mjukvara.
Reuters skriver att Meta har uppmanat personalen att använda AI-token mer effektivt efter begränsningarna. Det är en liten detalj som säger mycket om utvecklingen. AI håller på att få samma interna styrning som molnservrar, annonsbudgetar och datalagring. Det som tidigare kändes obegränsat börjar mätas, prioriteras och ransoneras.
Läs även: Siri byggs om från grunden – med hjälp av Google
Googles egna chip räcker inte till
Google har en fördel som många AI-bolag saknar. Bolaget använder sina egna TPU-chip, Tensor Processing Units, som är specialbyggda för maskininlärning och stora AI-arbetslaster. Enligt Google Cloud används TPU:er för bland annat stora språkmodeller, kodgenerering, bildtjänster, rekommendationssystem och personalisering. De driver också Gemini och Googles egna AI-funktioner i tjänster som Sök, Foto och Maps.
Trots det verkar kapaciteten inte räcka. Alphabet uppgav i sin senaste kvartalsrapport att Google Cloud växte med 63 procent och passerade 20 miljarder dollar i intäkter under första kvartalet 2026. Samtidigt ökade orderstocken till över 460 miljarder dollar, drivet av efterfrågan på AI-produkter och AI-infrastruktur.
Alphabet-chefen Sundar Pichai har också varit ovanligt tydlig med att Google Cloud är begränsat av tillgången till GPU-kapacitet på kort sikt. Efter rapporten konstaterade han att molnintäkterna hade varit högre om Google kunnat möta all efterfrågan.
Meta vill äga framtiden men hyr fortfarande delar av den
För Meta är uppgifterna känsliga eftersom bolaget positionerar sig som en av de stora vinnarna i nästa AI-våg. Meta har byggt Llama-modeller, investerat tungt i datacenter och pratat öppet om målet att skapa personlig superintelligens för användare. Bolaget har dessutom sagt att det ska investera över 600 miljarder dollar i amerikansk infrastruktur fram till 2028, bland annat för AI-teknik, datacenter och arbetskraft.
Samtidigt visar Gemini-uppgifterna hur svårt det är att bli självförsörjande i AI-racet. Det räcker inte att ha egna modeller. Bolagen behöver också tillräckligt med chip, el, kylning, nätverk, datacenterkapacitet och mjukvara för att använda modellerna i stor skala varje dag.
Det är här Googles position blir särskilt intressant. Bolaget konkurrerar med Meta om AI-produkter, annonser, användardata och utvecklare. Samtidigt kan Google Cloud fungera som leverantör till båda bolagen. När kapaciteten blir knapp uppstår en ny sorts maktbalans: molnleverantören kan behöva prioritera mellan egna produkter, betalande kunder och strategiskt viktiga AI-partners.
Läs även: Google ska betala SpaceX 9 miljarder i månaden
Flaskhalsen flyttar från modell till infrastruktur
Under de senaste åren har AI-debatten handlat mycket om vilken modell som är smartast. GPT, Gemini, Claude, Llama och andra modeller har jämförts i tester, benchmarks och produktdemos. Men den här typen av konflikt visar att nästa fas handlar om något mindre synligt.
Det avgörande blir hur många förfrågningar modellen klarar, hur snabbt den svarar, vad varje token kostar och om företagen får tillgång till kapacitet när de behöver den. För användare kan det i förlängningen påverka allt från svarstider och pris till vilka AI-funktioner som faktiskt lanseras.
Google har redan presenterat nya generationer TPU:er för att möta efterfrågan. I april beskrev bolaget sina åttonde generationens TPU-chip som anpassade för en mer agentdriven AI-era, där modeller inte bara svarar på frågor utan utför längre arbetsflöden. Den typen av AI kräver ännu mer GPU-kapacitet eftersom systemen kan behöva resonera, anropa verktyg och köra flera steg innan användaren får ett svar.
Det gör Metas problem till mer än en intern flaskhals. Det är en förhandsbild av hur AI-marknaden kan fungera framöver. De bolag som kontrollerar infrastrukturen kan få lika mycket makt som de bolag som bygger modellerna. Och även jättar som Meta kan behöva ställa sig i kö när hela branschen jagar samma sak: mer kapacitet.
