Hvorfor kommer ikke Apples AI-funksjoner til de lavere iPhone-ene? Her er min gjetning som IT-ekspert

0
45
iPhone 15 Kerry Wan /ZDNET

Under WWDC 2024 avduket Apple "Apple Intelligence," som inkorporerer avanserte AI-funksjoner gjennom hele økosystemet. Disse funksjonene er imidlertid bare tilgjengelige på avanserte enheter som iPhone 15 Pro, iPad Pro med M-seriebrikker og Mac-er som kjører på Apple Silicon. 

Også: Apple iscenesatte AI-comebacket vi har håpet på – men her trenger det fortsatt arbeid

Hvorfor lanserte ikke Apple disse funksjonene til iPhone 15 på startnivå og tidligere modeller? Selv om det kan være andre grunner til at selskapet valgte å ikke gjøre det, er beslutningen nesten helt sikkert påvirket av de betydelige kostnadene og infrastrukturutfordringene som er involvert i storskala AI-implementering.

Kostnadene ved GPU-behandling

h2>

Avanserte AI-funksjoner krever betydelig beregningskraft, vanligvis levert av høyytelses GPUer. For eksempel koster NVIDIAs MGX med GH 200 og Grace Hopper superchip designet for AI-trening, slutninger, 5G og HPC rundt $65 000 hver. Å distribuere disse serverne regionalt for å støtte lavere enheter vil være uoverkommelig dyrt. Apple ville lett trenge tusenvis av disse enhetene for å støtte hele brukerbasen, noe som resulterer i astronomiske kostnader som sannsynligvis overføres til forbrukerne gjennom tjenesteavgifter.

Også: Apple samarbeider med OpenAI for å bringe ChatGPT til iOS, iPadOS og MacOS

Selv store AI-tjenesteleverandører som OpenAI, Microsoft og Google møter utfordringer med å tilby pålitelig og rask tilgang til LLM og Generative AI-modeller til allmennheten uten nedetid og overbelastning av ressurser. Mangelen og kostnadene for GPU-aktiverte servere gjør disse problemene verre. For å opprettholde den raske responstiden som forventes av kundene, må Apple investere betydelig i servere, datasentre og edge-infrastruktur – et infrastrukturnivå de sannsynligvis ikke har for øyeblikket.

Apples tilnærming til Private Cloud Compute (PCC)

For den første utrullingen av Apple Intelligence har selskapet valgt en hybrid tilnærming for å balansere kostnader og ytelse, og kombinerer prosessering på enheten med Private Cloud Compute (PCC). Behandling på enheten bruker A17 Pro-brikken i iPhone 15 Pro-linjen og M-seriens brikker i iPads og Mac-er for å forbedre sikkerheten og personvernet. For mer krevende oppgaver tillater PCC skyoperasjoner samtidig som brukerens personvern opprettholdes. PCC er designet med tilpasset Apple-silisium og et robust operativsystem for å sikre persondatasikkerhet og forhindre uautorisert tilgang.

Også: Her er hvordan Apple holder skybehandlede AI-data trygge ( og hvorfor det er viktig)

Apple er for tiden fokusert på å rulle ut sine Generative AI-tjenester til avanserte enheter som en del av den innledende fasen av Apple Intelligence-distribusjon. Dette gjør at Apple kan forbedre AI-kapasiteten og infrastrukturen før den utvides til et bredere spekter av enheter. For å bringe Apple Intelligence til resten av økosystemet, vil selskapet sannsynligvis distribuere AI-akselererte serverenheter på kanten, slik at mindre kapable enheter kan dra nytte av avanserte AI-funksjoner. Denne infrastrukturen er imidlertid ennå ikke klar for storskala distribusjon, ettersom Apples overgang til AI-utvikling fortsatt er nylig.

Utfordringene med edge computing

Edge computing, som involverer behandling av data nærmere der de genereres i stedet for kun å stole på sentraliserte datasentre, kan forbedre ytelsen betydelig og redusere ventetiden. Distribusjon av edge computing-infrastruktur er imidlertid komplekst og kostbart, og krever robuste maskinvare- og programvareløsninger for å sikre sømløs integrasjon og sikkerhet. Apple er kjent for sin omhyggelige tilnærming til maskinvare- og programvareutvikling, og selskapet tester og raffinerer sannsynligvis fortsatt sine avanserte databehandlingsløsninger før de rulles ut i stor skala.

Også: Gjør plass til RAG: Hvordan Gen AIs maktbalanse skifter

Mens NVIDIA er en stor aktør i GPU-serverområdet, inkluderer andre tradisjonelle x86 Intel-baserte og Arm-baserte serverleverandører som Qualcomm og Ampere. Disse serverne kan også bruke NVIDIA GPUer, men Apple vil sannsynligvis kontrollere integrasjonen med operativsystemet og silisiumet for å distribuere AI-databehandling. I tillegg er forsyningskjeden fra NVIDIA eller en annen HPC-serverleverandør sannsynligvis utilstrekkelig til å møte Apples krav til storskala distribusjon.

Som rapportert av The Register, utvikler Apple sine egne AI-servere, som forventes å være mer kostnadseffektive og bedre integrert med økosystemet. Disse serverne blir for tiden testet i datasentre for bruk av grunnlagsmodeller, og en bredere utrulling er forventet i 2025. Denne trinnvise tilnærmingen sikrer at Apple kan opprettholde høye standarder for personvern, sikkerhet og brukeropplevelse samtidig som den gradvis utvider AI-funksjonene på tvers av enhetsutvalget.

Større implikasjoner for IoT og andre enheter

Apples beslutning om å begrense Apple Intelligence til avanserte modeller er drevet av de betydelige kostnads- og infrastrukturutfordringene knyttet til distribusjon av AI i stor skala, slik at selskapet kan sikre en jevn og sikker brukeropplevelse samtidig som det legger grunnlaget for fremtidige utvidelser.

Behovet for AI-akselererte servere handler ikke bare om eldre telefoner og lavere enheter. Apples IoT-produkter, som Apple Watch, Apple TV og HomePod, som mangler beregningskraften for AI på enheten, vil også dra nytte av slik infrastruktur. Disse enhetene vil neppe håndtere AI-beregning på enheten om kort tid, noe som gjør sky- og kantløsninger enda mer kritiske.

Også: Her er alle iPhone-modeller som vil støtte Apples nye AI-funksjoner (for nå)

Når Apple introduserer Apple Intelligence, kan brukere med eldre eller ikke-Pro-modeller føle seg utenfor. Tydelig kommunikasjon fra Apple angående den gradvise utrullingsstrategien og planer for bredere distribusjon vil være viktig for å administrere brukernes forventninger.

Når Apple fortsetter å utvikle sin AI-infrastruktur, inkludert potensielle avanserte databehandlingsløsninger, forventer vi at en bredere utrulling av Apple Intelligence vil bli distribuert i de kommende årene. Denne trinnvise tilnærmingen sikrer at Apple kan opprettholde sine høye standarder for personvern, sikkerhet og brukeropplevelse samtidig som den gradvis utvider AI-funksjonene på tvers av enhetsutvalget.